datetime 변환 코드 상에서 이와 같은 에러가 발생
pandas 데이터 인식이 잘 못된 경우일 수 있다. 아래와 같이 설정
train["datetime"] = pd.to_datetime(train["datetime"])
.dt에서 어트리뷰트 에러발생 - 인프런 | 질문 & 답변 (inflearn.com)
datetime 변환 코드 상에서 이와 같은 에러가 발생
pandas 데이터 인식이 잘 못된 경우일 수 있다. 아래와 같이 설정
train["datetime"] = pd.to_datetime(train["datetime"])
.dt에서 어트리뷰트 에러발생 - 인프런 | 질문 & 답변 (inflearn.com)
conda install graphviz 를 쳐서 설치를 하자
찾아보니 conda install로 설치를 하면
C:\Users\Anaconda3\Library\bin\graphviz
이 위치에 설치된다.
그런데 pip install로 하면 아래 경로에 설치가 된다.
C:\Users\Anaconda3\Lib\site-packages\graphviz
[출처] [파이썬][머신러닝] graphviz 설치/실행 에러 해결하기|작성자 하쿠나마타타
아래와 같이 복잡하게 하지 말고, 그냥
(base) pip install xgboost
하면 된다.
conda install 을 사용하면, 아래와 같이 python 버전에 따라 PakcagesNotFoundError 가 발생한다.
1) https://www.lfd.uci.edu/~gohlke/pythonlibs/#xgboost
2) 현재 pyton 3.10 설치된 상태이므로, xgboost-1.5.1-cp310-cp310-win_amd64.whl 다운 받는다.
3) 다운로드한 파일을 C:\Users\chpark\Anaconda3\pkgs\python-3.10.0-h96c0403_3\Lib\site-packages 에 저장
4) 다운 받은 폴더에 가서, pip install xgboost-1.5.1-cp310-cp310-win_amd64.whl
5) Jupyter notebook 에서 아래 명령어가 에러 나지 않으면 설치된 것임.
import xgboost as xgb
import matplotlib.pyplot as plt
%matplotlib inline
plt.figure(figsize=(28,12))
import plotnine as p9
p9.ggplot(data=df, mapping=p9.aes(x='Site_No', y='Vis_flag'))+ p9.geom_bar(stat='identity')
import pandas as pd
ind =(df['Vis_flag'] == 1) & (df['Site_No'] == 192) #조건만 만족하면 index 를 가지고 있다. 괄호가 중요
df[ind] # 조건에 맞는 모든 열을 추출한다.
print(np.sort(sum_by_flag['Vis_flag']) #정렬
C:\Users\chpark\OneDrive\My_Code\_Scratch
[ 0. 0. 0. 0. 1. 3. 13. 14. 14. 19. 22. 25. 27. 28.
32. 32. 34. 46. 48. 61. 63. 65. 75. 79. 89. 102. 105. 111.
114. 124. 125. 156. 181. 181. 191. 198. 202. 208. 223. 272. 397. 643.
881.]
print(np.sort(sum_by_flag['Vis_flag'])[::-1])# 역정렬
C:\Users\chpark\OneDrive\My_Code\_Scratch
[881. 643. 397. 272. 223. 208. 202. 198. 191. 181. 181. 156. 125. 124.
114. 111. 105. 102. 89. 79. 75. 65. 63. 61. 48. 46. 34. 32.
32. 28. 27. 25. 22. 19. 14. 14. 13. 3. 1. 0. 0. 0.
0.]
아래는 사이트 별 빈도수 그림그리는 법
import matplotlib.pyplot as plt
%matplotlib inline
plt.figure(figsize=(28,12))
import plotnine as p9
p9.ggplot(data=df, mapping=p9.aes(x='Site_No', y='Vis_flag'))+ p9.geom_bar(stat='identity')