본문 바로가기
반응형

연구 노트/R Python76

AI PCA :: (Fog) no difference before/after applying PCA on fog data 안동 안개 데이터35차원 --> 2차원   PCA 적용 전후, 정확도 차이 없음. 똑같음kernel PCA 적용 전후, 정확도 차이 없음. 똑같음 2024. 5. 10.
Error in install.packages : Updating loaded packages 백신 프로그램이 임시 저장 폴더에서 이동을 금지시킨 것이 원인 백신을 잠시 끄고 실행시키면 정상적으로 설치가 진행됨. 참조: https://m.blog.naver.com/jjy0501/221300556843 R 패키지 설치 및 업데이트 오류 (1) R 패키지를 설치하거나 업데이트 하다보면 여러 가지 문제가 생기는 경우들이 있습니다. 이 ... blog.naver.com 2023. 9. 4.
unable to access index for repository https://mran.microsoft.com/snapshot/ 쌩뚱맞은 microsoft.com 에러? 에러 발생 > install.packages("ggplot2") Warning in install.packages : unable to access index for repository https://mran.microsoft.com/snapshot/2020-07-16/src/contrib: URL 'https://mran.microsoft.com/snapshot/2020-07-16/src/contrib/PACKAGES'를 열 수 없습니다 WARNING: Rtools is required to build R packages but is not currently installed. Please download and install the appropriate ver.. 2023. 9. 4.
파이썬 :: 모델링 시간 측정 (코드) XGBOOST 작업 중 모델링 시간 측정 코드 # ## 4.4.4 시간 측정 (115) # from sklearn.ensemble import GradientBoostingClassifier # from xgboost import XGBClassifier # from sklearn.metrics import accuracy_score # import time # start = time.time() # df.info() # end=time.time() # elapsed = end - start # print('\n실행시간: ' + str(elapsed) + '초') # ## 4.4.5 속도비교(152) # %timeit -n 100 -r 3 sum(np.square(range(10000))) # %%tim.. 2022. 10. 6.
코드 :: 안개 발생 일수, 시간 계산 보호되어 있는 글 입니다. 2022. 9. 23.
TypeError: 'int' object is not iterable 에러 TypeError: 'int' object is not iterable 코드 n_row = len(din['Phen_fog'])-1 print(n_row) for i in n_row: if i == 1: print(i) 원인 for i in n_row: 에서 n_row 가 list 이어야 하는데, 여기서는 정수(int)로만 되어 있음. 다른 언어에서는 for i in (initial, end , increment) 형태로 되나, Python 에서는 배열 전체가 list 로 들어가 있어야 함. 해결 아래와 같이, din['Phen_fog'] 로 수정하면 에러 해결 for i in din['Phen_fog']: if i == 1: print(i) 2022. 9. 23.
머신러닝 :: 이진분류 평가 지표 1. 정확도 실제와 에측이 얼마나 일치하는가로 모델의 성능을 평가함 연속형 자료의 경우 예측값의 일치도를 의미. 정확도가 평가의 대부분임 범주형 자료의 경우 예측 범주의 일치정도를 의미. 정확도 뿐 아니라 그 이면을 세세하게 검토해야 함. 2. 오차행렬(confusion matrix) 오차 행렬은 이진 또는 다중 범주형 레이블의 하위 범주는 세부적으로 살펴보면서 실제 범주와 예측 범주의 일치 혹은 오류를 파악할 수 있는 결과임 0 1 0 90 10 1 20 80 음성예측 양성예측 음성 클래스 TN FP 양성 클래스 FN TP 정확도 = (90+80)/200 = 85% 이진 분류의 평가 지표 3. 정밀도 양성 예측의 정확도를 의미 4. 재현율 분류기가 정확하게 예측한 양성 샘플의 비율 민감도 또는 진짜 양.. 2022. 7. 29.
머신러닝 :: 의사결정나무 의사 결정 나무 다양한 의사결정 결로와 결과를 놓고 나무 구조를 이용하여 설명하는 것 질문을 던지면서 대상에 접근해 가는 스무고개 놀이와 유사 질문은 조건을 이분법적으로 제시하면서 진행한다. 지도학습 기법으로서 변수의 영역을 게속적으로 분할해 나가면서 집단을 몇개의 소집단으로 분류하거나 예측하는 기법 맨 위쪽에 뿌리 노드로 시작해서 아래로 가면서 가지를 치고 마지막까지 진행한다. 처음에 어떤 분류기준을 선택할 것인가를 결정하는 것은 여러 알고리즘이 있다. 예를 들어, 프로 야구선수중에서 자유게약 선수(Free Agaent: FA)의 연봉을 의사결정 나무로 간단히 그려보자. 의사결저과정에서 나무를 가지고 목표와상황과 상호 관련성을 나타내어 최종 결정을 내린다. 의사결정 규칙을 나물 구조로 도식화 하여 관심.. 2022. 7. 29.
Avoid Overfitting By Early Stopping With XGBoost In Python https://machinelearningmastery.com/avoid-overfitting-by-early-stopping-with-xgboost-in-python/ Avoid Overfitting By Early Stopping With XGBoost In Python Overfitting is a problem with sophisticated non-linear learning algorithms like gradient boosting. In this post you will discover how you can use early stopping to limit overfitting with XGBoost in Python. After reading this post, you will know.. 2022. 7. 28.
728x90