728x90
반응형
1. 정확도
실제와 에측이 얼마나 일치하는가로 모델의 성능을 평가함
연속형 자료의 경우
예측값의 일치도를 의미.
정확도가 평가의 대부분임
범주형 자료의 경우
예측 범주의 일치정도를 의미.
정확도 뿐 아니라 그 이면을 세세하게 검토해야 함.
2. 오차행렬(confusion matrix)
오차 행렬은 이진 또는 다중 범주형 레이블의 하위 범주는 세부적으로 살펴보면서 실제 범주와 예측 범주의 일치 혹은 오류를 파악할 수 있는 결과임
0 | 1 | |
0 | 90 | 10 |
1 | 20 | 80 |
음성예측 | 양성예측 | |
음성 클래스 | TN | FP |
양성 클래스 | FN | TP |
정확도 = (90+80)/200 = 85%
이진 분류의 평가 지표
3. 정밀도
양성 예측의 정확도를 의미
4. 재현율
분류기가 정확하게 예측한 양성 샘플의 비율
민감도 또는 진짜 양성 비율이라고도 함.
암진단/범죄여부/불법영상 진단 등
5. f-score
정밀도와 재현율의 조화평균으로 두 지표를 종합적으로 파악
정밀도 = TP/(TP + FP)
재현율 = TP/(TP+FN)
f-score = 2/((1/정밀도) + (1/재현율))
728x90
반응형