728x90
반응형

1. 정확도

실제와 에측이 얼마나 일치하는가로 모델의 성능을 평가함

연속형 자료의 경우

예측값의 일치도를 의미.

정확도가 평가의 대부분임

범주형 자료의 경우

예측 범주의 일치정도를 의미.

정확도 뿐 아니라 그 이면을 세세하게 검토해야 함. 

 

2. 오차행렬(confusion matrix)

오차 행렬은 이진 또는 다중 범주형 레이블의 하위 범주는 세부적으로 살펴보면서 실제 범주와 예측 범주의 일치 혹은 오류를 파악할 수 있는 결과임

 

 

 

  0 1
0 90 10
1 20 80

 

  음성예측 양성예측
음성 클래스 TN FP
양성 클래스 FN TP

 

 

정확도 = (90+80)/200 = 85%

 

이진 분류의 평가 지표

3. 정밀도

양성 예측의 정확도를 의미

 

4. 재현율

분류기가 정확하게 예측한 양성 샘플의 비율

민감도 또는 진짜 양성 비율이라고도 함. 

암진단/범죄여부/불법영상 진단 등

 

5. f-score

정밀도와 재현율의 조화평균으로 두 지표를 종합적으로 파악

 

정밀도 = TP/(TP + FP)

재현율 = TP/(TP+FN)

f-score = 2/((1/정밀도) + (1/재현율))

728x90
반응형

+ Recent posts