본문 바로가기
연구 노트/R Python

머신러닝 :: 이진분류 평가 지표

by Dr. STEAM 2022. 7. 29.
반응형

1. 정확도

실제와 에측이 얼마나 일치하는가로 모델의 성능을 평가함

연속형 자료의 경우

예측값의 일치도를 의미.

정확도가 평가의 대부분임

범주형 자료의 경우

예측 범주의 일치정도를 의미.

정확도 뿐 아니라 그 이면을 세세하게 검토해야 함. 

 

2. 오차행렬(confusion matrix)

오차 행렬은 이진 또는 다중 범주형 레이블의 하위 범주는 세부적으로 살펴보면서 실제 범주와 예측 범주의 일치 혹은 오류를 파악할 수 있는 결과임

 

 

 

  0 1
0 90 10
1 20 80

 

  음성예측 양성예측
음성 클래스 TN FP
양성 클래스 FN TP

 

 

정확도 = (90+80)/200 = 85%

 

이진 분류의 평가 지표

3. 정밀도

양성 예측의 정확도를 의미

 

4. 재현율

분류기가 정확하게 예측한 양성 샘플의 비율

민감도 또는 진짜 양성 비율이라고도 함. 

암진단/범죄여부/불법영상 진단 등

 

5. f-score

정밀도와 재현율의 조화평균으로 두 지표를 종합적으로 파악

 

정밀도 = TP/(TP + FP)

재현율 = TP/(TP+FN)

f-score = 2/((1/정밀도) + (1/재현율))

728x90
반응형