분류 모델에 대한 성능을 평가할 때에는 여러 방법이 있지만, 대표적으로 정확도(Accuracy), 정밀도(Precision), 재현도(Recall), F1 score가 있다.
1. Confusion Matrix (오차행렬)
Confusion Matrix란 Training을 통한 Prediction 성능을 측정하기 위해 예측값과 실제값을 비교하기 위한 표이다.
여기서 ACTUAL VALUES는 실제값, PREDICTIVE VALUES는 예측값을 의미하며, T는 True, F는 False, P는 Positive, N은 Negative를 의미한다. 즉, TP, TN은 실제값과 맞게 예측한 부분이며, FP, FN은 실제값과 다르게 예측한 부분을 의미한다.
2. Accuracy (정확도)
Accuracy란 전체 중 모델이 바르게 분류한 비율을 말한다.
Confusion Matrix에서 대각선 부분이다.
3. Precision (정밀도)
Precision이란 모델이 Positive라 분류한 것 중 실제값이 Positive인 비율을 말한다.
Confusion Matrix에서 열방향에 해당하는 부분이다.
4. Recall (재현도)
Recall이란 실제값이 Positive인 것 중 모델이 Positive라 분류한 비율을 말한다.
Confusion Matrix에서 행방향에 해당하는 부분이다.
5. F1 score
F1 score란 정밀도와 재현도의 조화평균이다.
데이터가 불균형할 때, 정확도가 아닌 F1 score를 사용한다.
참조
분류 모델 성능 평가 지표 - Confusion Matrix란? :: 정확도(Accuracy), 정밀도(Precision), 재현도(Recall), F1 Sc
분류 모델 성능 평가 지표 Linear 모델에 대해서는 R-Square, MSE 등 으로 모델의 성능을 평가한다.그렇다면 분류 모델에 대해서는 모델의 성능을 어떻게 평가할 수 있을까? 여러가지 방법이 있지만,
leedakyeong.tistory.com
'데이터 분석' 카테고리의 다른 글
[데이터 분석] Train, Validation, Test Set / train_test_split 모듈 (0) | 2024.03.27 |
---|---|
박스플롯 (Boxplot) 이란 ? (0) | 2024.03.20 |
[데이터 분석] LabelEncoding, fillna, inplace 옵션 (1) | 2024.03.13 |
[데이터 분석] 데이터 시각화 Seaborn 라이브러리 (0) | 2024.03.10 |
[데이터 분석] 영화 관객수 예측 (0) | 2024.03.07 |