분류 모델 성능 평가 지표 (Confusion Matrix)

2024. 4. 2. 17:30·Data Analysis

분류 모델에 대한 성능을 평가할 때에는 여러 방법이 있지만, 대표적으로 정확도(Accuracy), 정밀도(Precision), 재현도(Recall), F1 score가 있다. 

 

1. Confusion Matrix (오차행렬)

  Confusion Matrix란 Training을 통한 Prediction 성능을 측정하기 위해 예측값과 실제값을 비교하기 위한 표이다.

여기서 ACTUAL VALUES는 실제값, PREDICTIVE VALUES는 예측값을 의미하며, T는 True, F는 False, P는 Positive, N은 Negative를 의미한다. 즉, TP, TN은 실제값과 맞게 예측한 부분이며, FP, FN은 실제값과 다르게 예측한 부분을 의미한다.

 

2. Accuracy (정확도)

Accuracy란 전체 중 모델이 바르게 분류한 비율을 말한다.

Confusion Matrix에서 대각선 부분이다.

 

3. Precision (정밀도)

Precision이란 모델이 Positive라 분류한 것 중 실제값이 Positive인 비율을 말한다.

Confusion Matrix에서 열방향에 해당하는 부분이다.

 

4. Recall (재현도)

Recall이란 실제값이 Positive인 것 중 모델이 Positive라 분류한 비율을 말한다.

Confusion Matrix에서 행방향에 해당하는 부분이다.

 

 

5. F1 score

F1 score란 정밀도와 재현도의 조화평균이다.

 

 

데이터가 불균형할 때, 정확도가 아닌 F1 score를 사용한다.

 

 

참조

분류 모델 성능 평가 지표 - Confusion Matrix란? :: 정확도(Accuracy), 정밀도(Precision), 재현도(Recall), F1 Score (tistory.com)

 

분류 모델 성능 평가 지표 - Confusion Matrix란? :: 정확도(Accuracy), 정밀도(Precision), 재현도(Recall), F1 Sc

분류 모델 성능 평가 지표 Linear 모델에 대해서는 R-Square, MSE 등 으로 모델의 성능을 평가한다.그렇다면 분류 모델에 대해서는 모델의 성능을 어떻게 평가할 수 있을까? 여러가지 방법이 있지만,

leedakyeong.tistory.com

 

'Data Analysis' 카테고리의 다른 글

[데이터 분석] Train, Validation, Test Set / train_test_split 모듈  (0) 2024.03.27
박스플롯 (Boxplot) 이란 ?  (1) 2024.03.20
[데이터 분석] LabelEncoding, fillna, inplace 옵션  (1) 2024.03.13
[데이터 분석] 데이터 시각화 Seaborn 라이브러리  (0) 2024.03.10
[데이터 분석] 영화 관객수 예측  (0) 2024.03.07
'Data Analysis' 카테고리의 다른 글
  • [데이터 분석] Train, Validation, Test Set / train_test_split 모듈
  • 박스플롯 (Boxplot) 이란 ?
  • [데이터 분석] LabelEncoding, fillna, inplace 옵션
  • [데이터 분석] 데이터 시각화 Seaborn 라이브러리
seulll
seulll
개인 공부 블로그입니다.
  • seulll
    seulll
    seulll
  • 전체
    오늘
    어제
  • Seuli's Github
    • 분류 전체보기 (405) N
      • Coding Test (262)
        • Programmers (165)
        • Baekjoon (95)
      • Data Structures & Algorithm.. (15)
      • Development & Projects (20)
        • Python (5)
        • Java (15)
        • Android (5)
        • AI (6)
        • Unity (3)
        • API (5)
      • OS (5)
      • DB | SQL (10) N
      • Network (8)
      • Data Analysis (14)
      • Study | etc (22)
  • 블로그 메뉴

    • 홈
    • 태그
    • 글쓰기
    • 설정
  • 공지사항

  • 인기 글

  • 태그

    2 x n 타일링
    API
    웹크롤링
    confusion matrix
    백엔드 개발자 역량
    Boxplot
    asterisk
    Greedy
    데이터분석
    그리디 알고리즘
    프로그래머스
    solving environment
    train_test_split
    kakao map api
    카카오맵 api
    박스플롯
    바다코끼리
    코딩테스트
    대입 표현식
    Python
    프렌즈4블록
    파이썬
    오블완
    오차행렬
    백엔드
    카카오맵
    티스토리챌린지
    모델 성능 평가
    야근 지수
    백엔드 개발자
  • 최근 댓글

  • hELLO· Designed By정상우.v4.10.0
seulll
분류 모델 성능 평가 지표 (Confusion Matrix)
상단으로

티스토리툴바