-
분류전공 서적/핸즈온 머신러닝 2018. 8. 23. 14:35
- 성능 측정
- 오차 행렬
- 오차 행렬의 행은 실제 클래스를 나타내고, 열은 예측한 클래스를 나타낸다.
- 정밀도
- 양성 예측의 정확도를 나타낸다.
- 재현율 (민감도, TPR(진짜 양성 비율))
- 분류기가 정확하게 감지한 양성 샘플의 비율
- 정밀도와 재현율
- F1 점수
- 정밀도와 재현율을 하나의 숫자로 만든 것
- F1 점수는 정밀도와 재현율의 조화 평균이다.
- 정밀도/재현율 트레이드오프
- 정밀도와 재현율 중 한 쪽을 추구할 경우 다른 쪽을 포기해야 하는 것
- ROC 곡선
- 거짓 양성 비율(FPR)에 대한 진짜 양성 비율(TPR)의 곡선
- 곡선 아래의 면적(AUC)를 측정하면 분류기들을 비교할 수 있다.
- 다중 분류
- 일대다(OvA) 전략
- 클래스별로 이진 분류기를 훈련시켜 각 분류기의 결정 점수 중 가장 높은 것을 클래스로 선택
- 일대일(OvO) 전략
- 각 클래스의 조합마다 이진 분류기를 훈련시켜 가장 많이 양성으로 분류된 클래스를 선택
- 각 분류기의 훈련에 전체 훈련 세트 중 구별할 두 클래스에 해당하는 샘플만 필요하다.
- 다중 레이블 분류
- 여러 개의 이진 레이블을 출력하는 분류 시스템
- 다중 출력 분류
- 다중 레이블 분류에서 한 레이블이 다중 클래스가 될 수 있도록 일반화 한 것
'전공 서적 > 핸즈온 머신러닝' 카테고리의 다른 글
결정 트리 (0) 2018.09.13 서포트 벡터 머신 (0) 2018.09.12 모델 훈련 (0) 2018.08.30 머신러닝 프로젝트 처음부터 끝까지 (0) 2018.08.22 한눈에 보는 머신러닝 (0) 2018.08.16 댓글