ABOUT ME

-

Today
-
Yesterday
-
Total
-
  • 분류
    전공 서적/핸즈온 머신러닝 2018. 8. 23. 14:35
    1. 성능 측정
      1. 오차 행렬
        1. 오차 행렬의 행은 실제 클래스를 나타내고, 열은 예측한 클래스를 나타낸다.
        2. 정밀도
          1. 양성 예측의 정확도를 나타낸다.
        3. 재현율 (민감도, TPR(진짜 양성 비율))
          1. 분류기가 정확하게 감지한 양성 샘플의 비율

     

    1. 정밀도와 재현율
      1. F1 점수
        1. 정밀도와 재현율을 하나의 숫자로 만든
        2. F1 점수는 정밀도와 재현율의 조화 평균이다.
    2. 정밀도/재현율 트레이드오프
      1. 정밀도와 재현율 쪽을 추구할 경우 다른 쪽을 포기해야 하는
    3.  ROC 곡선
      1. 거짓 양성 비율(FPR) 대한 진짜 양성 비율(TPR) 곡선
      2. 곡선 아래의 면적(AUC) 측정하면 분류기들을 비교할 있다.
    1. 다중 분류
      1. 일대다(OvA) 전략
        1. 클래스별로 이진 분류기를 훈련시켜 분류기의 결정 점수 가장 높은 것을 클래스로 선택
      2. 일대일(OvO) 전략
        1. 클래스의 조합마다 이진 분류기를 훈련시켜 가장 많이 양성으로 분류된 클래스를 선택
        2. 분류기의 훈련에 전체 훈련 세트 구별할 클래스에 해당하는 샘플만 필요하다.
    2. 다중 레이블 분류
      1. 여러 개의 이진 레이블을 출력하는 분류 시스템
    3. 다중 출력 분류
      1. 다중 레이블 분류에서 레이블이 다중 클래스가 있도록 일반화
         


    '전공 서적 > 핸즈온 머신러닝' 카테고리의 다른 글

    결정 트리  (0) 2018.09.13
    서포트 벡터 머신  (0) 2018.09.12
    모델 훈련  (0) 2018.08.30
    머신러닝 프로젝트 처음부터 끝까지  (0) 2018.08.22
    한눈에 보는 머신러닝  (0) 2018.08.16

    댓글