ABOUT ME

-

Today
-
Yesterday
-
Total
-
  • 결정 트리
    전공 서적/핸즈온 머신러닝 2018. 9. 13. 23:43
    1. 예측하기
      1. 노드의 모든 샘플이 같은 클래스에 속해 있다면 노드를 순수(gini=0)하다고 한다.
      2. 지니 불순도
    2. 클래스 확률 추정
      1. 결정 트리는 샘플이 특정 클래스 k 속할 확률을 추정할 수도 있다.
    3. CART 훈련 알고리즘
      1. 훈련 세트를 하나의 특성 k 임계값 t_k 사용해 개의 서브셋으로 나눈다.

     k t_k가장 순수한 서브셋으로 나눌 있는 값을 찾아 사용한다.

    서브셋을 성공적으로 둘로 나누었다면 같은 방식을 반복한다.
    과정은 최대 깊이가 되면 중지하거나, 불순도를 줄이는 분할을 찾을 없을 멈추게 된다.

    1. 분류에 대한 CART 비용함수
    2. 최적의 트리를 찾는 알고리즘의 소요 시간 : O(exp(m))
    1. 회귀
      1. 노드에서 클래스를 예측하는 대신 어떤 값을 예측한다.

    리프 노드에 있는 훈련 샘플의 평균 타깃 값이 예측 값이 된다.

    1. 개의 결정 트리 회귀 모델의 예측
    2. 회귀에서 CART 알고리즘은 평균제곱오차를 최소화하도록 분할한다.
    1. 불안정성
      1. 결정 트리는 계단 모양의 결정 경계를 만든다.
        때문에, 훈련 세트의 회전에 민감하다.
      2. 훈련 데이터를 좋은 방향으로 회전시키는 PCA 기법을 사용해 문제를 해결할 있다.
      3. 훈련 세트의 회전에 민감한 결정트리

    '전공 서적 > 핸즈온 머신러닝' 카테고리의 다른 글

    차원 축소  (0) 2018.09.25
    앙상블 학습과 랜덤 포레스트  (0) 2018.09.23
    서포트 벡터 머신  (0) 2018.09.12
    모델 훈련  (0) 2018.08.30
    분류  (0) 2018.08.23

    댓글