ABOUT ME

-

Today
-
Yesterday
-
Total
-
  • Ensemble & Bootstrap & Bagging & Boosting 간단정리
    data-science-summary/summary 2020. 9. 20. 17:02
    반응형

    Ensemble & Bootstrap & Bagging & Boosting

    Ensemble

    여러 모델들을 결합하여 사용하면 Single 모델 보다 더 좋은 성능을 얻을 수 있다는 아이디어

    높은 bias 로 인한 underfitting 과 높은 Variance로 인한 Overfitting 의 문제를 일종의 중간값으로 맞출수 있어 Overfitting피함 가능

    동일한 학습 알고리즘을 사용한 모델을 결합하면 앙상블 / 서로 다른 학습 모델을 결합하여 새로운 모델을 결합하면 Stacking 이라고 함

    Bootstrap

    중복을 허용하여 샘플 n개를 뽑는것

    Bagging

    Bagging(Bootstrap Aggregating) => 샘플을 여러번 뽑은 뒤 각 모델을 학습시켜 결과를 집계(Aggregating) 후 투표(voting)하여 가장 투표를 많이 받은 예측값 선택

    => 복원 랜덤 샘플링하여 병렬적으로 모델 학습 후 집계하여 모델 생성 => 각 모델들 독립

    RandomForest => Decision Tree 여러개 말그대로 나무 많은 숲

    Boosting

    Boosting => 맞추기 어려운 문제에 초점. => 오답에 높은 가중치를 주어 오답에 집중 => but, 이상치 있으면 이거에 초점 맞춰서 이상치에 취약

    복원 램덤 샘플링을 하지만 가중치를 부여하여 순차적으로 학습을 시킴 => 이전 모델에 영향 받음

    AdaBoost, GradientBoost, XGBoost

    반응형

    'data-science-summary > summary' 카테고리의 다른 글

    AdaBoost in python  (0) 2020.09.20
    Random Forest in python  (0) 2020.09.20
    Decision Tree in python  (0) 2020.09.20
    binary vs multi class 차이 간단 정리  (0) 2020.09.20
    SVM (Support Vector Machine) in python  (0) 2020.09.20

    댓글

Designed by Tistory.