koos808

배깅(Bagging)과 부스팅(Boosting) 본문

Statistics

배깅(Bagging)과 부스팅(Boosting)

koos808 2020. 7. 5. 17:58
728x90
반응형
  • 배깅과 부스팅

    • Boosting은 Bagging과 유사하게 초기 샘플 데이터를 조작하여 다수의 분류기를 생성하는 기법 중 하나지만 가장 큰 차이는 순차적(Sequential)방법이라는 것입니다.

    • 앞서 살펴본 bagging의 경우 각각의 분류기들이 학습시에 상호 영향을 주지않고 학습이 끝난 다음 그 결과를 종합하는 기법이었다면, Boosting은 이전 분류기의 학습 결과를 토대로 다음 분류기의 학습 데이터의 샘플가중치를 조정해 학습을 진행하는 방법입니다.

  • 장단점

    • 이러한 이유로 이전 학습의 결과가 다음학습에 영향을 주게 되고 부스팅 라운드를 진행할수록 m차원 공간의 분류경계선(Borderline)상의 데이터의 가중치가 증가하게 되는 결과를 가져오게 됩니다.

    • 일반적으로 부스팅 알고리즘은 의사결정나무(Decision Tree)모형을 주로 사용하는 것으로 알려져 있고 과적합(Over fitting)에 강한 장점을 갖고 있습니다. 하지만 다른 앙상블 모형과 마찬가지로 분류결과에 대한 해석이 불가능하다는 단점을 갖고 있습니다.

참조 : http://www.mysas.co.kr/SAS_tiptech/j_eminer.asp?b_no=7108&gotopage=4&con=subject&keyword=&cmd=content&bd_no=29&gubun=

 

728x90
반응형
Comments