일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | 7 |
8 | 9 | 10 | 11 | 12 | 13 | 14 |
15 | 16 | 17 | 18 | 19 | 20 | 21 |
22 | 23 | 24 | 25 | 26 | 27 | 28 |
29 | 30 | 31 |
Tags
- ORACLE SQL NVL
- ORACLE 상위 행 추출
- 리눅스 저장 용량 확인
- 파이썬 테마
- Cudnn 버전 확인
- 파이썬 이미지 라벨 저장
- 신용평가 Fraud
- 회수모형
- jupyter notebook PDF
- linux 폴더 용량 확인
- Python Numpy
- ORACLE 상위 N개 추출
- SQL NULL값 처리
- 딥러닝
- python pandas
- ORACLE NULL값 처리
- CSS Fraud Score
- 파이썬 이미지 리스트 변환
- 행동평점
- 주피터노트북 테마 변경
- python image load
- SQL NVL
- linux 폴더 크기 확인
- jupyter notebook 테마 변경
- 신용평가 부정사용 평점
- 파이썬 이미지 불러오기
- 딥러닝 제대로 시작하기
- 신청평점
- python image list
- 주식 데이터 수집
Archives
- Today
- Total
koos808
배깅(Bagging)과 부스팅(Boosting) 본문
728x90
반응형
-
배깅과 부스팅
-
Boosting은 Bagging과 유사하게 초기 샘플 데이터를 조작하여 다수의 분류기를 생성하는 기법 중 하나지만 가장 큰 차이는 순차적(Sequential)방법이라는 것입니다.
-
앞서 살펴본 bagging의 경우 각각의 분류기들이 학습시에 상호 영향을 주지않고 학습이 끝난 다음 그 결과를 종합하는 기법이었다면, Boosting은 이전 분류기의 학습 결과를 토대로 다음 분류기의 학습 데이터의 샘플가중치를 조정해 학습을 진행하는 방법입니다.
-
-
장단점
-
이러한 이유로 이전 학습의 결과가 다음학습에 영향을 주게 되고 부스팅 라운드를 진행할수록 m차원 공간의 분류경계선(Borderline)상의 데이터의 가중치가 증가하게 되는 결과를 가져오게 됩니다.
-
일반적으로 부스팅 알고리즘은 의사결정나무(Decision Tree)모형을 주로 사용하는 것으로 알려져 있고 과적합(Over fitting)에 강한 장점을 갖고 있습니다. 하지만 다른 앙상블 모형과 마찬가지로 분류결과에 대한 해석이 불가능하다는 단점을 갖고 있습니다.
-
728x90
반응형
'Statistics' 카테고리의 다른 글
성능평가지표, 모델 평가 방법 Python Code (0) | 2020.09.28 |
---|---|
코사인 유사도(cosine similarity) + python 코드 (0) | 2020.09.25 |
1종 오류와 2종 오류 (0) | 2020.07.05 |
P-value 정의와 이해 (0) | 2020.07.05 |
신뢰구간(Confidence Interval) (0) | 2020.07.05 |
Comments