부스팅 AdaBoost, gradient boosting, XGBoost

머신러닝

부스팅 AdaBoost, gradient boosting, XGBoost

주영 🐱 2022. 12. 9. 12:41

728x90

부스팅은 약한 학습기를 여러 개 연결하여 강한 학습기를 만드는 앙상블 방법이다. 부스팅 방법 중 가장 유명한 것은 에이다부스팅과 그래디언트 부스팅(XGBoost, LightGBM)이다.

에이다부스트

이전 예측기를 보완하는 방식은 이적 모델이 과소적합했던 훈련샘플의 가중치를 더 높이는 것이다. 이렇게 하면 새로운 예측기는 이전에 학습이 잘 안됐던 샘플에 더 맞춰지게 된다. 에이다부스트는 이 방식을 사용한다.

예를 들어 에이다부스트 분류기를 만들 때는 먼저 알고리즘의 기반이 되는 첫 번째 분류기(예; 결정 트리)를 훈련세트에서 훈련시키고 예측을 만든다. 그 다음에 알고리즘이 장못 분류한 훈련샘플의 가중치를 상대적으로 높인다. 두 번째 분류기는 업데이트됨 가중치로 훈련세트에서 훈련하고 다시 예측한다. 또 가중치를 업데이트한다...반복...

지정된 예측기 수에 도달하거나 완벽한 예측기가 만들어지면 중지된다.

사이킷런의 AdaBoostRegressor, AdaBoostClassifier를 사용한다.

그래디언트 부스팅

에이다부스트처럼 앙상블에 이전까지 오차를 보정하도록 례측기를 순차적으로 추가하지만, 샘플의 가중치를 업데이트하는 에이다부스트와 달리 이전 예측기가 만든 잔여 오차(residual error)에 새로운 예측기를 학습시킨다.

사이킷런의 GradientboostingRegressor, GradientboostingClassifier

XGBoost

최적화된 그래디언트 부스팅, 자동 조기 종료 옵션도 설정할 수 있다.

import xgboost

xg_reg=xgboost.XGBRegressor()
xg_reg.fit(X_train, y_train, eval_set=[(X_val, y_val)], early_stopping_rounds=2)
y_pred = xg_reg.predict(X_val)

저작자표시 비영리 변경금지

'머신러닝' 카테고리의 다른 글

앙상블학습과 배깅 (0)	2022.12.09
python numpy, pandas 라이브러리란, 차이 (0)	2022.12.08
비지도학습 - 군집, k-means, 실루엣점수 사이킷런 (0)	2022.12.07
머신러닝 분류 성능 측정 (0)	2022.12.06
차원 축소, PCA python 사이킷런 (0)	2022.12.05

현재글부스팅 AdaBoost, gradient boosting, XGBoost

TIL

딥러닝, 오픽AL, 오픽IH, 안드로이드개발, 오블완, 배당투자계산기, 1인개발자, 오픽 AL, 1인개발, 오픽기출, 오픽모의고사, 1인개발마케팅, 티스토리챌린지, 오픽, 오픽1주, 오픽 모의테스트, 마케팅, 특수문자이모티콘, 오픽공부법, 배당투자,

Today :
Yesterday :

일	월	화	수	목	금	토
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30

내 블로그 - 관리자 홈 전환	`Q` `Q`
새 글 쓰기	`W` `W`

글 수정 (권한 있는 경우)	`E` `E`
댓글 영역으로 이동	`C` `C`

이 페이지의 URL 복사	`S` `S`
맨 위로 이동	`T` `T`
티스토리 홈 이동	`H` `H`
단축키 안내	`Shift` + `/` `⇧` + `/`

TIL