반응형
Feature 을 선택하는 많은 기준이 있겠지만 가장 처음 기본적인 방식은 다음과같다.
랜덤으로 생성된 feature을 포함하여 학습을 시키고 해당 feature보다 importance가 낮은 feature들을 제외시키는 것이다. 해당 방법을 사용하면 학습시간을 단축시키는 방법이 될것이다.
그림 출처:https://mljar.com/automated-machine-learning/feature-selection/
반응형
'통계학 > 데이터분석' 카테고리의 다른 글
feature engineering2 (0) | 2024.02.04 |
---|---|
히스토그램과 KDE(ViolinPlot)의 차이점 (1) | 2024.02.03 |
Feature Engineering (0) | 2024.02.03 |
데이터 결측치 처리(Data Imputation) (0) | 2024.01.23 |
xgboost 와 random forest,LGBM, CatBoost 특징과 차이점 (0) | 2024.01.08 |