AskUp 답변
SimpleImputer
는 scikit-learn 라이브러리의 누락된 값을 다루기 위한 클래스 중 하나입니다. 이 클래스는 누락된 값을 다른 값으로 대체하는 데 사용됩니다.
SimpleImputer
를 사용하려면, 우선 누락된 값을 대체할 값을 지정해야 합니다. 이 값은 strategy
매개변수로 지정할 수 있으며, 다음 중 하나를 선택할 수 있습니다.
mean
: 평균값으로 대체합니다.median
: 중앙값으로 대체합니다.most_frequent
: 가장 빈번한 값으로 대체합니다.constant
: 지정된 값으로 대체합니다.
예를 들어, 다음과 같이 SimpleImputer
를 사용하여 누락된 값을 평균값으로 대체할 수 있습니다.
from sklearn.impute import SimpleImputer
import numpy as np
X = np.array([[1, 2], [np.nan, 3], [7, 6]])
imputer = SimpleImputer(strategy='mean')
X_imputed = imputer.fit_transform(X)
print(X_imputed)
위 코드에서는 X
라는 배열에서 누락된 값을 평균값으로 대체하여 X_imputed
라는 새로운 배열을 생성합니다. SimpleImputer(strategy='mean')
에서 strategy
매개변수를 mean
으로 지정하여 누락된 값을 평균값으로 대체하도록 설정했습니다. fit_transform()
메서드는 누락된 값을 대체한 결과를 반환합니다.
'오답노트' 카테고리의 다른 글
Notebook 환경에서 Weights & Biases 로그인하기 (0) | 2023.06.06 |
---|---|
Linux 터미널 명령어 동시 실행 (0) | 2023.05.11 |
Python argparse 간단 정리 (0) | 2023.05.03 |
pip 패키지 매니저 (0) | 2023.04.24 |
Windows에서 venv 가상환경 생성, 활성화, 비활성화, 제거 (0) | 2023.04.24 |