데이터인코딩1 [머신러닝/딥러닝] 데이터 인코딩(레이블, 원-핫) 데이터 인코딩에 대해 정리한 내용이다. 데이터 인코딩 머신러닝 모델은 문자 데이터를 인식하지 못하기 때문에 문자로 구성된 범주형 데이터는 숫자로 바꿔야 한다. 이미 숫자로 구성된 범주형 데이터도 모델 성능 향상을 위해 다른 숫자 데이터로 바꾸기도 한다. 1. 레이블 인코딩 (label encoding) 레이블 인코딩은 범주형 데이터를 숫자로 일대일 매핑해주는 인코딩 방식 범주형 데이터를 숫자로 치환 사이킷런의 LabelEncoder로 구현 다음은 사이킷런의 LabelEncoder로 레이블 인코딩을 적용해 과일 문자열 데이터를 숫자형으로 변환하는 코드다. from sklearn.preprocessing import LabelEncoder # 레이블 인코더 fruits = ['사과', '블루베리', '바나나.. 2022. 9. 19. 이전 1 다음