본문 바로가기

ML,DL10

[머신러닝/딥러닝] 향후 판매량 예측 경진대회: 분석정리 및 시각화 이번 9장은 과거 판매 데이터를 기반으로 향후 판매량을 예측하는 경진대회에 참가한다. Predict Future Sales https://www.kaggle.com/competitions/competitive-data-science-predict-future-sales/overview/evaluation Predict Future Sales | Kaggle www.kaggle.com https://www.kaggle.com/code/dimitreoliveira/model-stacking-feature-engineering-and-eda/notebook Model stacking, feature engineering and EDA Explore and run machine learning code with.. 2022. 11. 19.
[머신러닝/딥러닝] 안전 운전자 예측 경진대회: 분석정리 및 시각화 이번 장에서는 실제 기업 데이터를 활용한 안전 운전자 예측 경진대회 문제를 풀어보았다. 경진대회명은 포르투 세구로 안전 운전자 예측 경진대회다. 보험회사에서는 사고를 낼 가능성이 낮은 안전운전자에게는 보험료를 적게 청구하고, 사고 가능성이 높은 난폭 운전자에게는 많은 보험료를 청구해야한다. 예측 모델이 부정확하다면 보험료를 잘못 부과하게 되어 고객 만족도와 회사 수익에 문제가 생긴다. 그러므로 이번 목표는 포르투 세구로 보험사에서 제공한 고객 데이터를 활용해서 운전자가 보험을 청구할 확률을 예측하는 것이다. 이 글에서는 모델을 만들기 전에 먼저 탐색적 데이터 분석으로 데이터를 살펴보고, 시각화를 통해서 모델링에 필요 없는 데이터를 찾아볼 것이다. Porto Seguro’s Safe Driver Predi.. 2022. 11. 7.
[머신러닝/딥러닝] 범주형 데이터 이진분류 경진대회: 분석정리 및 시각화 범주형 데이터를 활용해 이진부류를 하는 경진대회 문제를 풀어보았다. 다양한 범주형 데이터를 활용해 타깃값 1에 속할 확률을 예측하는 것이 목표이다. Categorical Feature Encoding Challenge https://www.kaggle.com/competitions/cat-in-the-dat/overview Categorical Feature Encoding Challenge | Kaggle www.kaggle.com https://www.kaggle.com/code/kabure/eda-feat-engineering-encode-conquer/notebook EDA & Feat Engineering - Encode & Conquer Explore and run machine learnin.. 2022. 10. 4.
[머신러닝/딥러닝] 피처 스케일링: min-max 정규화, 표준화 이번에는 피처스케일링과 그 방법 중 가장 많이 쓰이는 min-max 정규화와 표준화에 대해 정리해보았습니다.   피처 스케일링서로 다른 피처 값의 범위(최댓값 - 최솟값)가 일치하도록 조정하는 작업값의 범위가 데이터마다 다르면 모델 훈련이 제대로 안 될수도 있다 서로 다른 피처값의 범위란 어떤 의미인지 키(m)와 몸무게(kg)로 예를 들 수 있다. 이름키(m)몸무게(kg)옷 사이즈광일1.775L혜성1,555S덕수1.860?  이 데이터에서 덕수의 옷 사이즈를 예측한다고 하자.키와 몸무게를 더하는 방법을 사용할 수 있다. 광일: 1.7 + 75 = 76.7혜성: 1.5 + 55 = 56.5덕수: 1.8 + 60 = 61.8  덕수의 키와 몸무게 합은 혜성에 더 가깝기 때문에 머신러닝 모델은 덕수의 옷 사이.. 2022. 9. 19.