본문 바로가기

머신러닝8

[머신러닝/딥러닝] 흉부 엑스선 기반 폐렴 진단: 베이스라인 모델과 성능개선 https://gongboogi.tistory.com/14 [머신러닝/딥러닝] 흉부 엑스선 기반 폐렴 진단: 분석정리 및 시각화 드디어! 마지막 장으로 이번에는 경진대회에 참여하지 않고 캐글러가 공유한 데이터셋으로 모델링 연습을 실습해보았다 이번 데이터셋에서는 흉부 엑스선 이미지가 나오는데, 이 이미지들을 gongboogi.tistory.com 저번 글에서 흉부 엑스선 이미지 데이터셋을 살펴보고 시각화해보았다. 이번에는 베이스라인 모델을 만들고 성능개선을 진행해보았다. 베이스라인 모델링 때 훈련과 예측 단계를 함수로 묶어서 성능 개선 때 재활용할 것이고, efficientnet의 여러 버전을 시도한다. 1. 베이스라인 모델: 시드값 고정 및 GPU 장비 설정 시드값 고정 import torch # 파이토.. 2023. 2. 13.
[머신러닝/딥러닝] 흉부 엑스선 기반 폐렴 진단: 분석정리 및 시각화 드디어! 마지막 장으로 이번에는 경진대회에 참여하지 않고 캐글러가 공유한 데이터셋으로 모델링 연습을 실습해보았다 이번 데이터셋에서는 흉부 엑스선 이미지가 나오는데, 이 이미지들을 보고 정상인의 엑스선인지, 폐렴에 걸린 사람의 엑스선인지 판별하는 모델을 만들어보며 훈련과 예측 단계를 함수로 묶어 활용하는 방법을 학습한다. 경지대회가 아니기 때문에 결과를 제출할 수 없고 정해진 평가 지표도 없다. 그래서 원하는 지표를 사용하면 되는데, 이번에는 정확도, F1 점수를 사용한다. 두 평가지표를 구하려면 예측을 확률이 아닌 이산값(양성:1 또는 음성:0) 기본적으로 예측하는 확률을 이용해 타깃 예측값을 이산값으로 바꿀 수 있다. 데이터셋은 다음과 같이 제공되어있다. ▶ train: 훈련 데이터 - NORMAL: .. 2023. 2. 12.
[머신러닝/딥러닝] 향후 판매량 예측 경진대회: 분석정리 및 시각화 이번 9장은 과거 판매 데이터를 기반으로 향후 판매량을 예측하는 경진대회에 참가한다. Predict Future Sales https://www.kaggle.com/competitions/competitive-data-science-predict-future-sales/overview/evaluation Predict Future Sales | Kaggle www.kaggle.com https://www.kaggle.com/code/dimitreoliveira/model-stacking-feature-engineering-and-eda/notebook Model stacking, feature engineering and EDA Explore and run machine learning code with.. 2022. 11. 19.
[머신러닝/딥러닝] 안전 운전자 예측 경진대회: 분석정리 및 시각화 이번 장에서는 실제 기업 데이터를 활용한 안전 운전자 예측 경진대회 문제를 풀어보았다. 경진대회명은 포르투 세구로 안전 운전자 예측 경진대회다. 보험회사에서는 사고를 낼 가능성이 낮은 안전운전자에게는 보험료를 적게 청구하고, 사고 가능성이 높은 난폭 운전자에게는 많은 보험료를 청구해야한다. 예측 모델이 부정확하다면 보험료를 잘못 부과하게 되어 고객 만족도와 회사 수익에 문제가 생긴다. 그러므로 이번 목표는 포르투 세구로 보험사에서 제공한 고객 데이터를 활용해서 운전자가 보험을 청구할 확률을 예측하는 것이다. 이 글에서는 모델을 만들기 전에 먼저 탐색적 데이터 분석으로 데이터를 살펴보고, 시각화를 통해서 모델링에 필요 없는 데이터를 찾아볼 것이다. Porto Seguro’s Safe Driver Predi.. 2022. 11. 7.