OOF예측1 [ML경진대회] 안전 운전자 예측-성능 개선(1) 8장을 참고해 실습한 내용입니다. 저번 글에서는 '범주형 데이터 이진분류' 경진대회에 참가해서 탐색적 데이터 분석을 하는 글을 블로깅했었는데요. 이번에는 "Porto Seguro's Safe Driver Prediction" 경진대회에 참가해서 탐색적 데이터 분석의 다음 단계를 진행했습니다. 앞 단계에서 선별한 피처들을 제거해 베이스라인 모델을 만들고, 성능 개선을 실습하여 블로깅해 보겠습니다! 1. 베이스라인 모델 베이스라인 모델로 파이썬 래퍼 LightGBM을 사용할 건데요. LightGBM은 마이크로소프트가 개발한 모델로, 빠르면서 성능이 좋아 캐글에서 가장 많이 사용하는 머신러닝 모델입니다. 먼저 훈련, 테스트, 제출 샘플 데이터를 불러오겠습니다. import pandas as pd #데이터 경로.. 2022. 11. 21. 이전 1 다음