본문 바로가기

ML.DL14

[ML경진대회] 범주형 데이터 이진분류-탐색적 데이터 분석(1) 책 7장을 실습한 내용입니다. 지난 글에서는 를 정리해보았다. 이번 글에서는 그 프로세스를 따라 실제 경진대회에 참가해볼 것이다! 들어가기 전에, 주피터 노트북에서 자주 사용하는 단축키들을 정리해보았다. 셀 실행: Ctrl+Enter / Shift+Enter 현재 셀 아래에 셀 추가: Esc, b 현재 셀 위에 셀 추가: Esc, a 현재 셀 삭제: Esc, d, d 현재 셀 잘라내기: Esc, x 잘라낸 셀 붙여넣기: Esc, v 마크다운 셀로 변환: Esc, m 코드 셀로 변환: Esc, y 1. 경진대회 이해 이번에 참가하는 '범주형 데이터 이진분류 경진대회'는 2019년 8월부터 12월까지 진행됐고 총 1,338팀이 참가했다. 이 대회의 목표는 범주형 피처 23개를 활용해 해당 데이터가 타깃값 1.. 2022. 9. 30.
[머신러닝 딥러닝 문제해결 전략] 문제해결 프로세스 및 체크리스트 3장 정리 3장의 목표는 머신러닝과 딥러닝, 두 가지 성격의 대회를 정복하는 일반적인 프로세스를 알아보고, 프로세스의 각 단계에서 확인해야 할 체크리스트를 정리하는 것이다. 머신러닝 프로세스와 체크리스트는 이 책의 2부 대회에서, 딥러닝 프로세스와 체크리스트는 3부 대회에서 활용할 수 있다. 이 책 전반에서 반복 숙달할 것이기 때문에, 지금은 전체적인 흐름을 기억해두면 좋을 것이다! 1. 머신러닝 문제해결 프로세스 대회에 따라 세부 내용은 조금씩 다를 수 있지만 큰 흐름과 구조는 대부분 비슷하다. 표로 정리해보자! ① 문제(경진대회) 이해 문제 이해 경진대회의 배경과 목적을 이해해야 한다. 어떤 데이터를 활용해서 어떤 값을 예측해야 하는지, 회귀 문제인지 분류 문제인지, 어떻게 접근해야 하는지 등 다양한.. 2022. 9. 12.