본문 바로가기

ML.DL14

[B&S 유저들의 이탈 시점 예측] 문파(길드) 데이터 엔지니어링 1. 문파 데이터의 문제점 길드 아이디에 속한 아이디의 리스트가 저장되어 있어, 각 유저의 길드 정보를 바로 파악하기 어려웠다. 2. MySQL Workbench guild_member_acc_id에 저장되어 있던 아이디들을 콤마(,)를 기준으로 나눠 각 다른 열(m1, m2... m78)에 구분하여 저장되도록 데이터를 수정했다. MySQL Workbench에서 bns DB를 만들고, train_guild 데이터와 train_label 데이터를 삽입해 테이블을 생성했다. 길드원 아이디 열들을 UNION으로 결합하고, GROUP BY 문으로 길드 아이디를 기준으로 그룹화한 뒤 COUNT 함수로 각 길드 아이디별로 행의 수를 계산해서 길드원의 수를 member_count 열에 저장했다. SELECT guil.. 2023. 11. 20.
[B&S 유저들의 이탈 시점 예측] 탐색적 데이터 분석 1. 대회 문제 주제 Blade&Soul 유저들의 게임 활동 정보를 이용하여 향후 게임 서비스에서 이탈하는 시점 예측하기 데이터 규모 Train 데이터: (계정 아이디 기준) 10만 명의 게임 활동 데이터 Test 데이터: (계정 아이디 기준) 4만 명의 게임 활동 데이터 레이블 및 이탈 기준 이탈 기준: 4주 이상 게임 미접속 제공 데이터 시점 이후 12주 동안의 접속 이력으로 판단 레이블: 총 4개 클래스로 구분 Week: 1주 이내 이탈 Month: 2~4주 이내 이탈 2Month: 5~8주 이내 이탈 Retained: 잔존 Train 데이터의 10만 명의 레이블은 클래스별로 각각 25000개씩 들어 있음. 2. 분석할 데이터 activity (활동 정보) cnt_dt (해당 주에 접속한 일수), .. 2023. 10. 29.
[B&S 유저들의 이탈 시점 예측] 데이터의 이해 1. 대회 문제 주제 Blade&Soul 유저들의 게임 활동 정보를 이용하여 향후 게임 서비스에서 이탈하는 시점 예측하기 데이터 규모 학습 데이터: (계정 아이디 기준) 10만 명의 게임 활동 데이터 평가 데이터: (계정 아이디 기준) 4만 명의 게임 활동 데이터 레이블 및 이탈 기준 이탈 기준: 4주 이상 게임 미접속 제공 데이터 시점 이후 12주 동안의 접속 이력으로 판단 레이블: 총 4개 클래스로 구분 Week: 1주 이내 이탈 Month: 2~4주 이내 이탈 2Month: 5~8주 이내 이탈 Retained: 잔존 데이터의 종류 주요 활동 정보: 게임 내에서 수행하는 주요 활동량을 유저별로 1주일 단위로 집계 결제 정보: 사용자가 게임 활동을 위해 결제한 정보를 1주일 단위로 집계 사회 관계 정보.. 2023. 10. 6.
[리니지 이탈 예측 모형 개발] 데이터 탐색 및 시각화 1. 에 대한 이해 리마스터 후 높은 사양을 필요로 해서 노트북으로는 게임을 구동할 수 없고 PC방을 가야 해서, PC 리니지의 핵심 요소와 운영 방식 및 시스템이 가장 흡사한 리니지M을 플레이하려고 했다. 그런데 앱의 문제인지 아이폰과 패드에서 실행 오류가 발생해 제대로 플레이하지 못했다(앱 리뷰에도 대부분 같은 불만 사항이었음). 그래서 리니지 관련 자료, 게임 유튜브, 논문들을 조사했다. 1998년 9월 1일부터 현재까지도 서비스 중인 엔씨소프트의 장수 1세대 MMORPG 온라인 게임이다. 모바일 버전 발매, 리마스터 등을 통해 서비스를 확장하였다. 간단한 마우스와 키보드 단축키 조작으로 플레이할 수 있어 주로 중장년층에게 많은 사랑을 받고 있다. MMORPG에서는 게임 내에서 수행한 사용자의 다양.. 2023. 9. 25.