박가방

[KTAIVLE] 미니 프로젝트 3차 진행 본문

활동/KTAIVLE

[KTAIVLE] 미니 프로젝트 3차 진행

박가방 2023. 3. 20. 10:03

개요

머신러닝 강의를 마치고, 이를 기반으로 미니프로젝트 3차를 진행하였다. 지금 까지 공부한 머신러닝은 다음과 같다.

 

우리는 수업 중에 배운 머신러닝 알고리즘들을 사용하여, 주어진 문제에 대해 예측할 수 있는 모델을 생성하여 비교하였다.

 

1. 장소

이번 미니프로젝트 장소는 정자동에 위치한 KT 분당 본사를 선정하였다. 

3일동안 각 팀원들이 자율적으로 참여하도록 하였다. 스터디룸도 고려해보았지만 6명과 6개의 노트북이 있다보니 너무 더워서, 그리고 돈이 들기에 분당 본사로 선정하였다.

1층으로 가면 안내데스크에 계신 직원 분께서 신분증과 출입증을 교환해주신다. 그 출입증을 받고, 프로젝트 장소로 이동하였다.

 

2. 진행 순서

진행 순서는 미션제로 이루어져 있으며 머신러닝에 대한 복습을 중점적으로 하는듯하다.

 

- 이번 미니 프로젝트는 PPT를 제작하지 않는다. 그러나 각자 역량 상승과 발전을 위해 PPT를 제작하였다.

1일차 - 데이터 분석

- 데이터를 탐색적으로 분석하여,  행동 분류에 영향도가 높은 상위 Feature를 도출

09 : 40 ~ 10 : 30 프로젝트 소개
10 : 40 ~ 11 : 30 개인별 프로젝트 수행 
11 : 40 ~ 12 : 30 리뷰
12 : 30 ~ 13 : 30 점심 시간
13 : 30 ~ 14 : 20 개인별 프로젝트 수행 
14 : 30 ~ 15 : 20 조별 프로젝트 수행 
15 : 20 ~ 16 : 20 조별 프로젝트 수행
16 : 30 ~ 17 : 10 1일차 리뷰

2일차 - 모델 튜닝

- 여러가지 머신러닝 알고리즘을 사용하여 적절한 알고리즘을 선정, 모델 튜닝을 통해 정확도를 개선

3일차 - 모델 검증

- 데이터를 활용하여 생성한 모델을 검증하고, 특정 행동분류에 대한 행동 추론

3. 분석 목적

미니프로젝트 3차의 목적은 머신러닝을 사용하여 웨어러블 기기 사용자의 행동을 파악, 유추하는 것이다.

4. 과정

과정에 대해 간단하게 나열해본다.

 4.1

 독립변수들이 종속변수에게 영향을 미친 순위를 조사하였다. 결론적으로 1위부터의 가중치 순위를 위와 같이 가시적으로 확인할 수 있었다.

4.2

- 각 box_plot 분석을 통해 특정 센서 데이터를 기반으로 행동을 유추할 수 있는지를 확인한다.

4.3

- sensor + agg(집계) 별 상위 중요도 20개를 시각화하였다.

 

- 모델링전 데이터에 대한 수집 & 분석 & 전처리를 진행하였다.

 

4.4 모델링 & 정확도

먼저 train set 과 validation set으로 데이터를 분리하여 데이터를 학습시켰고 ,

우리는 각 머신러닝 알고리즘 설정 & 교차검증 & 튜닝 & 평가 과정을 통해 가장 성능이 좋았던,

xgb_hpt, xgb_top 모델을 선정하여 test set으로 그 결과를 확인해볼 수 있었다.

따라서 센서데이터만 존재하고 실제 행동은 알 수 없는 데이터 셋에 우리의 모델을 통해 행동을 유추해볼 수 있었다.

 

5. 결론

 

이번 머신러닝 미니 프로젝트를 통해서 상당한 발전을 이루었다. 수업이 끝나고 내용을 복습하여도 아무래도 단기간이다보니 그 코드와 과정을 이해하기 어려웠는데 이번 KTAIVLE에서 미니프로젝트의 잘 짜여진 교본과 친절한 강사님의 설명 그리고 조원들과의 토의로 한층 더 발전한 모습을 확인할 수 있었다.

 

역시 잘 짜여진 교안과 교본이 KT AIVLE의 핵심인듯하다. 상당히 퀄리티가 높다