가장 아쉬운 점과 가장 뿌듯한 점이 동일한 프로젝트였다. 새로운 모델 (random forest)로 변경해 시도해본 것, 환불-구매 1:1 매칭을 찾아 제거하려고 시도해본 것 - 이 두 시도 모두 내가 스스로 밑바닥부터 가설을 세우고 구현해 검증까지 마쳤지만, 결과적으로 성능 향상을 이뤄낼 수 없었기 때문이다.
주 관심 분야는 Vision이지만, 역시 AI의 본토는 데이터분석이며 여전히 데이터를 이해하는 것이 얼마나 중요한 것인지 새삼 몸소 느껴볼 수 있는 경험이었다. 다양한 방식의 EDA와 Feature engineering을 실험으로 구성하고 결과를 확인하는 과정을 통해, 그동안 내가 데이터 자체보다 모델 구성에 너무 가중치를 두어 학습을 진행해왔다는 걸 알 수 있었다. 모델 학습을 잠시 멈추고, 나 자신의 학습에 대한 weight update가 필요한 시점인 것 같다.
Project2 Wrap up Report
Result
Task
Model & Hyperparameters
Approaches
Model selection & ensemble
EDA & Feature engineering
ETC
Lessons
Ideas might have been helpful
Thoughts