개인 Project 진행 상황

  • RandomForest에서 threshold 실험

    • 300 (default) : 0.8428
    • 280 : 0.8429
    • 290 : 0.8430
  • Gradient Boosting (lgbm)으로 돌려봄

    • (threshold=290) 0.8552 (Rank 30)
  • word2vec을 이용해 description 특성을 다양하게 해석해 feature로 넣어줘봤지만, 모두 성능이 하락해 제외함.



Peer session

  • (아름님) 구매액 total threshold를 300에서 290으로 내렸더니 성능 향상.
    • (my) 300 이상 (레이블 1) 비율이 훨씬 적기 때문에, 레이블 0에 fit되는 경향을 완화시켜 주어서 향상한 듯.
  • (성익님) week별로 (총 99주) weight 주고 aggregation 후 성능 향상.