Peer session

Ground Rule

  • 적극적으로 의견 개진 (다양한 아이디어 환영, 반대의견 환영)
  • 적극적으로 질문 (이런것도 질문해도 되나도 그냥 전부 싹다)
  • 상세하고 확실한 커뮤니케이션 지향 (‘이정도면 어련히 알아들었겠지’ X)
  • 20시간 GPU 사용하기
  • 서버 놀리지 않기 (자기 전에 돌려놓고 자기)
  • 금요일마다 한번씩 wrap up 리포트, github 만들기
  • 서로 “님”이라고 호칭하기

Github

  • WiKi: 회의록 폴더
  • Connectnet github
  • Team
    • 김현우
    • 배철환
    • 서준배
    • 윤준호
    • 임기홍
    • 조호성

전략

  • 멘토님이 선정되면 캐글 솔루션 찾아서 멘토님 앞에서 발표하기
  • 실험은 최대한 작고 빠른 모델로 하기
  • 외부데이터도 고려하기
  • augmentation어떤게 가능할지 확인

아이디어

  • 수식인식기 web app (혹은 안드로이드 app)으로 serving하기!
    • github (page) 등 무료로 열어놓을 수 있는 서버 조사 후 언제든 실행 가능하도록 오픈

간단한 일정

  • 매주 금요일 오피스아워
  • 5/24~5/28
    • 수요일부터 베이스코드 공개
  • 5/31~6/4
  • 6/7~6/11
    • 6/8부터 줌 all day (10:30 ~ 19:00 막판에 야근!!!)
    • 참여는 자유, 서버는 주고 가세요
  • 6/15(화) 대회 마감
  • 6/18(금) 네트워킹 발표

개인별로 할일

  • 강의확인
  • 데이터 확인(EDA)
    • 일부만 봐도 엄청 다양하다…
    • 6명이 10만 나눠서 1만 7천장씩 확인(너무 많음)
    • 데이터 전처리 필요함: 가로 세로 길이를 확인하여 flip 할지 여부 판단
    • 데이터 불균형 파악
  • 자연 OCR이 어떻게 될지 대략적인 배경지식 쌓기
    • 논문 확인

Reference