Peer session
Ground Rule
- 적극적으로 의견 개진 (다양한 아이디어 환영, 반대의견 환영)
- 적극적으로 질문 (이런것도 질문해도 되나도 그냥 전부 싹다)
- 상세하고 확실한 커뮤니케이션 지향 (‘이정도면 어련히 알아들었겠지’ X)
- 20시간 GPU 사용하기
- 서버 놀리지 않기 (자기 전에 돌려놓고 자기)
- 금요일마다 한번씩 wrap up 리포트, github 만들기
- 서로 “님”이라고 호칭하기
Github
전략
- 멘토님이 선정되면 캐글 솔루션 찾아서 멘토님 앞에서 발표하기
- 실험은 최대한 작고 빠른 모델로 하기
- 외부데이터도 고려하기
- augmentation어떤게 가능할지 확인
아이디어
- 수식인식기 web app (혹은 안드로이드 app)으로 serving하기!
- github (page) 등 무료로 열어놓을 수 있는 서버 조사 후 언제든 실행 가능하도록 오픈
간단한 일정
- 매주 금요일 오피스아워
- 5/24~5/28
- 5/31~6/4
- 6/7~6/11
- 6/8부터 줌 all day (10:30 ~ 19:00 막판에 야근!!!)
- 참여는 자유, 서버는 주고 가세요
- 6/15(화) 대회 마감
- 6/18(금) 네트워킹 발표
개인별로 할일
- 강의확인
- 데이터 확인(EDA)
- 일부만 봐도 엄청 다양하다…
- 6명이 10만 나눠서 1만 7천장씩 확인(너무 많음)
- 데이터 전처리 필요함: 가로 세로 길이를 확인하여 flip 할지 여부 판단
- 데이터 불균형 파악
- 자연 OCR이 어떻게 될지 대략적인 배경지식 쌓기
Reference