Study/네이버 부스트 캠프 ai tech

[네이버 부스트캠프 AI Tech 5기] 11주차 회고록

motti 2023. 5. 23. 08:56
반응형

DKT 대회를 진행한지 어느덧 3주차이다! 어느정도 모델의 성능이 고도화 됐지만 검증셋과 대회 리더보드에서의 성능차이가 많이 차이나는 편이다. 이를 해결할려고 많은 시도를 해보았지만 유의미하게 개선하지 못해서 아쉽다. 아직 한주가 남았고 이제는 단일 모델의 성능보단 팀 전체의 모델을 앙상블해서 좋은 성능을 이끌어보자. 무엇보다 SWEEP이랑 Github을 많이 사용해볼 수 있어서 좋았음

Fact(사실 : 무슨 일이 있었나?)

  • DKT 대회에서 ELO 함수를 이용한 피쳐엔지니어링과 KFOLD를 통해 성능 향상을 이룸.
  • LGBM에서 wandb를 돌아갈 수 있게 코드 구현 → 성호형이 다시 수정해줌(팀원 모두가 돌아갈 수 있게)
  • 개인적인 실험으로 SHAP 라이브러리를 사용해봄 → 모델의 피쳐 설명력을 보여주는 시각화 함수
  • DKT 대회에서 유저와 문제유형 사이의 Cluster 변수 생성
  • 부캠에서 세미 미라클 모닝 시작 → 매일 아침 7시에 일어나서 기상인증과 활동내용 인증
  • 피쳐엔지니어링한 것을 딥러닝 모델에 추가
  • 강의를 통해 추천시스템의 이론을 벗어난 현업에선 어떻게 적용하는지 배움
  • 멘토링을 통해 멘토님의 취업기와 이력서 팁을 배울 수 있었음. 덕분에 이력서를 작성(아직 수정필요)

Feeling(느낌: 무슨 느낌이 들었나?)

  • 뭔가 정신없이 지나간 느낌 → 이것저것 많이 한 것 같은데 어떻게 했는지 정리를 잘 안해 놓은 것 같음. 초반에는 노션에 많이 기록했지만 갈수록 기록을 안하게 됐음
  • 깃허브의 pr을 할때 작은 단위로 했던 작업들을 계속해서 commit해야 할 듯. merge할때까지 기다리다가 괜히 더 꼬이는 느낌
  • 세미 미라클 모닝으로 아침에 일찍 일어나서 매우 알차지만 아직은 효율적으로 보내지 못하는 듯 함

Finding(배운점 : 어떤 인사이트를 얻었나?)

  • 협업을 위해 깃헙을 자주 사용하면서 생각보다 conflict 나는 경우가 많았음 → 새로운 팀의 첫번째 현업이라 그런 것도 있는듯 → 깃 convention을 정립해 나가면서 2번쨰 프로젝트와 최종프로젝트에선 보다 나은 협업을 기대함
  • 이력서 작성을 해보면서 아직 내가 했던 경험들을 면접관들에게 잘 보이게 적는 법이 부족한듯. 팀원, 멘토님과 피드백하면서 더 나아질 수 있길 기대함
  • 다양한 실험을 진행할때, 정리의 필요성을 배울 수 있었음
    • 내가 했던 실험을 간단한 글로 노션에 적고 공유하기
    • 서버에서 했던 실험을 다른사람들이 보기 좋게 파일명이나 주석, 제목등을 잘 정리하기(나도 헷갈릴 정도)
    • wandb에서 실험할때 어떤 모델과 파라미터를 사용했는지 기록하기

Future action(향후 행동)

  • 내가 했던 것에 대해 기록 잘하기!
  • 깃허브 작은 단위로 commit하고 push하기
  • 아침에 일찍 씻고 일찍 활동하기(코테)
  • 팀원과 같이 소통하면서 하나의 모델 만들어보기
  • 레벨2의 첫번째 프로젝트에 대해서 팀과 많이 소통하고 랩업리포트로 아쉬운 점 기록하기 → 두번째 프로젝트에 반영하기

Feedback(피드백)

  • 건강관리!
반응형