반응형

Study/네이버 부스트 캠프 ai tech 16

[네이버 부스트캠프 AI Tech 5기] 18주차 회고록 - 최종 1주차

지난주는 부스트캠프의 새로고침 데이로 한주간 방학을 가지게 되었다. 거제도 여행도 가고 게임도 하고 맛있는 것도 먹고 에너지를 충전할 수 있는 한주가 되었다. 이번주는 마지막 최종프로젝트를 팀원들과 오프라인으로 하기 위해 서울로 올라왔다. 올라온 만큼 성공적으로 프로젝트를 마무리할 것이다! 이번주 회고록은 새로운 양식으로 작성해보았다. 잘했던 것, 좋았던 것, 계속할 것 Offline Meeting. 확실히 서로 의견공유하고, 브레인스토밍 하는 업무는 Offline Meeting 효율이 훨씬 좋다. FastAPI 강의를 빠르게 듣고 전반적인 개념을 가져보다는 것이 좋았다. 각각 EDA를 진행하고 느낀점을 JIRA에 적어서 서로 공유할 수 있었음 멘토링을 통해 백엔드와 관련된 자료들을 받아 실습해볼 수 있..

[네이버 부스트캠프 AI Tech 5기] 16주차 회고록 - Movie 추천 대회 4주차 종료

Movie Recommendation 대회가 4주차를 마지막으로 끝이 났다. 최종 등수는 다소 아쉬웠지만 Recbole 라이브러리 구현 및 JIRA에 대해서 새롭게 배울 수 있었고, 최종프로젝트를 위한 와인 데이터 EDA 및 유저 스토리 고민 등 level2를 마무리하면서 level3를 위한 도약을 준비하는 한주였다. 다음주는 새로고침데이로 한주간 방학을 진행한다. 거제도 여행도 갔다오고 게임도 실컷하고 새로운 시작을 위한 준비도 하면서 새로고침 하고 올 것이다. Fact(사실 : 무슨 일이 있었나?) Recbole 라이브러리 Sequnece model과 Context model이 train/inference 모두 돌아가게 완성하였다. Recbole에 내장된 Hyperopt를 통해 하이퍼파라미터 튜닝을 ..

[네이버 부스트캠프 AI Tech 5기] 15주차 회고록 - Movie 추천 대회 3주차

수술 후 회복하면서 영화 추천 대회 3주차를 보냈다. Recbole 라이브러리를 구현하는 중인데 sequence 모델과 general 모델이 train까지는 돌아가는데 inference가 돌아가지 않아 말썽이다. 저번주에 못들었던 sequence 강의와 추천시스템 평가지표 강의를 수강한 한주였다. Fact(사실 : 무슨 일이 있었나?) Recbole 라이브러리 구현 추천시스템 sequence model(GRU4Rec, SASRec, BERT4Rec)에 대한 기초이론과 추천시스템 평가 기준(accuracy 외에도 diversity : 다양성 , serendipity : 우연성, novelty : 새로움 등등에 대해서 배웠다 최종프로젝트는 피드백을 바탕으로 유저플로우를 새롭게 구축하였고 유저가 처음에 웹에 ..

[네이버 부스트캠프 AI Tech 5기] 14주차 회고록 - Movie 추천 대회 2주차

영화 추천대회가 시작된지 2주차이다. Recbole 라이브러리를 이용해보자는 의견이 나왔고 내가 베이스라인 구현을 맡아서 코드를 완성해주었다. recbole을 그대로 가져와쓰면 되는줄 알았지만 라이브러리는 movielens 데이터를 explicit feedback 바탕으로 구현되어 있는데 movie 대회는 해당 데이터를 implicit feeback으로 활용하기에 그 구조를 바꿔서 적용하는데 애를 먹었다. 최종프로젝트도 크롤링을 끝내고 유저 플로우와 추천 메커니즘을 고민하기는 시간을 가졌다. 무엇보다도 몸이 아파서 수술을 했는데 회복하느라 고생했다 Fact(사실 : 무슨 일이 있었나?) Recbole 라이브러리 구현 context-aware recommendation 모델에 대한 이론 공부 → FM, D..

[네이버 부스트캠프 AI Tech 5기] 13주차 회고록 - Movie 추천 대회 시작

DKT 대회가 끝나자마자 Movie Recommendation 대회가 열렸다. 이번 대회도 4주 동안 진행되는데, 지난 대회 때 아쉬웠던 베이스라인 말고 다른 모델을 사용해보기, 남들이 똑같이 하는 대회 프로세스 말고 차별화된 실험을 해보기, 원활한 소통을 통해 팀원들과 실험하는 내용을 공유하기 등등 보다 개선된 대회를 하길 기대한다. 이제 최종 프로젝트하기 전 마지막 대회인데, 12등에서 7등을 해봤으니 7등에서 5등 이내로 드는 것이 개인적 목표이다. 최종 프로젝트 관련해서도 슬슬 데이터를 모으면서 시작 중인데, 아직은 구체화된 것이 없다 Fact(사실 : 무슨 일이 있었나?) Movie Recommendation 대회 시작(유저의 영화 시청이력이 있을때, 마지막 영화와 중간중간 시청했던 영화를 맞추..

[네이버 부스트캠프 AI Tech 5기] 12주차 회고록 - DKT 대회 종료

4주간의 DKT 대회가 끝났다. 마지막주에는 팀원들을 만나기 위해 서울로 올라왔다. 확실히 온라인으로 소통하는 것보다 오프라인이라 빠르게 의견을 공유하고 팀원들과 같이 진행할 실험들을 한번에 할 수 있었다. 하지만, 풀타임 집중해야해서 끝나고 나면 진이 쭈욱 빠지고 미팅장소까지 왔다갔다가 하는 시간이 아깝긴 했다. 그래도 목요일 대회가 끝나고 회식을 했는데 재밌었다. 대회동안 전체적인 협업과정이나 R&R, PM의 부재 등등 아쉬운 것도 많았지만, 피쳐엔지니어링 방법, Valid_set을 test_set과 비슷하게 하기, Shap, Sweep 등 다양한 실험을 해볼 수 있어서 얻은 것도 많은 대회였다. Fact(사실 : 무슨 일이 있었나?) 오프라인으로 카페에서 대회 마무리 Feature Engineeri..

[네이버 부스트캠프 AI Tech 5기] 11주차 회고록

DKT 대회를 진행한지 어느덧 3주차이다! 어느정도 모델의 성능이 고도화 됐지만 검증셋과 대회 리더보드에서의 성능차이가 많이 차이나는 편이다. 이를 해결할려고 많은 시도를 해보았지만 유의미하게 개선하지 못해서 아쉽다. 아직 한주가 남았고 이제는 단일 모델의 성능보단 팀 전체의 모델을 앙상블해서 좋은 성능을 이끌어보자. 무엇보다 SWEEP이랑 Github을 많이 사용해볼 수 있어서 좋았음 Fact(사실 : 무슨 일이 있었나?) DKT 대회에서 ELO 함수를 이용한 피쳐엔지니어링과 KFOLD를 통해 성능 향상을 이룸. LGBM에서 wandb를 돌아갈 수 있게 코드 구현 → 성호형이 다시 수정해줌(팀원 모두가 돌아갈 수 있게) 개인적인 실험으로 SHAP 라이브러리를 사용해봄 → 모델의 피쳐 설명력을 보여주는 ..

[네이버 부스트캠프 AI Tech 5기] 10주차 회고록

Level2 시작한지 2주차가 되었다. LGBM 모델을 베이스라인으로 EDA, Feature Engineering을 하느라 한주가 빠르게 지나갔다. 단순한 하나의 함수를 구현하는데 시간이 많이 소요되고 그만큼의 성능은 나오지 않는다. 그래도 계속해서 오르는 만큼 추가 피쳐를 만들어보고 GBM모델뿐만 아니라 딥러닝 모델도 사용해보도록 하자. 추가로 WADNB나 깃헙으로 시작했는데 아직은 미숙하지만 LEVEL1의 부족한 점을 채우고 있다는 것에 만족 중! Fact(사실 : 무슨 일이 있었나?) 팀원들마다 각자 공부하고 싶은 모델을 선택하고 모델 구조와 데이터로드, 코드분석까지 하기로 함 저번주에 얘기한 Fast API 스터디를 진행 오피스아워 시간에 금융 도메인의 추천시스템에 대해서 배울 수 있었음 두런두런..

[네이버 부스트캠프 AI Tech 5기] 9주차 회고록

8주차는 예비군으로 인하여 한주가 날라갔다.. 하지만 친구들과 다같이 예비군하면서 재밌었음! 9주차! Level2가 시작되었다!! 새로운 팀원들과 최종까지 함께 하게 되는데 많이 떨리기도 하지만 기대된다 level1에서 부족했던 점을 보완하여 성장할 수 있기를 바란다. 멘토님도 새롭게 배정 받았는데 해외 데이터 사이언티스트 현직자이시고 엄청나게 뛰어나신 분이다. 최근 들은 특강에서 코딩테스트와 CS,딥러닝 지식, 기술블로그, 이력서 등 취업에 관련된 내용을 많이 배우고 있다. 이제 부캠에서 배운 내용을 써먹을 수 있게 실전으로 다가가자 Fact(사실 : 무슨 일이 있었나?) 레벨2 대회 시작! DKT라는 딥러닝을 이용한 지식 추적 대회인데 사용자의 문제 풀이 이력을 통해 마지막 문제를 맞출 것인지 예측하..

[네이버 부스트캠프 AI Tech 5기] 7주차 회고록

프로젝트가 종료되었다. 최종 순위는 아쉽게 마무리했지만 그 과정에서 MLOps 사용, 깃헙이나 협업, 타임라인 구축, 빠른 실험 및 가설 검증 등 부족한 점에 대해서 알아낼 수 있었다. 다음 레벨2부터는 이러한 부족한 내용을 보완하는 식으로 발전해 나가고 최종프로젝트에서는 완벽한 프로세스를 구현해보자 Fact(사실 : 무슨 일이 있었나?) 추천시스템 기초 대회 2주차! 유저와 책 정보를 바탕으로 평점을 예측하는 것 오프라인 구인구팀 세션을 진행하면서 팀원들과 같이 대회를 진행 + 이후 저녁도 같이 먹음 전처리한 코드와 하이퍼파라미터 튜닝을 바탕으로 팀원들과 상의하며 성능을 올리기 위해서 다양한 실험을 진행 대회 마지막 날까지 하루종일 줌으로 다양한 모델에 대해서 앙상블을 진행하여 대회 리더보드에 제출 금..

반응형