[강화시스터즈 1기] 4주차 이미지 데이터 문제해결

4주차 추가 세션

요약

추가 세션 : 딥러닝 세 번째 세션을 진행했습니다.

이 세션은 자발적인 스터디로 운영진의 지도 하에 진행됩니다.

이론 스터디는 묵빠 내기로 조가 정해졌습니다! 승연-은나-정연 벗, 지은-주현 벗(컴공즈)이 조를 이루어 공부한 내용을 공유했습니다.

저번주 과제로 주어진 비지도 학습으로 군집을 만든 후, 모델 학습하기 테스크를 완성한 벗들의 발표를 듣고 구현이 막혔던 벗들의 코드를 리뷰했습니다.

잘 정제되어 있는 CIFAR 데이터 셋이 아닌, 인터넷에서 강아지 고양이 사진을 크롤링했을 때 학습시키는 방법론에 대해 토의했습니다. 다양한 의견이 나왔고, 그 생각을 바탕으로 실제 구현하는 테스크를 진행했습니다.

딥러닝 이론

기본적이지만, 딥러닝에서 너무나 중요한 학습 방법론과 문제에 대해 공부했습니다. 지은 벗께서 추가적으로 K-폴드 교차검증 방법의 정의와 장점, 승연 벗께서 BATCH의 크기에 따른 효과와 장단점을, 주현 벗께서 BATCH와 러닝레이트의 관계 + 주로 사용하는 BATCH 크기 규칙을 설명해주셨습니다.

과제 코드 리뷰

정연, 승연 벗께서 코드를 완성해 구현한 코드에 대해 발표하는 시간을 가졌습니다. 집단지성으로 다양한 비지도 학습을 볼 수 있으면 좋겠다고 생각해 클러스터링 기법을 지정해주지 않았더니 두 벗 모두 K-Means 기법을 사용하셨습니다. 🤣 정연 벗께서는 2개의 군집으로, 승연 벗께서는 군집을 2,8개로 나누어 분석을 해주셨고 군집 별로 시각화를 해주셨습니다.

주현 벗의 코드에서 오류를 찾고, 관련한 개념을 다시 복습하는 시간을 가졌습니다.

코드 구현

padding, crop, 부분 크롭 같은 다양한 아이디어가 나왔습니다. 토의를 바탕으로 구현 아이디어를 구체화시켰고, gdrive에 있는 이미지를 꺼내 아이디어를 적용한 이미지를 뱉는 Dataset을 구현했습니다. 기존에 사용했던 pickle 파일과 달리, 여러 문제가 있어 끝까지 구현할 수 없었기에 과제로 테스크를 마무리 짓기로 했습니다.

핵심 내용

  Train Valid Test
학습 대상 O X X
학습 코드 내부에서 사용 O O X



Comments