[강화시스터즈 1기/05주차/딥러닝 세션] CNN 및 컴퓨터 비전
4주차 추가 세션
요약
추가 세션 : 딥러닝 네 번째 세션을 진행했습니다.
이 세션은 자발적인 스터디로 운영진의 지도 하에 진행됩니다.
이론 스터디는 데덴찌로 조가 정해졌습니다! 은나-지은-정연 벗, 주현-승연-민서 벗이 조를 이루어 공부한 내용을 공유했습니다.
과제로 구현한 크롤링된 강아지 고양이 데이터 셋을 정제해 신경망에까지 물리는 코드를 리뷰했습니다.
대용량 데이터를 처리하는 효과적인 방법론들을 소개했고, map 계열 함수들을 소개해 코드의 효율성에 대해 이야기했습니다.
딥러닝 이론
- CNN
주로 이미지 처리에 사용되는 CNN의 기본적인 구조에 대해 공부했습니다.
- CNN의 학습 대상 : 필터
- flatten했을 때 fc layer의 노드 수 : output channelimage heightimage width
- 이미지 크기에 관여하는 CNN의 기능 : padding, stride, kernel size, pooling
- 이미지 외 데이터에서 CNN이 어떻게 사용될 수 있는가?
과제 코드 리뷰
- 크롤링된 강아지 고양이 이미지를 학습가능한 형태로 만들기 crop, resize, padding, resize+crop 과 같은 다양한 방법론으로 구현한 코드를 볼 수 있었습니다.
더하기
- 대용량 데이터 처리 공통적으로 이미지를 처리하는 것보다 gdrive에 있는 이미지를 꺼내는 것에서 문제가 발생했습니다. 이미지의 개수는 25000개 즈음 존재했는데, 1000개를 꺼내오는데도 막대한 시간이 걸려 대부분 소량의 데이터만 꺼내어 이미지 전처리를 진행했습니다. 이런 문제를 해결하기 위해 Process, Pool과 같은 병렬처리 기법과 map 계열 함수들을 소개했습니다. RAM 용량이 부족한 문제를 해결하기 위하여, 이미지의 크기를 줄여 load하는 지은 벗의 아이디어를 공유했습니다.