[강화시스터즈 1기/05주차/강화학습 세션] DEEP 강화학습 방법론

5주차 강화학습 세션

요약

개인 발표

딥러닝 개론 발표에서 딥러닝의 역사, 기본적인 구조, 방법론, 유명한 모델들을 소개해주셨습니다. 딥러닝 세션에서 열심히 갈고 닦은 보람이 느껴지는 발표였습니다. 🥰

class와 파이토치 발표는 pytorch의 대표적인 클래스들의 구조도, 기본 자료형도 모두 클래스라는 관점에서 진행되었습니다. 발표를 통해 빌트인 매소드(매직 매소드)에 대해 알 수 있었고, pytorch의 여러 class를 이해하는 기반을 마련해주셨습니다.

강화학습 세션

테이블 형식의 강화학습의 한계에서 DEEP 강화학습까지 영역을 확장시켰습니다. 가치 그래디언트의 Deep SARSA와 정책 그래디언트의 REINFORCEMENT Algorithm, 두 개가 합쳐진 Actor-Critic의 개념을 학습했습니다.

프로젝트 구현의 단계를 정했습니다. 지뢰찾기라는 단순한 테스크에서 어디까지 확장할 수 있을지 의견을 모았습니다.




Comments