[강화시스터즈 1기/05주차/강화학습 세션] DEEP 강화학습 방법론

01 April 2024 - less than 1 min read time

Tags: 24-1

5주차 강화학습 세션

요약

딥러닝 개론(손주현 벗)과 class와 기초 파이토치(주민서 벗)를 주제로 개인 발표를 진행했습니다.
메인 세션에서는 테이블 형식 강화학습의 단점을 극복한 DEEP-강화학습 방법론을 공부했습니다.
기본적인 구현에 대한 이야기를 나누고, 프로젝트에 시작하기 앞서 대략적인 목표를 정했습니다.
구체적인 개인 발표 내용은 추후 [개념정리] 카테고리에서 확인하실 수 있습니다.

개인 발표

📗 딥러닝 개론 : 손주현 벗
📗 class와 파이토치 : 주민서 벗

딥러닝 개론 발표에서 딥러닝의 역사, 기본적인 구조, 방법론, 유명한 모델들을 소개해주셨습니다. 딥러닝 세션에서 열심히 갈고 닦은 보람이 느껴지는 발표였습니다. 🥰

class와 파이토치 발표는 pytorch의 대표적인 클래스들의 구조도, 기본 자료형도 모두 클래스라는 관점에서 진행되었습니다. 발표를 통해 빌트인 매소드(매직 매소드)에 대해 알 수 있었고, pytorch의 여러 class를 이해하는 기반을 마련해주셨습니다.

강화학습 세션

📗 Deep 강화학습 : DEEP SARSA, REINFORCEMENT Algorithm, Actor-Critic
🥅 프로젝트 토의

테이블 형식의 강화학습의 한계에서 DEEP 강화학습까지 영역을 확장시켰습니다. 가치 그래디언트의 Deep SARSA와 정책 그래디언트의 REINFORCEMENT Algorithm, 두 개가 합쳐진 Actor-Critic의 개념을 학습했습니다.

프로젝트 구현의 단계를 정했습니다. 지뢰찾기라는 단순한 테스크에서 어디까지 확장할 수 있을지 의견을 모았습니다.

Comments