[강화시스터즈 2기/07주차/강화학습세션] DQN, DDQN 구현
7주차 강화학습 세션
시험 기간 중에 진행된 세션으로 가볍게 진행했습니다.
요약
- 시니어 : 작은 지뢰찾기 환경을 설정해 이를 푸는 DQN, DDQN 알고리즘을 구현했습니다.
-
운영진이 구현한 환경에 맞는 에이전트 코드를 작성했기에, 다같이 운영진 환경 코드를 보고 이해하는 시간을 가졌습니다.
- 주니어 : 간단한 레버 환경을 구현하고, DQN 로직을 구현해 학습했습니다.
-
state를 표현하는 다양한 방법에 대해 고민했고, env에 기본이 되는 step, render, reset 매서드의 구조와 환경과 에이전트 간의 상호작용에 대해 학습했습니다.
- 원만한 학습을 위해 다양한 제반 코드를 구현했습니다.