[강화시스터즈 2기/03주차/강화학습세션] 다이나믹 프로그래밍, min-max, alpha-beta
3주차 강화학습 세션
요약
- 동아리 깃을 활용하기 위해 개인 repo에 동아리 repo를 fork하고, 커밋 이후 pull-request를 실행했습니다.
- 커밋한 코드를 바탕으로 코드 리뷰를 진행했습니다.
- MDP 문제를 해결하는 방법인 다이나믹 프로그래밍에 대해 공부했습니다.
- 듀얼 플레이어 상황 게임 의사결정에 사용되는 알고리즘인 min-max를 학습하고, 효율을 높이는 알파-베타 가지치기 기법을 학습했습니다.
개인 발표
- 📗 다이나믹 프로그래밍 : 안서연 벗
- 📗 Min-Max : 이승연 벗
☝️ 제목을 누르면 글로 이동합니다.
코멘트
과제가 많았는데, 잘 공부하고 구현한 모든 부원 여러분 수고하셨습니다. 앞으로 계속해서 강화학습 개념 공부와 함께 코딩을 많이 하게 될텐데, 깃을 잘 활용해보며 익숙해지면 좋을 것 같습니다. 지금 프로젝트를 하는데도 편하고 나중에 팀 프로젝트를 진행할 때도 수월할거예요! 이번 과제도 열심히 해주시고, 다음주에 뵙겠습니다 😊
사진