[강화시스터즈 1기] 프로젝트 발표
프로젝트 마감 및 발표
요약
약 3개월 간 구현한 “강화학습을 이용한 지뢰찾기 문제 해결” 테스크를 발표하는 시간을 가졌습니다.
가장 고성능을 구현한 팀에게 돌아가는 상품 수여했고, 한학기 활동을 기념해 상장을 전달했습니다.
👩💻 팀 프로젝트
- 팀구성
지뢰마스터즈 | Agent | Environment |
---|---|---|
1팀 | 주민서 | 김도희 |
2팀 | 이정연 | 손주현 |
AI 폭탄 제거 부대 | Agent | Environment |
---|---|---|
1팀 | 변지은 | 이승연 |
2팀 | 이은나 | 김정은 |
발표 순서
- AI 폭탄 제거 부대 2팀 : 이은나, 김정은
- 지뢰마스터즈 2팀 : 이정연, 손주현
- 지뢰마스터즈 1팀 : 주민서, 김도희
- AI 폭탄 제거 부대 1팀 : 변지은, 이승연
- 동아리장 이지민
발표 정리
-
AI 폭탄 제거 부대 2팀 : 이은나, 김정은
지뢰찾기 환경과 에이전트를 직접 구현하고 학습을 진행했습니다. 아쉽게도 성능이 나오진 않았습니다. 🥹
-
지뢰마스터즈 2팀 : 이정연, 손주현
발표 시점까지는 성능이 나오지 않았으나, 성능을 향상을 위한 여러 가지 시도들을 발표했습니다.
발표 이후에도 성능을 향상시키기 위해 노력하고 있습니다. 😉
-
지뢰마스터즈 1팀 : 주민서, 김도희
정규화, DQN 구현, lr을 변경해 좋은 성능을 얻었습니다.
구현과정 발생했던 여러 오류들을 포기하지 않고 끈질기게 잡아내, 발표에 내용을 녹였습니다. -
AI 폭탄 제거 부대 1팀 : 변지은, 이승연
여러 팀들 중 가장 높은 성능의 모델을 만들었습니다! 행동을 규제하는 케이스와 푸는 케이스를 나누었고, 다양한 조건과 보상구조를 테스트했습니다.
-
동아리장 이지민
83-4% 성능을 지닌 모델을 구현했으며 다양한 state, 문제 분석을 진행했습니다.
상장 수여식
상장은 수료증 + 팀별 상으로 구성되어 있습니다. 팀별 상에는 보상 헌터 시스터, 최적화 마스터 시스터, 지뢰찾기 탐험가 시스터, 끈기의 패치노트 시스터가 있으며, 각 팀의 성격에 맞게 부여했습니다.
동아리 마무리
훌륭하고 열정적인 벗들과 함께라서 마무리할 수 있었습니다.🥰
멋진 추억을 만들어준 모든 강화인들에게 감사를 표합니다.