Deep Reinforcement Learning with its Application to Optimization
Jump to navigation
Jump to search
Deep Reinforcement Learning with its Application to Optimization | |
---|---|
제안자 | |
자문교원 | 이두석 |
연도 | 2017 |
분류 | |
타입 | A형 과제 |
코스 | 장영실 |
매칭여부 | |
참여학생수 | |
소개동영상 |
제안 배경
과제 목표
알파고에 사용된 Deep Reinforcement Learning 알고리즘을 이용하여,TSP(traveling salesman problem) 등의 최적화 문제 풀이에 이용한다.
과제 내용
□ Deep Reinforcement Learning 방법론에 대한 검토
- Reinforcement Learning(강화학습)에 대한 이해: Markov Decision Process, Discounted Future Reward, Q-Learning 등
- Deep Q Network
- Deep Q-learning Algorithm
- 알파고 알고리즘 이해하기
□ Optimization 풀이에 적용
- TSP(traveling salesman problem) 등의 complexity가 높은 optimization 문제의 Reinforcement Learning 문제로의 구성
- 성능 비교