Deep Reinforcement Learning with its Application to Optimization

From Course@DGIST
Jump to navigation Jump to search
Deep Reinforcement Learning with its Application to Optimization
제안자
자문교원 이두석
연도 2017
타입 A형 과제
코스 장영실
매칭여부
참여학생수
소개동영상

제안 배경

과제 목표

알파고에 사용된 Deep Reinforcement Learning 알고리즘을 이용하여,TSP(traveling salesman problem) 등의 최적화 문제 풀이에 이용한다.

과제 내용

□ Deep Reinforcement Learning 방법론에 대한 검토

  • Reinforcement Learning(강화학습)에 대한 이해: Markov Decision Process, Discounted Future Reward, Q-Learning 등
  • Deep Q Network
  • Deep Q-learning Algorithm
  • 알파고 알고리즘 이해하기

□ Optimization 풀이에 적용

  • TSP(traveling salesman problem) 등의 complexity가 높은 optimization 문제의 Reinforcement Learning 문제로의 구성
  • 성능 비교

참고자료

희망학생