728x90
반응형
강화학습으로 가장 유명한 알파고가 있으며 알파고를 만든 회사인 deepmind에서 David Silver가 강화학습에 대해 강의한 자료를 제공하고 있다. 따라서 이 강의를 보면서 정리한 내용들을 앞으로 올려보도록 한다.
https://www.youtube.com/watch?v=2pWv7GOvuf0&list=PLqYmG7hTraZDM-OYHWgPebj2MfCFzFObQ
728x90
반응형
'Book > Reinforcement Learning' 카테고리의 다른 글
[RL]Lecture 5. Model-Free Control (0) | 2020.02.12 |
---|---|
[RL]Lecture 4. Model-Free Prediction (0) | 2020.02.05 |
[RL]Lecture 3. Planning by Dynamic Programming (1) | 2020.01.29 |
[RL]Lecture 2. Markov Decision Processes (0) | 2020.01.22 |
[RL] Lecture 1. Introduction to Reinforcement Learning (0) | 2020.01.15 |