.
第 1 章 吃角子老虎機問題第 2 章 馬可夫決策過程第 3 章 貝爾曼方程式第 4 章 動態規劃法第 5 章 蒙地卡羅法第 6 章 TD 法第 7 章 類神經網路與 Q 學習第 8 章 DQN第 9 章 策略梯度法第 10 章 進階內容附錄 A 離線策略蒙地卡羅法附錄 B n 步 TD 法附錄 C 理解 Double DQN附錄 D 驗證策略梯度法
金融風險管理的機器學習應用|使用Python 機器學習模擬應用|將合成資料運用於AI 建構機器學習管道|運用TensorFlow實現模型生命週期自動化