.
第二版前言第一版前言符號摘要第1章 導論Part I 表格式解決方法第2章 多搖臂式拉霸機第3章 有限馬可夫決策過程第4章 動態規劃第5章 蒙地卡羅方法第6章 時序差分學習第7章 n 步自助法第8章 表格式方法的規劃和學習Part II 近似解決方法第9章 on-policy 預測的近似方法第10章 on-policy 控制的近似方法第11章 *off-policy 的近似方法第12章 資格痕跡第13章 策略梯度方法Part III 深入觀察第14章 心理學第15章 神經科學第16章 應用和案例研究第17章 前瞻技術參考資料與文獻
深度學習 圖解AI|機器學習和深度學習的技術與原理 實戰人工智慧之深度強化學習|使用PyTorch x Python