0 0 0

深入浅出强化学习:原理入门.epub

听见你哭泣
4天前 120
我用夸克网盘分享了「深入浅出强化学习:原理入门.epub」,点击链接即可保存。打开「夸克APP」在线查看,支持多种文档格式转换。
深入浅出强化学习:原理入门 作者: 郭宪/方勇纯 出版社: 电子工业出版社 出品方: 博文视点 出版年: 2018-1 页数: 256 定价: 79 装帧: 平装 丛书: 博文视点AI系列 ISBN: 9787121329180

内容简介

《深入浅出强化学习:原理入门》用通俗易懂的语言深入浅出地介绍了强化学习的基本原理,覆盖了传统的强化学习基本方法和当前炙手可热的深度强化学习方法。开篇从最基本的马尔科夫决策过程入手,将强化学习问题纳入到严谨的数学框架中,接着阐述了解决此类问题最基本的方法——动态规划方法,并从中总结出解决强化学习问题的基本思路:交互迭代策略评估和策略改善。基于这个思路,分别介绍了基于值函数的强化学习方法和基于直接策略搜索的强化学习方法。最后介绍了逆向强化学习方法和近年具有代表性、比较前沿的强化学习方法。 除了系统地介绍基本理论,书中还介绍了相应的数学基础和编程实例。因此,《深入浅出强化学习:原理入门》既适合零基础的人员入门学习、也适合相关科研人员作为研究参考。

网友热评

大海: 对于我这种小白来说,粗略了解到理论发展和框架,附带一定的例子实践 圣杯何在?: 真的很差。写的很混乱。用一些专业名词但是阐述的又非常口语化。不伦不类的感觉。而且公式推导就是四处抄的。 石人子: 拿这个入门显然是不妥当的,可以看看后面的三四篇,有一个还行的介绍。 钻石她怕: 从马尔科夫决策过程MDP,到决策/动作状态转移概率矩阵已知时的基于模型的动态规划方法,转移概率矩阵未知的基于无模型的强化学习方法。无论转移概率矩阵是否已知,都需要策略迭代算法/值迭代算法/策略搜索算法。就像强化学习(或增强学习)的名字暗示的那样,其中还包括bootstrapping算法。无模型的强化学习中的蒙特卡洛MC算法/时间差分TD算法。连续空间下的值函数逼近算法。顺带补充了一些统计/优化/gym/TensorFlow/Python/强化学习前沿等内容。好书推荐。 Raion: 强化学习,我是零基础,但这本书一点都不深入浅出,反而基本概念讲的不清不楚,公式推导也基本没有。才看了前两章就看不下去了,写的毫无逻辑可言。差评,根本对不住第一章作者吹下的牛皮…

深入浅出强化学习:原理入门.epub"网盘下载"

版权说明

1、本站不保存、不存储任何实质资源,以上二维码指向为网盘资源链接,其内容归对应版权方所有
2、如有侵犯版权的情况,请点击下面举报/反馈按钮反馈或发送邮件76556431@qq.com投诉说明情况
3、我们核实后将第一时间删除相关页面内容,谢谢理解和配合

这些人下载过 (12)
  • Winter.承諾
  • 貧血的吸血鬼
  • 红漫过了眼
  • 海棠泣血
  • 我给不了你的幸福
  • 国忧
  • 何必要那么多的借口
  • 清红造了个白
  • 毕竟爱过
  • 硬性
  • 凡间
  • 将笑意深藏
最新回复 (0)

    暂无评论

请先登录后发表评论!

返回
请先登录后发表评论!