0 0 0

白话强化学习与PyTorch.epub

小裙摆
6天前 140
我用夸克网盘分享了「白话强化学习与PyTorch.epub」,点击链接即可保存。打开「夸克APP」在线查看,支持多种文档格式转换。
白话强化学习与PyTorch 作者: 高扬 著 出版社: 电子工业出版社 出品方: 博文视点 出版年: 2019-9 页数: 384页 定价: 99.00元 装帧: 平装 丛书: 博文视点AI系列 ISBN: 9787121367472

内容简介

《白话强化学习与PyTorch》以“平民”的起点,从“零”开始,基于PyTorch框架,介绍深度学习和强化学习的技术与技巧,逐层铺垫,营造良好的带入感和亲近感,把学习曲线拉平,使得没有学过微积分等高级理论的程序员一样能够读得懂、学得会。同时,本书配合漫画插图来调节阅读气氛,并对每个原理都进行了对比讲解和实例说明。 《白话强化学习与PyTorch》适合对深度学习和强化学习感兴趣的技术人员、希望对深度学习和强化学习进行入门了解的技术人员及深度学习和强化学习领域的初级从业人员阅读。

作者简介

高扬,金山办公软件人工智能组技术负责人,历任欢聚时代人工智能算法专家,金山软件西山居大数据架构师等职。重庆工商大学研究生导师,电子工业出版社博文视点大数据技术图书专家委员会专家委员,有多年海外工作经验。有多部白话系列大数据与机器学习相关著作。 叶振斌,现任网易游戏伏羲人工智能实验室高级深度学习研发工程师。多年从事机器学习,特别是强化学习智能算法的研究及开发工作。拥有丰富的软件开发经验,丰富的人工智能算法训练平台开发经验。于2014年获东北大学软件工程专业学士学位,2017年获重庆大学计算机科学与技术专业硕士学位。

网友热评

一个大袁: 拿到扫了一眼,像是东拼西凑的一本书。不如看博客。退了! 浮沉水上: 写的不够好,但也可以把动态规划、蒙特卡洛、时间差分、Q-Learning、DQN、DDPG、A3C的概念梳理一遍。 Slyer: 非常适合入门强化学习的不错的书,娓娓道来,激发了我继续研究学习强化学习的兴趣。 果仁: 超适合我这样的小白。被各大入门就是QLearning的RL基础教程暴击以后,这本简直就是救星,粗略读完再看莫凡教程,总算能跟得上了。

图书目录

第1章强化学习是什么 1.1题设 1.1.1多智能才叫智能 1.1.2人工智能的定义 1.2强化学习的研究对象 1.2.1什么场合需要强化学习 1.2.2强化学习的建模 1.3本章小结 第2章强化学习的脉络 2.1什么是策略 2.2什么是好的策略 2.3什么是模型 2.4如何得到一个好的策略 2.4.1直接法 2.4.2间接法 2.5马尔可夫决策过程 2.5.1状态转移 2.5.2策略与评价 2.5.3策略优化 2.6MODEL-BASED和MODEL-FREE 2.6.1Model-Based 2.6.2规划问题 2.6.3Model-Free 2.7本章小结 第3章动态规划 3.1状态估值 3.2策略优化 3.3本章小结 第4章蒙特卡罗法 4.1状态估值 4.2两种估值方法 4.2.1首次访问策略估值 4.2.2每次访问策略估值 4.3策略优化 4.4本章小结 第5章时间差分 5.1SARSA算法 5.1.1伪代码 5.1.2SARSA的优缺点 5.2Q-LEARNING 5.2.1伪代码 5.2.2Q-Learning的优缺点 5.3ON-POLICY和OFF-POLICY 5.4ON-LINE学习和OFF-LINE学习 5.5比较与讨论 5.6本章小结 第6章深度学习 6.1PyTorch简介 6.1.1历史渊源 6.1.2支持 6.2神经元 6.3线性回归 6.4激励函数 6.4.1Sigmoid函数 6.4.2Tanh函数 6.4.3ReLU函数 6.4.4Linear函数 6.5神经网络 6.6网络训练 6.6.1输入 6.6.2输出 6.6.3网络结构 6.6.4损失函数 6.6.5求解极小值 6.6.6线性回归 6.6.7凸函数 6.6.8二元(多元)凸函数 6.6.9导数补充 6.6.10导数怎么求 6.6.11“串联式”神经元 6.6.12模型的工作 6.6.13损失函数的理解 6.7深度学习的优势 6.7.1线性和非线性的叠加 6.7.2不用再提取特征 6.7.3处理线性不可分 6.8手写数字识别公开数据集 6.9全连接网络 6.9.1输入输出 6.9.2代码解读 6.9.2.1网络结构 6.9.2.2交叉熵损失函数 6.9.3运行结果 6.10卷积网络 6.10.1代码解读 6.10.2理解卷积网络结构 6.10.3卷积核结构 6.11循环神经网络 6.11.1网络结构 6.11.2RNN应用案例 6.11.3代码解读 6.12其它注意事项 6.12.1并行计算 6.12.2梯度消失与梯度爆炸 6.12.3归一化 6.12.4超参数设置 6.12.5正则化 6.12.6不唯一的模型 6.13深度神经网络的发展趋势 6.14本章小结 第7章GYM——不要钱的试验场 7.1简介 7.2安装 7.3类别介绍 7.4接口 7.5本章小结 第8章DQN算法族 8.1DQN2013 8.1.1模型结构 8.1.2训练过程 8.1.3ReplayMemory 8.1.4小结 8.2DQN2015 8.2.1模型结构 8.2.2训练过程 8.2.3Target网络 8.2.4小结 8.3DOUBLEDQN 8.3.1模型结构 8.3.2训练过程 8.3.3效果 8.3.4小结 8.4DUELINGDQN 8.4.1模型结构 8.4.2效果 8.4.3小结 8.5优先回放DQN 8.6GORILADQN 8.7本章小结 第9章PG算法族 9.1策略梯度 9.2ACTOR-CRITIC 9.3DPG 9.4DDPG 9.5本章小结 第10章A3C 10.1模型结构 10.1.1A3CDQN 10.1.2A3CDDPG 10.2本章小结 第11章、UNREAL 11.1主任务 11.2像素控制任务 11.3奖励值预测 11.4值函数回放 11.5损失函数 11.6本章小结 第12章NEAT 12.1遗传算法 12.1.1进化过程 12.1.2算法流程 12.1.3背包问题 12.1.4极大(小)值问题 12.2NEAT原理 12.2.1基因组 12.2.2变异和遗传 12.3NEAT示例 12.3.1Cartpole 12.3.2LunarLander 12.4本章小结 第13章SERPENTAI 13.1简介 13.2安装配置 13.3示例 13.3.1创建GamePlugin 13.3.2创建GameAgent 13.3.3训练ContextClassifier 13.3.4模型设计 13.3.5训练Agent 13.4本章小结 第14章案例详解 14.1ALPHAGO 14.1.1AlphaGO的前世今生 14.1.2深蓝是谁 14.1.3围棋到底有多复杂 14.1.4论文要义 14.1.5成绩 14.1.6开源项目 14.2ALPHAGOZERO 14.2.1改进之处 14.2.2成绩 14.2.3开源项目 14.3试验场大观 14.3.1《星际争霸2》 14.3.2VizDoom 14.3.3Universe 14.3.4DOTA2 14.4本章小结 第15章扩展讨论 15.1TRPO 15.2反向强化学习 15.3模型压缩 15.3.1剪枝 15.3.2量化 15.3.3结构压缩 15.3.4矩阵分解 15.4本章小结 后记 附录 参考文献

白话强化学习与PyTorch.epub"网盘下载"

版权说明

1、本站不保存、不存储任何实质资源,以上二维码指向为网盘资源链接,其内容归对应版权方所有
2、如有侵犯版权的情况,请点击下面举报/反馈按钮反馈或发送邮件76556431@qq.com投诉说明情况
3、我们核实后将第一时间删除相关页面内容,谢谢理解和配合

这些人下载过 (12)
  • 寰鸾
  • 暗恋没有结果
  • 爸爸是我最爱的男人
  • 我不会变
  • 独霸我情
  • 我满身带刺
  • 风中诗行
  • 德行
  • Queen(魅眸)
  • 伪装叫坚强
  • 鲜有永久
  • 旧梦难舍旧情难割
最新回复 (0)

    暂无评论

请先登录后发表评论!

返回
请先登录后发表评论!