深入浅出强化学习:原理入门 在线电子书 pdf 下载 txt下载 epub 下载 mobi 下载 2024
☆☆☆☆☆
简体网页||
繁体网页
郭宪 作者
电子工业出版社
博文视点
译者
2018-1 出版日期
256 页数
79 价格
平装
博文视点AI系列 丛书系列
9787121329180 图书编码
深入浅出强化学习:原理入门 在线电子书 图书标签:
强化学习
人工智能
机器学习
算法
计算科学
深度学习
Python
喜欢 深入浅出强化学习:原理入门 在线电子书 的读者还喜欢
下载链接在页面底部
点击这里下载
立刻按 ctrl+D收藏本页
你会得到大惊喜!!
发表于2024-12-23
深入浅出强化学习:原理入门 在线电子书 epub 下载 mobi 下载 pdf 下载 txt 下载 2024
深入浅出强化学习:原理入门 在线电子书 epub 下载 mobi 下载 pdf 下载 txt 下载 2024
深入浅出强化学习:原理入门 在线电子书 pdf 下载 txt下载 epub 下载 mobi 下载 2024
深入浅出强化学习:原理入门 在线电子书 用户评价
评分
☆☆☆☆☆
客观的评价:简介作者为研究强化学习的博士,书籍却粗制滥造,确实让人大跌眼镜。1 概念不清晰,连强化学习的脉络都没有梳理清楚。2 过于口语化,开篇一来就吃肉啃骨头的口语化一大堆,不像治学严谨的博士写出来的 3 插图过于随意不清晰,不知道从网上哪里download下来直接上传,希望可以认真点起码让读者看清楚图 4 代码不要直接网上截图,请作者亲自检验
评分
☆☆☆☆☆
别用这个入门!入门概念不清晰!推荐去看吴恩达和david silver的课程。 优点是后面的数学证明比较全。有个问题,发现主线和配图公式以及例子几乎照搬ucl的ppt.
评分
☆☆☆☆☆
啥玩意,堆砌公式,图不对文,而且内容还是直接从david silver的课搬过来的,就这也能出书我也是醉了。
评分
☆☆☆☆☆
显而易见的数学式写一大堆推导,需要解释的给一行。想学强化学习的去看david silver或者别的书吧,这真是吹牛皮,当免费专栏还可以,这种水平来卖钱真是算了。。
评分
☆☆☆☆☆
无力吐槽,细节写的晦涩不清,一点不够基础,看了一半实在不想读了。
深入浅出强化学习:原理入门 在线电子书 著者简介
深入浅出强化学习:原理入门 在线电子书 图书目录
1 绪论 1
1.1 这是一本什么书 1
1.2 强化学习可以解决什么问题 2
1.3 强化学习如何解决问题 4
1.4 强化学习算法分类及发展趋势 5
1.5 强化学习仿真环境构建 7
1.5.1 gym安装及简单的demo示例 8
1.5.2 深入剖析gym环境构建 10
1.6 本书主要内容及安排 12
第一篇 强化学习基础 17
2 马尔科夫决策过程 18
2.1 马尔科夫决策过程理论讲解 18
2.2 MDP中的概率学基础讲解 26
2.3 基于gym的MDP实例讲解 29
2.4 习题 34
3 基于模型的动态规划方法 36
3.1 基于模型的动态规划方法理论 36
3.2 动态规划中的数学基础讲解 47
3.2.1 线性方程组的迭代解法 47
3.2.2 压缩映射证明策略评估的收敛性 49
3.3 基于gym的编程实例 52
3.4 最优控制与强化学习比较 54
3.5 习题 56
第二篇 基于值函数的强化学习方法 57
4 基于蒙特卡罗的强化学习方法 58
4.1 基于蒙特卡罗方法的理论 58
4.2 统计学基础知识 67
4.3 基于Python的编程实例 71
4.4 习题 74
5 基于时间差分的强化学习方法 75
5.1 基于时间差分强化学习算法理论讲解 75
5.2 基于Python和gym的编程实例 83
5.3 习题 87
6 基于值函数逼近的强化学习方法 88
6.1 基于值函数逼近的理论讲解 88
6.2 DQN及其变种 94
6.2.1 DQN方法 94
6.2.2 Double DQN 100
6.2.3 优先回放(Prioritized Replay) 102
6.2.4 Dueling DQN 104
6.3 函数逼近方法 105
6.3.1 基于非参数的函数逼近 105
6.3.2 基于参数的函数逼近 111
6.3.3 卷积神经网络 117
6.4 习题 123
第三篇 基于直接策略搜索的强化学习方法 125
7 基于策略梯度的强化学习方法 126
7.1 基于策略梯度的强化学习方法理论讲解 126
7.2 基于gym和TensorFlow的策略梯度算法实现 134
7.2.1 安装Tensorflow 135
7.2.2 策略梯度算法理论基础 135
7.2.3 Softmax策略及其损失函数 136
7.2.4 基于TensorFlow的策略梯度算法实现 138
7.2.5 基于策略梯度算法的小车倒立摆问题 141
7.3 习题 141
8 基于置信域策略优化的强化学习方法 142
8.1 理论基础 143
8.2 TRPO中的数学知识 153
8.2.1 信息论 153
8.2.2 优化方法 155
8.3 习题 164
9 基于确定性策略搜索的强化学习方法 165
9.1 理论基础 165
9.2 习题 170
10 基于引导策略搜索的强化学习方法 171
10.1 理论基础 171
10.2 GPS中涉及的数学基础 178
10.2.1 监督相LBFGS优化方法 178
10.2.2 ADMM算法 179
10.2.3 KL散度与变分推理 183
10.3 习题 184
第四篇 强化学习研究及前沿 185
11 逆向强化学习 186
11.1 概述 186
11.2 基于最大边际的逆向强化学习 187
11.3 基于最大熵的逆向强化学习 194
11.4 习题 201
12 组合策略梯度和值函数方法 202
13 值迭代网络 207
13.1 为什么要提出值迭代网络 207
13.2 值迭代网络 210
14 基于模型的强化学习方法:PILCO及其扩展 214
14.1 概述 214
14.2 PILCO 216
14.3 滤波PILCO和探索PILCO 226
14.3.1 滤波PILCO算法 227
14.3.2 有向探索PILCO算法 230
14.4 深度PILCO 232
后记 235
参考文献 237
· · · · · · (
收起)
深入浅出强化学习:原理入门 在线电子书 pdf 下载 txt下载 epub 下载 mobi 在线电子书下载
深入浅出强化学习:原理入门 在线电子书 图书描述
《深入浅出强化学习:原理入门》用通俗易懂的语言深入浅出地介绍了强化学习的基本原理,覆盖了传统的强化学习基本方法和当前炙手可热的深度强化学习方法。开篇从最基本的马尔科夫决策过程入手,将强化学习问题纳入到严谨的数学框架中,接着阐述了解决此类问题最基本的方法——动态规划方法,并从中总结出解决强化学习问题的基本思路:交互迭代策略评估和策略改善。基于这个思路,分别介绍了基于值函数的强化学习方法和基于直接策略搜索的强化学习方法。最后介绍了逆向强化学习方法和近年具有代表性、比较前沿的强化学习方法。
除了系统地介绍基本理论,书中还介绍了相应的数学基础和编程实例。因此,《深入浅出强化学习:原理入门》既适合零基础的人员入门学习、也适合相关科研人员作为研究参考。
深入浅出强化学习:原理入门 在线电子书 下载 mobi epub pdf txt 在线电子书下载
深入浅出强化学习:原理入门 在线电子书 读后感
评分
☆☆☆☆☆
一本优秀的读书笔记?现在真的是出本书的门槛越来越低了,看的十分费劲!!没有基础看这本书会更糊涂,因为好多地方描述的不详细,甚至有错误,另外这书卖79有点贵了,不值!还有硕博论文都不能截图,出书就可以了吗?而且那伪代码太简练了,也没解释!感觉有些浪费感情了,我...
评分
☆☆☆☆☆
一本优秀的读书笔记?现在真的是出本书的门槛越来越低了,看的十分费劲!!没有基础看这本书会更糊涂,因为好多地方描述的不详细,甚至有错误,另外这书卖79有点贵了,不值!还有硕博论文都不能截图,出书就可以了吗?而且那伪代码太简练了,也没解释!感觉有些浪费感情了,我...
评分
☆☆☆☆☆
个人觉得写得很垃圾。即便作者是我同校毕业的师兄,符号丢三落四。完全不知所然。完全不像是一个博后写的书嘛。心疼我的70块钱。看了开头2章真心觉得还不如看博客。个人建议,博文视点ai系列的书,大家买的时候慎重吧。而且我朋友说这本书大部分都是copy一份课程的东西,copy我...
评分
☆☆☆☆☆
一本优秀的读书笔记?现在真的是出本书的门槛越来越低了,看的十分费劲!!没有基础看这本书会更糊涂,因为好多地方描述的不详细,甚至有错误,另外这书卖79有点贵了,不值!还有硕博论文都不能截图,出书就可以了吗?而且那伪代码太简练了,也没解释!感觉有些浪费感情了,我...
评分
☆☆☆☆☆
首先请把0基础数学这几个字删掉,概率论,线性代数,微积分是至少的,里面的介绍只能说聊胜于无。虽然对我没影响了 github代码维护极差,两年没更新第一个demo都跑不通,issue也不看。您倒是关心一下后续啊喂 简单的部分一再重复,复杂的部分一语带过。前5步看的挺开心,到最后...
类似图书 点击查看全场最低价
深入浅出强化学习:原理入门 在线电子书 pdf 下载 txt下载 epub 下载 mobi 下载 2024