模式识别 pdf epub mobi txt 电子书下载 2026

简体网页||繁体网页

☆☆☆☆☆

出版者:机械工业出版社

作者:吴建鑫

出品人:

页数:338

译者:

出版时间:2020-3-1

价格:99元

装帧:平装

isbn号码:9787111643890

丛书系列:智能科学与技术丛书

图书标签:

机器学习
计算机
计算机视觉
模式识别
教科书
大陆
吴建鑫
华语
模式识别
机器学习
人工智能
统计学习
数据挖掘
图像处理
信号处理
分类
聚类
判别分析

下载链接在页面底部

facebook linkedin mastodon messenger pinterest reddit telegram twitter viber vkontakte whatsapp 复制链接

想要找书就要到图书目录大全

book.wenda123.org

立刻按 ctrl+D收藏本页

你会得到大惊喜!!

具体描述

前言

符号表

部分概述1

章绪论2

1.1样例：自动驾驶3

1.2模式识别与机器学习5

1.2.1一个典型的模式识别流程5

1.2.2模式识别vs.机器学习8

1.2.3评估、部署和细化9

1.3本书的结构9

习题12

第2章数学背景知识14

2.1线性代数14

2.1.1内积、范数、距离和正交性14

2.1.2角度与不等式15

2.1.3向量投影16

2.1.4矩阵基础17

2.1.5矩阵乘法18

2.1.6方阵的行列式与逆19

2.1.7方阵的特征值、特征向量、秩和迹20

2.1.8奇异值分解22

2.1.9(半)正定实对称矩阵22

2.2概率23

2.2.1基础23

2.2.2联合分布、条件分布与贝叶斯定理25

2.2.3期望与方差/协方差矩阵26

2.2.4不等式27

2.2.5独立性与相关性28

2.2.6正态分布29

2.3优化与矩阵微积分30

2.3.1局部极小、必要条件和矩阵微积分30

2.3.2凸优化与凹优化31

2.3.3约束优化和拉格朗日乘子法33

2.4算法复杂度34

2.5阅读材料35

习题35

第3章模式识别系统概述39

3.1人脸识别39

3.2一个简单的近邻分类器40

3.2.1训练或学习40

3.2.2测试或预测40

3.2.3近邻分类器41

3.2.4k-近邻42

3.3丑陋的细节43

3.4制定假设并化简46

3.4.1设计工作环境vs.设计复杂算法46

3.4.2假设与简化47

3.5一种框架51

3.6阅读材料51

习题53

第4章评估55

4.1简单情形中的准确率和错误率55

4.1.1训练与测试误差56

4.1.2过拟合与欠拟合56

4.1.3使用验证集来选择超参数58

4.1.4交验证59

4.2化代价/损失61

4.2.1正则化62

4.2.2代价矩阵62

4.2.3贝叶斯决策理论63

4.3不平衡问题中的评估64

4.3.1单个类别内的比率64

4.3.2ROC曲线下的面积65

4.3.3查准率、查全率和F值66

4.4我们能达到100％的准确率吗?68

4.4.1贝叶斯错误率68

4.4.2真实标记69

4.4.3偏置-方差分解70

4.5对评估结果的信心73

4.5.1为什么要取平均?73

4.5.2为什么要报告样本标准差?74

4.5.3比较分类器75

4.6阅读材料79

习题79

第二部分与领域知识无关的特征提取83

第5章主成分分析84

5.1动机84

5.1.1维度与内在维度84

5.1.2降维86

5.1.3PCA与子空间方法86

5.2PCA降维到零维子空间86

5.2.1想法-形式化-优化实践87

5.2.2一个简单的优化87

5.2.3一些注释88

5.3PCA降维到一维子空间88

5.3.1新的形式化88

5.3.2优性条件与化简89

5.3.3与特征分解的联系90

5.3.4解91

5.4PCA投影到更多维度91

5.5完整的PCA算法92

5.6方差的分析93

5.6.1从化方差出发的PCA94

5.6.2一种更简单的推导95

5.6.3我们需要多少维度呢?95

5.7什么时候使用或不用PCA呢?96

5.7.1高斯数据的PCA96

5.7.2非高斯数据的PCA96

5.7.3含异常点数据的PCA98

5.8白化变换98

5.9特征分解vs.SVD98

5.10阅读材料99

习题99

第6章Fisher线性判别103

6.1用于二分类的FLD104

6.1.1想法：什么是隔得很远呢?104

6.1.2翻译成数学语言105

6.1.3散度矩阵vs.协方差矩阵107

6.1.4两种散度矩阵以及FLD的目标函数108

6.1.5优化108

6.1.6等等,我们有一条捷径109

6.1.7二分类问题的FLD109

6.1.8陷阱：要是SW不可逆呢?110

6.2用于多类的FLD111

6.2.1稍加修改的符号和SW111

6.2.2SB的候选111

6.2.3三个散度矩阵的故事112

6.2.4解113

6.2.5找到更多投影方向113

6.3阅读材料113

习题114

第三部分分类器与其他工具119

第7章支持向量机120

7.1SVM的关键思想120

7.1.1简化它!简化它!简化它!120

7.1.2查找（或较大）间隔的分类器121

7.2可视化并计算间隔122

7.2.1几何的可视化123

7.2.2将间隔作为优化来计算124

7.3化间隔124

7.3.1形式化125

7.3.2各种简化125

7.4优化与求解127

7.4.1拉格朗日函数与KKT条件127

7.4.2SVM的对偶形式128

7.4.3优的b值与支持向量129

7.4.4同时考虑原始形式与对偶形式131

7.5向线性不可分问题和多类问题的扩展131

7.5.1不可分问题的线性分类器132

7.5.2多类SVM134

7.6核SVM134

7.6.1核技巧135

7.6.2Mercer条件与特征映射136

7.6.3流行的核函数与超参数137

7.6.4SVM的复杂度、权衡及其他138

7.7阅读材料139

习题139

第8章概率方法144

8.1思考问题的概率路线144

8.1.1术语144

8.1.2分布与推断145

8.1.3贝叶斯定理145

8.2各种选择146

8.2.1生成式模型vs.判别式模型146

8.2.2参数化vs.非参数化147

8.2.3该如何看待一个参数呢?148

8.3参数化估计148

8.3.1似然148

8.3.2后验150

8.3.3贝叶斯151

8.4非参数化估计153

8.4.1一个一维的例子153

8.4.2直方图近似中存在的问题155

8.4.3让你的样本无远弗届156

8.4.4核密度估计157

8.4.5带宽选择158

8.4.6多变量KDE158

8.5做出决策159

8.6阅读材料159

习题160

第9章距离度量与数据变换163

9.1距离度量和相似度度量163

9.1.1距离度量164

9.1.2向量范数和度量164

9.1.3lp范数和lp度量165

9.1.4距离度量学习167

9.1.5均值作为一种相似度度量168

9.1.6幂平均核170

9.2数据变换和规范化171

9.2.1线性回归172

9.2.2特征规范化173

9.2.3数据变换175

9.3阅读材料177

习题177

0章信息论和决策树182

10.1前缀码和霍夫曼树182

10.2信息论基础183

10.2.1熵和不确定性184

10.2.2联合和条件熵184

10.2.3互信息和相对熵185

10.2.4一些不等式186

10.2.5离散分布的熵187

10.3连续分布的信息论187

10.3.1微分熵188

10.3.2多元高斯分布的熵189

10.3.3高斯分布是熵分布191

10.4机器学习和模式识别中的信息论192

10.4.1熵192

10.4.2交熵193

10.4.3特征选择194

10.5决策树195

10.5.1异或问题及其决策树模型195

10.5.2基于信息增益的结点划分197

10.6阅读材料198

习题199

第四部分处理变化多端的数据203

1章稀疏数据和未对齐数据204

11.1稀疏机器学习204

11.1.1稀疏PCA?204

11.1.2使用l1范数诱导稀疏性205

11.1.3使用过完备的字典208

11.1.4其他一些相关的话题210

11.2动态时间规整212

11.2.1未对齐的时序数据212

11.2.2思路（或准则）213

11.2.3可视化和形式化214

11.2.4动态规划215

11.3阅读材料218

习题218

2章隐马尔可夫模型222

12.1时序数据与马尔可夫性质222

12.1.1各种各样的时序数据和模型222

12.1.2马尔可夫性质224

12.1.3离散时间马尔可夫链225

12.1.4隐马尔可夫模型227

12.2HMM学习中的三个基本问题228

12.3α、β和评估问题229

12.3.1前向变量和算法230

12.3.2后向变量和算法231

12.4γ、δ、ψ和解码问题234

12.4.1γ和独立解码的优状态234

12.4.2δ、ψ和联合解码的优状态235

12.5ξ和HMM参数的学习237

12.5.1Baum-Welch：以期望比例来更新?238

12.5.2如何计算ξ238

12.6阅读材料240

习题241

第五部分高阶课题245

3章正态分布246

13.1定义246

13.1.1单变量正态分布246

13.1.2多元正态分布247

13.2符号和参数化形式248

13.3线性运算与求和249

13.3.1单变量的情形249

13.3.2多变量的情形250

13.4几何和马氏距离251

13.5条件作用252

13.6高斯分布的乘积253

13.7应用Ⅰ：参数估计254

13.7.1似然估计254

13.7.2贝叶斯参数估计255

13.8应用Ⅱ：卡尔曼滤波256

13.8.1模型256

13.8.2估计257

13.9在本章中有用的数学258

13.9.1高斯积分258

13.9.2特征函数259

13.9.3舒尔补&矩阵求逆引理260

13.9.4向量和矩阵导数262

习题263

4章EM算法的基本思想266

14.1GMM：一个工作实例266

14.1.1高斯混合模型266

14.1.2基于隐变量的诠释.267

14.1.3假若我们能观测到隐变量,那会怎样?268

14.1.4我们可以模仿先知吗?269

14.2EM算法的非正式描述270

14.3期望化算法270

14.3.1联合非凹的不完整数据对数似然271

14.3.2(可能是)凹的完整数据对数似然271

14.3.3通用EM的推导272

14.3.4E步和M步274

14.3.5EM算法275

14.3.6EM能收敛吗?275

14.4EM用于GMM276

14.5阅读材料279

习题279

5章卷积神经网络281

15.1预备知识281

15.1.1张量和向量化282

15.1.2向量微积分和链式法则283

15.2CNN概览283

15.2.1结构283

15.2.2前向运行285

15.2.3随机梯度下降285

15.2.4误差反向传播286

15.3层的输入、输出和符号287

15.4ReLU层288

15.5卷积层290

15.5.1什么是卷积?290

15.5.2为什么要进行卷积?291

15.5.3卷积作为矩阵乘法293

15.5.4克罗内克积295

15.5.5反向传播：更新参数296

15.5.6更高维的指示矩阵297

15.5.7反向传播：为前一层准备监督信号298

15.5.8用卷积层实现全连接层300

15.6汇合层301

15.7案例分析：VGG-16网络303

15.7.1VGG-Verydeep-16303

15.7.2感受野304

15.8CNN的亲身体验305

15.9阅读材料305

习题305

参考文献309

英文索引325

中文索引332

内容虚线

内容简介

本书是模式识别领域的入门教材，系统阐述了模式识别中的基础知识、主要模型及热门应用，并给出了近年来本领域一些新的成果和观点；通过理论学习和动手实践相结合的形式使初学者能有效入门，并培养独立解决任务的能力，为模式识别的项目开发及相关科研活动打好基础。

全书共15章，大致分为五部分：分（~4章）介绍了本书的概论和基础知识，包括绪论、数学背景知识、模式识别系统概述以及评估；第二部分（第5~6章）介绍了与领域知识无关的特征提取，包括主成分分析和Fisher线性判别；第三部分（第7~10章）介绍了分类器与其他工具，包括支持向量机、概率方法、距离度量与数据变换、信息论和决策树；第四部分（1~12章）介绍了如何处理变化多端的数据，包括稀疏数据和未对齐数据、隐马尔可夫模型；第五部分（3~15章）介绍了一些高阶课题，包括正态分布、EM算法和卷积神经网络。

《算法的国度：数据驱动的洞察力与决策》在这瞬息万变的数字时代，数据以前所未有的规模和速度涌现。从社交媒体上的每一次点赞，到每一次在线购物行为，再到精密仪器产生的海量传感器读数，数据已渗透到我们生活的方方面面。然而，原始数据本身往往是杂乱无章、难以理解的。它们就像一片汪洋大海，其中蕴藏着无数宝藏，但如果没有恰当的工具和方法，我们很难从中发掘出有价值的信息。《算法的国度：数据驱动的洞察力与决策》正是为驾驭这股数据洪流而生。本书并非一本介绍特定技术细节的工具手册，而是带您深入理解驱动现代数据科学核心的那些根本性思想和原则。我们将探索那些让机器能够从海量数据中学习、发现隐藏模式、做出预测，并最终辅助我们做出更明智决策的强大“算法”。本书的叙述将围绕“算法”这一核心概念展开，但并非仅仅停留在抽象的数学定义。我们将以一种生动、形象的方式，揭示这些算法在现实世界中的应用场景和解决问题的能力。从理解数据本身的性质，到构建能够识别复杂关系的数学模型，再到评估模型的性能并将其转化为可操作的洞察，我们将一步步引领读者走进算法的奇妙世界。第一部分：数据生命的黎明在深入算法之前，我们必须先理解我们所面对的“数据”。本部分将引导您审视数据的本质：它们是如何产生的？又以何种形式存在？我们将探讨不同类型的数据（如数值型、类别型、文本型、图像型）的特性，以及数据质量的重要性。理解“脏数据”和“噪声”如何影响最终的结果，以及基本的预处理技术，如同为算法的构建奠定坚实的基础。数据之源：探索数据生成的各种渠道，从简单的传感器到复杂的网络交互。数据之形：区分不同类型的数据，理解它们的结构和内在联系。数据之质：认识到数据质量的重要性，并了解如何处理缺失值、异常值和不一致性。数据之貌：学习可视化技术，用图表和图形直观地展现数据的分布和特征。第二部分：洞察的艺术家——探索性数据分析在掌握了数据的基本面貌后，我们便可以开始尝试从中“听”到数据的声音。探索性数据分析（EDA）是这一过程的核心。本部分将介绍一系列统计学和可视化技术，帮助您在不预设模型的情况下，主动探索数据，发现潜在的趋势、异常和关联。这将是培养直觉、形成初步假设的关键阶段。统计之眼：掌握描述性统计量的运用，理解均值、方差、中位数等指标的意义。相关之链：学习度量变量之间的关系，识别哪些因素可能相互影响。模式之舞：通过聚类等方法，尝试将相似的数据点分组，发现数据中的自然结构。异常之辨：学习识别与整体数据行为不符的“离群点”，它们可能隐藏着重要的信息或错误。第三部分：构建智能的基石——监督学习的艺术当我们的探索让我们对数据有了更深的理解，并形成了一些关于数据之间关系的假设时，我们便可以进入构建预测模型的阶段。本部分将重点介绍“监督学习”的理念。我们将了解如何利用带有“标签”的数据（即我们已知结果的数据）来训练模型，使其能够预测未知数据的标签。回归的预测：学习如何构建模型来预测连续数值，例如预测房价、销售额或股票价格。我们将深入理解线性回归、多项式回归等基本模型，以及它们背后的数学思想。分类的辨别：学习如何构建模型来将数据分配到不同的类别，例如识别垃圾邮件、判断客户是否会流失或诊断疾病。逻辑回归、支持向量机（SVM）以及决策树等经典分类算法将是我们的重点。模型的选择与评估：在众多模型中如何选择最适合的？我们将探讨各种评估指标（如准确率、精确率、召回率、F1分数、均方误差等），以及交叉验证等技术，确保模型的泛化能力。特征工程的魔力：理解如何从原始数据中提取、转换和创造出更有信息量的“特征”，这往往是提升模型性能的关键。第四部分：发掘隐藏的规律——无监督学习的智慧并非所有数据都带有明确的标签。在许多情况下，我们拥有的只是原始数据，需要算法帮助我们自己去发现其中的结构和模式。本部分将深入探讨“无监督学习”，专注于从无标注的数据中提取洞察。聚类的奥秘：再次深入聚类，学习更复杂的聚类算法，如K-Means、DBSCAN等，用于发现数据中的自然分组，如客户细分、市场分区。降维的艺术：当数据的维度过高时，理解和可视化变得困难。我们将学习主成分分析（PCA）等降维技术，如何在保留信息的同时，简化数据的表示。关联的发现：学习如何发现数据项之间的潜在关联规则，例如在超市购物篮分析中，发现购买面包的顾客也常常购买牛奶。Apriori算法等将是探讨的主题。异常检测的新视角：除了监督学习中的异常点识别，无监督学习也能从数据分布的整体特征来识别异常。第五部分：算法的演进与应用在掌握了监督学习和无监督学习的基本原理后，本部分将拓宽视野，介绍更复杂、更强大的算法范式，以及它们在现实世界中的广泛应用。决策的艺术——决策树与集成方法：深入理解决策树的工作原理，以及如何通过集成多个决策树（如随机森林、梯度提升树）来构建更鲁棒、更高精度的模型。神经网络的启示：简要介绍神经网络的基本概念，它们如何模仿人脑神经元的工作方式，以及它们在图像识别、自然语言处理等领域的巨大潜力。算法的伦理与偏见：随着算法在社会中扮演的角色越来越重要，我们也必须关注其潜在的伦理问题，如算法偏见、数据隐私和可解释性。本书将引导读者思考这些关键问题。数据驱动的决策流程：将前文介绍的各种技术融会贯通，构建一个完整的数据驱动决策流程，从问题定义、数据收集、模型构建到结果解读和部署。《算法的国度：数据驱动的洞察力与决策》旨在成为您探索数据世界、解锁数据价值的引路人。无论您是数据分析领域的初学者，还是希望深化理解的从业者，本书都将为您提供一套系统而深入的思维框架，让您能够 confidently 地驾驭数据，发现其中蕴藏的无限可能。在这片由数据构成的广袤国度里，算法是您最强大的探险工具，而洞察力则是您最宝贵的宝藏。

作者简介

目录信息

读后感

评分☆☆☆☆☆

用户评价

评分☆☆☆☆☆

这本书的阅读体验简直是一场穿越时空的探险，仿佛置身于一个由数据和算法构建的奇妙世界。作者的文笔犹如一位技艺精湛的织布匠，将那些晦涩难懂的数学公式和复杂的理论，巧妙地编织成了一幅幅生动具体的图像。初读时，我带着些许忐忑，担心会迷失在那些高深的术语中，然而，很快我就被书中的叙事节奏所吸引。每一次概念的引入，都伴随着现实生活中的生动案例，让我能够立刻抓住其核心思想。特别是关于特征提取的那几章，作者没有停留在理论的阐述上，而是深入剖析了不同领域专家是如何从海量信息中提炼出“关键信息”的，那种洞察力令人拍案叫绝。全书的结构安排也十分考究，从基础的统计学原理，稳步推进到复杂的神经网络模型，每一步都像是精心设计的阶梯，让你在不知不觉中就攀上了新的高度。读完后，我感觉自己仿佛拥有了一双能够看穿事物本质的“慧眼”，看待周遭世界的目光都变得锐利而深刻了许多。这本书不仅是知识的积累，更是一种思维方式的重塑，强烈推荐给所有对信息处理和决策科学感兴趣的同仁们。

评分☆☆☆☆☆

这本书给我的感觉，更像是一部哲学思辨录，而不是一本传统意义上的技术手册。它探讨的并非仅仅是“如何识别”，而是更深层次的“我们如何认知世界”这一母题。作者的笔触极其细腻，擅长捕捉那些潜藏在数据背后的微妙规律和人类认知的局限性。我特别欣赏其中关于“不确定性”的处理方式，它没有试图将所有事物都归于绝对的黑白，而是坦然地接受了世界的模糊性，并提供了与之共存的优雅工具。书中对贝叶斯方法的阐述，简直可以用“诗意”来形容，它将概率论的冷峻逻辑与日常生活的经验判断完美地融合在一起，让人体会到理性决策的真正魅力。阅读过程中，我常常停下来，对着书页沉思良久，思考着那些关于模式形成、偏差产生的深层原因。这种阅读体验是极其独特的，它迫使你走出技术细节的泥潭，去仰望理论构建的宏伟蓝图。那些精妙的比喻和类比，如同清泉般洗涤了我的固有思维，让我开始以一种更加开放和批判性的眼光去审视那些所谓的“标准答案”。

评分☆☆☆☆☆

这本书的排版和插图设计简直是一场视觉盛宴，对于我这种更倾向于“视觉学习”的人来说，简直是福音。通常严肃的技术书籍都伴随着大段密集的文字和枯燥的图表，但此书却做到了雅俗共赏。作者深知，复杂的概念需要直观的表达。那些用来解释高维空间映射关系的示意图，设计得极其巧妙和清晰，每一个箭头、每一个阴影区域的设置，都恰到好处地传达了数学上的意义，甚至不需要过多的文字辅助就能自行领悟。阅读体验的流畅性得益于此，我很少需要频繁地翻阅附录去理解一个图示。更难能可贵的是，作者在介绍经典算法时，会穿插一些历史小故事，讲述这些理论是如何在特定历史背景下被提出和完善的，这极大地增加了阅读的趣味性和代入感，让人感觉这些理论不再是冰冷的知识点，而是有血有肉的科学探索历程。这是一本真正做到了“让专业知识变得易于亲近”的典范之作。

评分☆☆☆☆☆

这是一本极具“实操指导性”的工程学著作，它没有被那些高谈阔论的理论所束缚，而是牢牢扎根于工程实践的土壤。阅读过程中，我感受到了作者作为一名资深工程师的严谨和务实。书中对于算法的介绍，总是伴随着清晰的伪代码和详细的步骤分解，对于想要动手实现的人来说，简直是一份无价的宝藏。我特别关注了关于模型评估和优化的章节，作者对交叉验证、偏差-方差权衡的讲解，细致到令人发指，每一个参数的选择都给出了明确的理由和潜在的陷阱提示。这不像其他教材那样只给出结论，而是手把手地带着你走过“试错”的全过程。我尝试着根据书中的指导，对一个旧有的项目进行了重新设计，结果发现，仅仅是微调了几个参数和更换了一种特征选择方法，系统的性能就有了质的飞跃。这本书的价值在于，它不仅告诉你“是什么”，更重要的是，它教会了你“怎么做才能更好”。它的专业性毋庸置疑，但表述方式却充满了对读者解决实际问题的尊重。

评分☆☆☆☆☆

坦白讲，我起初是被这本书的“跨学科视野”所吸引的。它并非局限于计算机科学的象牙塔内，而是将触角伸向了生物学、经济学乃至艺术史等多个领域，展现出一种宏大的知识格局。作者成功地架起了不同学科之间的桥梁，例如，将生物进化中的自然选择原理，巧妙地类比到某些优化算法的迭代过程。这种融会贯通的能力，让阅读过程充满了惊喜。每一次的阅读，都像是在进行一次知识的“星际漫游”，从一个领域的概念跳跃到另一个领域的应用，视野被不断拓宽。特别是关于“降维”的探讨，作者不仅从数学角度解释了其必要性，还从信息冗余和认知负荷的角度进行了人文关怀的解读，这种多维度的分析，极大地提升了对该主题的理解深度。这本书的价值，在于它提供了一个看待复杂世界的通用框架，一个能够帮助我们从碎片化的信息中构建连贯知识体系的“元工具”。

评分☆☆☆☆☆

讲的很好！给吴老师给个五星好评！

评分☆☆☆☆☆

wxs推荐的。。感觉回过头来看基础一点的理论感觉和以前不一样了。。

评分☆☆☆☆☆

挺用心的，谢了

评分☆☆☆☆☆

wxs推荐的。。感觉回过头来看基础一点的理论感觉和以前不一样了。。

评分☆☆☆☆☆

讲的很好！给吴老师给个五星好评！