推薦序
前言
第一部分 準備篇
第1章 機器學習發展及應用前景 2
1.1 機器學習概述 2
1.1.1 什麼是機器學習 3
1.1.2 機器學習的發展 3
1.1.3 機器學習的未來 4
1.2 機器學習應用前景 5
1.2.1 數據分析與挖掘 5
1.2.2 模式識彆 6
1.2.3 更廣闊的領域 6
1.3 小結 7
第2章 科學計算平颱 8
2.1 科學計算軟件平颱概述 9
2.1.1 常用的科學計算軟件 9
2.1.2 本書使用的工程計算平颱 10
2.2 計算平颱的配置 11
2.2.1 Numpy等Python科學計算包的安裝與配置 11
2.2.2 OpenCV 安裝與配置 14
2.2.3 mlpy 安裝與配置 14
2.2.4 BeautifulSoup安裝與配置 15
2.2.5 Neurolab安裝與配置 15
2.2.6 R安裝與配置 16
2.3 小結 16
第二部分 基礎篇
第3章 計算平颱應用實例 18
3.1 Python計算平颱簡介及應用實例 18
3.1.1 Python語言基礎 18
3.1.2 Numpy庫 29
3.1.3 pylab、matplotlib繪圖 36
3.1.4 圖像基礎 38
3.1.5 圖像融閤與圖像鏡像 46
3.1.6 圖像灰度化與圖像加噪 48
3.1.7 聲音基礎 51
3.1.8 聲音音量調節 53
3.1.9 圖像信息隱藏 58
3.1.10 聲音信息隱藏 62
3.2 R語言基礎 68
3.2.1 基本操作 69
3.2.2 嚮量 71
3.2.3 對象集屬性 77
3.2.4 因子和有序因子 78
3.2.5 循環語句 79
3.2.6 條件語句 79
3.3 R語言科學計算 80
3.3.1 分類(組)統計 80
3.3.2 數組與矩陣基礎 81
3.3.3 數組運算 84
3.3.4 矩陣運算 85
3.4 R語言計算實例 93
3.4.1 學生數據集讀寫 93
3.4.2 最小二乘法擬閤 94
3.4.3 交叉因子頻率分析 96
3.4.4 嚮量模長計算 97
3.4.5 歐氏距離計算 98
3.5 小結 99
思考題 99
第4章 生産環境基礎 100
4.1 Windows Server 2008基礎 100
4.1.1 Windows Server 2008 R2概述 101
4.1.2 Windows PowerShell 102
4.2 Linux基礎 103
4.2.1 Linux命令 104
4.2.2 Shell基礎 114
4.3 Vim編輯器 122
4.3.1 Vim編輯器概述 122
4.3.2 Vim常用命令 123
4.4 虛擬化平颱 124
4.4.1 Citrix Xenserver概述 125
4.4.2 Citrix Xenserver部署 126
4.4.3 基於XenCenter的虛擬服務器管理 126
4.5 Linux環境下的NumPy安裝 135
4.6 Linux環境下的R運行環境 136
4.7 PyPy編譯器 136
4.7.1 PyPy概述 136
4.7.2 PyPy安裝與配置 137
4.7.3 PyPy性能 137
4.7.4 PyPy實踐之Lempel-Ziv壓縮 138
4.8 小結 145
思考題 146
第三部分 統計分析實戰篇
第5章 統計分析基礎 148
5.1 數據分析概述 148
5.2 數學基礎 149
5.3 迴歸分析 154
5.3.1 單變量綫性迴歸 154
5.3.2 多元綫性迴歸 156
5.3.3 非綫性迴歸 157
5.4 數據分析基礎 159
5.4.1 區間頻率分布 159
5.4.2 數據直方圖 161
5.4.3 數據散點圖 162
5.4.4 五分位數 164
5.4.5 纍積分布函數 165
5.4.6 核密度估計 166
5.5 數據分布分析 167
5.6 小結 169
思考題 170
第6章 描述性分析案例 171
6.1 數據圖形化案例解析 171
6.1.1 點圖 171
6.1.2 餅圖和條形圖 172
6.1.3 莖葉圖和箱綫圖 173
6.2 數據分布趨勢案例解析 175
6.2.1 平均值 175
6.2.2 加權平均值 175
6.2.3 數據排序 176
6.2.4 中位數 177
6.2.5 極差、半極差 177
6.2.6 方差 178
6.2.7 標準差 178
6.2.8 變異係數、樣本平方和 178
6.2.9 偏度係數、峰度係數 179
6.3 正態分布案例解析 180
6.3.1 正態分布函數 180
6.3.2 峰度係數分析 181
6.3.3 纍積分布概率 181
6.3.4 概率密度函數 182
6.3.5 分位點 183
6.3.6 頻率直方圖 185
6.3.7 核概率密度與正態概率分布圖 185
6.3.8 正態檢驗與分布擬閤 186
6.3.9 其他分布及其擬閤 188
6.4 多變量分析 189
6.4.1 多變量數據分析 189
6.4.2 多元數據相關性分析 197
6.5 小結 201
思考題 201
第7章 假設檢驗與迴歸模型案例 202
7.1 假設檢驗 202
7.1.1 二項分布假設檢驗 202
7.1.2 數據分布檢驗 204
7.1.3 正態總體均值檢驗 205
7.1.4 列聯錶 206
7.1.5 符號檢測 207
7.1.6 秩相關檢驗 210
7.1.7 Kendall相關檢驗 213
7.2 迴歸模型 214
7.2.1 迴歸預測與顯著性檢驗 214
7.2.2 迴歸診斷 216
7.2.3 迴歸優化 217
7.2.4 主成分迴歸 219
7.2.5 廣義綫性模型 221
7.3 小結 226
思考題 226
第四部分 機器學習實戰篇
第8章 機器學習算法 230
8.1 神經網絡 230
8.1.1 Rosenblatt感知器 232
8.1.2 梯度下降 245
8.1.3 反嚮傳播與多層感知器 251
8.1.4 Python神經網絡庫 270
8.2 統計算法 272
8.2.1 平均值 272
8.2.2 方差與標準差 274
8.2.3 貝葉斯算法 276
8.3 歐氏距離 279
8.4 餘弦相似度 280
8.5 SVM 281
8.5.1 數學原理 281
8.5.2 SMO算法 283
8.5.3 算法應用 283
8.6 迴歸算法 287
8.6.1 綫性代數基礎 288
8.6.2 最小二乘法原理 289
8.6.3 綫性迴歸 290
8.6.4 多元非綫性迴歸 292
8.6.5 嶺迴歸方法 294
8.6.6 僞逆方法 295
8.7 PCA降維 296
8.8 關聯規則 297
8.8.1 關聯規則概述 297
8.8.2 頻繁項集算法 298
8.8.3 關聯規則生成 301
8.8.4 實例分析 302
8.9 自動分類 306
8.9.1 聚類算法 306
8.9.2 決策樹 313
8.9.3 AdaBoost 316
8.9.4 競爭型神經網絡 317
8.9.5 Hamming神經網絡 323
8.10 小結 325
思考題 325
第9章 數據擬閤案例 327
9.1 數據擬閤 327
9.1.1 圖像分析法 327
9.1.2 神經網絡擬閤法 338
9.2 綫性濾波 352
9.2.1 WAV聲音文件 352
9.2.2 綫性濾波算法過程 352
9.2.3 濾波Python實現 353
9.3 數據或麯綫平滑 358
9.3.1 平滑概述 358
9.3.2 移動平均 359
9.3.3 遞歸綫性過濾 362
9.3.4 指數平滑 364
9.4 小結 368
思考題 368
第10章 圖像算法案例 370
10.1 圖像邊緣算法 370
10.1.1 數字圖像基礎 370
10.1.2 算法描述 371
10.2 圖像匹配 372
10.2.1 差分矩陣求和 373
10.2.2 差分矩陣均值 375
10.2.3 歐氏距離匹配 376
10.3 圖像分類 382
10.3.1 餘弦相似度 382
10.3.2 PCA圖像特徵提取算法 388
10.3.3 基於神經網絡的圖像分類 389
10.3.4 基於SVM的圖像分類 394
10.4 高斯噪聲生成 397
10.5 二值化 401
10.5.1 threshold 401
10.5.2 adaptiveThreshold 402
10.6 插值與縮放 404
10.7 仿射 405
10.7.1 仿射原理 405
10.7.2 仿射變換實例 405
10.8 透視投影與透視變換 406
10.8.1 透視投影原理 406
10.8.2 透視投影實例 407
10.9 灰度變換與圖像增強 409
10.9.1 灰度變換概述 409
10.9.2 對數變換 409
10.9.3 分段綫性變換 410
10.9.4 指數變換 411
10.9.5 直方圖均衡化 412
10.10 圖像濾波與除噪 415
10.10.1 均一化塊濾波 415
10.10.2 鄰域平均法 420
10.10.3 中值濾波 423
10.10.4 高斯濾波 427
10.10.5 雙邊濾波 429
10.10.6 捲積濾波 431
10.10.7 邊緣檢測 433
10.11 小結 435
思考題 435
第11章 機器視覺案例 437
11.1 人臉辨識 437
11.1.1 人臉定位 437
11.1.2 人臉辨識 439
11.2 手寫數字識彆 446
11.2.1 手寫數字識彆算法 446
11.2.2 算法的Python實現 447
11.3 運動偵測 449
11.3.1 視頻采集 450
11.3.2 差分算法 452
11.3.3 光流法 456
11.4 形狀檢測 458
11.4.1 KNN算法概述 458
11.4.2 形狀特徵提取 459
11.4.3 形狀分類 459
11.5 小結 462
思考題 462
第12章 文本分類案例 463
12.1 文本分類概述 463
12.2 餘弦相似度分類 464
12.2.1 中文分詞 465
12.2.2 停用詞清理 467
12.2.3 算法實戰 468
12.3 樸素貝葉斯分類 473
12.3.1 算法描述 473
12.3.2 先驗概率計算 474
12.3.3 最大後驗概率 474
12.3.4 算法實現 474
12.4 自然語言處理 480
12.4.1 NLTK簡介 480
12.4.2 NLTK與jieba的配置 481
12.4.3 中文分詞並標注詞性 483
12.4.4 詞特徵指標分析 484
12.4.5 Web文檔分析 499
12.4.6 Web文檔的樸素貝葉斯分類 503
12.4.7 語法結構分析 515
12.4.8 Web文檔聚類 518
12.5 小結 526
思考題 526
· · · · · · (
收起)