第1章 硬件、進程和綫程 1
1.1 計算機的內部結構 1
1.2 多核處理器的緣起 3
1.2.1 在單芯片上支持多綫程 4
1.2.2 通過處理器核心流水綫作業提高指令發齣率 8
1.2.3 使用緩存保存最近使用的數據 10
1.2.4 用虛擬內存存儲數據 12
1.2.5 從虛擬地址轉換到物理地址 13
1.3 多處理器係統的特徵 14
1.4 源代碼到匯編語言的轉換 16
1.4.1 32位與64位代碼的性能 18
1.4.2 確保內存操作的正確順序 19
1.4.3 進程和綫程的差異 21
1.5 小結 23
第2章 高性能編碼 24
2.1 定義性能 24
2.2 瞭解算法復雜度 25
2.2.1 算法復雜度的示例 26
2.2.2 算法復雜度的重要性 28
2.2.3 謹慎運用算法復雜度 30
2.3 結構如何影響性能 30
2.3.1 在源代碼和生成結構上權衡性能和便利性 30
2.3.2 利用庫結構化應用程序 33
2.3.3 數據結構對性能的影響 42
2.4 編譯器的作用 47
2.4.1 兩種編譯器優化 48
2.4.2 選擇閤適的編譯器選項 50
2.4.3 如何用跨文件優化提高性能 51
2.4.4 使用配置文件反饋 53
2.4.5 潛在的指針彆名會如何抑製編譯器優化 55
2.5 通過分析確定占用時間的地方 58
2.6 怎樣避免手動優化 64
2.7 從設計角度看性能 64
2.8 小結 65
第3章 識彆並行機會 66
3.1 使用多進程提高係統工作效率 66
3.2 多用戶使用一個係統 67
3.3 通過整閤提高機器工作效率 68
3.3.1 用容器隔離共享一個係統的應用程序 69
3.3.2 使用虛擬機監控程序托管多個操作係統 69
3.4 采用並行機製提高單個任務的性能 71
3.4.1 理解並行應用程序 72
3.4.2 並行如何影響算法的選擇 72
3.4.3 Amdahl定律 73
3.4.4 確定最大實際綫程數 75
3.4.5 同步成本怎樣降低擴展性 76
3.5 並行模式 78
3.5.1 使用SIMD指令的數據並行 78
3.5.2 通過進程或綫程實現並行化 79
3.5.3 多個獨立任務 79
3.5.4 多個鬆散耦閤的任務 80
3.5.5 相同任務的多個副本 81
3.5.6 單個任務拆分到多個綫程 82
3.5.7 使用流水綫任務完成某個事項 82
3.5.8 將工作分配給客戶端和服務器 83
3.5.9 將責任劃分給生産者和消費者 84
3.5.10 結閤多種並行化策略 85
3.6 依賴關係對並行運行代碼能力的影響 85
3.6.1 反依賴和輸齣依賴 86
3.6.2 通過推測打破依賴 88
3.6.3 關鍵路徑 91
3.7 發現並行機會 92
3.8 小結 93
第4章 同步和數據共享 94
4.1 數據爭用 94
4.1.1 使用工具檢測數據爭用 95
4.1.2 避免數據爭用 98
4.2 同步原語 98
4.2.1 互斥量和臨界區 98
4.2.2 自鏇鎖 99
4.2.3 信號量 100
4.2.4 讀寫鎖 100
4.2.5 屏障 101
4.2.6 原子操作和無鎖代碼 102
4.3 死鎖和活鎖 103
4.4 綫程和進程間的通信 104
4.4.1 內存、共享內存和內存映射文件 104
4.4.2 條件變量 105
4.4.3 信號和事件 107
4.4.4 消息隊列 108
4.4.5 命名管道 108
4.4.6 通過網絡棧進行通信 109
4.4.7 綫程之間共享數據的其他方法 110
4.5 存儲綫程私有數據 110
4.6 小結 112
第5章 使用POSIX綫程 113
5.1 創建綫程 113
5.1.1 綫程終止 114
5.1.2 用子綫程接收和傳遞數據 115
5.1.3 分離綫程 116
5.1.4 設置pthread的屬性 117
5.2 編譯多綫程代碼 119
5.3 進程終止 121
5.4 綫程之間共享數據 122
5.4.1 使用互斥鎖保護訪問 122
5.4.2 互斥鎖屬性 124
5.4.3 使用自鏇鎖 125
5.4.4 讀寫鎖 127
5.4.5 屏障 129
5.4.6 信號量 130
5.4.7 條件變量 136
5.5 變量和內存 140
5.6 多進程編程 143
5.6.1 在進程之間共享內存 144
5.6.2 在進程之間共享信號量 147
5.6.3 消息隊列 147
5.6.4 管道和命名管道 150
5.6.5 使用信號與進程通信 151
5.7 套接字 156
5.8 可重入代碼和編譯器標誌 158
5.9 小結 160
第6章 Windows綫程 161
6.1 創建Windows本機綫程 161
6.1.1 終止綫程 165
6.1.2 創建和重新啓動掛起的綫程 167
6.1.3 使用內核資源的句柄 168
6.2 同步和資源共享的方式 168
6.2.1 綫程間需要同步的一個例子 169
6.2.2 保護對臨界區代碼的訪問 170
6.2.3 用互斥量保護代碼段 172
6.2.4 輕量級讀寫鎖 173
6.2.5 信號量 175
6.2.6 條件變量 177
6.2.7 嚮其他綫程或進程發齣事件完成的信號 178
6.3 Windows中的寬字符串處理 179
6.4 創建進程 180
6.4.1 在進程之間共享內存 182
6.4.2 在子進程中繼承句柄 185
6.4.3 互斥量命名及其在進程間的共享 186
6.4.4 用管道通信 187
6.4.5 用套接字進行通信 190
6.5 變量的原子更新 193
6.6 分配綫程本地存儲 195
6.7 設置綫程的優先級 197
6.8 小結 198
第7章 自動並行化和OpenMP 199
7.1 使用自動並行化産生並行代碼 199
7.1.1 識彆和並行約簡 203
7.1.2 對包含調用的代碼進行自動並行化 204
7.1.3 協助編譯器實現代碼的自動並行化 206
7.2 使用OpenMP生成並行應用程序 208
7.2.1 使用OpenMP並行化循環 209
7.2.2 OpenMP應用程序的運行時行為 210
7.2.3 OpenMP並行區域中的變量作用域 210
7.2.4 使用OpenMP並行化約簡 212
7.2.5 在並行區域外訪問私有數據 212
7.2.6 使用調度改進工作分配 214
7.2.7 用並行段完成獨立工作 217
7.2.8 嵌套並行 218
7.2.9 使用OpenMP動態定義並行任務 219
7.2.10 保持數據對綫程私有 223
7.2.11 控製OpenMP運行時環境 225
7.2.12 等待工作完成 227
7.2.13 限製執行代碼區域的綫程 229
7.3 確保並行區域的代碼按順序執行 232
7.4 摺疊循環改進工作負荷均衡 233
7.5 強製實現內存一緻性 234
7.6 並行化示例 235
7.7 小結 239
第8章 手工編碼的同步和共享 240
8.1 原子操作 240
8.1.1 用比較和交換指令構成更復雜的原子操作 242
8.1.2 強製實現內存排序以確保正確操作 245
8.1.3 編譯器對內存排序指令的支持 247
8.1.4 編譯器對操作的重新排序 247
8.1.5 易失變量 251
8.2 操作係統提供的原子操作 251
8.3 無鎖算法 254
8.3.1 Dekker算法 254
8.3.2 帶循環緩存的生産者/消費者 256
8.3.3 擴展到多個消費者或生産者 259
8.3.4 將生産者/消費者擴展到多個綫程 260
8.3.5 更改生産者/消費者代碼為使用原子操作 266
8.3.6 ABA問題 268
8.4 小結 271
第9章 基於多核處理器的擴展 272
9.1 對應用程序擴展的限製 272
9.1.1 串行代碼對性能的限製 272
9.1.2 超綫性擴展 275
9.1.3 工作負荷不均衡 276
9.1.4 熱鎖 277
9.1.5 庫代碼擴展 282
9.1.6 工作量不足 284
9.1.7 算法限製 286
9.2 擴展的硬件限製 288
9.2.1 核心之間的帶寬共享 288
9.2.2 僞共享 290
9.2.3 緩存衝突和容量 293
9.2.4 流水綫資源匱乏 297
9.3 操作係統對擴展性的限製 301
9.3.1 過度訂閱 301
9.3.2 使用處理器綁定改善內存局部性 303
9.3.3 優先級反轉 310
9.4 多核處理器和擴展 310
9.5 小結 311
第10章 其他並行技術 312
10.1 基於GPU的運算 312
10.2 語言擴展 314
10.2.1 綫程構建模塊 314
10.2.2 Cilk++ 317
10.2.3 Grand Central Dispatch 320
10.2.4 為未來C和C++標準提議的可能功能 321
10.2.5 微軟的C++/CLI 324
10.3 其他語言 325
10.4 集群技術 327
10.4.1 MPI 328
10.4.2 以MapReduce作為擴展策略 331
10.4.3 網格 332
10.5 事務性內存 332
10.6 嚮量化 333
10.7 小結 334
第11章 結束語 335
11.1 編寫並行應用程序 335
11.1.1 識彆任務 335
11.1.2 估算性能提升 336
11.1.3 確定依賴關係 336
11.1.4 數據爭用和互斥鎖擴展限製 336
11.1.5 鎖的粒度 337
11.2 多核處理器上的並行代碼 337
11.3 並行化的未來 339
參考文獻 340
索引 342
· · · · · · (
收起)