计算机体系结构

计算机体系结构 pdf epub mobi txt 电子书 下载 2026

出版者:机械工业出版社
作者:[美] 约翰·L. 亨尼斯(John L. Hennessy)
出品人:
页数:930
译者:
出版时间:2019-7-9
价格:269.00
装帧:
isbn号码:9787111631101
丛书系列:经典原版书库
图书标签:
  • 计算机
  • CS
  • 计算机体系结构
  • 架构
  • 计算机体系结构
  • 计算机组成原理
  • 数字逻辑
  • 处理器
  • 存储系统
  • 并行计算
  • 流水线
  • 缓存
  • 指令集
  • 系统设计
想要找书就要到 图书目录大全
立刻按 ctrl+D收藏本页
你会得到大惊喜!!

具体描述

在过去20多年的时间里,本书一直是计算机领域的教师、学生和体系结构设计人员的必读之作。两位作者Hennessy和Patterson于2017年荣获图灵奖,肯定了他们对计算机领域持久而重要的技术贡献。随着处理器和系统架构的最新发展,第6版进行了全面修订。这一版采用RISC-V指令集体系结构,这是一个现代的RISC指令集,被设计为免费且可公开采用的标准。书中还增加了一个关于领域特定体系结构的新章节,并更新了关于仓储级计算的章节,其中介绍了谷歌最新的WSC。与本书之前版本的目标一样,本书致力于揭开计算机体系结构的神秘面纱,关注那些令人兴奋的技术创新,同时强调良好的工程设计。

作者简介

John L. Hennessy 斯坦福大学校长,IEEE和ACM会士,美国国家工程研究院院士及美国科学艺术研究院院士。Hennessy教授因为在RISC技术方面做出了突出贡献而荣获2001年的Eckert-Mauchly奖章,他也是2001年Seymour Cray计算机工程奖得主,并且和David A.Patterson分享了2000年约翰 · 冯 · 诺依曼奖。

David A. Patterson 加州大学伯克利分校计算机科学系教授,美国国家工程研究院院士,IEEE和ACM会士。他因为对RISC技术的贡献而荣获1995年IEEE技术成就奖,而在RAID技术方面的成就为他赢得了1999年IEEE Reynold Johnson信息存储奖。2000年他和John L. Hennessy分享了约翰 · 冯 · 诺依曼奖。

目录信息

Chapter 1 Fundamentals of Quantitative Design and Analysis
1.1 Introduction 2
1.2 Classes of Computers 6
1.3 Defining Computer Architecture 11
1.4 Trends in Technology 18
1.5 Trends in Power and Energy in Integrated Circuits 23
1.6 Trends in Cost 29
1.7 Dependability 36
1.8 Measuring, Reporting, and Summarizing Performance 39
1.9 Quantitative Principles of Computer Design 48
1.10 Putting It All Together: Performance, Price, and Power 55
1.11 Fallacies and Pitfalls 58
1.12 Concluding Remarks 64
1.13 Historical Perspectives and References 67
Case Studies and Exercises by Diana Franklin 67
Chapter 2 Memory Hierarchy Design
2.1 Introduction 78
2.2 Memory Technology and Optimizations 84
2.3 Ten Advanced Optimizations of Cache Performance 94
2.4 Virtual Memory and Virtual Machines 118
2.5 Cross-Cutting Issues: The Design of Memory Hierarchies 126
2.6 Putting It All Together: Memory Hierarchies in the ARM Cortex-A53 and Intel Core i7 6700 129
2.7 Fallacies and Pitfalls 142
2.8 Concluding Remarks: Looking Ahead 146
2.9 Historical Perspectives and References 148
Case Studies and Exercises by Norman P. Jouppi, Rajeev
Balasubramonian, Naveen Muralimanohar, and Sheng Li
Chapter 3 Instruction-Level Parallelism and Its Exploitation
3.1 Instruction-Level Parallelism: Concepts and Challenges 168
3.2 Basic Compiler Techniques for Exposing ILP 176
3.3 Reducing Branch Costs With Advanced Branch Prediction 182
3.4 Overcoming Data Hazards With Dynamic Scheduling 191
3.5 Dynamic Scheduling: Examples and the Algorithm 201
3.6 Hardware-Based Speculation 208
3.7 Exploiting ILP Using Multiple Issue and Static Scheduling 218
3.8 Exploiting ILP Using Dynamic Scheduling, Multiple Issue, and Speculation 222
3.9 Advanced Techniques for Instruction Delivery and Speculation 228
3.10 Cross-Cutting Issues 240
3.11 Multithreading: Exploiting Thread-Level Parallelism to Improve Uniprocessor Throughput 242
3.12 Putting It All Together: The Intel Core i7 6700 and ARM Cortex-A53 247
3.13 Fallacies and Pitfalls 258
3.14 Concluding Remarks: What’s Ahead 264
3.15 Historical Perspective and References 266
Case Studies and Exercises by Jason D. Bakos and Robert P. Colwell 266
Chapter 4 Data-Level Parallelism in Vector, SIMD, and GPU Architectures
4.1 Introduction 282
4.2 Vector Architecture 283
4.3 SIMD Instruction Set Extensions for Multimedia 304
4.4 Graphics Processing Units 310
4.5 Detecting and Enhancing Loop-Level Parallelism 336
4.6 Cross-Cutting Issues 345
4.7 Putting It All Together: Embedded Versus Server GPUs and Tesla Versus Core i7 346
4.8 Fallacies and Pitfalls 353
4.9 Concluding Remarks 357
4.10 Historical Perspective and References 357
Case Study and Exercises by Jason D. Bakos 357
Chapter 5 Thread-Level Parallelism
5.1 Introduction 368
5.2 Centralized Shared-Memory Architectures 377
5.3 Performance of Symmetric Shared-Memory Multiprocessors 393
5.4 Distributed Shared-Memory and Directory-Based Coherence 404
5.5 Synchronization: The Basics 412
5.6 Models of Memory Consistency: An Introduction 417
5.7 Cross-Cutting Issues 422
5.8 Putting It All Together: Multicore Processors and Their Performance 426
5.9 Fallacies and Pitfalls 438
5.10 The Future of Multicore Scaling 442
5.11 Concluding Remarks 444
5.12 Historical Perspectives and References 445
Case Studies and Exercises by Amr Zaky and David A. Wood 446
Chapter 6 Warehouse-Scale Computers to Exploit Request-Level and Data-Level Parallelism
6.1 Introduction 466
6.2 Programming Models and Workloads for Warehouse-Scale Computers 471
6.3 Computer Architecture of Warehouse-Scale Computers 477
6.4 The Efficiency and Cost of Warehouse-Scale Computers 482
6.5 Cloud Computing: The Return of Utility Computing 490
6.6 Cross-Cutting Issues 501
6.7 Putting It All Together: A Google Warehouse-Scale Computer 503
6.8 Fallacies and Pitfalls 514
6.9 Concluding Remarks 518
6.10 Historical Perspectives and References 519
Case Studies and Exercises by Parthasarathy Ranganathan 519
Chapter 7 Domain-Specific Architectures
7.1 Introduction 540
7.2 Guidelines for DSAs 543
7.3 Example Domain: Deep Neural Networks 544
7.4 Google’s Tensor Processing Unit, an Inference Data Center Accelerator 557
7.5 Microsoft Catapult, a Flexible Data Center Accelerator 567
7.6 Intel Crest, a Data Center Accelerator for Training 579
7.7 Pixel Visual Core, a Personal Mobile Device Image Processing Unit 579
7.8 Cross-Cutting Issues 592
7.9 Putting It All Together: CPUs Versus GPUs Versus DNN Accelerators 595
7.10 Fallacies and Pitfalls 602
7.11 Concluding Remarks 604
7.12 Historical Perspectives and References 606
Case Studies and Exercises by Cliff Young 606
Appendix A Instruction Set Principles
A.1 Introduction A-2
A.2 Classifying Instruction Set Architectures A-3
A.3 Memory Addressing A-7
A.4 Type and Size of Operands A-13
A.5 Operations in the Instruction Set A-15
A.6 Instructions for Control Flow A-16
A.7 Encoding an Instruction Set A-21
A.8 Cross-Cutting Issues: The Role of Compilers A-24
A.9 Putting It All Together: The RISC-V Architecture A-33
A.10 Fallacies and Pitfalls A-42
A.11 Concluding Remarks A-46
A.12 Historical Perspective and References A-47
Exercises by Gregory D. Peterson A-47
Appendix B Review of Memory Hierarchy
B.1 Introduction B-2
B.2 Cache Performance B-15
B.3 Six Basic Cache Optimizations B-22
B.4 Virtual Memory B-40
B.5 Protection and Examples of Virtual Memory B-49
B.6 Fallacies and Pitfalls B-57
B.7 Concluding Remarks B-59
B.8 Historical Perspective and References B-59
Exercises by Amr Zaky B-60
Appendix C Pipelining: Basic and Intermediate Concepts
C.1 Introduction C-2
C.2 The Major Hurdle of Pipelining—Pipeline Hazards C-10
C.3 How Is Pipelining Implemented C-26
C.4 What Makes Pipelining Hard to Implement C-37
C.5 Extending the RISC V Integer Pipeline to Handle Multicycle Operations C-45
C.6 Putting It All Together: The MIPS R4000 Pipeline C-55
C.7 Cross-Cutting Issues C-65
C.8 Fallacies and Pitfalls C-70
C.9 Concluding Remarks C-71
C.10 Historical Perspective and References C-71
Updated Exercises by Diana Franklin C-71
References R-1
Index I-1
Online Appendices
Appendix D Storage Systems
Appendix E Embedded Systems
by Thomas M. Conte
Appendix F Interconnection Networks
by Timothy M. Pinkston and Jos.e Duato
Appendix G Vector Processors in More Depth
by Krste Asanovic
Appendix H Hardware and Software for VLIW and EPIC
Appendix I Large-Scale Multiprocessors and Scientific Applications
Appendix J Computer Arithmetic
by David Goldberg
Appendix K Survey of Instruction Set Architectures
Appendix L Advanced Concepts on Address Translation
by Abhishek Bhattacharjee
Appendix M Historical Perspectives and References
· · · · · · (收起)

读后感

评分

书对应的CD资源在这:[https://booksite.elsevier.com/9780123747501/downloads/Resources.zip] 勿需多言,此书让我大开眼界!相见恨晚!截止明年3月,必须啃完! 此版增加了一个新的章节,定制化的架构,因为在特定领域里,定制化的架构比通用架构有更好的性能 此版最大改动是...  

评分

如题,翻译差,差,差。。。。。。。。。。。。。。。。。。。。。!!!!!!!!!!!!翻译差,差,翻译差,差,翻译差,差,翻译差,差,翻译差,差,如题,翻译差,差,差。。。。。。。。。。。。。。。。。。。。。!!!!!!!!!!!!翻译差,差,翻译差,差,...  

评分

每一个搞计算机的必读之一,如果想让你的程序运行的快,那么你就读完这本书。 这本书会让你真正的理解什么是cache, cache并不是对程序员是透明的,在编程的时候是需要考虑到的。 这本书需要读至少两遍才能真正体会其中的奥秘。 这本书是我们公司人手必读的一本书之一。  

评分

书对应的CD资源在这:[https://booksite.elsevier.com/9780123747501/downloads/Resources.zip] 勿需多言,此书让我大开眼界!相见恨晚!截止明年3月,必须啃完! 此版增加了一个新的章节,定制化的架构,因为在特定领域里,定制化的架构比通用架构有更好的性能 此版最大改动是...  

评分

翻译太差,汉字是认识,但句子没逻辑,很多翻译 是错的。还得看原版,浪费时间,教授们没时间自己翻译,都是研究生做的。书绝对是经典,一定要买原版,不要看翻译,太坑了。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。...  

用户评价

评分

我花了整个暑假的时间来研读这本《计算机体系结构》,老实讲,它的深度和广度是毋庸置疑的,但其叙事节奏简直像是在爬一座陡峭的山峰,每一步都充满了挑战。这本书在处理并行计算和多核设计时,展现了极强的学术功底。作者对向量处理器、SIMD扩展的描述详尽到令人发指,每一个指令集操作的底层实现逻辑都剖析得入木三分。尤其是关于内存一致性模型(Consistency Models)的章节,简直是理论的巅峰,它不仅仅是描述了理论,更是探讨了不同模型之间的权衡——比如顺序一致性与释放一致性的性能差异,以及这对应用程序开发者意味着什么。然而,这种极致的深度也带来了一个副作用:它牺牲了与实际工程应用的紧密联系。书中引用的许多经典案例,虽然具有里程碑意义,但放在当下来看,与我们日常接触的云计算平台、边缘计算设备上的实际优化策略显得有些脱节。我希望能看到更多关于现代GPU架构如何利用其庞大的并行度来解决非图形计算问题的实例,而不是过多地纠结于几十年前的并行机设计细节。它更像是一部体系结构的“史诗”,值得收藏,但要从中提炼出立即可用的工程经验,则需要读者自己进行大量的二次加工和知识迁移。

评分

这本书的排版和内容组织方式,给我的阅读体验打了不少折扣。它仿佛是将一系列高度专业化的讲义生硬地拼接在一起,段落之间缺乏自然的过渡,章节间的逻辑跳跃性很大。比如,在详细介绍了分支预测器的复杂结构后,下一小节突然跳到了I/O处理的DMA机制,两者之间的联系非常微弱,让我感觉像是在同时阅读好几本不同的专业书籍。从读者的角度看,我希望体系结构的学习能够构建起一个清晰的“自底向上”或“自顶向下”的脉络,例如,先清晰地定义什么是“透明性”,然后依次讲解如何通过缓存、指令重排等技术来实现这种透明性。这本书的优点在于,它对某些关键技术点的理论推导非常彻底,数学公式的严谨性无可挑剔,这对于那些追求数学证明的读者来说是福音。但是,对于绝大多数希望理解“为什么”和“怎么做”的工程师而言,这些严密的推导反而成了理解的障碍。它像是一个完美的理论模型,却缺少了连接模型与现实世界“毛刺”和“妥协”的桥梁。

评分

这本书的语言风格是极其正式和学术化的,几乎没有任何作者的“个人色彩”或“教学热情”流露出来。它更像是一份经过多次同行评审的官方技术文档,而不是一本旨在激发学习兴趣的读物。所有的论述都遵循着最高的客观性标准,论据充分,逻辑链条严密,但阅读起来却有一种冰冷的距离感。我尝试用它来辅助我的一个项目——设计一个简化的嵌入式系统CPU,结果发现,书中虽然提供了理想化的模型,但面对实际的资源限制和实时性要求时,这些模型往往需要大量的“打折”和“变通”。这本书的价值在于提供了一个理想化的基准和一套完备的理论框架,它告诉你“理论上最好的设计应该是什么样子的”。但是,它并没有很好地教会我如何在“不完美”的现实世界中进行“次优”但可行的工程决策。总而言之,这是一本供人“查阅定义”和“验证理论深度”的工具书,而不是一本适合在深夜里伴随着咖啡,激发你对计算机奥秘产生无限遐想的“启蒙之作”。

评分

这本《计算机体系结构》的书籍,坦白说,对我这个初次涉足计算机科学领域的门外汉来说,简直是一场硬仗。我满怀憧憬地翻开第一页,希望能迅速掌握CPU如何像个指挥家一样调度着复杂的运算流程,然而,迎接我的是一连串关于指令集架构(ISA)、流水线设计、存储器层次结构的专业术语。作者似乎默认读者已经对数字逻辑和基础电子学有相当的了解,对于那些核心概念的阐述,虽然理论上是严谨的,但缺乏足够生动的比喻和逐步深入的引导。举例来说,当谈到缓存一致性问题时,书中直接抛出了MESI协议的复杂状态转换图,看得我云里雾里,不得不去搜索引擎上反复查找“缓存行”、“写穿透”、“写回”这些概念的通俗解释。全书的图示也多是标准的、略显陈旧的系统框图,对于理解数据流动的动态过程帮助有限。我期望看到更多现代处理器,比如主流的x86或ARM架构是如何在实际中权衡性能与功耗的案例分析,而非仅仅停留在理论模型上。这本书更像是一本为研究生准备的教科书,对于想快速构建整体概念的自学者来说,门槛实在太高了,需要极大的毅力和耐心去啃食每一个技术细节。

评分

我必须承认,《计算机体系结构》这本书在某些特定领域,特别是涉及到性能分析和功耗管理方面,提供了非常独到的见解。书中关于性能公式的推导,以及如何利用Amhdahl定律进行瓶颈分析的部分,写得非常清晰和富有启发性。它教会了我如何用量化的思维去审视一个设计决策背后的性能收益和成本。作者对功耗和热设计在现代处理器中的日益重要性给予了足够的重视,这在一些较老的教材中是难以见到的。他们详细讨论了动态电压和频率调节(DVFS)背后的硬件机制,以及如何通过软件层次的干预来优化能效比。这部分内容无疑是极具价值的,它反映了作者对当前计算领域发展趋势的敏锐洞察力。然而,这种侧重于“性能指标”和“功耗预算”的讨论,使得本书在底层硬件设计细节上略显单薄。例如,对于特定工艺节点下的晶体管级设计对体系结构的影响,或者新型存储技术(如MRAM, ReRAM)的架构适配性,书中着墨不多,留下了不少空白,让人感到意犹未尽。

评分

评分

评分

评分

评分

本站所有内容均为互联网搜索引擎提供的公开搜索信息,本站不存储任何数据与内容,任何内容与数据均与本站无关,如有需要请联系相关搜索引擎包括但不限于百度google,bing,sogou

© 2026 book.wenda123.org All Rights Reserved. 图书目录大全 版权所有