纵横大数据——云计算数据基础设施 pdf epub mobi txt 电子书下载 2026

简体网页||繁体网页

☆☆☆☆☆

出版者:电子工业出版社

作者:何小朝

出品人:

页数:264

译者:

出版时间:2014-5

价格:49.00元

装帧:平装

isbn号码:9787121232138

丛书系列:

图书标签:

大数据
科普
技术
云计算
IT
大数据
云计算
数据基础设施
数据存储
数据处理
数据分析
分布式系统
Hadoop
Spark
数据安全

下载链接在页面底部

facebook linkedin mastodon messenger pinterest reddit telegram twitter viber vkontakte whatsapp 复制链接

想要找书就要到图书目录大全

book.wenda123.org

立刻按 ctrl+D收藏本页

你会得到大惊喜!!

具体描述

大数据的概念很火，但人们对它的认识却是混乱的：有人说大数据就是指所有的数据，有人说大数据是指线上行为、日志等半结构/非结构化的数据形态，有人说大数据就是以Hadoop为代表的新技术……到底什么是大数据？同样风风火火了很久的云计算与大数据有什么关系？令人眼花缭乱的众多大数据技术的本质是什么？各有什么优缺点？争论不休的“小变大”与“大变小”技术策略到底孰正孰邪？企业究竟应该如何定位与使用大数据，难道是为了Hadoop而Hadoop？未来的技术方向究竟如何？

《纵横大数据——云计算数据基础设施》结合现代企业数据管理实践，从策略、技术、应用、企业数据架构等多个维度，体系化地对大数据及相关技术进行了全面深入的论述：首先对大数据相关概念予以澄清；接着深入剖析各种大数据技术的内在本质，指出其各自的优缺点、适用场景与相互关系；同时对大数据技术“分”与“合”这两种广受争议的技术策略的内在联系进行了分析与讨论，明确指出现代数据管理技术的发展趋势；最后结合大数据时代企业新一代数据架构规划的实际，对大数据及相关技术在企业数据体系中的具体定位给出了切实可行的建议，并且面向云数据中心建设，提出了大数据云—云计算数据基础设施的概念与方法。

作者简介

目录信息

第1部分　大数据概论
第1章　大数据与云计算 2
1.1 云计算概论 3
1.2 大数据概论 4
1.2.1 现代数据管理需求分析 4
1.2.2 大数据的引入 9
1.2.3 大数据的定义与特征 10
1.2.4 大数据与互联网 12
1.2.5 大数据战略、大数据与大数据技术 14
1.3 大数据的技术实现—云计算 15
1.4 本章小结 16
第2章　关系数据库的挑战与应对 17
2.1 关系数据库技术的核心特征 18
2.2 主流关系数据库的挑战 22
2.2.1 经典DBMS的挑战 22
2.2.2 Shared Disk 23
2.2.3 Shared Nothing 24
2.3 改进型关系数据库 26
2.3.1 技术改进 26
2.3.2 主要产品代表 30
2.4 本章小结 40
第3章　非SQL技术简介 41
3.1 大数据技术家族 42
3.1.1 NoSQL 42
3.1.2 关系数据库联邦NewSQL 42
3.1.3 分布式海量文件管理 43
3.1.4 Map Reduce 43
3.2 分与合—云计算的两种技术路线 44
3.3 本章小结 44
第 2部分　“分”为云—数据切分
第4章　NoSQL 46
4.1 NoSQL的引入 47
4.1.1 概念诠释与特征分析 47
4.1.2 NoSQL的本质 50
4.2 NoSQL家族 52
4.2.1 NoSQL产品目录与分类 52
4.2.2 Hadoop之HBase 54
4.2.3 Facebook之Cassandra 58
4.2.4 MongoDB与CouchDB 61
4.2.5 Oracle NoSQL DB 63
4.2.6 Memcached与Redis 65
4.2.7 图数据库Neo4J 65
4.2.8 其他NoSQL数据库 67
4.2.9 问题与疑惑 67
4.3 NoSQL技术探研 68
4.3.1 NoSQL理论基础 68
4.3.2 NoSQL技术手段 75
4.3.3 NoSQL技术解析 83
4.4 NoSQL与关系数据库 88
4.5 本章小结 89
第5章　NewSQL—关系数据库联邦 90
5.1 数据库联邦的引入 91
5.1.1 企业业务数据管理面临的问题 91
5.1.2 垂直分库 92
5.1.3 水平分表 93
5.1.4 读写分离 95
5.1.5 联邦的引入 97
5.2 “联邦”的设计与实践 99
5.2.1 企业级“联邦”架构设计 99
5.2.2 公共基础服务设计 103
5.2.3 联邦的元数据库 106
5.2.4 联邦的应用实践 107
5.3 “联邦”技术分析 108
5.3.1 关于“垂直分库” 108
5.3.2 如何“水平分表” 110
5.3.3 关于“读写分离” 112
5.3.4 基本方法—分布与聚合 114
5.3.5 关于分布式事务 116
5.3.6 关联操作 117
5.3.7 冗余策略 119
5.3.8 异步解耦策略 120
5.3.9 使用缓存 122
5.3.10 其他问题 123
5.4 数据库联邦、NoSQL与主流关系数据库 124
5.4.1 技术与应用—八仙过海，各显神通 124
5.4.2 互联网的神话 126
5.5 本章小结 128
第6章　文件系统联邦 129
6.1 问题的引入 130
6.1.1 关于几个数据概念的澄清 130
6.1.2 文件数据管理的困难 131
6.1.3 文件系统联邦的引入 133
6.2 典型开源技术介绍 135
6.2.1 MogileFS 135
6.2.2 FastDFS 136
6.2.3 MogileFS与FastDFS的对比 138
6.3 技术分析 139
6.4 本章小结 140
第7章　平民化的分布计算—MapReduce 141
7.1 分布式计算概述 142
7.1.1 几个概念的澄清 142
7.1.2 分布式计算技术综述 143
7.1.3 MapReduce的引入 147
7.2 MapReduce技术介绍 148
7.2.1 设计思想 148
7.2.2 MapReduce框架介绍 152
7.3 MapReduce技术分析 160
7.3.1 关于效率 160
7.3.2 关于扩展性 162
7.3.3 关于可靠性与可用性 163
7.3.4 关于MapReduce与关系数据库 164
7.3.5 关于适用的数据类型 167
7.3.6 关于数据存储与管理 168
7.4 MapReduce的应用实践 169
7.5 本章小结 170
第8章　后Hadoop时代 171
8.1 Hadoop体系及其困惑 172
8.2 Google的新三驾马车 173
8.2.1 新一代搜索引擎Caffeine 173
8.2.2 大规模图处理系统Pregel 174
8.2.3 Dremel—秒级实现PB级数据分析 175
8.3 Symphony MapReduce 181
8.4 后Hadoop时代即将来临 181
8.5 本章小结 183
第9章　InfiniData—一种关系型云数据库的设计与实践 184
9.1 现代企业数据管理需求再分析 185
9.1.1 新的企业数据需求—海量关系数据管理 185
9.1.2 技术分析 187
9.2 关系型云数据库架构设计 188
9.2.1 关系型云数据库的引入 188
9.2.2 技术架构设计 189
9.3 云存储层 192
9.3.1 逻辑架构 193
9.3.2 物理架构 194
9.3.3 关系模型云存储元 196
9.4 云计算层 198
9.4.1 MapReduce云计算引擎 198
9.4.2 集群式云计算引擎 200
9.4.3 两种引擎的比较 201
9.5 云存储索引层 202
9.5.1 存储索引的管理 202
9.5.2 索引云运行时动态创建 203
9.6 技术分析 203
9.7 本章小结 205
第3部分　云计算的分与合
第10章　合为“云”—数据整合 208
10.1 数据整合的需求分析 209
10.2 存储整合云 210
10.3 数据库整合云 211
10.4 本章小结 213
第11章　关于分与合的讨论 214
11.1 困惑—分与合，孰是孰非？ 215
11.2 分为技，合为神 216
11.3 分为雨，合为云—大数据云 217
11.4 数据管理技术发展趋势总结 219
11.4.1 数据管理物理基础设施发展趋势 219
11.4.2 数据管理软基础设施发展趋势 220
11.5 本章小结 221
第12章　企业大数据技术体系与云计算数据基础设施 222
12.1 现代企业数据管理需求再分析 223
12.2 新一代企业数据体系建设 225
12.2.1 新一代企业数据体系建设的定义与内容 225
12.2.2 新一代企业数据分类体系 228
12.2.3 新一代企业数据分布与流转规划 230
12.3 大数据技术在企业数据架构中的定位 234
12.3.1 技术规划战略 234
12.3.2 大数据技术架构规划 235
12.3.3 典型场景—电子渠道线上行为分析 238
12.4 云计算数据基础设施概念的引入 240
12.5 本章小结 242
后记—超越技术 243
参考文献 245
· · · · · · (收起)

读后感

评分☆☆☆☆☆

用户评价

评分☆☆☆☆☆

读完前三分之一的内容，我不得不提一下作者在处理“安全与合规”这块内容时的细致入微。在如今大数据无处不在的时代，安全问题早已不是可选项，而是生存的基石。这本书在这方面的着墨之重，超出了我原先的预估。它没有停留在设置防火墙这种基础操作层面，而是深入探讨了数据生命周期中各个环节的安全策略，从数据的采集、传输、存储到最终的销毁，每一个节点都有对应的安全防护措施被详细阐述。特别是关于“零信任”架构在云环境中的落地实践，作者提供了一套清晰的路线图，如何从小规模试点逐步推广到全企业级的安全模型。这种前瞻性布局的讲解，让我意识到构建一个健壮的云数据基础设施，安全必须是“内建”而非“附加”的。这本书让我对那些光鲜亮丽的业务创新背后，隐藏着多少必须被严密看管的“隐形资产”有了更深刻的敬畏感。

评分☆☆☆☆☆

这本书的封面设计得非常抓人眼球，那种深邃的蓝色调配上闪烁的科技感线条，立刻让人联想到数据海洋的无垠与计算的浩瀚。我拿到书时，首先被它厚重的质感所吸引，感觉里头一定蕴含着扎实的干货。我原以为这会是一本偏向理论模型的艰深著作，毕竟“云计算”和“基础设施”这两个词听起来就自带一种高冷的学术气息。然而，翻开目录，我惊喜地发现作者似乎有意构建一个从宏观战略到微观实践的完整叙事框架。它没有一上来就堆砌那些晦涩难懂的算法公式，反而像是邀请读者进入一个精心规划的数字化城市，一步步带你认识支撑这个城市的“地基”——那些看不见摸不着的云端架构是如何搭建起来的。特别是关于资源调度和弹性伸缩的章节，作者用了很多生动的比喻，比如将服务器集群比作一个高效率的物流中心，数据流就像是各种包裹，需要被精准、快速地分发到需求最高的地方。这种叙事方式极大地降低了初学者的理解门槛，让我感觉自己不是在啃一本技术手册，而是在听一位经验丰富的架构师讲述他如何“白手起家”打造一个支撑海量业务的数字平台。这种务实的切入点，确实让人对后续内容的深入探讨充满了期待。

评分☆☆☆☆☆

这本书的排版和图表设计，说实话，是其一大亮点，极大地提升了阅读体验。很多关于网络拓扑和数据流转的复杂概念，如果仅凭文字描述，很容易让人迷失在术语的迷宫中。然而，作者团队显然在可视化上下了苦功夫。那些流程图和架构示意图，逻辑清晰、层级分明，很多时候，我看图比看文字更快地把握了核心概念。比如，在解释跨区域灾备策略时，那种用不同颜色和箭头清晰标记数据同步方向和状态的图示，简直是教科书级别的优秀范例。这表明作者不仅精通技术，也深谙如何向他人有效地传达复杂信息。这对于团队内部知识共享和新员工培训都有极高的参考价值。它不只是一本供个人阅读的书籍，更像是一份可以被打印出来、贴在白板上进行团队讨论的“标准操作指南”。

评分☆☆☆☆☆

这本书的行文风格，坦率地说，充满了老派工程师的严谨与一丝不苟，但又巧妙地融入了现代互联网产品的快速迭代思维。我尤其欣赏作者在讨论不同数据存储技术选型时的那种“没有最好，只有最适合”的辩证视角。他没有盲目推崇某一种最新的时髦技术，而是深入剖析了每种方案的底层权衡——延迟、吞吐量、持久性、成本，每一个维度都被放在天平上反复掂量。在某一章中，我清晰地看到作者对比了两种看似相似的分布式数据库，但通过引入一个模拟的高并发场景，瞬间就凸显出两者在实际生产环境中的巨大差异。这种基于案例的分析，远比教科书上干巴巴的定义来得有力。它迫使读者跳出“我会用”的浅层认知，去思考“为什么是这样设计”的深层逻辑。这种深度挖掘问题的态度，对于那些已经工作几年，开始负责系统优化和架构决策的中级技术人员来说，简直是一剂强心针，因为它提供的不是现成的答案，而是解决问题的思维工具包。

评分☆☆☆☆☆

总体而言，这本书给我留下的印象是“全面、深刻且具备极高的实操指导价值”。它成功地架起了一座连接“理论概念”与“生产实战”的桥梁。我个人认为，这本书的读者群体定位非常精准：它既能满足那些希望系统性了解云计算数据基础设施全貌的决策者，也能为那些日常与这些系统打交道的工程师提供可靠的参考和解决问题的思路。我特别喜欢作者在每章末尾设置的“反思与挑战”环节，这些问题通常非常尖锐，直指当前行业面临的痛点，比如如何在保证性能的同时有效控制公有云的隐性成本、如何平衡数据治理与业务创新的速度等。这种引导性的思考，让阅读过程变成了一种主动的知识构建活动，而不是被动的接受信息。读完后，我感觉自己对支撑现代数字化世界的那些庞大而复杂的云端引擎，有了一种更加清晰、更有掌控感的理解。

评分☆☆☆☆☆