本書是您縱情享用數據之美的得力助手。作為處理海量數據集的理想工具,Apache Hadoop架構是MapReduce算法的一種開源應用,是Google(榖歌)開創其帝國的重要基石。本書內容豐富,展示瞭如何使用Hadoop構建可靠、可伸縮的分布式係統,程序員可從中探索如何分析海量數據集,管理員可以瞭解如何建立與運行Hadoop集群。.
本書完全通過案例學習來展示如何用Hadoop解決特殊問題,它將幫助您:
使用Hadoop分布式文件係統(HDFS)來存儲海量數據集,通過MapReduce對這些數據集運行分布式計算..
熟悉Hadoop的數據和I/O構件,用於壓縮、數據集成、序列化和持久處理
洞悉編寫MapReduce實際應用程序時常見陷阱和高級特性
設計、構建和管理專用的Hadoop集群或在雲上運行Hadoop
使用Pig這種高級的查詢語言來處理大規模數據
利用HBase這個Hadoop數據庫來處理結構化和半結構化數據
學習Zookeeper,這是一個用於構建分布式係統的協作原語工具箱
如果您擁有海量數據,無論是GB級還是PB級,Hadoop都是完美的選擇。本書是這方麵最全麵的參考。
买了第一版,时间太紧,没来得及看,后来出了个号称修订升级的第二版,毫不犹豫又买了,后来听说第二版比第一版翻译得好,心中窃喜,再后来看了第二版,我震惊了,我TM就是一傻子,放着好好的英文版不看,赶什么时髦买中文版呢。在这个神奇的国度,牛奶里放的是三聚氰胺,火腿...
評分 評分開源東西變化太快瞭,這本書的內容對應現在2.×版本來說有點兒裏力不從心瞭。
评分學一學
评分還是要讀中文啊
评分入門
评分沒完全看明白 預習一下
本站所有內容均為互聯網搜索引擎提供的公開搜索信息,本站不存儲任何數據與內容,任何內容與數據均與本站無關,如有需要請聯繫相關搜索引擎包括但不限於百度,google,bing,sogou 等
© 2025 qciss.net All Rights Reserved. 小哈圖書下載中心 版权所有