數據密集型應用係統設計 在線電子書 圖書標籤: 分布式係統 計算機 分布式 數據庫 架構 計算機科學 數據 大數據
發表於2024-05-17
數據密集型應用係統設計 在線電子書 pdf 下載 txt下載 epub 下載 mobi 下載 2024
涵蓋數據集成、處理、存儲的全貌,粗讀瞭第一遍,然後又二刷瞭一遍,分布式領域涉及很多艱深的理論,需要大量理論學習。單機存儲到分布式存儲完全梳理瞭一下,收獲頗豐。p.s.最後一章翻譯太差,各種錯彆字,落字
評分20190815第一遍。啃瞭大半個月纔啃完,一二部分對我很有幫助,基本上梳理並討論瞭現有工業界分布式係統的各種理論及其實現細節。這本書應該作為後端架構的必讀書目,對很多籠罩著光環的各種架構服務很有祛媚效果。每章後麵的參考文獻是個大寶藏,需要好好閱讀。
評分為瞭您的身體健康,請不要閱讀開源翻譯版本....我隻舉一個例子。leader one翻譯成林登萬是幾個意思?難不成還有林登兔?
評分最後一章錯字病句太多
評分最驚喜地是作者提齣瞭很多問題,邏輯縝密,這些問題雖然不都有解,但是對設計和實現各種都是寶貴的指南和經驗。
作者簡介
Martin Kleppmann是英國劍橋大學分布式係統方嚮的研究員。此前,他曾是LinkedIn和Rapportive等互聯網公司的軟件工程師,負責大規模數據基礎設施建設。在此過程中他遇到過一些睏難,因此他希望這本書能夠幫助讀者避免重蹈覆轍。Martin還是一位活躍的會議演講者、博主和開源貢獻者。他認為,每個人都應該學習深刻的技術理念,對技術的深入理解能幫助我們開發齣更好的軟件。
譯者簡介
趙軍平, 大數據存儲與分析資深開發者與推廣者(EMC 10餘年),GPU異構計算的親曆者。中國計算機協會專傢委員,DELL EMC資深架構師。12年係統研發、創新與團隊管理經驗,擅長數據存儲與保護, 雲計算與大數據實時分析,GPU異構加速優化等。相關領域已申請中、美技術專利100餘項,並多次在SNIA,LinuxConf,Hadoop Summit, Nvidia GPU Tech Conf等做技術分享,持續關注數據密集和計算密集相關技術的演進、融閤與賦能推廣。
呂雲鬆,北京大學計算機碩士,碩士及DELL EMC中國研究院實習期間專注於大數據實時流式處理相關的研究。現就職於華為2012中軟院黎曼實驗室,主要從事深度學習的研發。
耿煜,DELL EMC架構師兼GTM負責人,緻力於推廣企業級數字化轉型方案。深耕分布式架構以及雲計算12年,先後任職於ChinaCache,Sun Microsystems以及EMC等公司。
李三平,美國麻省大學計算機工程專業博士,DELL EMC中國研究院首席科學傢,研究方嚮為機器學習、深度學習、智能運維、遙感影像等。已在IEEE Transactions期刊和會議上發錶論文數十篇,申請美國專利20餘項。推崇簡約,熱衷機器學習。
全書分為三大部分:
第一部分,主要討論有關增強數據密集型應用係統所需的若乾基本原則。首先開篇第1章即瞄準目標:可靠性、可擴展性與可維護性,如何認識這些問題以及如何達成目標。第2章我們比較瞭多種不同的數據模型和查詢語言,討論各自的適用場景。接下來第3章主要針對存儲引擎,即數據庫是如何安排磁盤結構從而提高檢索效率。第4章轉嚮數據編碼(序列化)方麵,包括常見模式的演化曆程。
第二部分,我們將從單機的數據存儲轉嚮跨機器的分布式係統,這是擴展性的重要一步,但隨之而來的是各種挑戰。所以將依次討論數據遠程復製(第5章)、數據分區(第6章)以及事務(第7章)。接下來的第8章包括分布式係統的更多細節,以及分布式環境如何達成一緻性與共識(第9章)。
第三部分,主要針對産生派生數據的係統,所謂派生數據主要指在異構係統中,如果無法用一個數據源來解決所有問題,那麼一種自然的方式就是集成多個不同的數據庫、緩存模塊以及索引模塊等。首先第10章以批處理開始來處理派生數據,緊接著第11章采用流式處理。第12章總結之前介紹的多種技術,並分析討論未來構建可靠、可擴展和可維護應用係統可能的新方嚮或方法。
本书开头提到“当今很多新型应用都属于数据密集型(data-intensive)而不是计算密集型(compute-intensive)” 当今机器学习越来越普及的情况下其实用户应用后面基础件层的compute-intensive应用越来越多了。“很可惜,让鄙人日常头秃都是 compute-intensive的,啥时候有一本De...
評分作者的态度与高度于书的结尾再见一斑。 “As software and data are having such a large impact on the world, we engineers must remember that we carry a responsibility to work toward the kind of world that we want to live in: a world that treats people with huma...
評分每一个数据工程师和产品经理都应该把最后一节,Doing the right thing,读十遍。 为了说服大家为什么值得读十遍,我摘抄几句: automated systems can systematically and arbitrarily exclude a person from participating in society without any proof of guilt, and with l...
評分https://github.com/Vonng/db ==========================================================================================================================================================
評分數據密集型應用係統設計 在線電子書 pdf 下載 txt下載 epub 下載 mobi 下載 2024