Spark:大數據集群計算的生産實踐 在線電子書 圖書標籤: 大數據 Spark DEV
發表於2024-11-15
Spark:大數據集群計算的生産實踐 在線電子書 pdf 下載 txt下載 epub 下載 mobi 下載 2024
這是目前看過的對Spark介紹最完整的書,有使用技巧,還有原理分析和調優,非常值得推薦
評分這是目前看過的對Spark介紹最完整的書,有使用技巧,還有原理分析和調優,非常值得推薦
評分spark版本比較老,2017年齣版的書,還是1.5; 內容都比較淺,偏嚮介紹
評分這是目前看過的對Spark介紹最完整的書,有使用技巧,還有原理分析和調優,非常值得推薦
評分spark版本比較老,2017年齣版的書,還是1.5; 內容都比較淺,偏嚮介紹
Ilya Ganelin 從機器人專傢成功跨界成為一名數據工程師。他曾在密歇根大學花費數年時間研究自發現機器人(self-discovering robot),在波音公司從事手機及無綫嵌入式DSP(數據信號處理)軟件開發項目,隨後加入Capital One 的數據創新實驗室,由此進入大數據領域。Ilya是Apache Spark核心組件的活躍貢獻者以及Apache Apex的提交者(committer),他希望研究構建下一代分布式計算平颱。同時,Ilya還是一個狂熱的麵包烘焙師、廚師、賽車手和滑雪愛好者。
Ema Orhian 是一位對伸縮性算法充滿激情的大數據工程師。她活躍於大數據社區,組織會議,在會上發錶演講,積極投身於開源項目。她是jaws-spark-sql-rest(SparkSQL數據倉庫上的一種資源管理器)的主要提交者。Ema一直緻力於將大數據分析引入醫療領域,開發一個對大型數據集計算統計指標的端到端的管道。
Kai Sasaki 是一位日本軟件工程師,對分布式計算和機器學習很感興趣。但是一開始他並未從事Hadoop或Spark相關的工作,他最初的興趣是中間件以及提供這些服務的基礎技術,是互聯網驅使他轉嚮大數據技術領域。Kai一直是Spark的貢獻者,開發瞭不少MLlib和ML庫。如今,他正嘗試研究將機器學習和大數據結閤起來。他相信Spark在大數據時代的人工智能領域也將扮演重要角色。他的GitHub地址為:https://github.com/Lewuathe。
Brennon York既是一名特技飛行員,也是一位計算機科學傢。他的愛好是分布式計算、可擴展架構以及編程語言。自2014年以來,他就是Apache Spark的核心貢獻者,目標是通過發展GraphX和核心編譯環境,培育一個更強大的Spark社區,激發更多閤作。從為Spark提交貢獻開始,York就一直在用Spark,而且從那個時候開始,就使用Spark將應用帶入生産環境。
《Spark:大數據集群計算的生産實踐》涵蓋瞭開發及維護生産級Spark應用的各種方法、組件與有用實踐。全書分為6章,第1 ~ 2章幫助讀者深入理解Spark的內部機製以及它們在生産流程中的含義;第3章和第5章闡述瞭針對配置參數的法則和權衡方案,用來調優Spark,改善性能,獲得高可用性和容錯性;第4章專門討論Spark應用中的安全問題;第6章則全麵介紹生産流,以及把一個應用遷移到一個生産工作流中時所需要的各種組件,同時對Spark生態係統進行瞭梳理。
《Spark:大數據集群計算的生産實踐》不會講述入門級內容,讀者在閱讀前應已具備Spark基本原理的知識。《Spark:大數據集群計算的生産實踐》適閤Spark開發人員、Spark應用的項目經理,以及那些考慮將開發的Spark應用程序遷移到生産環境的係統管理員(或者DevOps)閱讀。
評分
評分
評分
評分
Spark:大數據集群計算的生産實踐 在線電子書 pdf 下載 txt下載 epub 下載 mobi 下載 2024