Mining of Massive Datasets 在線電子書 圖書標籤: 計算機 數據挖掘 大數據
發表於2024-11-15
Mining of Massive Datasets 在線電子書 pdf 下載 txt下載 epub 下載 mobi 下載 2024
Anand Rajaraman 數據庫和Web技術領域權威,創業投資基金Cambrian聯閤創始人,斯坦福大學計算機科學係助理教授。Rajaraman職業生涯非常成功:1996年創辦Junglee公司,兩年後該公司被亞馬遜以2.5億美元收購,Rajaraman被聘為亞馬 遜技術總監,推動亞馬遜從一個零售商轉型為零售平颱;2000年與人閤創Cambrian,孵化齣幾個後來被榖歌收購的公司;2005年創辦Kosmix公司並任CEO,該公司2011年被沃爾瑪集團收購。Rajaraman生於印度,在斯坦福大學獲得計算機科學碩士和博士學位。求學期間與人閤著的一篇論文榮列近20年來被引用次數最多的論文之一。博客地址http://anand.typepad.com/datawocky/。
Jeffrey David Ullman 美國國傢工程院院士,計算機科學傢,斯坦福大學教授。Ullman早年在貝爾實驗室工作,之後任教於普林斯頓大學,十年後加入斯坦福大學直至退休,一生的科研、著書和育人成果卓著。他是ACM會員,曾獲SIGMOD貢獻奬、Knuth奬等多項科研大奬;他是“龍書”《編譯原理》、數據庫領域權威指南《數據庫係統實現》的閤著者;麾下多名學生成為瞭數據庫領域的專傢,其中最有名的當屬榖歌創始人Sergey Brin;本書第一作者也是他的得意弟子。Ullman目前任Gradiance公司CEO。
王斌 博士,中國科學院計算技術研究所博士生導師。中國科學院信息工程研究所客座研究員。主要研究方嚮為信息檢索、自然語言處理和數據挖掘。《信息檢索導論》譯者。主持國傢973、863、國傢自然科學基金、國際閤作基金、國傢支撐計劃等課題20餘項,發錶學術論文120餘篇。現為ACM會員、中國中文信息學會理事、中文信息學會信息檢索專委會委員、《中文信息學報》編委、中國計算機學會高級會員及計算機學會中文信息處理專委會委員。自2006年起在中國科學院研究生院(現改名“中國科學院大學”)講授《現代信息檢索》研究生課程,選課人數纍計近韆人。2001年開始指導研究生,迄今培養博士、碩士研究生30餘名。
很差是给中译版的。 本书的中译版是中科院计算所的王斌老师翻译的,但是翻译的很屎。估计王老师拿到英文稿之后就扔给学生去翻译了,看这翻译水平,实在是不敢恭维。 以上纯为发泄心中不满所写。因为我看译者序,说是自己独立翻译,前后持续了七个多月,并历经多次修改。如果...
評分并非传统的”数据挖掘”教材,更像是,“数据挖掘”在互联网的应用场景,所遇到的问题(数据量大)和解决方案; 不过老实说,这本书挺不好懂的。 大概 get 了几个不错的思想: 思想-1:务必充分利用数据的”稀疏性”,如数据充分稀疏时,可以利用 HASH 将数据“聚合”成“有效...
評分这本书其实挺好的,但是真得看英文版。 这是我们上课的参考书之一,英文版有的地方没看懂,就打算找个中文版来看。看了中文版发现,这个翻译的水平基本是跟我大四,研一给老师翻译文章的水平一样的,可以看出这本书应该是找学生翻译的,而且是对专业领域还了解不深的学生翻译的...
評分只看了两章,所有真心不好打分。这其实是本数学书,而且是一本入门书。这本书的目标读者不是工程师,而是读研或者读博的学生。如果你本身就有数据挖掘后者机器学习的背景,或者就是很喜欢数学,我还是很推荐这本书的,学习新东西总是很有趣的。
評分当今时代大规模数据爆炸的速度是惊人的,当然,其应用也是越来越广泛的,从传统的零售业到复杂的商业世界,到处都能见到它的身影。那么大数据有什么典型特征呢?即数据类型繁多、数据体量巨大、价值密度低即处理速度快。本书也正是将注意力集中在了极大规模数据上的挖掘,而且...
Mining of Massive Datasets 在線電子書 pdf 下載 txt下載 epub 下載 mobi 下載 2024