Mining of Massive Datasets 在线电子书 图书标签: 数据挖掘 大规模数据处理 机器学习 Mining 计算机 DataMining 推荐系统 人工智能
发表于2024-11-21
Mining of Massive Datasets 在线电子书 pdf 下载 txt下载 epub 下载 mobi 下载 2024
基础、简洁、易懂、广泛
评分结合Coursera 上的课程看效果更佳。对数据挖掘涉及的技术,比较全面,也很通用,而且相形还比较新。工作中很多技术也完全可以拿来应用。
评分最近看了3章节,内容翔实,推荐~
评分第二版赞爆了!Coursera课程网站上有免费且添加Hyperlink的版本供下载,Stanford的MOOC真是业界良心!
评分第二版赞爆了!Coursera课程网站上有免费且添加Hyperlink的版本供下载,Stanford的MOOC真是业界良心!
Anand Rajaraman 数据库和Web技术领域权威,创业投资基金Cambrian联合创始人,斯坦福大学计算机科学系助理教授。Rajaraman职业生涯非常成功:1996年创办Junglee公司,两年后该公司被亚马逊以2.5亿美元收购,Rajaraman被聘为亚马 逊技术总监,推动亚马逊从一个零售商转型为零售平台;2000年与人合创Cambrian,孵化出几个后来被谷歌收购的公司;2005年创办Kosmix公司并任CEO,该公司2011年被沃尔玛集团收购。Rajaraman生于印度,在斯坦福大学获得计算机科学硕士和博士学位。求学期间与人合著的一篇论文荣列近20年来被引用次数最多的论文之一。博客地址http://anand.typepad.com/datawocky/。
Jeffrey David Ullman 美国国家工程院院士,计算机科学家,斯坦福大学教授。Ullman早年在贝尔实验室工作,之后任教于普林斯顿大学,十年后加入斯坦福大学直至退休,一生的科研、著书和育人成果卓著。他是ACM会员,曾获SIGMOD贡献奖、Knuth奖等多项科研大奖;他是“龙书”《编译原理》、数据库领域权威指南《数据库系统实现》的合著者;麾下多名学生成为了数据库领域的专家,其中最有名的当属谷歌创始人Sergey Brin;本书第一作者也是他的得意弟子。Ullman目前任Gradiance公司CEO。
王斌 博士,中国科学院计算技术研究所博士生导师。中国科学院信息工程研究所客座研究员。主要研究方向为信息检索、自然语言处理和数据挖掘。《信息检索导论》译者。主持国家973、863、国家自然科学基金、国际合作基金、国家支撑计划等课题20余项,发表学术论文120余篇。现为ACM会员、中国中文信息学会理事、中文信息学会信息检索专委会委员、《中文信息学报》编委、中国计算机学会高级会员及计算机学会中文信息处理专委会委员。自2006年起在中国科学院研究生院(现改名“中国科学院大学”)讲授《现代信息检索》研究生课程,选课人数累计近千人。2001年开始指导研究生,迄今培养博士、硕士研究生30余名。
The popularity of the Web and Internet commerce provides many extremely large datasets from which information can be gleaned by data mining. This book focuses on practical algorithms that have been used to solve key problems in data mining and which can be used on even the largest datasets. It begins with a discussion of the map-reduce framework, an important tool for parallelizing algorithms automatically. The authors explain the tricks of locality-sensitive hashing and stream processing algorithms for mining data that arrives too fast for exhaustive processing. The PageRank idea and related tricks for organizing the Web are covered next. Other chapters cover the problems of finding frequent itemsets and clustering. The final chapters cover two applications: recommendation systems and Web advertising, each vital in e-commerce. Written by two authorities in database and Web technologies, this book is essential reading for students and practitioners alike.
当今时代大规模数据爆炸的速度是惊人的,当然,其应用也是越来越广泛的,从传统的零售业到复杂的商业世界,到处都能见到它的身影。那么大数据有什么典型特征呢?即数据类型繁多、数据体量巨大、价值密度低即处理速度快。本书也正是将注意力集中在了极大规模数据上的挖掘,而且...
评分读技术书于我而言就像高中物理老师说的那样:一看就懂、一说就糊、一写就错。为了不马上遗忘昨天刚刚看完的这本书,决定写点东西以帮助多少年之后还有那么一点点记忆。好吧,开写。 1. 总体来说,数据挖掘时数据模型的发现过程。而数据建模的方法可以归纳为两种:数...
评分看到开篇的两个例子,一个是地图聚类分析伦敦病毒问题,另一个是概率统计的例子。对本书还挺有期望。结果翻到第三章开始,这。。 尼玛整本书就是个目录啊。全书结构如下:知识点,摘要,奇葩的例子,习题。 然后另一个知识点,知识点,识点。。 如果为了平时聊天增加些谈资偶...
评分只看了两章,所有真心不好打分。这其实是本数学书,而且是一本入门书。这本书的目标读者不是工程师,而是读研或者读博的学生。如果你本身就有数据挖掘后者机器学习的背景,或者就是很喜欢数学,我还是很推荐这本书的,学习新东西总是很有趣的。
评分这本书其实挺好的,但是真得看英文版。 这是我们上课的参考书之一,英文版有的地方没看懂,就打算找个中文版来看。看了中文版发现,这个翻译的水平基本是跟我大四,研一给老师翻译文章的水平一样的,可以看出这本书应该是找学生翻译的,而且是对专业领域还了解不深的学生翻译的...
Mining of Massive Datasets 在线电子书 pdf 下载 txt下载 epub 下载 mobi 下载 2024