大数据:互联网大规模数据挖掘与分布式处理,ISBN:9787115291318,作者:(美) Anand Rajaraman (美) Jeffrey David Ullman 著,王 斌 译
Anand Rajaraman 数据库和Web技术领域权威,创业投资基金Cambrian联合创始人,斯坦福大学计算机科学系助理教授。Rajaraman职业生涯非常成功:1996年创办Junglee公司,两年后该公司被亚马逊以2.5亿美元收购,Rajaraman被聘为亚马 逊技术总监,推动亚马逊从一个零售商转型为零售平台;2000年与人合创Cambrian,孵化出几个后来被谷歌收购的公司;2005年创办Kosmix公司并任CEO,该公司2011年被沃尔玛集团收购。Rajaraman生于印度,在斯坦福大学获得计算机科学硕士和博士学位。求学期间与人合著的一篇论文荣列近20年来被引用次数最多的论文之一。博客地址http://anand.typepad.com/datawocky/。
Jeffrey David Ullman 美国国家工程院院士,计算机科学家,斯坦福大学教授。Ullman早年在贝尔实验室工作,之后任教于普林斯顿大学,十年后加入斯坦福大学直至退休,一生的科研、著书和育人成果卓著。他是ACM会员,曾获SIGMOD贡献奖、Knuth奖等多项科研大奖;他是“龙书”《编译原理》、数据库领域权威指南《数据库系统实现》的合著者;麾下多名学生成为了数据库领域的专家,其中最有名的当属谷歌创始人Sergey Brin;本书第一作者也是他的得意弟子。Ullman目前任Gradiance公司CEO。
王斌 博士,中国科学院计算技术研究所博士生导师。中国科学院信息工程研究所客座研究员。主要研究方向为信息检索、自然语言处理和数据挖掘。《信息检索导论》译者。主持国家973、863、国家自然科学基金、国际合作基金、国家支撑计划等课题20余项,发表学术论文120余篇。现为ACM会员、中国中文信息学会理事、中文信息学会信息检索专委会委员、《中文信息学报》编委、中国计算机学会高级会员及计算机学会中文信息处理专委会委员。自2006年起在中国科学院研究生院(现改名“中国科学院大学”)讲授《现代信息检索》研究生课程,选课人数累计近千人。2001年开始指导研究生,迄今培养博士、硕士研究生30余名。
看到好多人说这本书是大纲,是目录,没啥内容,讲的浅。 那就对了。 本书是Stanford CS246课程MMDS使用的讲义,还有配套的Slides和HW,所以观看本书请配套课程进行学习,同时coursera上也有配套的课程。 See more detail: http://www.mmds.org/
评分很差是给中译版的。 本书的中译版是中科院计算所的王斌老师翻译的,但是翻译的很屎。估计王老师拿到英文稿之后就扔给学生去翻译了,看这翻译水平,实在是不敢恭维。 以上纯为发泄心中不满所写。因为我看译者序,说是自己独立翻译,前后持续了七个多月,并历经多次修改。如果...
评分 评分很差是给中译版的。 本书的中译版是中科院计算所的王斌老师翻译的,但是翻译的很屎。估计王老师拿到英文稿之后就扔给学生去翻译了,看这翻译水平,实在是不敢恭维。 以上纯为发泄心中不满所写。因为我看译者序,说是自己独立翻译,前后持续了七个多月,并历经多次修改。如果...
评分从总体安排来看,书的结构还是不错的。没看过英文的,但是中文版的行文真的不好,磕磕绊绊看了一半以后实在是没有兴趣看后面的了。 之前了解的pagerank看了以后了解了,之前不了解的adwords还是不了解,
这本书的语言风格非常吸引人,不像我之前读过的技术书籍那样严肃刻板。作者像是我的一个老朋友,用一种非常轻松、幽默的口吻,向我介绍了一个庞大而迷人的世界。书中对大数据价值的挖掘,让我大开眼界。我从未想过,那些看似不起眼的用户行为、设备日志,竟然能够被转化为如此有价值的信息。作者通过大量鲜活的案例,生动地展示了大数据在各个行业如何发挥作用,例如精准营销、风险控制、客户体验优化等等。我印象最深刻的是,书中提到了一个关于“预测性维护”的案例,通过分析设备运行数据,能够提前预警潜在的故障,大大减少了停机时间和维修成本。这让我觉得,大数据不仅仅是关于“知道”什么,更是关于“预测”和“优化”。这本书让我看到了技术的力量,也让我开始思考,如何将这些大数据思维应用到自己的工作和生活中,去发现那些隐藏的规律,去做出更明智的决策。
评分我承认,在翻开这本书之前,我对“大数据”这个词的理解非常浅显,甚至有些抵触,觉得它听起来像是某种冷冰冰、不近人情的技术。但这本书完全颠覆了我的固有印象。它不是一本枯燥的技术手册,而更像是一位睿智的长者,用充满温度的语言,为我娓娓道来这个时代的脉搏。书中探讨的不仅仅是技术本身,更深入地触及了数据背后的人性、社会和伦理问题。我被书中对数据偏见、隐私保护以及算法公平性的讨论深深吸引。作者并没有回避这些复杂而敏感的话题,而是以一种开放和负责任的态度,引导读者去思考这些技术发展所带来的双刃剑效应。我尤其喜欢书中对未来社会形态的设想,那些基于大数据分析而实现的个性化服务、智能决策,既让人感到振奋,也引发了我对技术与人类关系的深层思考。读这本书,与其说是学习一项技术,不如说是一次关于未来、关于我们与数据共存方式的深度对话。它让我感到,大数据并非冰冷的机器语言,而是连接人与世界、连接过去与未来的桥梁。
评分这本书简直像打开了一个潘多拉的盒子,里面装满了各种各样我从未想象过的可能性。初读时,我甚至有点不知所措,信息量太大,术语也层出不穷。但随着我一点点地深入,那些原本陌生的概念逐渐在我脑海中清晰起来。我开始理解,原来我们每天产生的海量数据,并不是简单的数字堆砌,而是蕴藏着巨大的价值,等待着被发掘。书中详细地阐述了如何从这些看似杂乱无章的数据中提取出有用的信息,如何通过各种算法和工具去分析、预测,甚至改变我们的生活方式。尤其令我印象深刻的是,作者用了很多生动的案例来解释抽象的理论,比如通过分析用户的购物习惯来推荐商品,或者通过监测交通流量来优化城市规划。这些案例让我觉得,大数据不再是遥不可及的技术名词,而是切实地影响着我们的方方面面。读完这本书,我感觉自己对这个世界有了全新的认知,也对未来的发展充满了好奇。这绝对是一本能够拓宽视野、激发思考的佳作,强烈推荐给所有对科技和未来感兴趣的朋友们。
评分坦白说,这本书的厚度一开始让我有些犹豫,但当我真正沉浸其中后,才发现时间过得飞快。它就像一座宏伟的知识殿堂,里面陈列着各种精美的“数据宝石”。作者并没有停留在技术层面的讲解,而是深入探讨了大数据对社会结构、商业模式以及个人生活所带来的深远影响。我被书中关于“数据驱动决策”的理念深深打动,它强调了基于客观数据进行判断的重要性,这对于我们这个信息过载但常常缺乏洞察力的时代来说,无疑是醍醐灌顶。书中对新兴技术趋势的预测,也让我感到耳目一新,尤其是关于人工智能与大数据的融合,以及未来个性化定制的无限可能。读完这本书,我感觉自己不再是被动地接受信息,而是能够主动地去理解和分析这个世界。它不仅提升了我的专业认知,更重要的是,它激发了我对未来发展方向的思考,让我对接下来的学习和工作有了更清晰的规划。
评分我一直以为自己对科技领域的信息还算敏感,但这本书的出现,让我意识到自己之前的认知是多么的局限。它像一个精巧的万花筒,将我之前零散的、模糊的关于数据、算法、人工智能的认知,瞬间组合成了清晰而壮丽的图景。书中对大数据处理流程的梳理,从数据采集、存储、清洗到分析和应用,每一步都讲解得详略得当,逻辑严谨。我特别佩服作者在复杂技术概念上的阐释能力,那些原本可能让我望而却步的数学模型和统计学原理,在书中被巧妙地“翻译”成了易于理解的语言,甚至还穿插了一些有趣的类比和故事。让我印象深刻的是,书中不仅介绍了大数据在商业领域的应用,还拓展到了医疗、科研、公共服务等多个领域,让我看到了大数据改变世界的广阔前景。读这本书,感觉就像是在进行一次高强度的头脑风暴,但又充满了发现的乐趣。它让我开始重新审视我所处的这个信息爆炸的时代,并对如何更好地利用数据、如何应对数据带来的挑战有了更深刻的理解。
评分这本书的难度相比其他大数据的书要更高一些、专业性也更强,但似乎讲解偏少,适合以此为纲再去找其他资料学习
评分名字有些哗众取宠。其实本书就是介绍了一些基本的数据挖掘的概念,但是只有很少的几节才给出了在Massive Data时该做的处理和优化;本书还是比较适合有着一定经验的人来填补自己的知识空缺,或者放在办公桌旁偶尔查阅。最后,这本书翻译的真的很烂。
评分还看不懂
评分只给大概的方法,极浅的入门型,要深度学的话感觉一开始看这个好浪费时间。
评分虽然内容不多但是对我来说还需要精读几个部分。
本站所有内容均为互联网搜索引擎提供的公开搜索信息,本站不存储任何数据与内容,任何内容与数据均与本站无关,如有需要请联系相关搜索引擎包括但不限于百度,google,bing,sogou 等
© 2026 book.wenda123.org All Rights Reserved. 图书目录大全 版权所有