Toby Segaran是Genstruct公司的软件开发主管,这家公司涉足计算生物领域,他本人的职责是设计算法,并利用数据挖掘技术来辅助了解药品机理。Toby Segaran还为其他几家公司和数个开源项目服务,帮助它们从收集到的数据当中分析并发掘价值。除此以外,Toby Segaran还建立了几个免费的网站应用,包括流行的tasktoy和Lazybase。他非常喜欢滑雪与品酒,其博客地址是blog.kiwitobes.com,现居于旧金山。
本书以机器学习与计算统计为主题背景,专门讲述如何挖掘和分析Web上的数据和资源,如何分析用户体验、市场营销、个人品味等诸多信息,并得出有用的结论,通过复杂的算法来从Web网站获取、收集并分析用户的数据和反馈信息,以便创造新的用户价值和商业价值。全书内容翔实,包括协作过滤技术(实现关联产品推荐功能)、集群数据分析(在大规模数据集中发掘相似的数据子集)、搜索引擎核心技术(爬虫、索引、查询引擎、PageRank算法等)、搜索海量信息并进行分析统计得出结论的优化算法、贝叶斯过滤技术(垃圾邮件过滤、文本过滤)、用决策树技术实现预测和决策建模功能、社交网络的信息匹配技术、机器学习和人工智能应用等。
本书是Web开发者、架构师、应用工程师等的绝佳选择。
这本书好的地方就不多说了,也没有必要我再浪费口舌。 值得注意的倒是这本书上的代码实在问题很多,当然这也大概是计算机书籍所共有的特点。 所以还是在网上搜索了一下,找到这本书的勘误表,这样在代码测试时才容易不走弯路。 http://oreilly.com/catalog/errataunconfirme...
评分 评分记得第一次读这本书的时候,是刚毕业在第一家小公司工作,虽然当时只是做Web,但是作为十人团队中少有的还有那么点数学基础的人,无可避免地把一些简单的非工程化的东西接了过来。当时有一个小任务是来做喜欢xxx的人也喜欢xxx,老大就把这本集体智慧编程扔给了我,说看这本书,...
评分都是干货,没什么废话。注重由浅入深向读者讲解,兼顾各种细节。作者的编程经验丰富,书里的代码都是选自案例,可以直接应用。所以,这本书特别实用。 对我来说,终于搞明白了一种神经网络:多层感知机。首先将抽象神经元的权重(突触强度)存入到数据库中,或者通过反向传播...
评分花了很长时间,终于断断续续地坚持把《Programming Collective Intelligence》给读完了。作者用非常直观的方式向读者展示了人工智能和机器学习中的大量经典的算法。更可贵的是,作者在展示算法时所使用的例子都是Internet中非常有代表性的场景,并且很多情况下还会结合一些...
真是好实战哇!
评分三年前第一次看这本书的时候里面有一章教你如何使用libsvm...那时候鬼知道3年后libsvm是我帮老师一起release的呢...
评分这本书,前几章看着还可以,觉得学到了点东西,到了后面完全不知道在说什么了,只告诉你怎么做却不告诉你为什么要这样做,套公式
评分翻译减分,有很多句子在原文里清晰简单,被翻译得莫名其妙。作者这种从零开始自己写决策树的精神是很伟大的,值得学习。
评分数据挖掘入门书,比清华的教材好太多了。这本是基于Python的应用书,但数学算法部分没有细讲,不过至少告诉你这些算法可以怎么用,而很多应用数学的教材,只谈理论,没应用。
本站所有内容均为互联网搜索引擎提供的公开搜索信息,本站不存储任何数据与内容,任何内容与数据均与本站无关,如有需要请联系相关搜索引擎包括但不限于百度,google,bing,sogou 等
© 2025 book.wenda123.org All Rights Reserved. 图书目录大全 版权所有