本书介绍了网络爬虫开发中的关键问题与Java实现。主要包括从互联网获取信息与提取信息和对Web信息挖掘等内容。本书在介绍基本原理的同时注重辅以具体代码实现来帮助读者加深理解,书中部分代码甚至可以直接使用。 本书适用于有Java程序设计基础的开发人员。同时也可以作为计算机相关专业本科生或研究生的参考教材。
腾道数据(http://www.tendata.cn/)是一家创业型的外贸咨讯网站,上线于2007年左右。 网站目前年营业额在1000万左右,略有盈利。 目前因发展需要,寻求资金合作,资金量在300-1000万左右。 如果您有兴趣,请致电010-81727660,或联系QQ:270954928 gtalk:luogang@gmail.com 详谈。
评分http://www.topteam.cc/02-shop-detail.php?cid=47&pid=236 當你在飆網時,是否知道還有一類特殊的網路使用者也再網際網路上默默的工作著,他們就是網路爬蟲。這些網路爬蟲按照設計者預定的方式,在網路中穿梭,同時自動蒐集有用的資訊,進行分類和整理,將整理結果提供給使用...
评分虽然是最近才出的一本书,里面涉及到知识大部分可以在网络上找到,如第一章后面列举的爬虫,就有同样的英文文档,而且是很早以前的,作者根本没有自己去做些分析。第二章的bigtable,consistent hash都是现有论文或文章。 书中大段的代码其实也是没必要的,光盘里都有,书的内容...
评分开始从Web开发转向了网络爬虫的方向,然后在书店一个特偶然的机会,就看到了这本书,由于这是国内唯一一本关于网络爬虫的书,所以想也没想就买下了。 其实我原本是很不信任中国人写的书的,不过最近看了一些比如《Javascript王者归来》,再追溯到很久以前的《你所知道的.NET》...
评分http://www.topteam.cc/02-shop-detail.php?cid=47&pid=236 當你在飆網時,是否知道還有一類特殊的網路使用者也再網際網路上默默的工作著,他們就是網路爬蟲。這些網路爬蟲按照設計者預定的方式,在網路中穿梭,同時自動蒐集有用的資訊,進行分類和整理,將整理結果提供給使用...
只读了第一和第二章,实在看不下去了,相关背景知识占用了太多太多的篇幅,真正我关心的只有2%-3%的几段话,刚开始讲就收了场。
评分初步了解了网络爬虫的概念,了解了Google的PageRank算法的实现,HITS的实现。学到了很多
评分只找到第一章啦~~~ 2了吧,HttpClient的api改了,里面的代码都不能用~~~
评分初步了解了网络爬虫的概念,了解了Google的PageRank算法的实现,HITS的实现。学到了很多
评分没学会。
本站所有内容均为互联网搜索引擎提供的公开搜索信息,本站不存储任何数据与内容,任何内容与数据均与本站无关,如有需要请联系相关搜索引擎包括但不限于百度,google,bing,sogou 等
© 2026 book.wenda123.org All Rights Reserved. 图书目录大全 版权所有