本書介紹瞭網絡爬蟲開發中的關鍵問題與Java實現。主要包括從互聯網獲取信息與提取信息和對Web信息挖掘等內容。本書在介紹基本原理的同時注重輔以具體代碼實現來幫助讀者加深理解,書中部分代碼甚至可以直接使用。 本書適用於有Java程序設計基礎的開發人員。同時也可以作為計算機相關專業本科生或研究生的參考教材。
书中介绍的HttpClient版本旧了,下面是新的4.0版本的例子: import java.io.BufferedInputStream; import java.io.IOException; import java.io.InputStream; import java.util.ArrayList; import java.util.List; import org.apache.http.HttpResponse; import org.apache....
評分开始从Web开发转向了网络爬虫的方向,然后在书店一个特偶然的机会,就看到了这本书,由于这是国内唯一一本关于网络爬虫的书,所以想也没想就买下了。 其实我原本是很不信任中国人写的书的,不过最近看了一些比如《Javascript王者归来》,再追溯到很久以前的《你所知道的.NET》...
評分http://www.topteam.cc/02-shop-detail.php?cid=47&pid=236 當你在飆網時,是否知道還有一類特殊的網路使用者也再網際網路上默默的工作著,他們就是網路爬蟲。這些網路爬蟲按照設計者預定的方式,在網路中穿梭,同時自動蒐集有用的資訊,進行分類和整理,將整理結果提供給使用...
評分http://www.topteam.cc/02-shop-detail.php?cid=47&pid=236 當你在飆網時,是否知道還有一類特殊的網路使用者也再網際網路上默默的工作著,他們就是網路爬蟲。這些網路爬蟲按照設計者預定的方式,在網路中穿梭,同時自動蒐集有用的資訊,進行分類和整理,將整理結果提供給使用...
評分想了解一下nutch,然后买了这本书,但是作者大量的copy网络资料,而且例子举得也很烂,然后东一点,西一点拼凑了这本书,看了几章,实在看不下去了。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。...
感覺隻是整理一下網絡上的資源,很少有作者自己的思考。
评分不怎麼的。感覺作者有點坑爹。
评分入門不錯.. 隻看瞭一點.. 最近暫時不搞爬蟲瞭 暫時就看到這
评分一般瞭
评分2013-12-24 重復
本站所有內容均為互聯網搜索引擎提供的公開搜索信息,本站不存儲任何數據與內容,任何內容與數據均與本站無關,如有需要請聯繫相關搜索引擎包括但不限於百度,google,bing,sogou 等
© 2025 qciss.net All Rights Reserved. 小哈圖書下載中心 版权所有