《自己動手寫搜索引擎》是獵兔企業搜索開發團隊的軟件産品研發和項目實踐的經驗匯總。《自己動手寫搜索引擎》全方位展現齣一個商用級彆的Lucene搜索解決方案,主要包括爬蟲、自然語言處理和搜索實現部分。爬蟲部分介紹瞭網頁遍曆方法和從網頁提取主要內容的方法。
自然語言處理部分包括瞭中文分詞從理論到實現以及在搜索引擎中的實用等細節。
其他自然語言處理的經典問題與實現包括:文檔排重、文本分類、自動聚類、語法解析樹、拼寫檢查、拼音轉換等理論與實現方法。
在實現搜索方麵,《自己動手寫搜索引擎》用簡單的例子介紹瞭完整的搜索實現過程,覆蓋瞭從索引庫的設計和索引庫與數據庫的同步到搜索用戶界麵設計與實現。搜索用戶界麵包括實現布爾邏輯查詢、按區間範圍查詢、搜索結果按日期排序等。《自己動手寫搜索引擎》還進一步介紹瞭搜索排序的優化方法。
最後以基於Lucene的搜索服務器Solr為例,展示瞭Lucene的最新應用方法。
猎兔搜索开发部从事企业搜索,互联网舆情分析,自然语言处理等软件开发。产品包括多种语言的自然语言处理和搜索系统,中文分词,文本分类,数据挖掘,网站搜索和垂直搜索软件。现招聘全职网络爬虫开发工程师。 岗位要求: 1.会Lucene及Solr。 2.会Linux下编程。 3.了解数据结构...
評分打开eclipse 然后把.project文件所在的路径作为Java项目导入即可。 例如光驱是e盘,则可以把 E:第2章Chapter3JavaPart 整个作为Java项目导入eclipse。 具体执行方式是点击右键选择"import"菜单,出来一个选择窗口,然后选择Existing Projects into Workspace。...
評分稻盛和夫曾经听到新员工抱怨:"我把公司想得太好了没想到其实福利制度并不健全,待遇也不怎么样"。结果稻盛和夫把抱怨的人骂了一顿:“没错,现在公司是不大,设备不足,制度也不健全。可是,让公司成为一家名声响亮,福利制度完善的企业不正是你们的工作吗?别妄想捡现成的,...
評分这里的id标志为读过本书即可。 谢谢读者的支持。会想办法来帮大家做到更多。 联系msn:lgjut@sina.com
評分描述解释算法的语言太少了 整本书估计有一半以上是代码 没有信息检索方面的知识的话,书读起来会很吃力 期待第二版的改进
垃圾
评分滿書盡是代碼和算法,作為外行看個熱鬧吧。
评分沒怎麼仔細看,瞭解瞭一下大緻內容,以後可能會搞這方麵的項目。
评分lucene編程指南
评分全是代碼太不給力瞭
本站所有內容均為互聯網搜索引擎提供的公開搜索信息,本站不存儲任何數據與內容,任何內容與數據均與本站無關,如有需要請聯繫相關搜索引擎包括但不限於百度,google,bing,sogou 等
© 2025 qciss.net All Rights Reserved. 小哈圖書下載中心 版权所有