Class-tested and coherent, this groundbreaking new textbook teaches classic web information retrieval, including web search and the related areas of text classification and text clustering from basic concepts. Written from a computer science perspective by three leading experts in the field, it gives an up-to-date treatment of all aspects of the design and implementation of systems for gathering, indexing, and searching documents; methods for evaluating systems; and an introduction to the use of machine learning methods on text collections. All the important ideas are explained using examples and figures, making it perfect for introductory courses in information retrieval for advanced undergraduates and graduate students in computer science. Based on feedback from extensive classroom experience, the book has been carefully structured in order to make teaching more natural and effective. Although originally designed as the primary text for a graduate or advanced undergraduate course in information retrieval, the book will also create a buzz for researchers and professionals alike.
Contents
1. Information retrieval using the Boolean model; 2. The dictionary and postings lists; 3. Tolerant retrieval; 4. Index construction; 5. Index compression; 6. Scoring and term weighting; 7. Vector space retrieval; 8. Evaluation in information retrieval; 9. Relevance feedback and query expansion; 10. XML retrieval; 11. Probabilistic information retrieval; 12. Language models for information retrieval; 13. Text classification and Naive Bayes; 14. Vector space classification; 15. Support vector machines and kernel functions; 16. Flat clustering; 17. Hierarchical clustering; 18. Dimensionality reduction and latent semantic indexing; 19. Web search basics; 20. Web crawling and indexes; 21. Link analysis.
Reviews
“This is the first book that gives you a complete picture of the complications that arise in building a modern web-scale search engine. You'll learn about ranking SVMs, XML, DNS, and LSI. You'll discover the seedy underworld of spam, cloaking, and doorway pages. You'll see how MapReduce and other approaches to parallelism allow us to go beyond megabytes and to efficiently manage petabytes." -Peter Norvig, Director of Research, Google Inc.
"Introduction to Information Retrieval is a comprehensive, up-to-date, and well-written introduction to an increasingly important and rapidly growing area of computer science. Finally, there is a high-quality textbook for an area that was desperately in need of one." -Raymond J. Mooney, Professor of Computer Sciences, University of Texas at Austin
“Through compelling exposition and choice of topics, the authors vividly convey both the fundamental ideas and the rapidly expanding reach of information retrieval as a field.” -Jon Kleinberg, Professor of Computer Science, Cornell University
Christopher D. Manning,1989年毕业于澳大利亚国立大学,1995年获斯坦福大学语言学博士学位,曾先后在卡内基-梅隆大学、悉尼大学教授语言学,1999年起任斯坦福大学计算机科学和语言学副教授,其主要研究方向是统计自然语言处理、信息提取与表示,以及文本理解和文本挖掘等。
Prabhakar Raghavan,毕业于印度理工学院,后获加州大学伯克利分校计算机科学博士学位,自2005年起担任Yahoo!研究中心负责人,同时也是斯坦福大学计算机科学系顾问教授。其主要研究方向是文本及Web数据挖掘、组合优化、随机算法等,此前曾任Verity公司CTO,在IBM研究院担任过管理工作。
Hinrich Schütze,斯坦福大学博士,现任斯图加特大学自然语言处理研究所理论计算语言学主任。他在美国硅谷工作过多年,曾担任过Enkata公司首席科学家。
stanford的IR入门书籍,cmu stanford都在用该书作为IR入门书籍,很nice。在某些章节如果你有统计的基础来看的话,会更容易些。
评分搜素引擎入门书籍,各方面均有涉猎,严谨,通俗易懂 入门经典入门经典入门经典入门经典入门经典入门经典入门经典入门经典入门经典入门经典入门经典入门经典入门经典入门经典入门经典入门经典入门经典入门经典入门经典入门经典入门经典入门经典入门经典入门经典
评分第一次看到这本书的时候,还是在前年,当时这本书还只是个草稿的电子版,基本上ir所涉及到的内容都有,讲的也比较全面。 要是你英文阅读能力还好的话,推荐去读读这本书,肯定会对ir有一个较为全面的了解的。
评分这本书不错。值得一看。 Christopher D. Manning,1989年毕业于澳大利亚国立大学,1995年获斯坦福大学语言学博士学位,曾先后在卡内基-梅隆大学、悉尼大学教授语言学,1999年起任斯坦福大学计算机科学和语言学副教授,其主要研究方向是统计自然语言处理、信息提取与表示,以及...
评分作为入门书籍,还不错。分别介绍了信息检索领域的几个重要概念:倒排索引、检索引擎;tf-idf权重计算技术;向量空间模型,信息检索的评价,有序检索结果的评价MAP,ROC曲线,NDCG等等;相关反馈技术,伪相关反馈;概率检索模型,BM25算法;基于语言建模的信息检索模型,各种文...
这本书的作者在信息检索领域确实是享有盛誉的专家,这一点从他的学术背景和过往的研究成果就可以窥见一斑。我之所以选择入手这本书,很大程度上是因为他在该领域内提出的那些 groundbreaking 的理论和模型。我记得之前在某个国际会议上,他做了一个关于“语义搜索”的报告,简直是醍醐灌顶,让我对传统的关键词匹配产生了颠覆性的认识。这本书据说就是对这些理念的系统性梳理和阐述,我相信它一定能为我提供更深入的理论支撑和更广阔的视野。我尤其期待书中对各种算法的详细讲解,希望能从中汲取灵感,应用到我自己的研究项目中。
评分在信息爆炸的时代,如何高效地获取并利用有价值的信息,成为了一个至关重要的问题。我一直对搜索引擎的工作原理非常好奇,也想了解为什么我输入几个关键词,就能在瞬间得到海量相关的搜索结果。这本书恰恰满足了我这份好奇心。它详细地介绍了信息检索的各种技术,包括索引构建、查询处理、排序算法等等,让我对这个看似神秘的领域有了更清晰的认识。我尤其欣赏书中对一些经典算法的分析,例如TF-IDF、BM25等,它们是如何被设计出来,又如何在实际应用中发挥作用。这本书让我觉得,原来我们每天都在使用的工具,背后蕴含着如此深厚的理论和精妙的设计。
评分这是一本我花了很长时间才真正“读懂”的书。它不像一些通俗读物那样,几页纸就能讲清楚一个概念。这本书的内容非常扎实,每一章都像是在搭建一座知识的殿堂,需要一步一步地去理解和消化。刚开始读的时候,我甚至会因为一个数学公式而停下来,反复推导,确保自己没有漏掉任何细节。有时候,我会花上一个下午的时间,只为了理解书中的一个算法原理。但是,正是这种“慢”阅读的体验,让我收获颇丰。当我最终掌握了一个复杂概念时,那种成就感是无与伦比的。这本书真的教会了我如何去“思考”,而不仅仅是“记忆”。
评分这本书的封面设计非常简洁大气,蓝色的背景搭配白色的字体,给人一种沉静而专业的视觉感受。当我第一次拿到这本书时,就被它厚实的纸张和精美的印刷所吸引。翻开扉页,作者的名字显得尤为醒目,让我对接下来将要探索的信息检索世界充满了期待。书的整体装帧非常考究,即使随意放置在书架上也足够吸引目光。我尤其喜欢它内页的排版,字号适中,行间距舒适,阅读起来不会感到压抑,长时间阅读也不会让眼睛过于疲惫。封底的文字虽然不多,却点明了本书的核心主题,激发了我深入了解信息检索领域的兴趣。拿到这本书的那一刻,我就知道它不仅仅是一本教科书,更是一扇通往知识宝库的门。
评分我是一名在校的学生,现在正面临着毕业论文的选题和研究。我了解到信息检索在当今大数据时代的应用前景非常广阔,无论是搜索引擎、推荐系统,还是智能客服,都离不开信息检索的技术支持。我的导师也推荐我阅读一些基础性的书籍,来打下坚实的理论基础。这本书的名字非常直观,直接点明了主题,而且听其他师兄师姐说,这本书是这个领域的经典之作,覆盖了信息检索的主要分支和核心概念。我希望能通过阅读这本书,对整个信息检索的体系有一个清晰的认识,从而更好地选择我的研究方向,并为我的论文研究打下坚实的基础。
评分没有全部读完...估计一段时间内也不会再读,就先标记为读过吧...
评分简明好读
评分除了不少已经熟悉的data和ml方面的概念,好像没什么深刻的收获。有点过于浅显,也许对纯粹入门的大一学生来说算好的吧。也有可能,我没看懂。
评分上过课,第一次较为完整刷书,对搜索引擎有一个更直观的认识。
评分基础详实,信息量大
本站所有内容均为互联网搜索引擎提供的公开搜索信息,本站不存储任何数据与内容,任何内容与数据均与本站无关,如有需要请联系相关搜索引擎包括但不限于百度,google,bing,sogou 等
© 2026 book.wenda123.org All Rights Reserved. 图书目录大全 版权所有