我们使用的包括谷Google、百度、必应、搜狗等在内的搜索引擎都属于机器人搜索引擎,也叫做Web Spider,通过某种网络协议自动地在庞大的网络中搜集信息,为信息建立索引。当你输入查询内容后,检索器会查询检索索引库,把检索结果呈现给你。
我以Google为例,教大家一些常用的检索技巧。
举个例子:我想要检索有关信息检索方面的教程。我输入“信息检索有哪些教材?”后,Google为我呈现一下结果:
打红勾的是满足我需求的。但是这些还不够。我想要更丰富更精准的检索结果。我会采取以下方式:
布尔检索:用好“AND”“OR”“NOT”等检索词。我采用了“信息检索 教材”的关键词搭配方式,查准率大幅提高。但是前两个答案都是豆瓣网站抓取的。我不想要豆瓣的结果怎么办?于是我把检索式改为“信息检索 教材 -豆瓣”,这样,和豆瓣的检索结果消失了。去掉关键词用减号,减号前面要空格哦!
精确检索:刚才的检索中,有一些结果出现“信息检索利用教程”、“信息检索技巧教程”。我不喜欢,我只想要“信息检索教程”,怎么办呢?用双引号括起来,这样,检索结果中的“信息检索教程”就不会被“利用”“技巧”等词割裂。精确检索就是把双引号内的文字作为整体,以提高检索的精确度。
括号检索:用在检索式中可以改变运算的先后次序。
filetype检索:限定检索文件类型。假如我想检索信息检索教程的PDF格式的文本,我只要在关键词前面输入“filetype:pdf ”,就可以查出和信息检索相关的PDF格式文档。同理,想找PPT的话就把pdf换成ppt。
截词检索:这个主要是针对英文检索。如果我要输入“information retrieval”,检索结果会遗漏一些信息,例如有些information在网页中是简写的形式,retrieval以“retrieve”的形式存在。为了避免因为词性不同而引起的检索结果遗漏,可以采用截词检索。比如我将“information retrieval”改为“info* retrie*"就有效扩大了检索范围。*代表词尾任意字符变化。
概念检索:运用同一个词的同义词、近义词、上下位词进行扩大或者缩小检索范围。比如信息,就可以替换成资讯、情报。教材,可以用参考书、教程、书籍、指南等词替代。
site语法检索:也就是站内检索。适用于在特定某一网站中检索。格式为site:域名 检索词。例如我在Google中查找申请方中关于清华大学的信息,就可以输入site:https://www.applysquare.com 清华大学。这样,就可以在找到申请方网站中提及清华大学的所有内容啦!
今天先讲到这里啦。希望能对大家有帮助
著作权归作者所有,转载需联系作者以获得授权,引用需注明出处。
作者ID:沐沐同学
链接:https://www.applysquare.com/topic-cn/J0xjFbZTm,怎样利用好搜索引擎,得到符合我期望的检索结果/