高效检索

1、畅游互联网

善用搜索引擎能够帮助我们在信息汪洋中快速获取我们需要的信息,而不至于淹没在海量信息之中。下面以Google为例介绍如何更高效的利用搜索引擎。

  • 基本检索技巧
    • 检索式
    • 精准检索
    • 以图搜图

2、一个完成的检索过程

  1. 分析问题,明确检索目的。我们最终想要得到什么信息?
  1. 选择检索工具(储备更多优质信息的网站,检索事半功倍)
  2. 确定关键词(检索的重头戏,需反复训练)
  3. 构造检索式(检索式是对关键词的补充,让搜索引擎更了解你想要是什么)
  4. 筛选检索结果(除人工判断,多数搜索引擎都会提供进一步筛选选项,如指定搜索结果日期)
  5. 调整检索策略
  6. 进行下一次检索

当我们进行一次检索的时候,可以对照以上步骤进行检查。如果对检索结果不满意,那么就需要回过头来检查步骤,反思哪里出了问题,并对其进行调整、优化。

3、布尔逻辑检索

布尔逻辑检索可以将多个检索词组合成相对复杂的检索式,更精确传达用户的检索需求。它开发较早、比较成熟,目前多数信息检索系统都支持这种技术。

布尔逻辑检索采用布尔代数里的逻辑运算符 “与”、“或”、“非” 来指定检索条件。凡符合规定条件即为命中信息,反之不会出现在搜索结果中。

3.1 布尔逻辑 A AND B(与)

用 AND 连接两个和两个以上的关键词,表示检索所连接的两个检索项的交集部分。

其实你早已用这种检索式!当你在搜索框中键入多个关键词,就是在使用这种检索式。因为 AND 可以使用空格 、 + 或 & 近似等同。

3.2 布尔逻辑 A OR B(或)

用 OR 连接两个和两个以上的关键词,表示检索所连接的两个检索项的并集部分。如,用 OR 连接检索词 A 和检索词 B ,表示查找包含检索词 A 、B 之一的信息,或同时包含 A 和 B 的信息。

使用 OR 逻辑可以提升查全率。查全率用来衡量检索系统和检索者检出相关信息的能力。查全率=(检索出的相关信息量/系统中的相关信息总量)x 100%

与之类似的另一个指标是查准率,用于衡量检索系统和检索者拒绝非相关信息的能力。查准率=(检索出的相关信息量/检索出的信息总量)x 100%

实验证明,查全率与查准率存在反向依赖关系。如果提升查全率,就会降低其查准率,反之亦然。

3.3 布尔逻辑 A NOT B(非)

A NOT B 在 Google 中使用 A -B 的方式表达,注意 - 号与被减项之间没有空格。

A -B 意思是指从检索词 A 结果中将含有检索词 B 的结果排除掉。

4、 5种精准搜索技巧

如果要搜索指定网页中的内容,或按某种特定格式检索,进一步缩小搜索范围和结果,提升搜索质量。
如何实现呢?

4.1 双引号 ""

双引号内的文字不会被分开,会作为整体用于检索。注意需要使用英文双引号 " 。

4.2 site

使用 site 可以在搜索引擎中搜索指定网站,或指定网站类型。如 site:douban.com 只搜索豆瓣网站内容, site:.gov 只搜索域名为 .gov 后缀的网站。

在百度搜索中,site: 后字符不能带 http:// ,最好也不用 www ,Google 不受此影响。

.edu、.org 一般为教育、学术网站, .gov 一般为政府网站。

示例 1 :site:https://www.douban.com/doulist/ 创新

4.3 filetype

使用 filetype 可以指定文件类型,如 filetype:PDF 可指定搜索 pdf 类型文件。使用 filetype:PDF 的搜索结果比单纯加上 PDF 更精准。

示例 1:site:https://www.cia.gov filetype:pdf

与 site 结合使用,可以搜索某网站所有 pdf 文档。

4.4 inurl intext intitle

使用 inurl intext intitle 分别可以在网页标题、链接和主体中搜索关键词。

有时你或许会遇上找出所有和关键词相关的所有网页标题、链接和网页主体的需求,在这个时候你需要使用的是限定词 inurl:(在 url 链接中搜索)、intext:(在网页主体中搜索)以及 intitle:(在网页标题中搜索)。

4.5 星号 *

有时你只记住部分内容,或需要批量搜索相似内容,可以利用星号 * 模糊匹配 。如 第*届 表示搜索第 1 届、第 2 届、第 7 届等结果。

5、以图搜图

谷歌识图 可以实现以图搜图。借助图片搜索相关地名、相似图片、相关文章等。

©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容