正文

第6章 是法国的巴黎,还是拉斯韦加斯的巴黎?(1)

Google时代的工作方法 作者:(美)道格拉斯·梅里尔


—如何玩转搜索

计算机搜索具有其他任何技术发明都无法比拟的优势,它使得我们在信息时代的生存发展成为可能。氧气所到之处,一切都会随之改变。与此类似,搜索功能可以实现电脑文件、电子邮件、日历条目、数据库内容和网络信息的快速检索,这种能力已经改变了我们存储信息、取回信息及使用信息的方式。换言之,计算机搜索已经把我们从本不完美的大脑造成的混乱当中解放出来。

借助搜索功能,你再也不必像过去那样,费尽心思要把自己的信息资料归置得井井有条了。这就好比你再也不用一件一件地把所有衣服都挂好一样。相反,你只要把衣服扔到那个越来越高的大堆上就行。等到你想穿一件9号码的衬衫时,直接提出要求,那件衣服就像变魔术一样,神奇地出现在衣服堆的最顶上。这是多么自由的感觉啊!

过去10~15年间,计算机辅助搜索已经成为我们生活当中不可分割的一个组成部分。搜索技术不断演化,从最初只有研究人员和科学家在他们那些稀奇古怪的计算机上使用的东西,一直演变成我们大多数人每天都会本能地使用很多次的普通工具。我们呼吸,我们眨眼,我们吃饭,我们睡觉,我们“Google”。

结果我们大多数人都没有对计算机搜索予以太多的关注。实际上,我们现在已经普遍认为搜索是理所当然的事情。不过,搜索实际上是一种技能,它对新式有序组织至关重要。你在搜索这件事上变得越机智,你在滤除次要信息、抓住关键问题方面做得就越好。具备实施目标明确的快速搜索能力,有助于尽快找到自己需要的信息。有了计算机搜索,你就不必劳神费力地考虑在哪里能找到某条信息,也用不着处心积虑地算计该把这个内容放在什么地方。自己想要的资料,只要一搜索,马上就会出现。

因此,我们努力掌握搜索技能吧。我在这一章中会分享自己进行搜索的一些策略和诀窍,以便让你的搜索更有效。我以“Google搜索”作为本章的中心议题,因为大多数人都使用Google搜索。虽然Google搜索有很多竞争对手,但我认为Google搜索凭借简洁的搜索界面和成熟的关联算法,还是会一如既往地为我们提供最好的搜索引擎服务(我曾经供职于Google公司,这一点不会影响上述事实)。

搜索引擎的设置

Google搜索和大多数搜索引擎使用的是一种称为“爬虫”(crawler)的自动软件代理技术,这种代理也叫“蜘蛛”(spider)或“机器人”(robot)。爬虫程序会频繁地访问网络站点,读取并捕获网页上的大部分文本信息,同时也会跟踪进入该网站的其他页面。

爬虫程序在一个网站上搜集到的信息会添加到搜索引擎的网页索引中。当你提请查询的时候,搜索引擎会快速分析网页索引中的相关信息,以便找出匹配内容。搜索结果按照相关性排序,相关程度最高的网页排在最前面。(当然,我说的是搜索的自然结果,而不是付费搜索结果。在Google搜索结果页面的最上方和该页的右侧,可以看到那些很小的纯文本型付费广告。)

搜索引擎使用很多不同的相关因子来决定与你的查询要求相关性最高的结果是什么。Google搜索使用的相关因子有200多个,其中包括你的搜索条件出现在网页的什么地方,这个条件出现的频率有多高等因素。譬如,只是在搜索框中输入videoconferencing(视频会议)这个词,Google搜索到的结果会有数百万条。这个时候排在最前面的搜索结果有维基百科(Wikipedia)的网站和《商业周刊》(Business Week)的一篇文章。在这两个搜索结果中,videoconferencing这个单词都是出现在网页的标题中(这正是“查询条件出现位置”这个因子的影响),而且这个单词在网站和周刊文章中至少出现了4次(这是“出现频率”因子在起作用)。


上一章目录下一章

Copyright © 读书网 www.dushu.com 2005-2020, All Rights Reserved.
鄂ICP备15019699号 鄂公网安备 42010302001612号