正文

能力无限(1)

星球Google 作者:(美)兰德尔·斯特罗斯


计算机一度曾经是一种供展出用的外观新奇的物事。1947年,IBM公司的工程师们制造了一台长达120英尺的新机器――选择顺序控制计算机(Selective Sequence Electronic Calculator),当时IBM知道,这台计算机仅凭其外观就足以令公众惊诧不已。又是机械,又是电子,光是研发费用就高达100万美元,它身上装饰的有刻度盘、开关、仪表以及闪烁的指示灯。公司首席执行官托马斯·J.沃森(Thomas J. Watson)将它安装在位于曼哈顿的IBM世界总部大楼的首层,路过第57大街的行人都可以通过玻璃窗看到它,每天都有数百人驻足在人行道上痴痴地望着。

这个机器的外观令人印象深刻,它隐藏着这样一个事实:设计过于匆忙。当《纽约时报》的一名记者在机器的发明者小罗伯特·R.西博的引导下参观时,注意到在仪表盘后面有些跟哪儿也不连着的电线,便盯着仔细看。西博理解地点点头:“是的,这些线路有点儿奇怪――没人知道它们放在那儿有什么用。”

在IBM公司看来,把计算机放在众人一眼就能看得见的地方,是一个令人赞赏的市场行为。在大众的心目中,巨大的体积和脉冲发出的灯光与对电子计算机的想象十分吻合。严格说来,IBM的庞然大物只是一个性能单一的计算器,但好莱坞却将它的外型复制下来,每当电影背景中需要电子计算机之类道具的时候,就把它用上。今天,功率之大和功能之多都远非计算机所能比的机器都放在了我们的膝盖上――硬件再也不能令人惊讶了。

但是,如果我们有机会看到谷歌全部的计算机都摆放在一处,我们依然会产生兴趣。那么多机器聚集在一起,场面必然十分壮观。谷歌公司的创始人在当研究生的时候曾经深受贫困之苦――也就是说,他们因为计算机的数量不够而无法完全实施自己的研究计划。当他们成立了自己的公司后,似乎就下决心不再受资源短缺之罪。

谷歌应该是可以升级的,它的创立理念就是要使对网页的搜索速度与网页上信息量的增长速度保持同步,不断扩大自己的能力。谷歌的创办者坚定地认为,对搜索范围决不能画地为牢。无论网页会变得多大,也无论它将哪类信息包括进来,谷歌都不仅要保持其搜索的质量和速度,而且要将增加搜索广度作为提高质量的手段――输入谷歌引擎的信息越多,它的智能就越高。

佩奇和布林凭直觉感到,公司一些未能尽如人意的原因就在于搜索技术存在设计上的缺陷,不是遵循积极发展的思路,因而不能满足组织起网络上的海量信息的要求。当其他地方的搜索引擎因为可获得的信息越来越多反而被海量信息所淹没,无法区别网页中哪些是最有用的信息时,谷歌的PageRank打一开始就被设计成能够用一种别人从未达到过的复杂技术――从网上把有用的线索抽取出来。输入搜索引擎的关键词越多,PageRank能够抽取出来、进而用来根据关联性对页面进行分析的线索也越多。依此看来,谷歌的技术就有了它自己的独到性。

当布林和佩奇打算将全世界的信息都组织起来的时候,他们不仅为自己的公司,而且为广阔的信息世界――包括网络在内――做出了两个将会带出衍生结果的基础性的决定。第一个决定是,让谷歌的搜索结果完全按照数学原则排列顺序。一旦软件的公式算出了搜索结果,谷歌将禁止用任何人工编辑行为进行修改。他们相信,用软件手段处理网页搜索问题所得出的结果优于用人工编辑得出的结果。而且这也是最适合于数据升级的方法。即使人工编辑能够摆脱偏见,其速度也不够快――而且也不够廉价――无法赶上数以百万计,甚至以10亿计的新网页的增长速度。


上一章目录下一章

Copyright © 读书网 www.dushu.com 2005-2020, All Rights Reserved.
鄂ICP备15019699号 鄂公网安备 42010302001612号