正文

《搜》 神秘技术配方(1)

搜(第2版) 作者:(美)约翰·巴特尔


佩奇告诉我,他从来就没有打算过要创造出一个搜索引擎。他和布林确实不清楚这个项目最后会有什么用途。但是为了建立BackRub,他们一定要搜索网络。1996年3月,佩奇把网页捕获器指向一张网页―他自己在斯坦福的主页(大部分计算机专业的研究生都有自己的主页),然后把它放出去觅食,网页捕获器就从那里开始工作。这就是网络的美丽之处,不管你从何处开始,最终你总是可以到达几乎每一个角落。

搜索整个网络,然后计算出一共有多少个链接是他们主要的任务。不过,BackRub的创新之处绝不仅仅在网页捕获。佩奇很自然地注意到了学术出版的评级概念,他提出了这样的理论:网络图的结构不仅可以显示谁链接当我问起斯特姆伯格的灵感所在时,他说:“我想拉里只是想知道到底都有谁链接了他的网站。”了谁,更关键的是,可以根据进行链接行为的网站的各种属性决定这个链接的重要性。我们先前提过,这些属性――也就是像链接周围的锚文本之类的东西,对于等级和相关性的确定也非常关键。

如果BackRub知道一个网站的重要性,就可以给它一个相对的等级。对于任何一个给定的网站,我们不但可以知道哪些网页上的链接指向它,还可以知道这些链接的评级。佩奇想,这当然是有用的。

佩奇和布林研究的一个重要原则就是要有用,这也是后来Google所有的产品开发必须遵循的原则。他们当时还没有最终确定要在BackRub的基础之上创立一家公司,但是佩奇对特斯拉的教训一直铭记于心。“我的目标是为了进行实实在在的有趣的学术研究。”佩奇回忆道:“但是做没有什么实践价值的所谓学术研究是没有道理的,有许多研究课题既有趣又实际。这两者我都要,我不认为追求实用性需要牺牲什么。我想如果我真的发明出能够造福许多人的东西……我一定不会反对把它商业化,我不想最后像特斯拉那样。”

佩奇和布林完成网络搜索并存储了链接图之后,他们面临的问题是找到评定等级的方法。受到文献引用分析的启发,佩奇构建了自己的理论,认为计算所有指向某网页的链接数量对于确定这张网页的等级具有指导意义。但是这样一种方式带来了新的挑战―困难的递归性数学运算,因为不光要计算一张网页上的链接数量,还要计算同这些链接连接的链接的数量。很快,运算变得非常复杂。


上一章目录下一章

Copyright © 读书网 www.dushu.com 2005-2020, All Rights Reserved.
鄂ICP备15019699号 鄂公网安备 42010302001612号