正文

《永无止境:Google传》第3章 没有规则的世界(2)

永无止境:Google传 作者:(美)道格拉斯·爱德华兹


 

“GWS是一个软件系统,当用户提交查询及反馈搜索结果的时候,实际上都是由它来跟用户交互。我们打算更新Google的用户界面时,就需要推出一套新的GWS系统来实现变化。”

我想不出GWS是个什么样子,因此在那个人头后面画了些瑞士乳酪。等到克雷格讲完的时候,我对Google的工作方式有了宽泛的理解,此外还在我的收藏中增加了一幅怪异的涂鸦作品,这可是不会跟新同事们分享的东西。

后来,乌尔斯向我证实,早在拉里和谢尔盖1998年离开斯坦福大学之前,Google就已经在搜索质量方面稳操胜券了,因为链接分析就是互联网上等着点化成金的石头。Google搜索结果的高关联性对早期用户和新闻媒体产生了强大的吸引力,但是背后却隐藏着面临崩溃危险的脆弱基础。乌尔斯告诉我:“我们的排序方法远远胜过Alta Vista,但是速度很慢,而且无法稳定可靠地建立索引。”

如何改进Google在爬取、索引及服务交互方面的效率?正是这一挑战让乌尔斯进入Google。他估计实施改进计划需要一年左右的时间,随后他返回欧洲。“整件事情是个系统性的问题,我对此估计不足,”乌尔斯承认,“我们以前用的是大学里的系统,现在基本上需要重写一遍。”虽然Google对自己掌握的数据做得很好,可是它收集的数据远远不够,而且搜索数据的速度也不够快。

速度还是规模,只能选一个。当我们爬过的网页越来越多时,索引就会变得更大,PageRank算法需要利用的数据也就更多,这样我们才能产生相关性更好的结果。这一点吸引了更多的用户和研究人员,因而我们的追随者队伍不断壮大。然而,更大的索引需要更多的机器运行更多的处理过程,更多的处理过程需要耗费更多的时间。上网的人都知道,用户增加会对网络提出更多的要求,从而让速度变慢。

对于Google的未来走向,是要成为一个终端站点,还是要做其他网站的服务提供商,当拉里和谢尔盖不得不面对这个选择时,他们决定两者都要。即便是选择全面扩张,Google的搜索速度也要加快。他们都对自然法则强加在头上的约束限制不屑一顾,于是他们开始寻找同道中人。

找出原因,何去何从?

“在那个时候,主要是由乌尔斯定目标,因为拉里和谢尔盖处理商务方面的问题更多,他们更多处理交易之类的事情。”先期进入Google的工程师杰夫·迪安告诉我说。拉里和谢尔盖都能写程序代码,不过这不是他们最擅长的事。

“我信不过让拉里和谢尔盖编程,我不得不对他们在斯坦福大学时期留下来的乱糟糟的程序代码加以处理,里面问题很多。他们是研究型程序员 有兴趣写可以运行的程序,而不是写好维护的程序。” 克雷格·西尔弗斯坦如是说。据杰夫·迪安说,在斯坦福版本的Google系统中,有一个奇特的怪现象:每当程序发生异常时,都会加上一条没有任何解释的错误信息。错误提示的内容非常简单:“马儿,停下来!”

正如克雷格所回忆的那样,“乌尔斯靠自己的穿着和他那条狗而表现得魔力十足”,仿佛电影《指环王》中从云雾缭绕的法贡森林出来的那位身披一袭白袍的甘道夫,他在Google担任着统领全体工程师的角色。乌尔斯看起来有巫师那种全知全能的本领,他为Google的工程师限定任务,让他们从互联网的阴暗角落里汇集数据,然后把这些数据输送到他的服务器部队中。也许乌尔斯是从他天天穿的那双红袜子中获得的法力吧。

 


上一章目录下一章

Copyright © 读书网 www.dushu.com 2005-2020, All Rights Reserved.
鄂ICP备15019699号 鄂公网安备 42010302001612号