正文

独步天下的谷歌算法(4)

星球Google 作者:(美)兰德尔·斯特罗斯


2008年,当微软洽购雅虎时,公司的雇员们都发表了意见,认为两家的工程师能合并为一支队伍,将更有利于与谷歌展开竞争。但是谷歌的算法之所以在它还是一家小公司的时候就能得到较好的搜索结果,关键在于谷歌工程师队伍的质量,而不在于它的人员数量。

无论是微软还是雅虎,两家公司对于谷歌算法的威力的认识都过于迟缓。在谷歌浮现的早年,雅虎就受到依赖人工编程这个注定要倒霉的决定的拖累。1998年,在40人的雅虎索引维护团队中负责的斯里尼瓦桑(Srinija Srinivasan)说,她和她的新编辑们总是赶不上网站的增长速度,尽管他们已经开始对“无限的资源”进行了自行处理。从这个较早的时候开始,他们就已经不再勉为其难了――而是决定简单地满足于将自己选出的东西描述为“已有的东西当中最好的”。当然,凭什么他们肯定自己能从急剧膨胀的数据池里鉴别出最好的东西,这是一个难以回答的问题。

而就在此时,谷歌已经享受到了依靠不断更新的技术所带来的好处。算法塞进的数据越多,结果就越好。公司并不隐瞒算法所处理的网页到底有多少――2004年,他所公布的最后数字是对80亿个页面做了索引,此后它就决定不再提供更新数字了。但即使在2000年,观察家们就已经极力称赞谷歌的搜索结果与其他的引擎相比具有显著的优势。丹尼·苏里文在《搜索引擎报告》中写道:

当我对一群人说起搜索引擎并提到谷歌时,听众中有些人便会有不正常的反应。他们微笑、点头,就跟你在发现了一个别人不知道的秘密通道时也会有的那种表情一样。每次我说起这些事,都会看到有越来越多的人像这样微笑、点头,为发现了谷歌而惊喜。

谷歌研发了一种更加复杂的算法,它可以根据一个给定的搜索词语来选择哪类广告在它的搜索结果上出现,从此,它与竞争对手的距离就更加拉大了。谷歌采用拍卖机制,让赞助商竞标,从而确定他们愿意为每一个点击支付的最高金额。这种方式是谷歌的任何竞争者都可以仿效的。但谷歌还有一个令人意想不到的手段,保持它网站上的广告带来的利润远远超过其他任何网站发布的广告,即采用算法对赞助商在历史上的表现进行评估,看看他的广告对点击率的吸引力空间有多大,出价最高的竞标者不一定就能得到最好的广告位置,还要分析他历年的统计数据,看他是否最有可能为谷歌带来最高的回报,既要考虑到预期的点击数,又要考虑平均每一次点击创造的价值。谷歌受命履行的搜索越多,关于广告效益的历史数据收集得也就越多,它的评估体系就越精确。多亏谷歌公司拥有了同行业无人能够复制的算法,谷歌引擎的每一次搜索才能带来其他任何人都难以企及的收益。

微软一直囿于软件设计方面没有人能出其右,所以未能及时注意到谷歌软件的威力。要让人们承认像谷歌这样的相对缺乏经验的公司能够研发出比微软的产品更加复杂的软件,似乎不太容易。2004年,有一篇博客提到了谷歌的搜索结果比微软的好得多,这引起了一阵不安。在谷歌搜索栏中键入“微软博客”,就可以直接链接到微软雇员的博客。但同样的搜索词放在微软自己的MSN服务器中,却会导向西雅图一家日报的一名记者的博客,因为它凑巧包含了频繁提到“微软”字样的段落,并且拒绝搜索引擎的算法。这件事令人非常窘迫,因为将谷歌的搜索结果优于微软的事实公开出来的是微软雇员罗伯特?斯科博(Robert Scoble)在微软博客上写的一篇博文。


上一章目录下一章

Copyright © 读书网 www.dushu.com 2005-2020, All Rights Reserved.
鄂ICP备15019699号 鄂公网安备 42010302001612号