Harry’s Bing Talk
前段时间沈向洋(Harry Shum)同学来演讲了。以前只闻其声,不见其人。果然如很多技术出身的人一样,也算是扔到人堆就找不到的那种人,看上去没什么特色。上海人,在上海还有很多亲戚,呵呵。讲了几点比较有趣的东西,摘录如下:
(1)搜索的算法其实大家都差不多了,现在关于搜索结果质量的提高都是来源于数据的。如果你的数据越多,那么你的搜索结果越精确,那么用的人越多,你的数据就越多。这是一个正反馈,关键是看如何开始。微软在搜索市场的份额小于10%,那么数据就自然少了。不过沈同学说,他们有办法得到数据,但是不会告诉我们。:-) 。大胆猜测,会不会是在IE加了什么插件,然后记录人们使用搜索引擎的行为来得到数据呢,或者是MSIT内部的数据?不得而知,全是不负责任猜想。
(2)Bing本来不叫Bing,叫kooloo(?),以后七改八改改成了Bing。
(3)微软主要的关注市场是en_US,对于中文等的搜索投入有限,当然我们有专门的中文团队。
(4)令沈同学很担心的一个东西就是Google Adsense(可怜我申请了很多次,也没申请到…:( ),它相当于一个个小的sensor,把人们如何使用网络的行为都记录下来,便于Google进行分析。更别提,Google在这里面赚了多少银子呢。他对AdSense推崇备至,认为这是互联网时代最伟大的发明之一。确实如此,更具针对性的广告。其实技术很早就有了,具备商务头脑的人才会想到这种主意吧。
(5)还有人问到cost/query,沈同学没有正面回答,但感觉上,我们在这方面处于劣势,而且差距貌似还不小。有一次和同事谈起Google为什么这么重视性能优化,有点钻牛角尖的感觉。如果把性能提高10%都会受到广泛的尊重。我觉得这和两家公司的商业模式有关。Google写的程序都跑在自己的硬件上,而且都是那种很一般的硬件,不会奢侈到去买那种32颗CPU的服务器,同样的硬件如果能够干活的越多,那他的成本就越少啊。微软就不同的,微软只卖软件。这个软件跑到客户的服务器上,跑快一点跑慢一点不要紧。而且说不定跑慢一点更符合微软的利益呢。想想大家耳熟能详的WINTEL联盟,多年来推出产品的节奏呼应得多好呀。微软全球大概有10多万员工,每个人都会用的Exchange服务器,SharePoint服务器,加到一起大约有几百台吧。这对于网络应用来说还算是小case。微软很重视design和planning。软件design得一层又一层,很简单的功能就需要很复杂的design。好处就是扩展容易些,能够cover尽可能多的客户。又比如Azure,它是windows 2008上面又加了一层虚拟化层(号称这一层会失掉10%~15的性能),然后一个物理机器一分为二,上面跑两个虚拟机。好处有很多,比如便于管理和维护,但牺牲的就是性能。
(6)还有人问,为什么一定要做搜索呢?我们永远不大可能做到第一的。沈同学用了一个来自SteveB的笑话加以回答:每年Steve都会去某个产品组,和该产品组的老大和核心成员们待一段时间,仔细探讨在这个领域的问题。某一年Steve去了SQL Server组。在见面会上的QA环节,有一个人就问:Why don’t we simply quit search market? We will never be the market leader. Steve笑了笑说,我知道微软有一个产品组,它自从诞生以来就一直落后于Oracle,它就是SQL Server。
Google做老大不要紧,如果Yahoo或者其他人能和他竞争,完全没有问题。微软可以袖手旁观,专心做他的软件,互不相关。但问题是现在Yahoo的搜索一年不如一年,那Google长得太大就太危险了。那微软就一定要挺身而出了。这是正义无关,完全是出于自身利益的考虑。正如微软的open source策略是anyone but RedHat,和SUSE打得火热。这和千百年来中国古代中原政权(比如明代)对于游牧民族的政策何等相似——你们互相打仗可以的,但如果发现要抱团的苗头,就马上发兵把强一点的势力打下去一点,但是也不打死,继续维持这个平衡。
