互联网 频道

张智威:解读Google社区化的"野心"

  【IT168 高端访谈】当“知道”、“帖吧”、“空间”把百度从华语搜索的王位继续向社区延伸时,谷歌中国似乎一直毫无建树,对娱乐化、社区化的“漠视”让人对Google的印象更添一抹机器的冰冷。谷歌根本就是不懂中国本地化?李开复对此坚决否认!但谷歌中国的社区化形式依然让人难以猜测。8月20日谷歌高调宣布与天涯社区达成战略合作,使得谷歌社区化的战略初显倪端,8月21日,谷歌博客搜索的上线已经让人开始惊叹。在完成一个完美的亮相,谷歌的社区化“野心”还有什么?对于这样一个问题,显然没有谁比张智威回答更为合适。

社区:谷歌下一代搜索引擎的练兵场

  如果不是被“忽悠”到Google,张智威此时应该还在加州大学继续教书,而不是现在的工程研究院副院长。2006年,张智威与周杰等一行虎将被李开复调回谷歌中国助阵。除了从事研究理论,在谷歌的工作还要比大学有趣得多,因为在这里有世界上最大的搜索引擎舞台,你尽可以把那些空洞的公式和枯燥的数字变成人人手里把玩儿的新宠,就像张智威本次推出的“天涯来吧”、“天涯问答”。

谷歌中国工程研究院副院长张智威

  “我原来在斯坦福大学念书,毕业之后在加州大学教书教了七年,去年回到谷歌中国来。” 简要的介绍后,张智威向记者进行了详细描述:我们主要研究的项目是资料挖掘。搜索涉及到很多算法,如果都在一台机器上运行花的时间会非常长,我们把很多算法并行化,在成千上万台机器上进行处理。”

  张智威的话不难理解,随着网页内容的增加,搜索的个性化需求不断增加,搜索引擎除了要保持“快”,还要在“准”字上下苦功。而要完成这种搜索引擎的个性化革命,正是需要开发新一代的搜索引擎——智能搜索引擎!

  不过要实现两代技术的跨越却并非加几台服务器那般容易,张智威认为要想把个人偏好引入Pagerank的排名体系中,下一代搜索引擎必须研究、学习每位用户的真实信息,然后把这些信息转化为可扫描的模型,并利用这些信息来协助搜索。

  “不幸的是,个性化搜索面临至少两大技术上的挑战!首先,个人资料经常缺失或准确性较低;其次,相对于互联网中的信息,收集到的用户信息太少了,以至于我们无法有效的处理数据。也正是因为这些原因,个性化搜索已经被讨论了很多年,但至今仍未见到一个卓有成效的解决方案。”

张智威在发布会现场启动新品发布仪式(左一)

  张智威话锋一转,指向了社区,“近年来,上网社交成为互联网发展的又一热潮,这一变化给个性化搜索带来新的曙光。用户们不仅可以上网查找信息,而且也会在不同程度上参与网络社交活动,比如打牌、聊天、购物或者约会等等。我们可以通过他们的行为很好的了解用户。”

  果然是三句话不离本行,现在我们基本已经明白:对于Google来说,他们渴望从社区得到的不是流量,不是广告销售,而是来自每个人不同的个性搜索信息,当这些信息集中到一定数量,Google将可能从中破译出下一代搜索引擎的奥秘。而谁首先推出新一代的搜索引擎技术,无疑将决定了未来几年来的地位和影响力。

  社区化是打通搜索智能化任督二脉的“武林秘籍”?对此,电脑虎的大脑中首先会冒出两个问题:数据从哪里来?数据如何分析?

  第一个问题谷歌与天涯的联姻已经解决,至于第二个问题恰恰是张智威研究的方向。

  “我们理论上的创新点有很重要的一个是算法,它起源于另外一个非常有名的算法,但它的算法花的时间非常长,我们把这个算法经过了两层优化,第一个是把它缩小到一个比较小的矩阵,然后把这个矩阵在成千上万台机器上同时做处理。这样比如原来一个算法需要一两周的时间才能解出来这个结果,现在我们一两个小时就可以算出来。”

  不打无准备的仗!据张智威介绍,本次推出的两款产品在2006年第三季就已经开始研发,而与天涯的接触,天涯市场总监刘大浪则称已经有几年的时间。厚积薄发,谷歌的远见沉稳让人觉得有点“可怕”,而越往下聊,谷歌的可怕之处越让人感觉真切!

 

0
相关文章