互联网 频道

独家献映:工程师面对面之谷歌输入法

 【IT168 特别策划】一年前开始策划,历时一个月紧张拍摄制作,IT168虎年开篇巨制《谷歌工程师面对面》系列视频节目于2010年1月11日正式推出。作为《软件大讲堂》开播三年的献礼,本次节目特别获得谷歌中国公司大力支持,一网打尽谷歌十余项最热应用:谷歌搜索、谷歌翻译、谷歌地图、谷歌拼音输入法、谷歌音乐、谷歌浏览器、谷歌购物搜索、谷歌手机地图、iGoogle、谷歌云计算……15位天才谷歌工程师、项目经理云集IT168视频中心,为大家献上精彩的技术演示,与大家分享技术背后的妙事趣闻。谷歌,不仅仅是搜索!IT168带您走进真正的谷歌世界!


专题地址:http://focus.it168.com/focus/201001/google/index.html

  谷歌工程师面对面第2期——聪明好用的谷歌拼音输入法

  主题:谷歌拼音输入法
  嘉宾:谷歌软件工程师 王咏刚
  主持:IT168软件群组编辑 王凡
  播出时间:2010年1月12日
  论坛活动:说出你最想要的谷歌输入法新功能


《谷歌工程师面对面》第2期:聪明好用的输入法(原视频地址


王咏刚展示自己设计的“谷歌拼音输入法”T恤

  嘉宾简介:

  王咏刚,谷歌资深软件工程师。1998年毕业于北京大学。1998-2006年间长期从事金融行业软件系统设计与开发工作。2006年3月加入Google,先后从事中文搜索,Linux及开源软件开发,中文输入,音乐搜索等项目的研发工作。

  访谈记录:

  主持人:亲爱的观众朋友们,大家好!您现在收看的是由IT168软件频道推出的软件大讲堂特别节目,《谷歌工程师面对面》第二期。今天我们请来了谷歌优秀的工程师王咏刚先生。咏刚,您好,先跟观众朋友打个招呼好么。

  王咏刚:IT168的网友们大家好,我是来自谷歌的工程师王咏刚。

  主持人:您在谷歌主要是负责什么项目?

  王咏刚:我加入谷歌大概三年多了,应该也做过很多相关的项目搜索、开源等等的项目,现在目前主要负责的是输入法和音乐方面两个项目的开发。

  主持人:我们今天主要是谈一下谷歌拼音输入法这款产品。您能简单介绍一下,现在谷歌拼音输入法团队的状况

  王咏刚:谷歌拼音输入法应该是2007年4月份对外发布的。其实它的团队在谷歌内部是一个很小的团队,大概一直都是保持在三、四个人的水平。但是这三、四个人都是很精干的客户端软件开发的工程师,而且他们对这个中文语言的这种理解,他们对中文拼音的转换到中文语言的功能上的知识都是非常非常强的,所以这一直是一个很小、但是很精干的团队。

  主持人:我们知道现在的输入法有五笔输入法、正码输入法等等,为什么你们一开始就选择了做拼音输入法?

  王咏刚:我觉得这有两个方法,一个方面我觉得拼音是一种中国人最自然的思维习惯,任何讲话、任何打腹稿、任何写文章,都会先天的想到拼音。第二个方面就是拼音输入法本身,其实拼音输入法这件事,也不仅仅是输入法本身的一个小产品,实际上谷歌有很多很多产品都有拼音有关。比如说我们来看一下我这里的一个演示,实际上我们不要到拼音输入法的页面去,我们就在谷歌的这个主页上,如果你在搜索框里搜索一句话的时候,其实你根本不需要敲入汉字,直接敲入拼音就可以了。比如说我身上这句,大话西游的这个台词,“曾经有一份真挚的爱情摆在我面前”,实际上在我们的搜索框里只要写每个字的首字母拼音,“cengjingyouyifen”,大家看到搜索框提示的第一个结果就是曾经有一份真挚的爱情摆在我的面前,也就是说拼音输入法这件事已经融入到了谷歌的非常非常多的产品里面去,包括谷歌最核心的这个中文搜索的这样一个产品。所以说做拼音输入法有相当实质的意义,就是我们更好的去理解中文,更好的去了解中国人对中文的需求。

  主持人:就拼音输入法而言,现在也有很多的品牌,比如搜狗的拼音输入法,微软的拼音输入法。想问一下您在公司现在主要是使用什么拼音输入法?

  王咏刚:因为我是拼音输入法开发团队的,工作的原因我需要使用所有的拼音输入法,几乎所有的拼音输入法,我的电脑上经常安装了非常非常多的拼音输入法作为产品上的试用、比较等等。

  主持人:想问一个比较有趣的问题,为了推广谷歌拼音输入法,公司有没有规定员工必须使用谷歌的拼音输入法?

  王咏刚:好像我印象里没有这样的硬性规定,但是我知道大多数员工都会安装谷歌拼音。

  主持人:是因为谷歌拼音比较好用?

  王咏刚:或者说他们比较喜欢自己的产品。

  主持人:好,下面我们把时间交给咏刚,让他来演示一下谷歌产品的特性。


谷歌工程师 王咏刚与IT168软件群组编辑 王凡

  王咏刚:我们看一下屏幕。大家很容易到谷歌拼音输入法的页面下载到谷歌拼音输入法安装,这些我就不讲了。所以我只是讲一下,我们在使用拼音输入法有什么最方便的地方。因为我们谷歌拼音输入法现在是一个Windows版本,我们切换到Windows的界面来。在使用拼音输入法的时候,我们开发团队一直以来追求的就是让拼音输入法变成一个你最贴心的一个小工具,而不是一个非常大的产品,简单的说非常炫、非常让你知道它的存在的一个产品。实际上你在输入,比如说你在一个电脑上输入英文的时候,你根本不知道有一个输入法的存在,你只要在键盘上打英文就可以了。那么我们追求的一个方向也是,当你在打中文的时候,根本就不要想,你是不是在使用谷歌拼音输入法,或者你是不是在使用什么样的键盘,你只要按照你的思想,你在想一句话的时候,你就直接把这句话敲出来就行了。只要把这句话的拼音,所有的拼音按照你的思路敲出来,完全在不影响你的思路的情况下,谷歌拼音输入法就会把正确的中文解析在你的面前,这是我们对输入法最终的追求,也就是说让这个输入法非常非常的智能,它能够预先的、甚至在你的操作过程中间,非常快的猜测到你敲的是什么东西,你想敲的是什么东西,马上把最正确的中文摆在你面前。

  为了达到这种智能性,我们做了很多很多相关的工作。刚才我已经展示了你可以敲一个很长很长的一句话,把这句话完整的放在你编辑的文档中间去。实际上你在敲完整一句话的过程中间,很可能还会有比如说混合英文,混合标点的需求,实际上在谷歌拼音里面你完全不用想你怎么样敲这些事情,你只要按照你最原始的思路,去把这些东西用键盘打出来就可以了。比如说我在谷歌,谷歌已经出来了,我根本就没有切换到任何英文输入法。谷歌开会,那么我就可以把这句话非常完整的敲出来,至于标点符号什么的都可以非常顺利的敲出来,你不用去担心你要改什么选项,你不用去担心输入法目前是什么状态,你只要按照你的思路往下敲就可以了,所以这是我们对一个好的输入法的一个最高的要求。也就是说,我们追求的方向,也许我们会希望在一年后、或者两年后我们输入法真的成为一个完全不可见的一个东西。你打开了一个中文操作系统,然后你就可以顺利的敲中文、敲英文,敲任何你想敲的东西。甚至比如说你想敲出一个网址的时候,你就可以随便的在输入法里敲出这个网址,根本不需要去切换到网址输入状态之类的东西,这样的话就是对你的输入法来讲,才是一个最智能、最贴心的输入法。


图:谷歌拼音输入法的智能组句功能

  主持人:刚才我们看了用钢的介绍,谷歌输入法的确很好用。如果你不知道这个文字的读音,这个时候怎么样使用谷歌输入法进行输入呢?

  王咏刚:如果你想直接去,因为有些拼音实际上有些人可能对某些偏僻字,不是太知道它的读音。实际上你想输入这样一个字的时候,直接就可以进入到我们的一个所谓的笔划模式。直接比如说敲一个U键,然后你就可以按照这个横、竖、撇、捺、折,五个笔划。就像你在手机上使用那个横、竖、撇、捺、折的这个手机输入法一样,比如说竖折,这样你就可以敲出这样一个相对来说笔划比较复杂的一个字来。任何一个字,实际上在谷歌拼音输入法里,你只要敲U键,然后后面都可以跟着这样的一些用横、竖、撇、捺、折标记笔划的这样一个字。而且你可以注意到,这个字后面已经跟了它的正确读音,如果你现在不知道这样一个字的读音的时候,你敲了一遍之后,你下次就可以用这个读音来敲出这个字。


图:谷歌拼音输入法的“U”模式 笔画输入

  主持人:好,刚才我们输入的都是简体文字,谷歌输入法现在支持繁体输入么?

  王咏刚:实际上有一个很简单的简繁转换的按纽。你把这个简繁转换切换以后,谷歌输入法就可以在它里面切换为繁体模式的时候。你实际上你说的这句话里面,如果它的字对应有繁体字的话,就帮你转换成了繁体字,所以这个也是非常简单的一个状态切换。


图:谷歌拼音输入法的“繁体模式”

  主持人:下面请用钢给我们展示几各谷歌拼音输入法的绝活好吗。

  王咏刚:好吧。展示几个,可能谷歌拼音输入法有,其他拼音输入法现在还没有的一些小的功能。我觉得拼音输入法还是像我刚才说的,它最好的状态应该是一个不存在的状态,你可以随意的输入刚才说的像、中文、英文、标点等等,当然我们也希望拼音输入法是一个你桌面上的一个小玩具,或者是很有趣的一个小东西,陪伴你在很长时间的工作中间,给你一些乐趣。比如说我们在点它的选项菜单的时候,可以打开一个叫做统计表盘的功能。大家可以看到一个半透明的,当你鼠标移过来变成了一个真的一个汽车仪表盘。这个仪表盘很有意思,它有两个仪表,和下面总的里程表。这两个仪表一个是反应了你的敲键的速度,一个反应你敲的这个拼音,到中文的转换的这个第一侯选词的准确率,也就是说你的拼音转换到中文的时候,是不是非常非常准确。然后它的底下这个里程的统计,其实指的是你从这个使用谷歌拼音输入法开始,一共敲了多少个汉字。这是一个非常有趣的功能。我们知道很多的网友都会把这个东西当做一个自己经常打开的东西,然后把这个累计到一定程度之后,做一个截图给其他网友看,你看我敲字的准确率有多高,我敲字的速度有多快。很有意思。


图:谷歌拼音输入法的“仪表盘”

  还有一些很有意思的功能,谷歌拼音输入法,如果大家关心谷歌拼音输入法发布的历程的话,大家会注意到,我们在十月份,发布了一个很有趣的一个小功能。这个功能虽然很小,但是在网友里面引起了蛮大的一个轰动。其实就是谷歌拼音输入法扩展模式的一个功能。什么叫扩展模式呢,我可以简单稍微演示一下。刚才打的是U进入的我们这个笔划模式,实际上还有一个非常非常有趣的快捷键,叫做“I”,我爱输入法的“I”模式,你只要打这个“I”,大家会发现里面出现了一堆这个你可以选的小命令。这些命令还都很有趣。我们比如说演示一个查星座,你可以直接用这个查星座的命令,然后输入你的生日,比如说我的生日是11月3号,注意,谷歌拼音输入法就会告诉你,11月3号生日这个是天蝎座,然后是天蝎座的这个英文怎么拼,天蝎座的这个符号是什么。

  这个功能大家看起来是一个很有趣的功能,但是为什么我们要单独提出来作为一个扩展模式呢,我应该告诉大家的是,这里面的每一个功能都是你可以自己定义、自己开发的,如果我们登录谷歌拼音输入法的主页上的时候,大家会发现主页上新增了一个叫ATI指南的一个页面。如果你是一个开发者,那么你可以用API指南里提供的这种谷歌拼音输入法的编程开发接口,你也可以编这样的小程序,而且是动态的,让输入法做一些动态的功能。实际上当我们发布了这样的一个谷歌拼音输入法扩展的这样一个功能之后,有非常多的网友、有非常多的第三方开发者,在我们的论坛上,甚至他们在这个谷歌源代码这个主页(http://code.google.com)上,做了了一个非常漂亮的项目。这个项目的目的就是给谷歌拼音输入法各种各样的插件。现在他们已经开发出来很多很有趣的插件,比如说算个人贷款的利息,算房贷的利息,输入各种不同的表情符号,随机的输入各种名人名言,甚至去做这种,在桌面上发纸牌,来玩儿纸牌游戏,等等这样的一些扩展。很简单,用户只要告诉他们发布扩展这样的一个项目,或者到网页,或者到我们拼音论坛上面,只要下载了这样一个程序,装在我们的拼音输入法,你的输入法就会有越来越多的功能,也就是说让所有的网友去帮助大家开发功能,而不是说简单的我们这样一个三、四人小团队来开发功能,这样的话就给网友,特别给开发者一个非常大的开发空间,也就是说从上个月起,我们谷歌拼音输入法成了一个可以无限扩展的拼音输入法,这个是一个应该在所有拼音输入法里是第一个。

  主持人:听了用咏刚刚才的介绍,我们发现谷歌拼音输入法,不仅很智能,很好用,而且还很有趣。现在也有很多网友在使用这款输入法,他们都很关心谷歌拼音输入法的发展,也向我提出了一些问题。有网友想问,谷歌是否会出五笔输入法?

  王咏刚:就像我们刚才说的,我们之前从07年到现在,所有的精力都在拼音输入法,所以对其他输入法至少暂时还没有去研究,也没有去想该出还是不该出。

  主持人:在上周的时候,百度发布了,百度手机输入法,有些网友想了解一下,谷歌是否会发布手机输入法?

  王咏刚:事实上我们已经发布了手机输入法,应该是09年的4月份我们已经在Android的开源代码库里,发布了我们谷歌拼音的输入法的原码。而且现在如果你有一款Android手机,拿这些手机直接去Android Market就可以下载谷歌拼音输入法。

  主持人:现在有一个网友提出一个更具前瞻性的问题,他问将来是否可以实现语音输入?

  王咏刚:语音输入其实我们已经发布了一款在手机上面做这个语音搜索的软件。而且很有趣,这个软件大家可以去试一下,如果你有这样的相关的手机的话,你可以到我们的语音搜索去试一下。你直接说这个中文,然后就可以帮你去搜索这个中文。实际上语音搜索和真正的语音输入其实它们之间的关系非常非常的密切。只是就是说它的处理得数据量和关注的焦点的不同而已,在技术上应该是一样的。

  主持人:好,非常期待。谷歌拼音输入法什么时候会是3.0版?

  王咏刚:看怎么定义3.0吧。因为我们输入法的编的这个版本号,从规则上来讲,我们并不是说,一定会很看重一个大的版本号,我们在每一个小的版本号,谷歌拼音输入法版本号大家可以看一下,实际上是有一个四位数来组成的。比如说我们现在的版本号是2.1.9.59,那么2是一个主版本号,1是一个小的升级号,9是每次发布的号码,然后59是我们buid的一个号码。实际上我们对小的升级号,实际上都是要求我们在每一次升级之后,都给用户一些最贴心的、最能够改进用户体验的一个版本,至于大的版本号什么时候变呢,我们总觉得应该是一个有这种革命性意义的功能出现的时候,那个时候我们才会升级大的版本号?

  主持人:对于一款输入法,词库是非常重要的。有些网友就想了解一下,谷歌拼音输入法是如何搜集新词的

  王咏刚:OK。谷歌拼音输入法去搜集新词的过程有点像我们在所有的网页的海洋里面去找每天新冒出来那些最漂亮、最好玩儿的语言的这样一个过程。其实就是计算机去自动的执行这样一个过程,计算机大概每星期都会去分析所有的谷歌在可以搜索的这些网页的内容,主要是中文网页的内容,它会去看哪些中文网页的哪些内容是新鲜出炉的,然后会把这些内容,根据这种自然源处理的这样一些算法,来去精心的编排,从里面去分析出哪些内容的哪些词是那些我们认为上升最快,或者用户最关注的那些词,从这里面我们会得到这种新词的更新。

  主持人:我们知道谷歌除了拼音输入法之外,还有很多的软件,还有很多的服务。有些网友想知道,输入法与搜索、在线文档这些服务是如何打通的?

  王咏刚:谈不上打通吧。因为谷歌各个服务之间都会存在或多或少的关联。比如说如果我们在输入法里面,我们看一下屏幕,如果在输入法里面输入北京,然后这个时候你又想搜索北京这个词的时候,你实际上直接点一下输入法的右上角有一个谷歌的图表,或者按一个Ctrl+G这样一个组合键,实际上你就可以把这个浏览器打开,直接完成这个搜索功能了。这是我们谷歌拼音输入法和搜索之间的关联。至于和其他产品,包括网友提到的这些在线文档这些产品,我们总觉得输入法应该是其他产品的一个入口,或者说是一个更方便的让你使用在其他产品输入中文的这样一个工具,不一定非要有什么内在的关联,但是我们只要让这个整个使用过程体验更好、更方便就行。

  主持人:现在谷歌拼音输入法当中有一个“内嵌编辑模式”,很多网友都不是特别理解,您能不能给解释一下?

  王咏刚:内嵌编辑模式说起来也没有那么复杂了。其实是这样一个概念,实际上在浏览器里面,我们在这样的一个Firefox浏览器里面,这是一个Mac系统,这是上面的Mac的一个输入法。那么当你在这样的一个输入法输入的时候,你输入的内容实际上就可以适时的体现在输入框里面,这个状态其实就是一种内嵌编辑的模式,现在有很多浏览器,像Firefox,像谷歌浏览器,他们都实际上已经内置了支持这样的内嵌编辑模式。但是对我们一个客户端使用者来说,在Windows上使用这个软件来说,很多除了浏览器以外的很多软件还不支持这样的一个模式,那么就需要输入法提供一个支持。这种支持有一个什么好处呢,比如说我们在Photoshop中去做一个招贴画,里面需要一个很大的这种字体的摆放的时候,如果我有内嵌编辑模式的时候,当我去输入中文的时候,还没有提交的中文,就直接会以当前的字体显示到你的招贴画里面,你就会知道,我现在输入三个字,那么在招贴画里大概是个什么样子,那么我是要多加一个字呢,还是要减少一个字,我直接在拼音输入法没有提交前我就可以做这个决定,你就是一个所见即所得的体验,这样的话,内嵌编辑模式对大家编辑丰富的格式的文档,就会有相当大的帮助。

  主持人:谷歌输入法是一款聪明、好用的输入法。想请咏刚谈一下具体有哪些方面体现了谷歌拼音输入法的这种聪明、好用?

  王咏刚:就像我刚才演示的那样,或者说就像我们刚才讲的,我们追求的这种开发目标那样,我们希望一个拼音输入法是能够帮助你最快的时间内,最短的时间内,你想什么,我们打出来就是什么,这样的一个输入法,体现在技术上面,它能够体现出非常非常多的东西,但是体现在用户面前,我想它就非常非常简单了,它最好是一种隐形的输入法,你都不会觉察到输入法的存在,你只要在键盘上敲出你想敲的内容,然后屏幕上就会呈现出相关的中文、英文、网址等等等等。实际上从技术上来讲,谷歌拼音输入法开发团队为了达到这个目标,开发了非常非常多先进的技术。比如说我们定期的如果你的词库同步到我们的服务端的话,我们会定期的根据你的词库去想一下,你这个用户最常用的是什么样的语言风格,然后会相关的把这种相应的语言模型,来推送到你的客户端,来帮助你提高的这种输入的准确度。我们有这种定期的把新词推送到你的客户端的做法,我们也不断的根据你的输入习惯,去调整谷歌拼音输入法在客户端它去从拼音到中文的这种影射关系。达到一个什么样的目的呢,比如说你今天敲的是一篇长篇大论的专业的文章,明天你在QQ里面和朋友聊天,后天你可能是在网页上去做一个非常炫的一个PPT。那么不管你在哪种情节上面,谷歌拼音输入法都能非常快的找到你当前的,最适合你这样一个情景的拼音到中文的转换关系,能够用最好的转换、最快的转换满足你的需求,这是我们已经做的、正在做的,而且和未来非常大的精力要去投入的地方。

  主持人:好,非常感谢咏刚精彩的讲解,相信通过本期栏目,观众朋友们对谷歌拼音输入法有了更深的了解,也更加喜欢这款拼音输入法了。

  王咏刚:好,谢谢大家!

0
相关文章