【IT168 资讯】自计算机诞生以来,人们就在不断探索更便捷、更自然的交互方式。试想,如果计算机设备能听能看,就可以摆脱键盘的束缚,通过自然语言的对话就能让计算机懂你,是多么令人神往的事情。
科技发展到今天,人机对话已不是科幻电影中的桥段。科大讯飞自主研发的语音合成、语音识别、自然语言理解等关键技术实现了国际领先,让机器开口说话听到人说话已经不再是梦想。2014年10月在北京3W咖啡举办的讯飞输入法四周年生日会上,科大讯飞移动互联网事业部常务副总经理葛勇对外分享了讯飞输入法这四年的光阴故事。
2010年科大讯飞首次将智能语音技术融入手机输入法,实现了说话秒变文字,从而宣布移动互联网迈入了语音时代。
现在看,讯飞输入法第一个版本界面看起来“简单粗暴”却符合颠覆式创新的所有要素。科大讯飞首次将语音技术嵌入输入法中,随后搜狗、百度、QQ输入法相继模仿加入,至今语音输入已经成为输入法的标配功能;其次,麦克风图标直接置于键盘布局中,用最直观的方式引导用户使用语音;最后,语音输入需要联网符合移动互联的时代特征,这段原始积累期培育起用户联网上网的习惯。如今讯飞输入法界面已变得更加美观和实用,虽然增添了丰富应用,但语音输入至今依然是最重要的输入方式。
2012年,讯飞输入法进一步强化语音识别功能。重点剖析用户痛点,加入个性化语音识别,对声学语言学方面改进,实现语音输入联系人名称或个性化用户词条的准确无误;同年,新增粤语语音识别,成为首款同时支持普通话和粤语的输入法,从众多输入法产品中脱颖而出。
2013年,深挖用户需求加入英语语音识别,让讯飞输入法成为一款无国界的通用型输入法。与此同时,讯飞输入法更新搭载“InterReco蓝光”语音识别引擎,语音识别率在原基础上突破性提升40%,实现了有话直说的畅快表达。在2013年四季度,首家推出无需网络不用流量极速识别的“离线语音”,一举颠覆语音输入必须联网的传统观念,让语音输入无处不在无时不有。
2014年,讯飞输入法“大开脑洞”开启了方言语音识别的新时代,支持四川话、河南话……陕西话等12种方言,并且不断更新加入新的方言,受到诸多用户的好评。自发布方言识别以来,用户使用语音输入的频次更高,普遍认为讯飞输入法能够提升人机交互体验,相比文字手写更乐意选择语音输入。例如,以前用语音输入时,说标准的普通话有一定门槛,二来担心说得不标准导致识别错误;而讯飞输入法支持多方言语音输入后,用户使用语音轻松自如,识别率也是杠杠的。
未来,讯飞输入法如何发展?对此,葛勇也透露了一些思路和想法。从产品发展角度出发,讯飞输入法会成为每个人打造专属的输入法,极致表达用户的个性化;同时也将拓展面向多平台应用,统一人机交互体验。或许有一天,实体的和虚拟的键盘都将彻底消失,语音成为非常好的输入方式,能够精准理解用户说的内容同时完成快速输入。