互联网 频道

语义分析助智能输入法由"学"到"懂"

  【IT168 厂商动态】如今的人们可能很难想象:打字,曾经是一份“高大上”的技术性职业。当时,这个职业要求汉字录入速度达到每分钟90个以上,从业者在各种机构都显得不可或缺,甚至往往拥有操作个人电脑的专门权限……

  而在今天,每分钟输入汉字90个以上,已经是很多人都能做到的寻常之事了——这当然还得归功于中文输入法技术日新月异的发展。近期,输入法领域始终处于领先地位的搜狗发布了其中文输入法的3.0版,在增大了输入界面的基础上,又新增了“表情斗图”和“文思泉涌”等功能。现在使用搜狗时,输入法将可以在判读输入的内容后,直接提供海量的表情素材供用户选择使用,极大地丰富了用户的输入风格;不仅如此,在输入诗词、歌词和电影台词等内容是,输入法还将具备超强的“联想能力”,经典歌词、语录只要输入一句,搜狗就能联想起把整首歌、整段话!从简单的连字成词、到“深度学习”支撑下的自动问答、再到基于文本语义分析的海量内容联想……今天的智能输入法,即使说与三、五年前相比,也堪称是“面目全非”。一系列的“新技能”是如何让中文输入法走向未来的?眼看搜狗一路走来,令人颇有些叹为观止……

  

  准确只是起点,“智慧”只是途中

  从简单的基于词库的匹配组词,到基于深度学习的词句联想和自动问答,中间的每一步都是输入法的一次跃进——不止在技术,更是在理念上。就在几年前,开发者们还在绞尽脑汁、设计更复杂的组词规则好让输入法能够变得“更为精确”一些;而如今,输入法已经成了人工智能落地实践的前线之一,使人们实实在在地看到了智能化的机器能够以什么样的方式为人类提供服务。随着互联网的发展、特别是“互联网+”概念的兴起,输入已经集成了工具、入口、服务等多重角色;最先意识到这一点、并开始转变输入法开发思路的,是搜狗。

  2013年,搜狗v2.0智慧输入法问世,正式让中文输入法从“组词准确”的等级跃升到了“举一反三”的新境界。搜狗智慧输入法的“心有灵犀”功能,可以在用户输入文字时“机智地”给予在线内容的推荐,实现由输入到浏览的无缝衔接。随着这次创新的成功,业界开始注意到输入法产品在互联网时代所具有的潜力:凭借与用户最为亲密无间的关系,一旦输入法能够提供推荐、分享等智能化服务,就将立刻跃升成为互联网的一个主要入口。“智能”这个关键词,也凭着搜狗的尝试在输入法开发圈子里深入人心;从此,中文输入法走上了一条不一样的发展之路。

  然而,即便是在对“智能”的理解上,搜狗也还在不断地进化。在第三届世界互联网大会“移动互联网论坛”上,搜狗CEO王小川称,搜索和输入法未来还要向着智能问答的方向迈进。在搜狗的愿景里,今后的输入法究竟要有怎样的“智慧”?还需拭目以待……

  从“揣摩上意”到“读懂人心”,语义分析将是二次质变?

  尽管听上去已经足够科幻,但就实际原理而言,基于深度学习的输入智能终究还只是通过对使用者意图的模糊“揣测”、以此为依据来行动的。想要真正的“善解人意”,还需要让机器能够真的“读懂”人类的语言才行。人们最初提出这种假想,正是在对搜索引擎的开发过程中,希望能够通过“语义网”的建设实现真正的智能搜索和推荐服务;于是,当基于搜索引擎的智能输入法开始追求更加人性化的智能行为模式时,语义分析顺理成章地成为了突破口的所在。

  相比深度学习以及更早期的词库匹配来说,语义分析更多的是一种质变。须知在这之前,输入法并没有“语言”的概念,而是将任何输入信息一视同仁地按照“数据”来论处——即使是人工智能的介入,也不能改变这一状态。语义分析则不同。它藉由本体推理等技术的支撑,通过程序真正为机器建立起“语言”的哲学概念和相应的逻辑框架,从而帮助机器用与人类相同的方式去理解人类的语言。不难看出,对于专门处理人类语言的输入法而言,这样的技术尤为重要,很有可能会给用户的输入效果带来质变级的提升。

  

  以此次搜狗发布的v3.0版智慧输入法为例,就其新增功能来看,搜狗似乎已经有能力使计算机软件将用户所输入的问题与其想要表达的对应情感状态较为准确地联系起来,并能够通过对短句的判读分析进行大范围的文本内容联想。可见,在输入法中应用语义分析技术的赛跑当中,搜狗已经抢先起跑;综合过往的业界动态分析的话,搜狗的这一动作,或许又将引发输入法领域的一场新的技术研发竞赛。

  互联网的发展,给软件应用的发展带来的几乎无限的可能性,正如输入法的发展:如果站在它做出的设计目标的角度——软件系统本地化问题的一个解决方案——来看今天的话,人们肯定会觉得今天的输入法高端得难以想象吧。当时间再过去三五年、甚至十余年,人们所用的输入法又将被升级到一个怎样的高度呢?真是令人不禁憧憬起来了!

0
相关文章