3月22日,“尽在听说之间”百度语音搜索媒体开放日在北京举行。百度副总裁王海峰在《百度语音搜索:会倾听,爱思考》演讲中表示,百度语音搜索不仅仅是语音识别和搜索的简单相加,它更懂得理解和思考,最终将帮助人们更便捷自然地获取信息找到所求,并带动整个生态的发展。
一直以来存在这样的误区,很多人认为语音搜索仅仅是语音和搜索的简单串接。王海峰表示,百度语音搜索是语音技术、自然语言处理、智能搜索三方面的完美融合,以更自然的交互方式,对用户所说更准确的识别,对用户需求更精准的理解,进而为用户提供更满意的结果。
王海峰介绍道,百度语音搜索目前已通过人工智能做到了“听”和“说”,而且还尝试完成人类复杂的行为——沟通。集成语音识别、语义理解、深度问答、知识推理、多轮对话、智能摘要、情感分析、语言生成、语音合成等能力于一身后,百度语音搜索已经能够满足用户的多种复杂需求。
“例如,‘请问三亚最近的天气都什么样子了’,这是非常口语化的说法,”王海峰现场举例道,“百度语音搜索可以做到对用户的口语表达进行分析理解,并提供信息和服务。”除了口语化理解,百度语音搜索在Query语义理解上同样表现抢眼,比如“谢霆峰的儿子是谁”,“谢霆峰是谁的儿子”,两个提问的字是完全一样的,早期搜索引擎不管语序和语法,导致搜索到同样的结果,而现在经过分析理解之后,可以找出不同,并给出不同的答案。
百度语音搜索的理解思考能力还不仅仅局限于此,王海峰现场以多轮交互为例进行了介绍。例如,当用户用语音搜索询问“从北京到上海的动车多少钱”后,如果还想再看看机票,只需要直接追问一句“机票呢”,百度语音搜索的人工智能就能够很好结合这句话和上下文,准确理解“动车”和“机票”之间的可替代关系,并通过大数据验证替代后是一个合理的需求,进而精准理解用户的意图,给出机票价格信息。
值得一提的是,在少量词语没听清楚的情况下,百度语音搜索甚至能够在大数据的支持下,准确“猜”出用户需求并给予满足。比如,它能够将“回家的愿望主题歌曲”修正为“回家的欲望主题歌曲”,能将“帕皮酱”纠错为“papi酱”。甚至在面对汉字同音字,当第一次语音输入显示为“孙俪的电视剧”,如果这时你对手机说“茉莉的莉”,它就会改成“孙莉的电视剧”。
除此之外,百度语音搜索在知识推理、深度问答、以及消歧等方面的表现都令现场媒体称赞。区别于使用文本搜索,当语音搜索有准确答案时,它能够根据问法去组织回答的语言,并通过声音反馈来回答问题。
在百度强大的人工智能技术支持下,王海峰对语音搜索的前景充满信心,“现代搜索引擎要做的是连接人与信息及服务,它不仅会倾听,更懂得理解与思考,未来将更好地造福人类。”