登录 / 注册
IT168互联网频道
IT168首页 > 互联网 > 互联网应用 > 正文

想让应用开口说话?你还缺百度语音合成

2017-11-15 14:54    it168网站原创  作者: 王珅 编辑: 王珅

  【IT168 应用】当日常时间日益碎片化,同一时间段只专注做一件事,已经成为一件越发奢侈的事情。有心的开发者,一定早已发现用户正在寻找各种解放眼睛、双手的方式,期待能“一心多用”。

  以阅读需求为例,听书的需求正在不断增长,在异常激烈的阅读市场上,具备听书功能已成为越来越多阅读类APP的“标配”,这就对背后语音技术的支持提出了更高的要求。例如“快听小说”,是一款集看书、听书于一体的免费小说软件,让用户可以利用碎片化时间,像听音乐一样的去听书,并且已有IOS和Android两个版本。

想让应用开口说话?你还缺百度语音合成

  “快读小说”界面

  “快听小说”借助语音合成技术直接阅读书籍,这与通过录音实现书籍阅读的传统方式不同,不光需要语音技术进行文字识别,还需根据情感的不同进行对断句、语调、语速进行自动调节,其背后技术支持者便是百度的语音合成。

想让应用开口说话?你还缺百度语音合成

  百度语音技术对于小说文字的识别率非常高,能将小说中各类文字,输出成流畅自然的语音,有中文普通话、中英文混读等,大篇幅的文字可顺畅播放,断字断句准确,并对语句中停顿处理的得当到位,支持在合成的语音中加入语音和语调,控制音调、音量、可调整设置音频码率,打破传统文字式人机交互的方式,合成效果接近真人发声,流畅自然,且极具表现力。

想让应用开口说话?你还缺百度语音合成

  “快读小说”界面

  同时“快听小说”还接入了语速调整功能,用户随时可轻松调整听书的节奏。在此基础上,快听小说设置的语音定时功能,让用户从此再也不用担心睡着了没有人帮你关手机,进一步提升用户的听书体验。

  有了百度语音的助力,“快听小说”受到了广大用户的肯定,听书的用户也越来越多,下载量及使用量稳步提升,用户反馈的关于听书方面的问题也越来越少。如今,听书的体验已经不再是困扰“快听小说”的问题。

  百度语音合成基于业界领先的深度神经网络技术,能够提供流畅自然的语音合成服务,让应用开口说话。目前主要的应用场景包括文学有声阅读和任务播报:

  文学有声阅读场景即上述快听小说的应用,文学小说类软件利用百度语音合成技术,将文学小说作品进行高质量的朗读,除快听小说外,iReader、熊猫阅读、起点读书、飞卢小说、宜搜小说等也是百度的合作伙伴。

  任务播报是将游戏场景中的公告、任务或派单信息通过语音进行播报,让玩家玩游戏或配送员送货的同时,也可接听新任务,目前百度语音合成已与《神武》、《逍遥西游》达成合作。

想让应用开口说话?你还缺百度语音合成

  在实际应用上,百度语音合成主要表现出三个明显的技术优势:

  1、支持多种语言、多种音色。目前百度语音合成,可以实现多种语言及音色的选择。在语言方面,中文普通话、中英混读均可支持;在音色方面,有标准男声、标准女声、度逍遥(情感男声,比较适合读小说)、度丫丫(目前很多用户,使用在童声中)四大选择。此外,语速、音调、音量、音频码率也可根据用户需求进行设置,与传统意义上冰冷的机器模拟声效相比,现在百度的语音合成能够让应用拥有更甜美、更磁性的声音。

  2、支持离线在线融合模式。SDK可以根据当前网络状况及指令的类型,自动判断使用本地引擎还是云端引擎进行语音合成。因此,在断网的情况下,可实现离线合成,解决用户临时断网状况下的使用问题。目前离线音库有标准男声和标准女声,且都是免费提供。

  3、合成效果流畅自然。百度语音合成技术业界领先,合成效果接近真人发声,流畅自然,且极具表现力,可以给用户最舒适的听觉体验。

  4、接入方式丰富灵活,能降低用户的使用成本,具体可参考如下方式。

  API:restfulAPI

  客户端SDK:离在线融合AndroidSDK、离在线融合iOSSDK、

  服务端SDK:JavaSDK、PythonSDK、PHPSDK、C#SDK、Node.jsSDK

  看了这么多优势,要如何与百度语音合成对接合作?

想让应用开口说话?你还缺百度语音合成

  登录百度AI开放平台官网,进入语音合成技术界面,http://ai.baidu.com/tech/speech/tts,找到“立即应用”按钮,根据指引输入账号信息等,便能与百度语音合成技术达成合作。你的应用也可以开口说话。

相关文章
编辑推荐
首页 评论 返回顶部