互联网 频道

标贝科技推出四川话语音合成服务,全力助推方言定制解决方案

  “他是个落教的人,不弯酸。”

  “我巴郎不得去上班”

  “你啷个晓得噻”

  …………

  当你朗读上面的句子时,有没有自带音调,并不自觉拉长了语感?这种颇具感染力且最能直观表述情感的四川话,已然成为“流行”符号。无论是RAP歌曲,还是搞笑段子,四川话均可作为内容创作元素,引来大批“粉丝”围观学习。

  而四川话普及和方言保护问题早在2013年就已是当地重点研究项目。但如果你不是 local,对四川话也没有过多了解的话,还是很容易怀疑自己是不是听了外语。

  为了延续四川话中巴蜀文化与情感传承,让更多的人能够感受汉语西南官话文化的魅力,也为了更好地服务四川当地乃至世界各地的四川话相关使用人群,6月3日,标贝科技精心打造并推出四川话语音合成技术。

  一、四川话语音合成技术难点

  四川话语音合成技术在行业内已经较为普遍,标贝科技选择此时公开并发布,主要是对于其相关技术精进度的升级与把控。在四川话语音合成方面,进行了更多维度的技术开发,较普通话语音合成来说,难度提升也比较大。

  首先,四川话相比普通话有声韵母发音更加复杂,比如声母无卷舌音zh、ch、sh、r不卷舌,增加了舌面鼻浊音n、舌根鼻浊音。这样的发音方式,在一定程度上增加了语音数据标注和技术开发重构取舍的难度。

  其次,四川话声调值无高升调,各个地区调值的发音也不是很相同,在语音采集及标注中,均增加了样本数量,包括口语化的语料。同时在标准四川话选择上,增加了技术开发的精确度及地道川语的韵律。

  再者,四川话在构词法方面,跟普通话对比,构词法上显著的不同是名词和动词的重叠式,即名词能够重叠,动词一般不能重叠。

  面对以上问题及四川话语音合成发展现状,标贝科技在融合更多采集样本量及标注精确度上,技术开发进行一一突破,做出了更高质量的四川话语音合成效果。

  二、标贝科技四川话语音合成亮点

  在标贝科技最终的四川话语音合成音频中,其发音准确、音调标准,合成音色拟真人、无机械音,长句表述自然流畅、无卡顿,韵律停顿自然流畅。整体的技术都是基于标贝升级版本TTS3.0的框架,输出的音质效果更清晰稳定。

  四川话语音合成,其应用场景也较为广泛。包括:川语客服、语音播报、影视娱乐、硬件设备等。高标准的四川话语音,会为大家带来不一样的感受。

  正式上线四川话语音合成技术后,标贝科技将在其官网、标贝AI语音工坊小程序、标贝开放平台、标贝悦读等设置体验区和增加产品入口,欢迎川音应用厂商、各企业及开发者体验下载。

  而在推出四川话语音合成后,标贝科技声音库也新增“一员”,与粤语语音合成、台湾话语音合成等形成方言版声音定制库,助力更多方言场景落地。

  三、标贝科技个性化声音定制解决方案

  除了普通话语音合成、方言语音合成技术及解决方案外,标贝科技还有个性化声音定制、声音克隆(声音复刻)等解决方案,满足更多客户声音需求。

  声音定制方面,标贝科技会根据不同音色、不同发音的声音,采集不同领域的特定语料,对语料进行“设计”;之后,技术专家会对发音人的说话风格、语调和停顿方式进行指导,完成声音的“采集”;再对声音的音字、韵律和音节音素进行“标注”;从文本、韵律层级预测、声学参数和声码器方面进行合成。

  声音复刻「留声机」技术解决方案,客户只需录制 5 分钟,10 句话语音内容,当在机器录入任意文本后,就能播放出和用户声音几乎完全一致的“人造声”。目前在声音相似度、自然度等指标上均达到行业领先水平,MOS(语音质量的重要指标)接近 4 分,且音色高保真,真实还原录音人语气、语调、情感,清晰自然。

  标贝科技作为国内领先的人工智能语音技术、产品和数据服务提供商,一直在AI语音交互技术及高精度数据采标处理技术上进行创新。截止目前,语音合成、声音复刻等解决方案已经帮助客户实现多个场景落地。其包括:有声阅读、智能客服、智慧金融、AI教育、泛娱乐、自动驾驶等众多领域。而此次推出的四川话语音合成技术服务,也将助力更多开发者实现方言及个性化声音解决方案的落地。

  更多内容敬请关注标贝科技!

特别提醒:本网信息来自于互联网,目的在于传递更多信息,并不代表本网赞同其观点。其原创性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,并请自行核实相关内容。本站不承担此类作品侵权行为的直接责任及连带责任。如若本网有任何内容侵犯您的权益,请及时联系我们,本站将会在24小时内处理完毕。
1
相关文章