11月28日,捷通华声宣布灵云开放平台推出多语种语音合成(简称TTS)技术,全面支持中文、英语、法语、俄语、西班牙语、阿拉伯语、德语、葡萄牙语、日语、韩语、泰语等11种语言,覆盖全球90%以上的国家和地区。这也是捷通华声推出覆盖92种语言的手写识别(HWR)技术之后的另一项重大突破。目前,灵云多语种TTS已经在灵云开放平台(www.hcicloud.com)全面开放使用。
语音合成即TTS(Text to Speech)技术,又称文语转换技术,能将任意文本信息实时转化为标准流畅的语音朗读,简单讲就是让“机器开口讲话”。通过TTS技术,计算机可以在任何时候将任意文本“轻松”转换成具有高自然度的语音,从而真正实现让机器“像人一样开口说话”。
创建于2000年的北京捷通华声语音技术有限公司,是国内最早从事中文TTS研究与应用的企业,捷通华声中文语音合成(TTS)技术在国内已处于远远领先地位,市场占有率超过50%。十几年来,捷通华声始终坚持自主研究语音合成(TTS)、语音识别(ASR)等智能人机交互(HCI)技术,并不断推出粤语、维吾尔语等方言与少数民族语音合成技术,为保证我国中文智能语音技术始终处于世界领先地位做出了主要贡献。从2000年到今天的13年间,捷通华声无时无刻、无处不在地为中国13亿大众提供非常先进的智能语音服务。
2011年12月08日,捷通华声创造性推出了全球先进个最大、最全的智能人机交互(HCI)技术开放平台 — 灵云(www.hcicloud.com)。灵云是一种可以用语音、手写、拍照、手势,将来甚至可使用脑波识别等智能手段来操作、感知手机、计算机等数字设备的网络云服务,发展目标是让人机交互像人与人沟通一样的简单自然。灵云以“云 + 端”方式,为中国整个信息产业领域提供语音合成(TTS)、语音识别(ASR)、手写识别(HWR)、光学字符识别(OCR)和自然语言理解(NLU)等多项核心技术能力。自灵云推出以来,灵云开放平台与超过千家企业形成合作伙伴关系,为各行各业企业提供了全方位HCI技术支撑。两年来,灵云智能语音等HCI技术助力并通过百度导航、导航犬、搜狗地图、嘀嘀打车、汉字英雄、天行听书、触宝输入法、百度PC输入法、天行输入法等家喻户晓的移动应用服务大众,为超过近3亿社会大众提供轻松、便捷的HCI技术服务。
伴随着经济全球化的迅速发展,中国企业全面开始走向世界,捷通华声为顺应中国企业国际化潮流,适时在灵云平台推出多语种TTS能力,成功将世界主流语种纳入其中,为需要多国语言智能语音技术支持的中国企业提供了最丰富与最有力的能力支撑。此次,灵云平台推出多语种语音合成技术,适逢灵云庆祝诞生两周年之际,犹如为中国企业与社会大众献上了一份丰厚的大礼!
值得指出的是,此次捷通华声灵云推出多语种语音合成技术云服务,与两周前推出的覆盖92种语言手写识别技术,可谓“珠联璧合”,说明灵云平台已开始具备服务全球的基本能力,为助力中国企业进军国际市场、全面参与国际竞争做好越来越充足的HCI技术能力支撑准备。相信也会对促进中国与国际间的交流合作做出贡献。
灵云平台是一个开放的平台,也是一个企业间合作的平台。未来发展,捷通华声灵云将在发挥智能语音等多项HCI技术优势的基础上,不断与国内外学术界、产业界、包括国际跨国企业进行合作,力争通过全球范围的合作,为世界各国用户提供更多、更好、更全面的HCI技术能力,将合作共赢的理念通过HCI技术融入中国IT产业,也融入世界!
捷通华声灵云:源自中国,服务全球!
感知灵云,从这里开始,灵云智能人机交互技术试用体验入口:www.hcicloud.com