自2013年,国内智能人机交互(HCI)技术供应商捷通华声宣布全面加强与清华大学战略合作,并确定“灵云科技、源自清华、服务全球”的战略发展目标以来,捷通华声灵云各项HCI技术在清华大学的支持下全面升级,尤其是灵云语音识别技术突飞猛进,颇有一发不可收之趋势,代表国内最高水平的灵云语音合成、语音识别技术“双剑合璧”,助力捷通华声再次站到了中国语音产业的巅峰,几乎一夜间重新改写了中国语音产业与技术市场的格局,由此也拉开了清华大学科技力量全面参与并推动中国语音等HCI产业发展的序幕!
学术强则产业强
世界正处在一个产业革命的新时代,移动互联网、大数据、云计算、智能人机交互技术(Human-Computer Interaction,简称HCI)不仅成为推动整个世界产业变革的强大力量,也正在深刻地改变社会形态。这场产业革命,为中国完成从“中国制造”向“中国创造”,成为世界真正强国、科技经济大国创造了巨大的世纪机遇,同时信息安全等新课题、新挑战甚至也直接关乎中国的稳定发展之格局。
近年来,让人与机器像人与人交流一样简单自然的HCI技术已成为全世界学术界、产业界最活跃的领域之一,中国HCI技术的发展不仅能够保持与世界同步,而且在一些领域保持着领先地位,这其中离不开中国最高学府清华大学几十年来所做出的杰出贡献。自上世纪80年代起,清华大学率先在国内开展智能图像识别、智能语音交互等HCI技术研究,一直是国内HCI领域最重要的研究力量,保持并拥有在学术、科研、产业化应用的领导地位,并不断为中国、乃至世界学术界、产业界培养、输送大批优秀人才。
学术强则产业强!在新的产业革命中,清华大学顺应世界社会经济发展之新趋势,提出了“通过完善知识创新体系,构建以企业为主体、市场为导向、产学研相结合的技术创新体系”的发展规划。新的发展规划不仅将有利于清华科技在中国、乃至世界范围内扩大在产业中的影响力,从而加快推进世界优秀大学的建设步伐,也必将为中国高新技术产业的发展进步、国家科技创新体系的建设做出巨大的贡献。
纵观国内外信息产业发展趋势,HCI产业作为一个新兴的产业集群正在迅速崛起,智能语音交互、图像识别、语义理解、生物特征识别等HCI技术的进步,也在影响并改变着更多产业的发展进程。从苹果Siri的语音交互技术到谷歌眼镜的图像识别技术,从智能手机大战延伸至智能电视,从办公室自动化到智能汽车,无一不在说明在移动互联网时代,整个信息产业都在发生由量到“智”的居变,而捷通华声灵云在这场全球范围内的产业变革中,以专注+专业+国际化的独特定位,在中国HCI产业发展中占据了有利位置。
此次,清华大学与捷通华声合作,凭借清华大学在HCI技术领域中的雄厚研究力量,共同构建产学研一体化的创新发展新模式,推动实现“灵云科技、源自清华、服务全球”战略规划,不仅将帮助捷通华声等一大批中国企业提升企业核心竞争力,也必将对中国HCI产业新格局的诞生,提升中国HCI产业在世界范围内的竞争力产生深远的影响。
捷通华声依托清华,布局灵云
被称为“工程师的摇篮”的清华大学,伴随中国信息产业的高速发展,不仅为社会输出了无数优秀的工程师,也为社会培养了张朝阳、邓峰、宋柯等大批优秀的企业领导者。以清华学子领军的企业活跃在中国信息产业中的各个领域,清华89级毕业生张连毅所领军的捷通华声则是在HCI产业中的代表企业。
捷通华声公司创始人大都毕业于清华大学,自1990年,即与清华大学工程院士吴佑寿先生、丁晓青教授合作推广清华OCR,成绩卓着;99年,捷通华声创建之初,即与清华大学语音专家蔡莲红教授合作开展语音合成技术的研究,捷通华声也因此拥有了与清华大学的合作基础与丰富经验。如同大多数清华学子创办的企业,捷通华声尊重HCI技术发展规律,保持低调、务实的企业发展作风,长期专注HCI技术的研究与产业化应用,在智能语音、智能图像、智能语义理解等HCI技术领域保持着领先地位。经过十几年的专注与技术积累,捷通华声语音技术已“炉火纯青”,智能语音播报服务从纵贯中国的高铁到各大飞机场;从各个医院语音叫号到各地长途汽车站;从各大银行声讯服务到各领域企业呼叫服务中心……自1999年到今天,捷通之声已服务中国十三亿大众十五年之久。
2011年,捷通华声推出全球先进个全方位智能人机交互(HCI)能力云服务平台-灵云(www.hcicloud.com)。灵云是一种可以用语音、手写、拍照,手势,将来甚至可使用脑波识别等智能手段来操作、感知手机、计算机等数字设备的网络云服务,其目标是让人机交互像人与人沟通一样的简单自然。灵云自推出以来,灵云语音识别、语音合成、手写识别等HCI技术能力通过百度导航、搜狗导航、导航犬、嘀嘀打车、快的打车、汉字英雄、天行听书、天行输入法等“家喻户晓”的经典应用服务中国3亿多的社会大众,使大众群体充分感受并体验到HCI技术为现代生活所带来的轻松与便捷。
HCI产业拥有一个非常宽广的技术领域,并且随着全球范围内网络信息安全地位的提升,HCI产业发展与社会化服务也已经成为国家间竞争力强弱的重要标志。捷通华声清醒地认识到,在HCI产业日益激烈并趋向国际化的竞争中,单靠企业自身力量推动产业的发展尚显薄弱,只有依托更强大、厚实的基础研究力量作支撑,才能在这场席卷全球的产业竞争中赢得主动权。经过深入调研并在得到清华大学的支持下,捷通华声果断做出推动灵云回归清华母校怀抱的战略决策,依托清华大学HCI科技力量,共同实现“灵云科技、源自清华、服务全球”的长远战略发展目标。
灵云科技、源自清华、服务全球
捷通华声与清华大学的合作在不到半年的时间里便取得了丰硕成果,灵云语音识别技术的突飞猛进迅速打破了行业内正在形成的“垄断”,一举改变了国内语音产业市场的竞争格局;灵云自然语言理解技术也同时取得重大进展,采用了清华最新自然理解技术的“灵云智能客服系统”成为国内第一个真正通过语义理解、语义分析实现智能问答客户服务,并帮助企业客服中心开始从成本中心向企业营销中心转化,进而成为盈利中心的跨越。灵云技术的快速进步,标示着清华科技已经以创新的模式、崭新的风貌在中国HCI产业发展中开始爆发出最为强大的推动力量。
自上世纪80年代起,清华大学在众多HCI学术与科研领域一直处于国内领导地位,为中国HCI技术与世界同步发展做出重大贡献。为促进清华科技服务产业、服务社会,清华大学也一直鼓励校内科研力量与企业的合作,以实现科技成果商品化、产业化;然而过去一段时间,虽然清华大学HCI研究力量为众多企业发展做出了很大贡献,但由于各种原因,尤其是一些企业在引进清华技术之后,在市场中更多宣传的是企业自身技术实力,而“忽略”了背后清华科技的支持,在很大程度上“削弱”了清华科技在产业发展中,及其在学术、科研中的品牌影响力。
因此,捷通华声推动灵云回归清华之举,得到了清华大学电子系、计算机系、自动化系、信研院等院系许多HCI实验室、教授的帮助与欢迎,也得到清华大学有关方面的鼓励与支持。2013年,清华大学产业基金入资捷通华声,成为公司第二大股东,为灵云成为清华大学HCI技术展现“荣誉与力量”的平台奠定了更为牢固的基础。目前,在清华大学各院系、相关实验室的支持参与下,双方在智能语音交互、图像识别、语义理解、机器翻译、生物特征识别等领域展开了更为宽广、深入的合作。
作为国内主要的HCI技术供应商,捷通华声十几年来,坚持“合作共赢”的发展理念,专注HCI技术研究与产业化应用,专业为合作伙伴提供领先的HCI核心技术与应用方案。在国内外一些拥有部分HCI技术的企业试图形成“技术垄断”的产业环境中,捷通华声与清华大学的合作,不仅在产业界引发关注,也同样得到了众多合作伙伴的大力支持,并相信清华HCI科技力量全面参与HCI产业建设,将利于产业界共同打造一个技术领先、分工明确的产业生态环境,帮助所有中国企业共同抓住智能时代的产业发展机遇。
为加强更深层次与更全方位的合作,清华大学与捷通华声共同创建清华大学灵云HCI研究中心。捷通华声表示:清华大学灵云HCI研究中心将全面发扬清华大学在国家科技进步、国民经济建设中的强大推动力与影响力,继续全面巩固并提升清华大学HCI技术在产业中的影响力,助力清华大学构建“学术超前、科研领先、产业化推广最强”的领导地位,在中国乃至世界HCI技术学术、科研、产业化推广中彰显清华“荣誉与力量”,共同实现“灵云科技、源自清华、服务全球”战略发展目标。
一个融入清华力量的灵云,已悄然改变了中国HCI产业的格局!
灵云简介:
灵云全方位智能人机交互(HCI)能力开放平台(wwwhcicloud.com)是捷通华声全力打造的HCI技术云服务平台。灵云是一种可以用语音、手写、拍照,手势,将来甚至可使用脑波识别等智能手段来操作、感知手机、计算机等数字设备的网络云服务,其目标是让人机交互像人与人沟通一样的简单自然。灵云以“云 + 端”方式,为用户提供语音合成(TTS)、语音识别(ASR)、手写识别(HWR)、光学字符识别(OCR)和自然语言理解(NLU)、机器翻译等多项核心技术能力,是目前第一个专业HCI技术云服务平台。灵云平台致力于面向中国,未来能够向国际市场提供一个全方位HCI技术能力提供、HCI技术服务、HCI产业交流的平台。