互联网 频道

龚俊数字人现身百度世界2021演唱《夜曲》,这是如何做到的?

  “为你弹奏肖邦的夜曲,纪念我死去的爱情……”熟悉的旋律,这次却换了不一样的“人”来唱。8月18日,龚俊数字人形象首次亮相由百度和央视新闻联合举办的“百度世界2021”大会,演唱一首经典曲目《夜曲》,一颦一笑都和本人十分相似。

  如果在微博上搜索“龚俊”的相关词语,可以看到龚俊数字人唱歌被其粉丝广泛关注。

  除了龚俊数字人,全球首个火星车数字人祝融号也亮相大会,与主持人和嘉宾流畅互动,答题作诗。这些能力皆来自于百度智能云。

  揭秘数字人背后的百度智能云技术

  简单地说,龚俊数字人、火星车数字人背后拥有高精度写实、模型轻量灵活、驱动方式丰富多样三大技术优势。

  棱角分明的脸型,流畅的动作表演,数字人如龚俊真人一样“帅气”。百度智能云采用4D扫描技术,收集大量高精度训练数据,让机器学习进行人像驱动绑定和反复迭代调优,使得数字人表情更逼真,肢体动作流畅自如,并基于高精拟真3D人像制作绑定技术,让人物面部材质接近真实皮肤质感,还可根据相机的距离进行自动优化调节。

  整场《夜曲》听下来,龚俊数字人的声音和口型基本没有偏差,百度轻量级AI模型让逐字口型准确率高达98.5%以上。采用轻量级的深度神经网络模型,实现端到端的表情实时控制,精准口型同步,并支持数十种预置微笑、美颜动作和预置身体动作,让虚拟人越来越真实,同时模型还具有渲染性能优异、连线延迟、互动效果良好三大优势。

  另一方面,百度智能云数字人技术支持文本、语音等多种驱动方式,多国语言唤醒。文本驱动支持中英文输入,可插入表情、动作等,文本可转合语音驱动,语音驱动支持真人和合成声音输入,汉语、英语、德语、俄语等多语种均可,除此之外,数字人还支持普通RGB摄像头面部驱动、深度摄像头面部采集驱动共四种驱动方式。

  降低创造门槛,推动数字人普及

  当前,虚拟数字人在客服、传播、营销、社交等领域的价值正在得到广泛认可。越来越多的金融、游戏、媒体、文娱、电商等企业开始推出虚拟数字人助手,通过打造个性化、定制化的服务,为客户创造更好的价值。

  但是,整个数字人行业仍有三大痛点亟需解决,一是产业链效率较低,由于整个行业还处于相对早期的阶段,上下游各个生态没有被完全打通;二是缺乏标准,目前行业还没有建立起数字人的标准化体系;三是缺乏平台,只有通过平台化的产品聚沙成塔,不断分摊成本、功能更加模块化,才能够帮助客户降低数字人制作和运营成本。

  基于此,百度智能云推出数字明星运营平台,一方面通过平台化的方式让越来越多的数字人进入平台来均摊前期的投入成本;另一方面基于平台打造完整的生态链服务。

  百度智能云还推出“灿星计划”,从技术、生态、流量三方面扶持国内虚拟人IP,改善IP生存生态及因触媒习惯造成的宣发渠道闭塞,通过“平台赋能+冷启动服务“的方式赋能IP所有者,帮助更多人了解并使用数字人,惠普行业。

  未来,百度数字虚拟人技术将积累更多数据创造更好的模型,优化基础技术,改善服饰和人物形象,增强个性化素材,根据不同行业需求定制不同形象、功能、性格的数字人,推动数字人产业不断地向前演进。

  我们曾经在科幻电影中看到的那些智能助手,也许有一天就会出现在你我身边。


特别提醒:本网信息来自于互联网,目的在于传递更多信息,并不代表本网赞同其观点。其原创性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,并请自行核实相关内容。本站不承担此类作品侵权行为的直接责任及连带责任。如若本网有任何内容侵犯您的权益,请及时联系我们,本站将会在24小时内处理完毕。
0
相关文章