近日,由中国电子商会人工智能委员会主办的2023北京人工智能峰会暨第三届AI金雁奖颁奖典礼在北京盛大举行。循环智能(Recurrent AI)凭借在AI大模型技术上的创新、积累和应用,经过专家评审团的层层评比和筛选后获得了“2022人工智能技术创新大奖”,循环智能联合创始人杨植麟博士也被评选为“2022 AI领军人物”。
中国AI金雁奖是由来自人工智能领域从技术研发到市场营销和创投基金、从国家院士到企业高管和知名投资人等不同背景的专家和机构组成的评审团,从多维度的观察与剖析,多面向的评估与考核,经过初审、复审到终审,层层评比、层层筛选出在AI技术和商业领域有着突破性重要贡献的单位和个人,致力于不断为中国人工智能科技领域发掘出优秀的“头雁”。
循环智能自主研发千亿参数预训练NLP大模型“盘古”,是业内首个千亿参数的中文大模型,拥有1100亿密集参数,经过40TB的海量数据训练而成。同时也通过多任务prompt等技术延伸出10亿参数、性能更好的落地版本,极大地加速了AI的商业应用效率和泛化能力,提升NLP模型生产效率10-1000倍。“盘古”大模型刷新了世界中文CLUE榜单三项记录,并获得了2021世界人工智能大会“SAIL之星”荣誉。应用层面,循环智能提供基于“AI+销售科技”的解决方案,目前已赋能超100万一线人员,日均处理上亿次对话,在各行各业积累了丰富的销售增长实践、销售分析模型和非常好的沟通素材,累计生产了10000+面向各行业业务流程的AI数据模型。本次评选,循环智能凭借AI大模型技术创新、大量业务实践赢得了评审团的认可,获得“2022人工智能技术创新大奖”和“2022 AI领军人物”两项大奖。
颁奖典礼上,循环智能联合创始人兼CTO张宇韬博士作为获奖企业的代表,受邀发表了《AI大模型在企业服务场景下的实践与探索》的主题演讲,与现场领导、评审团、行业专家、媒体和100多位企业代表分享了AI大模型在企业落地的主要挑战、循环智能“千循零样本平台”多模型策略和应用场景,以及在大模型在企业应用场景的最新探索与实践。
以下是演讲内容的回顾:
以ChatGPT为代表的大模型应用开启了通用人工智能的新范式,其中最关键的技术创新是基于人类反馈数据的系统进行模型训练,从而提升了理解人类想法的准确性。
但企业在使用AI大模型时也面临着三大挑战,这些挑战也体现了GPT模型的局限性。
挑战一:事实性错误。事实性错误(即看似正确,但与事实不符),是GPT模型的原理带来的。GPT的模型优化目标是在有限的训练数据上泛化出无限的能力,当问题超过模型知识范围时,会开始自我创造。事实性错误的挑战,虽然在现有的技术路线下无法百分之百解决,但可以通过两种路径来“减弱”其影响。第一种是提升模型的知识范围,当模型的知识范围越大时,事实性错误也就会越少。第二种是通过更好地让模型对齐人类的需求和价值观,尽可能以合适的方式拒绝回答超出范围的问题,从而减少事实性错误造成的影响。
挑战二:难融入企业私域数据。像ChatGPT这样的通用AI系统,其能力上限是公域存量数据的范围,因为企业内部大量的信息、知识、数据均无法被公域模型覆盖。因此,企业内的垂直业务需求是无法被公域模型准确理解的。而企业内的垂直业务需求是与业务流程强相关的,往往需要结合内部数据作为上下文,才能准确理解。例如,客户质量分析场景,企业客户如果直接使用类似 ChatGPT 的通用AI系统,输入客户信息和对话内容,来判定客户是否属于优质客户,那么得到的结果往往不理想。主要原因是,通用AI系统并不清楚企业内部对于优质客户的定义,而且不同企业对于优质客户的定义很大程度上是不同的。
挑战三:规模化应用成本高。当前,百亿参数的模型输出(推理)速度大概可以做到每个GPU每秒生成 20 个字左右(30token)。在实时文本交互(在线客服、问答)场景,一个GPU支持3-5个并发客户,那么100万“日活跃用户”,对应的峰值并发约10000,需要 2000-3000个GPU,成本过于高昂。在实时语音交互场景(电话沟通、语音通话、视频通话)场景,在单个GPU单并发情况下,文本生成的句末延迟约1到3秒,叠加TTS(文本转语音)的延迟,基本无法支撑需求。
过去几年,循环智能在大模型训练和应用实践中有非常多的技术积累,为解决这些难题打下了良好的基础:首先,积累了大量行业文本和语音数据,中文文本数据超过40TB,真实语音对话数据超过 400 万小时;其次,具备超大规模预训练模型的工程化经验,主导开发和落地了首个千亿参数的中文语言大模型“盘古”,具备丰富的数据采集、清洗和标注经验。主导开发了面向认知的“悟道·文汇”超大规模预训练模型;第三,精通场景化的多任务指令微调,在银行、保险、证券、地产、汽车、零售等行业有丰富的业务实践。
今年,循环智能也将推出自研的“千循零样本AI平台”。“千循零样本AI平台”采用了多模型组合的策略,包括10亿参数的盘古NLU(自然语言理解)模型,主要服务语义理解的场景,和面向更复杂的文本生成类任务、参数规模更大的“千循-M”和“千循-XL”模型等。同时,为了使模型更好地适配企业需求,“千循零样本平台”提供多种“微调”方案,包括 P-tuning、Instruction tuning、LoRA等,可以更好地融入企业的专有知识库数据。
“千循零样本AI平台”在底层提供AI大模型的高质量文本理解能力、逻辑推理能力和文本生成能力。基于这些能力,在企业需要对外交互的营销场景、服务场景,以及内部的知识培训和内容运营场景,提供多种创新应用,帮助不同场景的不同角色员工提升产能和工作效率。
在智能化内容运营与生产场景,“千循零样本AI平台”提供“话术质量的分析&挖掘与优化建议、文案自动化生成与撰写、以及基于知识库的智能问答能力。
在客户画像与需求的智能分析场景,“千循零样本AI平台”提供基于对话内容自动识别客户画像与需求、基于对话内容总结客户所有兴趣点&评价和提问以及自然语言输入信息,快速进行客户描摹能力。
在智能化业务分析与决策推荐场景,“千循零样本AI平台”提供“基于对话全文生成业务策略的能力”,在房产和汽车销售场景,可以给出靠谱的商机跟进建议。还提供“基于对话内容评判服务效果”的能力,可以帮助企业了解客户对售后服务是否满意,以及满意的地方和不满意的地方分别是什么。之前企业主要是通过问卷来收集客户满意度,填写问卷的人数占比很少,现在可以做全量的满意度分析。