随着社会生活节奏不断加快,生活压力逐渐增大,各种各样的心理问题层出不穷,越来越受到社会重视。但精神科医生和心理咨询师却存在巨大缺口,导致大部分需要专业心理帮助的人“求助无门”。如今,随着AI心理技术的出现,心理医生短缺的现状有望迎来转变。
“我和女朋友分手了,心情不好。”
“分手一定很难过,那你现在有什么想说的或者想做的吗?”
以上对话就来自于寻求心理帮助的用户与一款名为emohaa的AI情绪对话机器人,这段看似简单的对话包含了探索、共情、安抚、提供建议等心理咨询过程。
2020年下半年开始,受到“疫情导致大众心理压力上升”的逻辑催化,心理健康赛道的节奏有了明显的加快。同时,由于精神心理医疗资源以及心理咨询服务供给侧的高度紧缺,人工服务的解决思路并没有完全解决问题,因此行业便开始看向AI。2021年,数字疗法及AI心理赛道获得频繁融资,成为风口。
国内人工智能-自然语言处理领域专家、清华大学计算机科学与技术系副教授黄民烈2021年创办人工智能心理健康企业“聆心智能”,通过建立先进的AI数字疗法体系,为临床患者和广大心理亚健康人群提供高质量、低成本、个性化、全天候的情绪支持、心理咨询和干预方案,为用户提供更科学、高效的精神健康服务。
上面提到的emohaa AI情绪对话机器人就是由聆心智能自主研发而成的。除emohaa之外,公司还开发了心理咨询服务线上平台聆心悠然、AI数字疗法App聆忧,为不同需求层次的用户提供服务。
依托领先的自然语音技术
寻求AI心理行业破局
黄民烈教授表示:“最新的流行病学调查显示,精神障碍人群大约占到整个人群的16~17%。精神健康是我们面对的核心议题,但我国仅有不足五万的专业心理咨询师从事心理咨询行业的专兼职工作,精神科医生更是少之又少。这中间巨大的供需差距可以通过人工智能技术和相应的产品来补充。”
然而,当前国内外心理领域AI对话机器人及数字化干预疗法的玩家主要以CBT(Cognitive Behavioural Therapy 认知行为疗法)为范式,原因在于CBT拥有高度结构化的特征,天然存在数字化的可能性。但是如果只有CBT数字化疗程,AI就是一个硬邦邦、冷冰冰的对话机器,当用户对CBT疗程话术感到不适应、或者不适合CBT疗法时,AI心理机器人通常需要搭配其他解决方案或者情绪话术为用户提供更好的使用体验。
训练出一个具备良好识别能力和情绪支持能力的AI机器人,门槛更高。这要求情绪支持AI机器人拥有强语义识别、用户状态识别能力、更广泛的知识图谱和更丰富的对话策略。这些能力背后意味着巨量的、经过妥善标注的数据,以及对情绪识别模型进行训练。
作为AI心理赛道中NLP(Natural Language Processing)基因领先的创业团队之一,聆心智能致力于突破当前AI心理行业仅以CBT数字化疗程为主的现状,促进机器人对用户情绪状态的区分和识别,并且针对用户的每种状态给予丰富的回应策略,比如表达支持、赞同、情绪映射、复述、自我暴露和及时反馈等策略,达到情绪支持。
其中,自然语言处理在聆心智能所提供方案的不同节点都起到了关键作用。比如,通过自然语言对话系统能够对用户不同层级的需求予以满足,包括但不限于情绪、陪伴、给予建议等等。在辅助诊疗方面,通过自然语言处理相关技术,将用户的输入信息处理为符合精神心理诊断体系的计算机符号表达,并且将该表达与医学专业诊断之间的关联和映射为理解用户输入提供底层架构上的支持。
最后,在数字疗法-数字药的开发方面,自然语言处理一方面作为理解用户需求的最基本工具,结合与其需求相契合的循证算法模型,为用户提供医学上最有用的数字疗法解决方案;另一方面,自然语言处理技术本身在生成模型上就带有了情感支持的能力,因此本身也会作为数字疗法的一个组成部分,目前,这是市场上所独有的技术。
AI逻辑如何“翻译”?数据标注如何进行?
AI心理疗法开发挑战重重
如同AI在其他应用领域存在的问题一样,聆心智能在整个数字疗法的设计开发过程中,也遇到了各种各样的难题。
黄民烈教授表示,最难的地方在于把咨询师的认知和语言,“翻译”成AI逻辑。他说道:“打个比方,CBT疗法咨询师在评估一位患者是否达到预期治疗效果时,其标准通常是患者的社会功能是否已恢复至正常水平。在人工心理咨询中,这一过程是根据数据和案例,持续不断调整评估的量化指标权重以期待达到最精准的动态评估。那对AI来说,什么叫做个体层面的正常?在AI算法开发过程中,我们就需要将这个目标量化。”
类似这种“翻译”,听起来不难,但在实践中非常不容易,需要AI人才和心理咨询人才之间的反复碰撞,才能重新设计出来。
另外,由于心理咨询的咨访过程存在隐私性的伦理要求,行业在建立和训练模型时可取得的数据量总是有限、且可能存在样本偏差,导致模型能力有所局限。面对这一问题,聆心智能从源头杜绝隐私泄露的可能,团队所收集的数据已经取得了来访者的许可,并且已经脱敏。
“我们现在的数据来源不仅是心理咨询,还有很多其他非心理咨询的数据来源,尽可能地确保数据能够覆盖所有人群样本和大部分人们可能遇到的议题。因此,我们在做数据标注时,会对所有可能的维度进行一个更精细的标注,以尽可能地避免样本偏差。但是必须承认,不可能完全避免偏差。需要注明的一点是,用于临床的机器人是有适应症或人群限定的,我们不期待用一个数据源去面对所有年龄段的所有来访者种类。”黄民烈教授表示。
在自然语言领域,算法可解释性、算法鲁棒性等方面的局限一直是可信AI 的讨论和研究热点,同样是AI心理领域需要持续解决的重要问题。聆心智能的AI心理疗法开发中,可解释性主要体现在AI的决策始终与其所担任的角色行为逻辑保持一致。黄民烈教授表示:“我们通过知识图谱将心理医生专业知识中的关键概念对齐起来,从而知道人工智能算法的决策是如何生成的。在这方面,我们还在持续探索、进步。关于鲁棒性问题,我们也有相应的算法研究和技术解决方案。”
更大的挑战在于数据量以及人工数据标注成本,这是心理领域AI发展的关键。心理咨询理论已经发展了100多年,形成了相对成熟而完整的理论,自发生长出一套标签体系。但是,把这些类别和标签全封不动地搬到AI模型内会面临巨大困难:首先,数据标注专业人士完成,导致标注成本昂贵;其次,类别体系越细致、越复杂,AI模型可能学不会,比如可能受到数据标注一致性的影响。
为此,以深入的心理健康专业理解为基础的,聆心智能设计出了一个包含10类情绪的标签体系。除了情绪类别,在对来访者意图识别等方面,聆心智能也按照类似的方法重构了一套标注体系。通过这种方式既平衡了资源、成本,也保证了专业性和有效性。
超强“共情”优势
引导用户解开“心结”
随着AI逻辑的“翻译”、数据隐私及样本偏差、算法的可解释性、数据标注等一系列难点得到突破,聆心智能成功开发出了一整套AI心理治疗服务体系,包含筛查、评估、干预、康复、长期跟随健康管理全过程。其中,干预康复阶段即所谓的数字药。
聆心智能以认知、情绪和行为三个维度去构建了整个疗法模型,包括了CBT、DBT、IPT、正念等多种已被印证可以治愈情绪障碍的循证疗法。并且所提供的干预方案会受到用户自身状态变化而动态调整,更好地根据用户自身特点提供治疗,提高用户的依从性和治疗的有效性。
聆心智能所提供的心理治疗一个显著的优势就是“共情”。在心理咨询的过程中,人和机器有一个比较大的区别,就是人能产生非常强烈的共情,而机器的共情程度没有人类那么浓烈、丰富。
那么聆心智能是如何让机器做到共情的呢?黄民烈教授解释:“我们现在采用的方法,就是在与用户对话过程中,更多调动用户自身的思考能力——也就是他的认知,并通过一些技术性和策略性的方式,回避机器人不太容易理解的、多样掺杂在一起的复杂情绪。”
聆心智能在编写算法过程中,会赋予机器人一个稳定人设,针对不同情景,这个机器人的人设会有自己的反应。例如,用户对机器人说“我工作好累”,拥有人设的机器人会告诉他,自己累的时候会做什么,这个事情为什么起效——这个就是机器人在使用自我暴露策略。
其次,机器人听到用户说很累时,可能会问用户压力大时通常会做什么,用户觉得这个事情有效吗?如果这个事情暂时没有效果,用户要不要试一下其他办法?然后机器人就会引入一些干预和练习。通过这些策略,既达到了安抚用户情绪的目的,同时能够促进用户自主思考什么事情对自己最有效果。
目前,得益于团队业界拔尖的工程能力,聆心智能的预训练模型参数达到了100亿规模左右,位于行业前列。数据源包括公开社交媒体、合作授权的专业心理健康数据以及实验室在过去6-7年的自主积累数据。数据量在几十亿到几百亿单词量之间。行业领先的大规模预训练模型为聆心智能的产品开发水平奠定了基础。
未来:政策利好下共创AI心理行业繁荣
目前,美国心理健康机器人Woebot已取得FDA认证,聆心智能团队认为海外趋势会促进国内监管政策发展,趋势和节奏会越来越快。
同时,国内也正在大力推行社会心理服务体系,北京、海南都已设立数字疗法认证中心,聆心智能的发展方向正这个大体系下非常重要的环节,因此团队有信心能够借助政策力量,更好地普惠大众。
目前,聆心智能已经开始进行临床实验,后续将取得医疗机械认证。“当然,我们可能需要一点时间,让监管完成对各方面风险评估,但因为数字疗法的副作用当前来看会非常小,甚至可以认为几乎没有,所以数字疗法跟其他治疗比如传统药物相比,获得监管认可的速度会更快。”黄民烈教授说道。
最后,在政策的利好与支持下,聆心智能团队希望与行业同仁共同努力,真正从实践中发现临床价值,而不是纯粹为了逐利,共同以真正惠及于民、有用有效的产品,推动行业标准、规范、监管体系的形成,真正促进一个AI心理行业的大发展。