多模态数据对心理评估的重要性

随着机器学习、自然语言处理和计算机视觉等人工智能技术的飞速发展,结合社会对心理健康重视程度的提升以及对个性化和自动化评估解决方案的需求,需要集成多种心理特征数据源和分析方法应用到心理评测中。数业智能心大陆独立自研的多模态心理评估大模型,融合人工智能(AI)技术与多种数据输入方式的心理健康评估方法(即“多模态”)。可以提供更准确的洞察分析,让用户更全面和深入的理解个体的心理状态,从而提供更有效的心理健康服务和干预措施。

打开网易新闻 查看更多图片

由此可见,实现多模态数据输入和融合的AI心理评估大模型变得尤为重要。特别是面对焦虑和抑郁等心理健康状态的评估,对数据的精准度要求极高,因为焦虑和抑郁等心理病症可能给患者带来很大的身心痛苦,它们是相似症状和体征的集合体。在我们的文化和社会环境下,许多患者可能会隐藏自己的真实精神状态,直接影响临床判断结果,导致误诊,再加上保护患者隐私和敏感信息等方面的要求,对于心理健康评估相关数据集的创建和共享更受限制,也导致了可用于科学和应用研究的数据集数量有限。目前国内外只有少数几个公开可用的数据集涉及抑郁检测[DAIC-WoZ Dataset(Gratch et al.,2014),AVid-Corpus(Valstar et al.,2014 ),EATD(Shen et al.,2022年),MODMA Dataset (Cai et al.,2020)],公开可用的涉及抑郁和焦虑检测的多模态数据集(包括音频、文本和面部视频等数据)更加稀缺,这对构建基于当代深度学习技术的AI心理评估模型造成了很大的阻碍,而依靠现有数据收集路径也面临成本控制、质量保障、隐私保护等挑战,如何以较低的成本建立更大规模的数据集来改进智能化焦虑/抑郁评估系统的准确度,仍是一项具有挑战性的任务

多模态心理评估数据集的实现逻辑

数业智能心大陆基于多年在数字心理健康领域的深耕,努力尝试克服种种障碍促进焦虑和抑郁智能化评估的研究,并将研究边界扩展到更真实的世界环境中:

首先,数业智能心大陆构建了一个全新且可公开访问的“关于青少年焦虑和抑郁评估的多模态心理评估数据集(MMPsy)”,包含了从近十万青少年中收集的心理访谈音视频及转录的文本数据以及相关的多种心理评估量表结果数据,比现有学术界公开的数据集规模更大、维度更广

该数据集是基于数业智能心大陆自研的SaaS数字心理服务平台进行交互所沉淀的数据源,能够为大规模用户群体提供便捷、标准和保密的数字化心理健康量表评估服务的同时,运用智能语音交互对话技术,对来访者进行实时的心理健康访谈,类似于专业心理咨询师通过一对一面谈咨询,来对来访者进行心理健康状况评估的方式。在智能交互访谈的过程中所沉淀的语音与对话内容等数据,经过加密传输和保存、匿名化、噪声去除、算法及人工转录与校对、人工筛选与标注等过程,形成了包含数十万分钟音频与相关的转录文本以及对应的多维度量表评估结果的多模态心理评估数据集(MMPsy),是目前心理健康领域中规模最大的多模态相关数据集

多模态心理评估数据集的应用价值

基于大规模的MMPsy数据集,数业智能心大陆目前已开发了基于深度学习的多模态心理健康评估大模型,利用语音、文本和其他相关特征,采用业界先进的语音文本等模态特征提取、建模和融合技术,通过深度且强大的特征学习、数据拟合及预测能力,实现了智能化、自动化的焦虑/抑郁心理状态的准确评估,并通过独立测试集对模型评估结果的准确度和灵敏度进行科学的测试和验证。

打开网易新闻 查看更多图片

数业智能心大陆在多模态心理评估数据集和AI模型构建方面的开创性工作对当代心理评估领域具有很高的科研与应用价值。对于多模态的AI心理评估,能够模拟专业心理医生通过对话访谈的方式与用户交互得到语音、语言、表情及行为数据,让用户在自然对话的状态下自由地进行表达,对用户进行“无感采集”,使用方便,副作用低,可经常性甚至在每次用户与心大陆AI助手对话的过程中应用,实时便捷地对用户的心理健康状态进行动态的评估与跟踪。

通过不断沉淀多维度心理评估数据和构建AI大模型,多模态心理评估不仅能评估焦虑和抑郁,还能便捷有效地评估学业压力、职场压力、人际关系、适应能力等多维度心理状态。这种全面的心理评估可以为用户提供学习和生活各方面的科学参考,有助于个性化教育和职业发展规划。