
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于大语言模型困惑度与语义距离联合评估的精神分裂谱系障碍言语不连贯性检测新方法
【字体: 大 中 小 】 时间:2025年08月23日 来源:Journal of Biomechanics 2.4
编辑推荐:
【编辑推荐】本研究创新性地结合大语言模型(LLM)困惑度(perplexity)与传统语义邻近度(proximity)指标,开发出可量化言语语义连贯性的双模态评估体系。在精神分裂谱系障碍(SSD)患者数据集验证中,联合模型与人类专家评分相关性达0.61(Spearman),显著优于单模态方法,为精神疾病早期筛查提供了自动化分析新范式。
关键发现
本研究探索了利用大语言模型(LLM)困惑度评估语义连贯性缺陷的新方法,包括创新的句子级分析技术。在两种不同数据集中,无论是转录本级别的LLM困惑度还是新方法产生的分数,均与人类对思维紊乱程度的评判显著相关。虽然既往研究中的最佳邻近度指标作为单一特征表现更优,但联合模型展现出更强的预测能力。
启示与局限
该研究通过整合LLM特征进一步提升了语义连贯性自动评估性能。结合邻近度和困惑度特征训练的模型,即使在测试数据(对话体)与训练数据(日记体)格式不同的情况下仍表现良好,表明双模态特征能有效捕捉不同数据形式的语义连贯性。研究还规避了当前LLM研究常见的计算资源消耗问题。
结论
本文通过挖掘LLM特征来增强不连贯言语的检测能力,证实困惑度指标可补充词嵌入邻近度特征的不足。在训练集和测试集中,联合模型与人类评判相关性的提升,凸显了LLM衍生指标在思维紊乱言语评估中的重要价值,为精神疾病自动化诊断和症状监测提供了新工具。
(注:根据要求已去除文献引用标识[32]和图示标识Fig.3/Table1等标记)
生物通微信公众号
知名企业招聘