基于无监督语义块检索与知识增强推理的多选题问答框架USCRaKE
《Neurocomputing》:USCRaKE: Unsupervised semantic chunk retrieval and knowledge-enhanced reasoning for multiple-choice question answering
【字体:
大
中
小
】
时间:2025年11月04日
来源:Neurocomputing 6.5
编辑推荐:
本研究针对复杂多选题问答中语义匹配不精确和推理不透明的问题,提出了无监督混合检索框架USCRaKE。该框架创新性地将杰森-香农散度(JSD)作为最优传输的基成本,实现了细粒度语义块检索,并结合ConceptNet三元组构建候选答案专属推理链。在通用、生物医学和物理领域的多个基准测试中,USCRaKE无需监督训练即可实现最高10.08%的准确率提升,为可解释推理提供了新范式。
在人工智能快速发展的今天,多选题问答(MCQA)已成为衡量机器智能的重要标尺。从日常的常识推理到专业的医学诊断,多选题无处不在。然而,当前的主流模型在面对需要多步推理和专业知识的问题时,往往显得力不从心。大型语言模型虽然能生成流畅的文本,但其推理过程如同"黑箱",难以追溯;知识图谱虽能提供结构化知识,但传统的检索方式又缺乏语义灵活性。更棘手的是,现有的检索方法多依赖欧氏距离或余弦相似度,这些指标在捕捉复杂语义关系时常常失灵。
正是在这样的背景下,日本先进科学技术研究所的Trung Vo等人提出了一种创新性的解决方案——USCRaKE框架。这项发表在《Neurocomputing》上的研究,试图通过无监督的方式,同时攻克语义检索和可解释推理两大难题。研究人员敏锐地发现,传统的相似度度量方法在处理上下文相关的语义表示时存在固有局限,而杰森-香农散度(JSD)因其对称性和对分布偏移的鲁棒性,能够更精准地捕捉语义间的细微差异。
该研究的核心技术方法包括:基于最优传输理论的语义块检索,其中创新性地使用JSD作为基成本;从ConceptNet获取1跳子图并自然语言化;为每个候选答案构建独立的推理链。实验使用了BGE模型生成语义嵌入,并通过FAISS进行高效检索。
研究结果显示,在三个重要的常识推理数据集(OBQA、CSQA、ARC_C)上,USCRaKE均表现出色。特别是在ARC_C数据集上,相比最强的无监督基线实现了10.08%的显著提升。这种优势在生物医学和物理等专业领域同样得以保持,证明了框架的强泛化能力。
通过细致的错误分析,研究者揭示了框架的局限性:当问题涉及抽象概念或隐喻表达时,由于缺乏明确的语义锚点,检索和推理都会面临挑战。例如在面对"人们在工作中追求什么"这类抽象问题时,系统更倾向于选择字面匹配的答案而非符合常识的选项。
这项研究的突破性在于首次将JSD应用于最优传输的语义检索,建立了更坚实的理论基石。其模块化设计不仅提升了性能,更重要的是带来了前所未有的可解释性——每个答案的推理路径都清晰可见,无论最终选择正确与否,都能追溯决策依据。这种透明化的推理机制,为医疗诊断、教育评估等高风险领域的AI应用提供了更可靠的技术支撑。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号