
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于多模态法律知识融合的司法判决预测框架MLK-LJP研究
【字体: 大 中 小 】 时间:2025年09月04日 来源:Knowledge-Based Systems 7.6
编辑推荐:
本文创新性地提出MLK-LJP框架,首次将法律条文(Legal article)、法律事件(Legal event)、法律关系(Legal relation)、量化证据及图像证据等多模态法律知识融入司法判决预测(LJP)任务。通过设计法律知识专家融合机制(GNN实现)与知识增强Transformer架构,在CAIL2018等数据集上实现SOTA性能,为突破传统LJP方法单一依赖文本描述的局限提供了新范式。
Highlight
• 突破现有方法单一模态局限,首次通过神经网络构建多模态法律知识混合专家框架(MLK-LJP),显著提升法律特征提取能力
• 创新设计五类法律知识获取方法:法律条文知识、法律事件知识、法律关系知识、数值证据知识及多模态(图像)证据知识
• 提出法律知识专家融合机制,利用图神经网络(GNN)捕捉五类知识专家间的协同信号
• 在三大基准数据集上验证MLK-LJP的优越性,几乎所有指标均达到最新SOTA水平
Legal Judgment Prediction
法律判决预测(LJP)作为法律智能的核心任务,通常需要根据案件事实描述文本预测法条适用、罪名判定及刑期等结果。现有方法主要分为两类:基于统计/特征工程的传统方法,以及基于深度神经网络(如CNN/RNN/GNN/Transformer)的现代方法。预训练语言模型(PLM)的运用进一步推动了该领域发展。
Problem Formulation
任务定义包含四个核心要素:
• 事实描述(F):法律文书中记载的案件事实文本
• 法律条文(Dl):与案件事实F相关的法律条款集合(如刑法条文)
• 指控罪名(Dc):根据事实F和条文Dl确定的刑事罪名集合(如盗窃罪、诈骗罪)
Ablation Analysis
为验证MLK-LJP各组件的有效性,我们在CAIL-small和CAIL-big数据集上进行消融实验。结果显示:移除法律条文知识(w/o law articles)导致准确率下降4.2%,而禁用图像证据模块(w/o image evidence)使F1值降低3.8%,证实多模态知识融合的必要性。
Conclusion
本研究通过MLK-LJP框架首次系统整合多粒度、多模态法律知识,创新性地采用基于GNN的专家混合(MoE)方法进行知识融合。实验表明该框架能显著提升模型对法律文本深层语义的理解能力,为司法人工智能发展提供了新思路。
生物通微信公众号
知名企业招聘