
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于深度迁移学习的小样本民事纠纷在线咨询分类方法研究
【字体: 大 中 小 】 时间:2025年06月09日 来源:Engineering Applications of Artificial Intelligence 7.5
编辑推荐:
针对民事纠纷在线咨询(COC)存在的数据稀疏、跨平台分散及小样本不平衡导致的分类难题,研究者提出基于深度迁移学习的特征映射分类方法(CMDTL)。通过本体建模规范特征表达、改进边际Fisher分析(IMFA)优化类内类间距离,结合条件特征映射的联合分布适配(JDA-CFM)降低异常值影响。实验显示该方法准确率达84.17%,召回率84.40%,为缺乏数据沉淀的智能法律系统提供关键技术支撑。
随着人工智能在法律服务领域的广泛应用,民事纠纷在线咨询分类(COC)成为智能平台的核心功能。然而,咨询文本的非规范性、跨平台数据碎片化以及小样本不平衡等问题,导致传统机器学习方法表现不佳。中国互联网法院等在线纠纷解决平台虽已建立,但运营时间短、数据积累不足,加之中文语法复杂、咨询用语口语化,使得分类准确率难以提升。这些问题直接影响后续知识推荐的精准度,制约了民事纠纷调解效率的提升。
为解决上述挑战,研究人员提出基于特征映射的深度迁移学习分类方法(CMDTL)。该方法创新性地融合本体设计规范语义表达,采用改进边际Fisher分析(IMFA)增强类内紧凑性与类间分离度,并设计带条件特征映射的联合分布适配算法(JDA-CFM)以抑制异常值干扰。关键技术包括:利用中国杭州、北京、广州等地互联网法院的民事纠纷案例构建跨平台数据集;通过文本向量化处理非结构化咨询文本;采用深度迁移学习实现跨平台知识迁移。
Machine learning methods for online consultation classification
研究对比了传统法律聊天机器人与深度学习方法的局限性,指出小样本场景下现有技术难以捕捉中文咨询文本的复杂实体关系。
The classification method based on feature mapping with deep transfer learning
提出的CMDTL框架包含四个关键模块:文本向量化模块将口语化咨询转换为结构化特征;领域特征优化模块通过IMFA提升特征判别性;联合适配模块采用JDA-CFM对齐源域与目标域分布;深度联合学习模块实现端到端分类。实验证实该方法在跨平台迁移时能有效缓解语义歧义。
Online consultation on civil disputes and dispute resolution case library
基于中国三地互联网法院2017-2023年的婚姻、合同、借贷纠纷案例构建测试集,验证显示CMDTL在准确率(84.17%)和召回率(84.40%)上显著优于基线模型,尤其在样本量不足200的细分案由中优势明显。
Applicability of the proposed method
研究表明,在平台建设初期数据稀疏阶段,传统数据增强方法收效有限,而CMDTL通过迁移其他平台知识可使分类准确率提升12-15个百分点。
Conclusion
该研究通过深度迁移学习突破民事纠纷COC的小样本瓶颈,其创新点在于:首次将本体建模与条件特征映射结合解决法律文本跨平台语义鸿沟;提出的IMFA算法使类间分离度提升23.6%。成果发表于《Engineering Applications of Artificial Intelligence》,为智能法律系统提供可解释性强、数据需求低的分类方案,对提升社会治理效率具有重要实践价值。
生物通微信公众号
知名企业招聘