一种用于文本分类的混合重融合模型 XLG-Net:突破传统局限,提升分类性能

【字体: 时间:2025年03月19日 来源:Scientific Reports 3.8

编辑推荐:

  为解决文本分类难题,研究人员提出 XLG-Net 模型,在多数据集上性能优异,助力 NLP 发展。

  在自然语言处理(NLP)的广阔领域中,文本分类宛如一座重要的灯塔,指引着人们从海量的文本数据中高效地提取关键信息。它广泛应用于情感分析、信息检索、意见挖掘等多个领域,极大地提高了文本处理的效率。然而,当前的文本分类方法却面临着诸多挑战。传统的机器学习方法依赖手工制作的特征,难以捕捉文本中的复杂关系;深度学习方法虽然能够自动学习特征,但在处理长距离依赖时表现不佳。预训练模型虽然取得了显著进展,但在捕捉局部和全局结构特征方面存在不足;图神经网络(GNNs)虽然能考虑文本的结构特征,但节点的上下文表示不够丰富,导致收敛速度慢和准确率低。
为了突破这些困境,来自北京印刷学院信息工程学院和北京工商大学计算机与人工智能学院的研究人员展开了深入的探索。他们提出了一种全新的混合重融合模型 ——XLG-Net,旨在提升文本分类的性能。这一研究成果发表在《Scientific Reports》上,为该领域的发展注入了新的活力。

研究人员在这项研究中主要运用了以下几种关键技术方法:

  • 图构建:针对每个数据集构建异质图,依据文档和单词的重要性及相关性,使用词频 - 逆文档频率(TF-IDF)衡量单词节点与文档节点的连接,用正点互信息(PMI)衡量单词节点之间的连接。
  • 基于 XLNetMix 的特征提取:基于 DoubleMix 思想,对每个数据集进行两次反向翻译操作得到扰动样本,在 XLNet 的隐藏空间进行混合操作,增强模型对文本数据的特征表示能力。
  • 基于 GCNII 的特征提取:利用 GCNII 对异质图进行特征提取和传播,通过引入初始残差连接和恒等映射机制,有效解决了 GCN 的过平滑问题,更好地捕捉文档的结构信息。

下面来看具体的研究结果:

  • 整体结果:研究人员在四个广泛使用的文本分类数据集(Movie Review(MR)、Ohsumed、R52 和 R8)上进行实验,并与多个基准模型进行比较。结果显示,XLG-Net 在这四个数据集上均取得了最优性能。例如,在 MR 数据集上,XLG-Net 的准确率达到 88.59%,Macro-average F1 为 88.55%;在 Ohsumed 数据集上,准确率为 73.34%,Macro-average F1 为 63.32% 。这表明 XLG-Net 在处理不同类型和规模的文本分类任务时都具有显著优势。
  • 超参数设置
    • λ 的影响:超参数 λ 控制 XLG-Net 和 XLNetMix 输出特征的平衡。实验表明,在四个基准数据集上,λ 取值在 0.6 - 0.8 之间最为合适,当 λ = 0.6 时准确率达到最优。这说明合理调整 XLNetMix 模块预测的比例对模型性能有积极影响。
    • L 的影响:探索 GCNII 层的最优层数(L)发现,当 L 小于 8 时,模型准确率随 L 增大而提高,L = 8 时模型达到最佳性能;L 超过 8 时,模型预测准确率逐渐下降,且 MR 数据集的模型性能受 L 影响更大。
    • 其他参数:学习率方面,当 XLNetMix 的学习率为 0.000007,GCNII 的学习率为 0.0007 时,模型达到峰值 F1 值。GCNII 隐藏层维度方面,增加到 256 时分类性能显著下降,因为过多的隐藏层增加了参数和计算量,影响了模型的拟合。

  • 消融研究
    • 插值层的影响:研究发现,进行插值操作能提升模型性能,不同插值层组合效果不同,其中 {9, 10, 12} 层集在四个数据集上表现最佳,且并非插值层数越多越好。
    • XLNet 和 GCNII 的有效性:通过实验对比不同模型组合发现,XLNet + GCNII 的组合在提升模型准确率方面表现出色,尤其是在 MR 和 Ohsumed 数据集上。


在研究结论与讨论部分,XLG-Net 模型凭借其创新的架构和出色的性能,为文本分类领域带来了新的突破。它有效结合了大规模预训练模型强大的上下文单词表示能力和 GCNII 深度图卷积技术,通过混合 XLNet 模型的隐藏状态,提升了模型的准确性和鲁棒性。然而,该研究也存在一些局限性,如在使用模型提取特征前需要构建整个数据集的异质图,与能自动构建图的模型相比可能不够优化;随着 GCNII 模型层数增加,训练时间变长。未来,研究人员可以朝着优化模型结构、提高训练效率的方向进一步探索,同时考虑增加 GCNII 模型层数超过 16 层的实验,以挖掘模型更大的潜力。这一研究成果不仅为当前的文本分类研究提供了重要的参考,也为后续的研究指明了方向,有望推动自然语言处理领域的进一步发展。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号