
-
生物通官微
陪你抓住生命科技
跳动的脉搏
跨源上下文增强的统一模型在多源虚假新闻检测中的创新应用
【字体: 大 中 小 】 时间:2025年06月13日 来源:Knowledge-Based Systems 7.2
编辑推荐:
为解决多源信息环境下虚假新闻检测的挑战,研究人员提出了一种统一跨源上下文增强模型(Unified Cross-source Context Enhancement Model)。该研究通过整合跨源全局上下文学习模块和双级对比学习机制,有效捕捉多源实例间的长程依赖关系,在公开数据集上实现了约5%的准确率提升(较LIMFA模型),为跨平台虚假信息治理提供了新范式。
在数字信息爆炸的时代,社交媒体平台如微博、Twitter等已成为公众获取信息的主要渠道,但随之而来的是虚假新闻的泛滥。2022年仅微博就报告了约82,000条虚假信息,这类内容不仅扭曲公众认知,更可能破坏社会信任体系。当前虚假新闻检测方法多局限于单一数据源分析,而现实中真实和虚假信息往往跨平台传播,呈现多源异构特性。传统单源检测模型难以应对不同平台间的风格差异和内容操纵策略,跨域适应方法在面临多源场景时性能显著下降,这一领域亟待突破性解决方案。
针对这一挑战,来自中国的研究团队在《Knowledge-Based Systems》发表研究,提出统一跨源上下文增强框架。该研究创新性地结合了基于Transformer的全局上下文建模和双级对比学习策略:通过上下文增强Transformer捕获多源实例间的长程依赖关系;设计局部(单源内模态对齐)和全局(跨源特征增强)双级对比学习机制;引入动态时间规整(DTW)实现跨模态对齐;构建源原型库优化特征融合。研究团队在MCFEND等多源数据集上验证了模型有效性,并新构建了MuFake数据集。
【跨源全局上下文学习】通过上下文增强Transformer构建全局特征库,利用注意力机制量化多源实例关联度,显著提升跨源特征交互能力。实验显示该模块使模型在跨组迁移任务中的F1值提升3.2%。
【双级对比学习机制】局部对比学习强化单源内文本-图像模态对齐,全局对比学习则通过原型记忆库实现跨源知识传递。消融实验表明双级学习使分类准确率提高2.8%,有效缓解源间偏差。
【多源特征融合】采用动态时间规整(DTW)对齐异构模态时序特征,结合对抗训练消除源特定偏差。在Fake News数据集上,该策略使跨源检测AUC达到0.912,优于基线模型7.3%。
【性能验证】在MCFEND数据集上,模型准确率达89.7%,较最佳基线LIMFA提升4.9%。新构建的MuFake数据集测试中,宏F1值保持86.2%的稳定表现,证实框架的泛化能力。
该研究突破性地解决了多源虚假新闻检测中的三大核心难题:源间异构性、模态不对齐和长程依赖建模。通过全局上下文增强和对比学习的协同设计,首次实现跨源信息的统一表征学习。值得注意的是,模型在跨组迁移任务中展现出显著优势,为社交媒体平台间的虚假信息联防联控提供技术支撑。研究团队同时指出未来需改进模态缺失场景的适应性,这为多源检测领域的后续研究指明了方向。论文建立的基准数据集和评估框架,为学术界开展可比研究提供了重要基础设施。
生物通微信公众号
知名企业招聘