综述:社交网络中的谣言检测与传播研究

【字体: 时间:2025年06月29日 来源:Expert Systems with Applications 7.5

编辑推荐:

  这篇综述系统梳理了2019-2024年社交网络谣言检测与传播建模的最新进展,重点探讨了深度学习(DL)模型(如RNN、GNN)在识别虚假信息中的应用,分析了传播动力学特征和用户行为数据的关键作用,并指出数据集限制(如Twitter API访问约束)和模型可解释性等挑战,为未来研究提供了明确方向。

  

Abstract
互联网的普及使社交网络成为信息传播的核心渠道,但伴随而来的信息污染(如谣言)对公众认知构成严重威胁。谣言区别于虚假新闻(fake news)的核心特征在于其真实性存疑——可能未经证实、部分真实或完全错误。例如新冠疫情期间,未经临床验证的草药疗法通过社交平台广泛传播,凸显了自动化谣言检测的紧迫性。当前研究通过结合文本分析、用户画像和传播时序特征,利用深度学习(DL)提升检测精度。

Introduction
社交媒体的开放性使其成为谣言滋生的温床。与传统机器学习相比,深度学习能更有效捕捉谣言传播的时空动态性(temporal dynamics)。关键挑战在于:1)谣言在传播过程中会发生内容变异(mutation);2)需整合多模态特征(如推文文本、用户信誉度、传播路径)。本综述特别关注2019-2024年的技术突破,包括图神经网络(GNN)对社交关系建模的改进。

Research Methodology
通过系统分析6项权威综述和关键词检索(如"rumor detection deep learning"),筛选出57篇核心文献。研究重点涵盖:1)基于传播树结构的检测模型;2)结合注意力机制(attention mechanism)的时序分析方法;3)融合领域知识(如医学事实库)的混合框架。

Latest Model on Rumor Propagation
传统流行病学模型因忽略网络拓扑结构而受限,新兴方法引入:

  • 节点异质性:根据用户影响力分配不同传播权重
  • 状态转移函数:模拟"相信-质疑-辟谣"的动态过程
  • 图卷积网络(GCN):捕获多层传播路径中的关键节点

Results
在Twitter15/16数据集上,融合GNN和BERT的混合模型达到92.3%准确率;而PHEME数据集显示,加入用户历史行为特征可使F1-score提升8.7%。值得注意的是,跨平台验证揭示模型泛化能力仍不足——在Reddit数据上性能平均下降14.2%。

Challenges
三大核心问题亟待解决:

  1. 数据壁垒:欧盟《通用数据保护条例》(GDPR)限制原始数据共享
  2. 时效性:现有模型对突发事件的响应延迟超过6小时
  3. 伦理风险:自动化检测可能误伤边缘群体发声

Conclusion
当前技术虽能有效识别结构化谣言(如公共卫生事件),但对政治类模糊信息的处理仍有不足。未来方向包括:开发轻量化边缘计算模型、构建多语言知识图谱、建立动态风险评估体系。值得注意的是,2023年ChatGPT等生成式AI的崛起,使得区分机器生成谣言成为新的研究热点。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号