
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于传播结构与多粒度时序动态联合建模的虚假新闻检测方法CoST研究
【字体: 大 中 小 】 时间:2025年06月16日 来源:Neurocomputing 5.5
编辑推荐:
为解决社交媒体虚假新闻检测中传统方法易受对抗攻击、现有传播模型难以捕捉复杂时空特征的问题,研究人员提出CoST框架,通过双向图注意力LSTM(GA-LSTM)建模社交枢纽与深度传播结构特征,结合时序感知注意力与Transformer编码器学习多粒度时序动态,实验证明其在早期检测中显著优于现有技术。该研究为遏制虚假新闻传播提供了更鲁棒的解决方案。
社交媒体时代,虚假新闻如同数字病毒般在社交网络上疯狂扩散,不仅扭曲公众认知,更可能引发社会动荡。传统基于新闻文本内容的检测方法,在恶意用户精心设计的对抗性篡改面前显得力不从心。尽管近年涌现出基于传播结构的检测技术,但这些方法往往将传播树或图谱视为静态对象,忽视了传播过程中至关重要的时间维度特征——例如虚假新闻因社交机器人推波助澜会呈现爆发式传播,而真实新闻的传播曲线则更为平缓。这种结构相似但时序迥异的特性,促使研究者思考:如何通过更全面的时空特征建模来提升检测效能?
上海交通大学的研究团队在《Neurocomputing》发表的研究给出了创新解决方案。他们提出的CoST框架首次实现传播结构模式与多粒度时序动态的联合建模:针对社交传播图谱中常见的枢纽结构和深度路径特性,设计双向图注意力LSTM(GA-LSTM)模块,通过前向传播捕捉深度路径特征,反向传播聚焦枢纽结构;采用时序感知注意力机制提取局部时间间隔特征,结合Transformer编码器学习全局传播序列模式;同时整合新闻与评论的语义特征、传播显式状态等多维度信息。在FakeNewsNet等真实数据集上的实验表明,CoST的AUC值较基线模型提升12.7%,尤其在传播早期(节点数<500时)仍保持85.4%的检测准确率。
关键技术包括:1) 构建带时间戳的传播图谱;2) 双向GA-LSTM模块处理图结构数据;3) 多粒度时序特征提取架构;4) 门控融合单元整合异构特征。实验数据来自公开基准数据集FakeNewsNet,包含政治、健康等领域的标注新闻事件。
【结构特征学习】通过双向GA-LSTM解决传统GCN在深度传播路径中的过平滑问题。前向传播模拟消息扩散过程捕获深度路径特征,反向传播通过注意力权重突出枢纽节点,实验显示该模块使结构特征区分度提升23.5%。
【时序动态建模】时序感知注意力机制量化相邻传播行为的时间间隔重要性,发现虚假新闻的局部时间间隔方差较真实新闻高3.2倍;Transformer编码器揭示虚假新闻的全局传播序列存在明显"脉冲式"模式。
【多模态融合】门控融合单元动态调整结构、时序、语义特征的贡献权重,消融实验表明多特征融合使早期检测F1值提升18.3%。
讨论部分指出,CoST的创新性体现在三方面:首先,双向GA-LSTM首次实现传播深度与枢纽结构的协同建模;其次,多粒度时序分析框架克服了传统方法对时间维度简化的缺陷;最重要的是,该模型在传播信息有限的早期阶段仍能保持稳定性能,这对及时遏制虚假新闻传播具有重要实践价值。局限性在于目前尚未整合用户画像等元数据特征,未来将通过跨平台异构数据融合进一步提升模型泛化能力。
这项研究为社交平台虚假新闻实时监测提供了新一代技术框架,其提出的时空特征联合建模范式对网络内容安全领域的其他检测任务也具有借鉴意义。随着社交传播模式的持续演化,这种具备强适应性的检测方法将发挥越来越关键的"数字免疫系统"作用。
生物通微信公众号
知名企业招聘