生成式AI辅助构建社交媒体烟草信息分析框架:探索电子烟误导性内容的多维度特征与公共卫生对策
《BMC Public Health》:Building an analytical framework for tobacco-related information on social media: an exploratory analysis with generative AI assistance
【字体:
大
中
小
】
时间:2025年10月29日
来源:BMC Public Health 3.6
编辑推荐:
本研究针对社交媒体上海量烟草相关误导信息难以系统识别的问题,创新性地结合生成式AI与人工分析,构建了包含内容维度(安全性/健康影响、戒烟、成分、政策)、虚假类型(捏造/无依据主张、歪曲、阴谋论)和来源(个人/网红、倡导团体、零售商)的三维分析框架。研究发现政策相关讨论被严重忽视,且虚假信息多呈现隐蔽性特征。该框架为针对信息获取弱势群体的干预措施设计提供了新思路,并为机器学习数据标注提供了理论依据。
在信息爆炸的数字时代,社交媒体已成为公众获取健康信息的重要渠道,然而这也为烟草相关误导信息的传播提供了温床。特别是对于教育程度较低、信息获取渠道有限的群体而言,这些误导性内容可能加剧烟草使用相关的健康不平等现象。尽管健康误导信息研究日益增多,但针对烟草领域的系统分析框架仍属空白。现有研究多聚焦于单一议题,如尼古丁误解、电子烟健康风险或 vaping 与 COVID-19 的关联等,缺乏对社交媒体上烟草信息的整体把握。
为填补这一研究空白,Han 等人在《BMC Public Health》上发表了题为“构建社交媒体烟草相关信息分析框架:生成式AI辅助的探索性分析”的研究。该研究创新性地结合潜在狄利克雷分布(Latent Dirichlet Allocation, LDA)主题建模与生成式人工智能(AI)技术,对2020年至2022年间收集的842,754条推文进行了深入分析,旨在开发一个能够系统识别和分类社交媒体上烟草相关信息的多维分析框架。
研究团队采用了一套严谨的方法论流程。首先,他们从两大跨国烟草公司(英美烟草和菲利普莫里斯国际)的推文中提取了高频标签,进而从包含340万条推文的大型数据库中筛选出相关的公众讨论内容。通过LDA主题建模识别出六个核心话题领域。随后,研究分别通过人工定性分析和ChatGPT 4.0辅助分析,对随机抽取的推文样本进行误导信息识别和分类,并将验证后的结果进行整合,最终构建出三维分析框架。
研究结果揭示了烟草误导信息的复杂面貌。通过分析169条经过人工验证的误导性推文,研究人员建立了包含三个关键维度的分类体系:内容维度(安全性/健康影响、戒烟、成分、政策)、虚假类型(捏造/无依据主张、歪曲、阴谋论)和信息来源(个人拥护者/网红、倡导团体、零售商)。
研究发现,安全性/健康影响(79条)和政策(49条)是误导信息最集中的领域。政策相关讨论尤其值得关注,常涉及对“电子烟禁令”政策的误解,并伴随阴谋论叙事,如声称政府与大型烟草公司勾结损害小企业利益。
分析显示,烟草误导信息很少是完全虚构的,更多表现为对事实的歪曲(122条)和阴谋论式扭曲(44条)。这类“隐性误导”更难被普通用户识别,特别是对信息素养较低的人群影响更大。
个体电子烟拥护者成为误导信息的主要传播源(79条),其账号通常带有明显的支持电子烟倾向。此外,倡导团体和零售商也在传播未经验证的健康声明中扮演重要角色。
在AI辅助分析方面,ChatGPT 4.0在识别含有极端术语的推文时表现良好,但对 nuanced 的安全声明识别准确率有限。在较大样本(S2)中,AI识别出的推文仅有21.7%经人工验证为真实误导信息,凸显了当前生成式AI在识别微妙误导内容方面的局限性。
研究的讨论部分深入剖析了烟草误导信息的特殊性。与政治领域不同,烟草误导信息更多表现为对科学证据和政策的有意歪曲,而非完全虚构。这种隐蔽性使得传统的事实核查方法难以应对,也对信息弱势群体构成了更大威胁。
政策误解作为突出的误导类型,反映了公众对烟草控制政策的普遍不信任。这种不信任往往与更广泛的阴谋论网络(如疫苗、5G等)相互交织,进一步加剧了反科学情绪的增长。
值得注意的是,尽管数据收集始于烟草行业的推文,但最终识别出的误导信息多来自个体拥护者而非行业官方账号。这一发现提示我们需要进一步探究这些个体与行业或倡导团体之间的潜在联系。
本研究构建的分析框架为系统识别和分类社交媒体烟草信息提供了重要工具。对政策误解和阴谋论的特别关注,为公共健康传播提供了新的视角——在发布新政策时,卫生部门应预先考虑可能的误解并准备针对性解释材料。
然而,该研究也存在一定局限性。框架仅基于Twitter文本内容构建,未涵盖多媒体信息或其他社交平台。数据收集时间限于2020-2022年,且随着Twitter API政策的变化,后续研究面临数据获取挑战。AI辅助分析的探索性质也表明,当前自动化系统在识别微妙误导内容方面仍需改进。
该研究的价值在于为健康传播研究者和公共卫生实践者提供了实用的分析工具,尤其有助于设计针对信息弱势群体的干预措施。未来研究可扩展该框架至多媒体内容分析,并结合网络分析方法探究误导信息的传播路径,从而更有效地应对数字时代的健康信息挑战。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号