AI辅助改写技术：虚假评论生成的新威胁与检测对策研究

首页今日动态人才市场新技术专栏中国科学人云展台
BioHot
云讲堂直播会展中心特价专栏技术快讯免费试用

生物通官微
陪你抓住生命科技
跳动的脉搏

生物通首页 > 今日动态 > 正文

【字体：大中小】 时间：2025年07月21日 来源：Knowledge-Based Systems 7.2

编辑推荐：

　　【编辑推荐】随着生成式人工智能(GAN)和大语言模型(LLM)的发展，恶意用户开始利用AI辅助改写技术批量生成虚假评论。研究人员针对这一新型网络声誉操纵手段，提出基于相似度模式的检测方法，在TripAdvisor真实评论与ChatGPT 4.0改写评论的混合数据集中实现90%以上的分类准确率，为平台治理提供新工具。

在数字化消费时代，在线评论已成为消费者决策的重要依据。然而这片信息绿洲正面临新型污染——随着ChatGPT等大语言模型(LLM)的普及，恶意用户开始利用AI辅助改写技术批量制造虚假评论。传统检测手段主要针对人工撰写的虚假内容，但当攻击者使用生成式人工智能(GAN)对真实评论进行语义保持的改写时，现有系统往往束手无策。

研究人员敏锐捕捉到这一技术灰色地带：通过ChatGPT 4.0对TripAdvisor平台2002-2008年的真实酒店评论进行改写，构建包含20家酒店原始评论与AI改写评论的平衡数据集。研究发现，AI改写会保留原文情感特征但改变表层表达，这种"语义克隆"行为使得传统AI文本检测工具(RADAR等)的准确率显著下降。

为应对这一挑战，研究团队创新性地将学术抄袭检测思路迁移至虚假评论识别领域。通过量化文本间词汇相似度阈值，建立分类模型。在包含100条评论的验证集上，该方法在准确率、精确度、敏感度等混淆矩阵指标上均突破90%，显著优于商业AI检测工具。特别值得注意的是，该方法不依赖传统机器学习所需的庞大数据训练，而是通过相似度特征实现高效判别。

关键技术包括：1) 使用2002-2008年TripAdvisor真实评论作为"纯净"样本库；2) 通过ChatGPT 4.0生成语义相似但表述差异的改写版本；3) 建立词汇重叠率计算模型确定分类阈值；4) 与RADAR等工具进行API级对比测试。

【Contribution/Novelty】
提出相似度量化指标作为区分特征，突破传统AI检测对生成文本的依赖，首次实现改写型虚假评论的系统化识别。

【Dataset】
选取AI技术普及前(2008年前)的675,069条全球酒店评论作为基准数据，确保样本不受现代GAN污染。

【Methodology】
构建词汇相似度阈值模型，通过20对原始/改写评论确定分类临界值，该方法避免复杂算法训练。

【Results】
在平衡测试集上F1-score达90%+，证明改写评论虽模仿人类情感，但词汇选择模式存在可检测差异。

【Comparison with other tools】
商业工具RADAR对改写文本检测准确率不足70%，凸显本研究方法的特殊价值。

这项发表于《Knowledge-Based Systems》的研究标志着虚假评论治理进入新阶段。其重要意义在于：一方面揭示LLM被滥用的新途径，另一方面提供轻量级解决方案。该方法可无缝集成至TripAdvisor、亚马逊等平台的现有审核系统，为"可信评论联盟"提供技术支撑。随着AI改写工具的普及，这种基于模式识别的检测框架，可能成为维护网络信息真实性的重要防线。

热点排行

新闻专题

联系信箱：

粤ICP备09063491号