孟德尔随机化研究的爆发式增长:质量危机与科学多元化的双刃剑

《European Journal of Epidemiology》:The rapid growth in Mendelian randomization studies

【字体: 时间:2025年11月07日 来源:European Journal of Epidemiology 5.9

编辑推荐:

  本文针对孟德尔随机化(MR)研究中低质量论文激增的问题,系统分析了其驱动因素与潜在影响。研究表明,MR论文数量的指数级增长主要与中国机构的作者相关,并指出自动化分析工具与论文工厂是重要推手。文章呼吁采用STROBE-MR报告指南、加强基因-环境等价性讨论,并提倡将MR纳入证据三角验证框架,对维护流行病学因果推断的可信度具有重要意义。

  
在当今的流行病学研究领域,孟德尔随机化(Mendelian Randomization, MR)作为一种强大的因果推断工具,正经历着一场前所未有的“论文爆炸”。然而,这场繁荣背后隐藏着深重的危机:大量低质量、甚至存在明显方法学错误的MR研究正涌入学术期刊,不仅稀释了该领域的科学价值,更对流行病学因果推断的整体可信度构成了威胁。发表在《European Journal of Epidemiology》的这篇编辑部文章,如同一篇清醒的“诊断书”,系统剖析了这场MR论文“海啸”的根源、影响,并为如何引导这一领域走向健康、高质量的未来提出了深刻的见解。
研究人员通过系统分析PubMed数据库中MR论文的增长趋势,发现MR文献呈指数级增长,且这种增长主要由主要隶属中国机构的作者驱动。
数据显示,MR论文在EJE投稿中的占比从2020年的3.1%飙升至2024年的13.0%。这种增长被置于更广阔的科学产出背景中考量,文章指出中国在整体科研产出体量和最高质量研究成果份额上均已处于全球领先地位,这本身是科学研究“去殖民化”进程中的一个历史性成就。然而,驱动高产出的因素复杂,文章提出了两个重叠的科研生态系统模型:一个是以高质量方法学贡献、大型队列研究(如China Kadoorie Biobank)和严谨应用研究为代表的高质量科研生态;另一个则是由强大的论文发表激励、部分机构对在国际期刊发表论文的硬性要求、以及高质量培训材料的相对缺乏所驱动的“高产”生态。后者为“论文工厂”(Research Paper Mills)——那些为客户提供快速、低质论文解决方案的投机公司——提供了土壤。自动化分析工具(如OpenGWAS/MR-Base平台)的普及是一把双刃剑,它们极大地降低了MR的分析门槛,使更多资源有限的研究者能够进行研究,但同时也为不加批判的分析、p-hacking(p值操纵)乃至论文工厂的自动化生产提供了便利。
主要技术方法
本研究主要采用了文献计量学分析,系统检索了PubMed数据库以量化MR文献的增长趋势并按第一作者主要隶属国家进行分层。研究还分析了《European Journal of Epidemiology》 (EJE) 的投稿数据。此外,文章深入探讨了开放式分析平台(如OpenGWAS/MR-Base)在自动化MR分析中的作用,并引用了来自大型人群队列(如中国嘉道理生物银行[China Kadoorie Biobank]和中国心血管代谢与癌症队列[4C])的数据作为高质量研究的范例。
The factors driving prolific output of MR studies
分析表明,MR论文数量的爆炸式增长是一个显著现象。这种增长并非均匀分布,而是主要由与中国机构有主要隶属关系的作者所贡献。然而,文章谨慎地指出,不能将这种增长简单地等同于质量低下。一方面,中国的研究界在MR方法学(如选择压力景观作图、双向因果检验框架SMR-portal平台开发)和应用研究方面做出了实质性贡献。另一方面,存在于全球学术界、但在中国可能尤为突出的“发表压力”文化,以及DORA(《旧金山科研评估宣言》)等旨在改革科研评价体系的倡议在中国采纳程度相对较低(截至文章发表,中国仅有9个机构签署,而美国和英国分别有183和289个),共同催生了一个有利于“论文工厂”运作的环境。自动化工具的使用量(如OpenGWAS平台的用户访问量和数据库搜索次数)激增,暗示可能存在为获得阳性结果而进行的p-hacking行为,从而导致发表偏倚。
The role of automated tools
自动化工具(如OpenGWAS/MR-Base)极大地降低了进行MR分析的技術门槛,使研究人员能够利用大规模全基因组关联研究(Genome-Wide Association Study, GWAS)摘要数据快速完成分析。这加速了科研进程,但也带来了新的风险。工具使得进行科学上无意义但技术上看似有效的分析变得异常容易。更重要的是,这些工具极易被论文工厂等非诚信实体利用,结合大型语言模型人工智能(AI),能够以极低的专业知识和人力成本批量生产论文。这使得在投稿阶段区分严谨学者的工作与论文工厂的产物变得愈发困难。
A perspective on diversity
在讨论MR研究激增的问题时,文章强调必须认识到科学界存在的权力不平衡现象。一方面,要警惕拥有权威地位者(如期刊编辑和审稿人)可能成为不公正的“守门人”,阻碍来自历史上机会较少地区和群体的学者的参与。另一方面,MR研究的国际化本身是一个积极趋势,参与MR论文撰写的国家数量从2020年的45个增至目前的62个,这种多样性部分得益于GWAS摘要数据的公开获取。然而,要实现真正有意义的全球MR研究社区,需要确保分析工具适用于不同的祖先群体,并大力投资以纠正生物医学数据全球代表性的不平衡。
Implications for biomedical journals
针对低质量MR论文泛滥的问题,文章为期刊和审稿人提出了具体的质量把控建议。首先,严格执行STROBE-MR报告指南,并将其完成情况作为送审的前提条件,同时要求提交所有分析代码。其次,重点审查作者是否充分讨论了“基因-环境等价性”(gene-environment equivalence)这一MR基本假设,这是检验研究设计科学合理性的试金石。对于使用新兴方法(如非线性MR)的研究,应确保其经验性结论的强度与方法学在科学界所受评估的程度相称。此外,对于仅使用已发表的GWAS摘要数据、现有软件和方法进行简单MR分析的论文,其新颖性值得质疑;相反,能够综合现有数据资源、阐述新的流行病学见解、并结合多种遗传证据链进行因果推断的研究更具价值。最后,文章鼓励将MR作为证据三角验证(triangulation of evidence)的一部分,但强调这种整合必须有充分的动机和理由,避免机械地将MR与另一种研究设计(如观察性分析)简单堆砌。
结论与意义
该文的论述揭示了孟德尔随机化领域在高速发展期所面临的机遇与挑战。低质量研究的泛滥确实威胁着MR方法的信誉,但简单的排斥或“一刀切”的遏制并非解决之道。问题的根源是多方面的,涉及科研评价体系、培训资源、技术工具的民主化与滥用、以及全球科研格局变化下的权力 dynamics。未来的出路在于多管齐下:期刊需通过严格的报告指南和方法学审查守住质量底线;科研机构和管理部门应推动更健康的学术评价体系;方法论专家需持续完善和评估MR方法本身;而全球科学社区则应致力于建设更包容、公平、数据代表性和方法适用性更强的科研环境。最终目标是引导MR这一强大的因果推断工具,从“数量爆炸”走向“质量升华”,使其能在解决重要的、以往因缺乏专业知识和数据而被忽视的流行病学问题上发挥真正的作用。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号