编辑推荐:
为解决罕见癌症研究样本量小、统计效力不足的问题,研究人员基于 EPIC 队列开展研究,利用 RARECAREnet 分类识别罕见癌症,开发交互式 R Shiny 应用。结果显示 EPIC 中 11450 例罕见癌症,证实烟酒与头颈部癌症关联,为罕见癌症研究提供新资源。
在癌症研究领域,罕见癌症一直是一块难啃的 “硬骨头”。这类癌症年发病率低于 6/10 万,单个癌种病例稀少,导致传统研究难以积累足够样本量,统计效力不足,病因机制和预防策略的探索长期滞后。据欧洲数据显示,罕见癌症占全部癌症诊断的 22%、死亡的 25%,但 5 年相对生存率仅 47%(常见癌症为 65%),且缺乏针对性药物研发动力,患者预后普遍较差。如何利用大规模队列数据挖掘罕见癌症的潜在风险因素,成为科学界亟待突破的难题。
为攻克这一挑战,国际癌症研究机构(IARC)的研究人员聚焦于欧洲癌症与营养前瞻性调查队列(European Prospective Investigation into Cancer and Nutrition, EPIC),开展了一项具有里程碑意义的研究。该研究成果发表在《ESMO Rare Cancers》,旨在通过整合 EPIC 中逾 52 万参与者的长期随访数据,结合 RARECAREnet(罕见癌症注册网络)的标准化分类体系,构建首个基于大规模人群的罕见癌症数据库,并探索其在病因学研究中的应用潜力。
研究主要采用了以下关键技术方法:
- 数据整合与分类:基于 RARECAREnet 的三级分类系统(Tier 1-3),结合 SEER 数据库的肿瘤部位和形态学编码,从 EPIC 中筛选出 11450 例罕见癌症病例,涵盖 8851 例完整数据,涉及 12 个罕见癌症家族(如头颈部、中枢神经系统、血液系统等)。
- 交互式工具开发:利用 R 语言的 Shiny 框架开发 EPIC Rare Cancers Explorer 网络应用,提供按性别、癌症部位、形态学、RARECAREnet 层级等维度的动态数据可视化和初步统计分析功能,确保数据隐私的同时支持研究假设生成。
- 生存与风险因素分析:以头颈部癌症为案例,采用 Cox 比例风险模型,分析吸烟、饮酒、高血压、糖尿病等因素与癌症风险的关联,并通过 Kaplan-Meier 法评估生存差异。
研究结果
1. EPIC 罕见癌症数据库的构建与特征
- 病例分布:在 EPIC 队列中,罕见癌症占总癌症病例的 18.3%,涉及 57 个 Tier 1 和 155 个 Tier 2 类别。血液系统癌症(1808 例)、头颈部癌症(881 例)和中枢神经系统癌症(754 例)为最常见类型。女性占比 64.3%,平均诊断年龄 63.4 岁,5 年生存率 55%,与既往报道一致。
- 数据完整性:91.6% 病例记录了终身饮酒模式,98.6% 有吸烟状态数据,100% 包含 BMI 等人体测量指标,5177 例保存了生物样本(血清、血浆、DNA 等),为分子流行病学研究提供基础。
2. 交互式工具的功能与应用
EPIC Rare Cancers Explorer 通过动态图表(如树状图、条形图)展示各癌症家族的病例分布、性别比例及生物样本可用性。用户可自定义查询肿瘤部位与形态学组合,快速评估特定研究问题的可行性。例如,查询 “头颈部鳞状细胞癌” 时,工具可实时呈现吸烟强度与癌症风险的剂量 - 反应关系,辅助研究人员设计后续验证实验。
3. 头颈部癌症风险因素的验证性研究
- 吸烟与饮酒的核心作用:多变量分析显示,当前吸烟者患头颈部癌症的风险较非吸烟者高 2.65-8.18 倍,且呈剂量依赖性(每日吸烟量越多,风险越高);重度饮酒者(男性 > 60g/d,女性 > 30g/d)风险增加 3.50 倍, former heavy drinkers 因 “病态戒断效应” 风险更高(HR=5.54)。
- 解剖亚型差异:喉癌与吸烟强相关(HR=13.25),口咽癌与重度饮酒强相关(HR=19.76),而唇癌风险与高血压相关(HR=1.98),提示不同亚部位的致病机制异质性。
- 其他因素:BMI 与头颈部癌症的弱关联可被吸烟 / 饮酒混淆,体力活动、能量摄入及石棉暴露未显示显著影响。
研究结论与意义
本研究首次系统性地将 EPIC 队列应用于罕见癌症流行病学研究,证实了大规模前瞻性队列在解析罕见癌症病因中的独特价值。通过构建标准化数据库和交互式分析工具,研究团队为全球学者提供了探索罕见癌症风险因素的开放平台,尤其在验证已知风险因素(如烟酒)和发现潜在关联(如高血压与唇癌)方面展现了强大潜力。尽管存在观察性研究的固有局限(如无法确证因果关系、招募偏倚),但 EPIC 的长期随访数据和生物样本库为跨学科研究(如分子流行病学、药物靶点发现)奠定了基础。随着 2026 年 EPIC 数据库的更新,预计将纳入更多病例,进一步提升罕见癌症研究的统计效力。该研究不仅填补了罕见癌症领域的数据空白,更呼吁全球研究网络加强协作,共同攻克这类 “被遗忘的癌症”。