中国西南地区女性乳腺癌易感性研究:基于贝叶斯网络探索叶酸代谢酶(MTHFR、MYD88、TP53)及其单核苷酸多态性的交互作用
【字体:
大
中
小
】
时间:2025年09月26日
来源:Frontiers in Oncology 3.3
编辑推荐:
本研究采用贝叶斯网络方法,深入探讨了中国西南地区女性中叶酸代谢关键酶(MTHFR、MTR、MTRR)及炎症相关基因(MYD88、TP53)的单核苷酸多态性(SNP)与乳腺癌易感性的复杂关联。研究通过高维数据分析识别出多个关键SNP位点(如rs1801133、rs7744、rs1042522等),并构建了能够量化多基因互作风险的预测模型。结果显示特定基因型组合可使乳腺癌发生概率从48.2%升至99%,模型外部验证准确率达70%。该研究为乳腺癌的早期风险预警和精准预防提供了重要分子依据。
乳腺癌是全球女性中最常见的恶性肿瘤之一,遗传因素在其发病机制中扮演重要角色。单核苷酸多态性(SNP)作为常见的遗传变异形式,近年来受到广泛关注。然而,现有研究多聚焦于单个基因位点与乳腺癌风险的关联,跨基因多位点间复杂的交互作用尚未得到充分探索。
本研究纳入490例乳腺癌患者及490例对照样本,所有参与者均为中国云南省三代以上长期居民。采用Promega全血DNA提取试剂盒提取基因组DNA,并通过飞行时间质谱(TOFMS)生物芯片系统检测目标SNP位点。数据分析使用R Studio进行,首先通过χ2检验或Fisher精确检验筛选显著位点,再利用随机森林(RF)算法计算特征重要性,提取重要性评分大于0.05的位点。最后,基于MATLAB平台的贝叶斯网络工具箱(FullBNT-1.0.7),结合Cramer’s V强相关性筛选与K2算法,构建多基因交互的贝叶斯网络模型。
27个多态性位点均符合Hardy-Weinberg平衡。其中rs1801133(P=0.005)和rs56221660(P=0.049)在病例与对照组间分布存在显著差异。
通过随机森林模型识别出8个关键SNP位点,按重要性从高到低依次为:rs7744、rs1042522、rs1801133、rs1801394、rs7851696、rs1805087、rs17884306和rs9651118。
网络结构包含10个节点和10条有向边,直接与乳腺癌相关的节点包括rs1042522、rs1801133、rs1801394、rs1805087、rs56221660、rs7744和rs7851696,而rs17884306和rs9651118则通过间接路径发挥作用。
通过贝叶斯参数估计发现,某些特定基因型组合显著提高乳腺癌发生概率。例如,当rs1042522、rs1801133、rs1801394、rs1805087、rs56221660、rs7744和rs7851696的基因型为[CG A A A A A A G]时,患病概率高达99.98%。在所有可能的19,683种组合中,最大后验概率(MAP)组合为{rs1042522=C, rs17884306=C, rs1801133=AG, rs1801394=A, rs1805087=A, rs56221660=A, rs7744=A, rs7851696=G, rs9651118=CT},此组合下乳腺癌发生概率为99.99%。
模型在测试集上准确率为78.39%,精确率82.64%,召回率72.46%,表现出良好的分类性能与泛化能力。
使用10例独立样本进行验证,模型预测乳腺癌存在的概率平均为70%,其中一例患者的实际基因型输入后,模型输出患病概率为80%,与临床诊断高度一致。
本研究通过整合传统统计方法与机器学习模型,系统揭示了TP53(rs1042522、rs17884306)、MTHFR(rs1801133、rs56221660、rs9651118)、MTRR(rs1801394)、MTR(rs1805087)、MYD88(rs7744)及rs7851696等多个基因位点在乳腺癌发生中的协同作用。TP53作为重要的核苷酸稳态调控因子,其突变可影响基因组稳定性;MTHFR与MTR参与叶酸代谢,调控DNA甲基化与合成过程;MYD88则是Toll样受体(TLRs)炎症信号通路中的关键适配蛋白,其rs7744多态性 previously 被报道与类风湿关节炎(RA)和溃疡性结肠炎(UC)等相关。MTRR通过影响同型半胱氨酸代谢与氢硫化氢(H2
贝叶斯网络作为一种可解释的概率图模型,特别适用于描述多基因、多态性位点之间的复杂依赖关系。本研究提出的“由局部推整体”分析框架,不仅可基于部分基因型数据预测个体患病风险,也为今后扩大样本量、纳入更多位点或分子分型(如Luminal A、HER2+等)分析奠定了基础。
研究的局限性包括样本来源的区域性以及样本量在高维组合分析中仍显不足。未来需通过多中心合作扩大样本规模,进一步验证当前所识别的高风险基因型组合的临床适用性及其在乳腺癌精准防治中的实际价值。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号