
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于残差网络和少数类过采样技术的精准神经网络方法研究结直肠癌与食物类别的相关性
【字体: 大 中 小 】 时间:2025年08月25日 来源:Results in Engineering 7.9
编辑推荐:
本研究针对全球结直肠癌(CRC)发病率上升与饮食模式的关联性难题,创新性地采用ResNet18(Conv1D)结合SMOTE等过采样技术,系统分析了7大类25种食物亚型与CRC风险的关系。通过对比XGBoost、RF等5种算法,模型准确率达92%,首次揭示低脂黄油(RR 2.1)和未加工红肉(RR 1.09)的促癌风险,以及白肉(RR 0.77)的防护作用,为精准膳食干预提供了AI驱动的科学依据。
研究背景与意义
在全球癌症负担日益加重的背景下,结直肠癌(CRC)已成为威胁人类健康的重大疾病。近年数据显示,50岁以下人群CRC发病率激增79%,2020年全球CRC死亡病例高达百万。尽管饮食因素被公认与CRC风险相关,但关于特定食物类别的争议持续存在——例如红肉是否必然致癌?低脂乳制品是否更安全?这些问题的答案长期被传统流行病学研究方法的局限性所掩盖。
技术方法创新
研究团队从美国PLCO癌症筛查试验获取154,892人(76,679男/78,213女)的膳食数据,包含7大类25亚型食物。为克服数据不平衡(仅1,965例CRC),采用SMOTE、BLSMOTE和ADASYN三种过采样技术。创新性地将ResNet18从图像处理的Conv2D改造为Conv1D结构,配合Adam优化器(学习率0.00001),与RNN、XGBoost等算法对比验证。
关键发现
模型性能突破
定制化ResNet18+SMOTE组合表现最优,准确率92%,特异性89%,MCC(Matthews相关系数)达0.8,显著优于传统算法。过采样使癌症识别率从近乎0%提升至84%。
食物风险图谱
危险因素:每日>20g低脂黄油(RR 2.1, CI 0.93-5.23)风险最高;未加工红肉>75g/d(RR 1.09)
保护因素:白肉>75g/d(RR 0.77)保护效应显著;全脂牛奶与常规黄油呈中性
饮食模式:"鱼类+白肉+乳制品"组合风险降低30%
亚型差异颠覆认知
同属红肉:含防腐剂的加工肉风险是新鲜肉1.5倍
乳制品:化学减脂产品风险比天然产品高2倍
科学价值
该研究首次实现食物亚型水平的CRC风险量化,突破传统"全有或全无"的饮食建议模式。技术层面,Conv1D-ResNet18为医学时序数据处理提供新范式;应用层面,证实适度摄入某些"争议性食物"(如适量红肉)未必增加风险,而某些"健康标签"产品(如低脂黄油)反而需警惕。这些发现为个性化膳食指导提供了精准依据,对公共卫生政策制定具有里程碑意义。
局限与展望
研究受限于PLCO数据的自我报告偏差,未来需结合代谢组学验证。作者建议建立全球食物成分-癌症风险数据库,推动AI营养学发展。正如论文在《Results in Engineering》所述,这种"深度学习+预防医学"的交叉范式,将为癌症防控开辟新路径。
生物通微信公众号
知名企业招聘