
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于层次多标签深度学习模型的结肠镜检查患者指南驱动临床决策支持系统
【字体: 大 中 小 】 时间:2025年05月24日 来源:CHINESE MEDICAL JOURNAL 7.5
编辑推荐:
本文推荐一项创新性研究,通过构建基于预训练Transformer模型(BERT/ERNIE)和层次多标签策略的临床决策支持系统(CDSS),实现对中国多中心结肠镜检查报告的智能解析。该系统采用5类主标签和22个子标签的层次结构,显著提升模型在癌症识别(100%精准率)和正常病例筛除(72%召回率)中的性能,同时解决中文医疗文本分词歧义、实体混合等NLP挑战。研究证实,结合医学知识预训练(E3BZ模型)与层次推理路径的端到端框架,可平衡模型可解释性与泛化能力,为优化结直肠癌筛查资源分配提供AI解决方案。
引言
结肠镜检查在胃肠疾病诊断中具有核心地位,但分散存储的电子病历报告导致患者获取专业建议效率低下。数据显示,约50%检查结果正常无需短期复查,1.5%提示癌症需紧急干预,但医疗资源错配现象普遍。中国国家癌症中心2022年统计表明,结直肠癌已成为第二大高发癌种,凸显优化筛查流程的紧迫性。
传统自然语言处理(NLP)技术依赖命名实体识别(NER),但中文医疗文本存在术语混合、无显式分词界限等挑战。本研究创新性采用层次多标签深度学习框架,直接解析结肠镜报告语义,规避NER的初始误差累积问题。
方法
数据来源
纳入解放军总医院等5家三甲医院2012-2016年163,601例结肠镜检查数据,经分层随机抽样获得2041例标注样本(训练集:测试集=7:3)。外部验证集包含5家其他医院3177例数据,确保模型泛化性。
标签体系设计
依据中国最新指南构建5类主标签(肠道准备不足/正常/癌症/息肉/其他)和22个子标签的层次结构。例如"息肉##炎性##5-10年"代表完整推理路径,每个标签节点对应医学证据评估环节。
模型优化
对比BERT-base-Chinese(BC)、BERT-wwm-ext-Chinese(BWEC)和ERNIE-3.0-base-zh(E3BZ)三种预训练模型表现。采用分层标签编码策略,使用BCEWithLogitsLoss损失函数,设置早停机制(10轮无改善终止)。引入提示工程(Prompt Engineering)优化语义捕捉,如"根据报告,患者应何时复查或就诊哪个科室?"
结果
性能比较
E3BZ模型在分层标签模式下表现最优:准确率90.18%,Macro-F1值69.14%,较扁平标签策略提升8%。癌症识别达到100%精准率/召回率,正常病例识别特异性达100%。外部验证显示,经30%数据微调后,正常病例召回率提升至72%,资源节约效益显著。
局限性
开放文本输入中的书写不规范可能影响稳定性,未来拟采用概念瓶颈模型(Concept Bottleneck Model)增强混合智能决策。
讨论
该研究突破传统两阶段模型局限,通过层次标签编码实现指南推理路径的可视化。中文特性如"结肠腺瘤(TA)"与英文术语混用等挑战,被医学知识增强的ERNIE-3.0模型有效化解。多中心数据验证证实,系统每年可避免约1100万例不必要的结肠镜检查,具有重大卫生经济学价值。
创新点
该框架为其他医学文本分析任务提供范式参考,未来可通过数据增强(Data Augmentation)进一步优化长证据链类别的预测稳定性。
生物通微信公众号
知名企业招聘