
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于自然语言处理的肾脏超声报告分析:影像特征与慢性肾病诊断的关联研究
【字体: 大 中 小 】 时间:2025年08月06日 来源:Renal Failure 3
编辑推荐:
这篇研究创新性地应用自然语言处理(NLP)技术解析肾脏超声报告,开发了基于词级分析和深度句法特征的模型,精准识别慢性肾病(CKD)关键指标——肾回声增强(echogenicity)和小肾脏(<10th百分位长度)。研究发现双侧回声增强对CKD的预测力最强(OR=7.642),为临床早期筛查提供了可扩展的自动化工具。
Abstract
这项单中心试点研究利用自然语言处理(NLP)技术分析了1,068份肾脏超声报告,首次系统评估了文本特征与慢性肾病(CKD)诊断的关联。研究通过词级和句级两种NLP方法识别肾脏回声状态(正常/增强),并以低于性别特异性10%百分位的长度定义"小肾脏"。结果显示,词级模型在分类性能上显著优于句级方法(左肾准确率0.97 vs 0.92),双侧回声增强成为CKD最强预测因子(OR=7.642)。
Introduction
慢性肾病(CKD)影响全球约15%成人,其诊断高度依赖肾脏超声特征。肾皮质回声增强反映纤维化病理改变,而肾脏缩小(长度<8.5cm女性/<9.0cm男性)提示晚期萎缩。尽管超声报告包含关键临床信息,但自由文本的非结构化特性阻碍了大规模分析。既往研究多聚焦于影像直接分析,而本研究首次将先进NLP技术(包括临床词嵌入和ELMo句法解析)应用于报告文本挖掘。
Materials and methods
数据源自石溪大学医院(SBUH)2020-2024年住院患者超声报告,排除终末期肾病(ESKD)后保留1,068份。采用双重NLP策略:
词级模型:基于临床词嵌入(clinical-embeddings-100d-w2v-cr)筛选30个回声相关术语,结合句法树分析否定语境
句级模型:通过BioBERT生成句子嵌入,与专家定义的锚句子进行余弦相似度比对
肾脏长度通过ELMo解析器提取,按性别分层后定义异常阈值。
Results
验证集显示词级模型对双侧回声增强的识别准确率达96%。多变量逻辑回归揭示:
双侧回声增强:OR=7.642(95%CI 4.887-11.949)
双侧小肾脏:OR=4.981(1.522-16.300)
值得注意的是,无CKD诊断但eGFR<60 mL/min/1.73m2的患者中,双侧回声增强者平均eGFR显著更低(68.74 vs 83.55)。
Discussion
该研究突破性地证明:
词级NLP能有效捕捉"hyperechoic"等专业术语的细微差异
句法树结构可解析跨句关联(如"右肾9cm,皮质回声增强"的复合特征)
模型在13位放射科医师的报告间保持稳定性能
临床转化价值体现在:
对ICD未编码的早期CKD患者(eGFR 30-59)具有筛查潜力
双侧小肾脏的识别可提示移植评估时机
局限性包括单中心数据、未纳入皮质厚度等次要特征。未来方向涵盖跨机构验证和实时临床决策支持系统开发。研究为利用常规超声报告实现CKD风险分层树立了新范式。
生物通微信公众号
知名企业招聘