基于自然语言处理的肾脏超声报告分析:影像特征与慢性肾病诊断的关联研究

【字体: 时间:2025年08月06日 来源:Renal Failure 3

编辑推荐:

  这篇研究创新性地应用自然语言处理(NLP)技术解析肾脏超声报告,开发了基于词级分析和深度句法特征的模型,精准识别慢性肾病(CKD)关键指标——肾回声增强(echogenicity)和小肾脏(<10th百分位长度)。研究发现双侧回声增强对CKD的预测力最强(OR=7.642),为临床早期筛查提供了可扩展的自动化工具。

  

Abstract

这项单中心试点研究利用自然语言处理(NLP)技术分析了1,068份肾脏超声报告,首次系统评估了文本特征与慢性肾病(CKD)诊断的关联。研究通过词级和句级两种NLP方法识别肾脏回声状态(正常/增强),并以低于性别特异性10%百分位的长度定义"小肾脏"。结果显示,词级模型在分类性能上显著优于句级方法(左肾准确率0.97 vs 0.92),双侧回声增强成为CKD最强预测因子(OR=7.642)。

Introduction

慢性肾病(CKD)影响全球约15%成人,其诊断高度依赖肾脏超声特征。肾皮质回声增强反映纤维化病理改变,而肾脏缩小(长度<8.5cm女性/<9.0cm男性)提示晚期萎缩。尽管超声报告包含关键临床信息,但自由文本的非结构化特性阻碍了大规模分析。既往研究多聚焦于影像直接分析,而本研究首次将先进NLP技术(包括临床词嵌入和ELMo句法解析)应用于报告文本挖掘。

Materials and methods

数据源自石溪大学医院(SBUH)2020-2024年住院患者超声报告,排除终末期肾病(ESKD)后保留1,068份。采用双重NLP策略:

  1. 词级模型:基于临床词嵌入(clinical-embeddings-100d-w2v-cr)筛选30个回声相关术语,结合句法树分析否定语境

  2. 句级模型:通过BioBERT生成句子嵌入,与专家定义的锚句子进行余弦相似度比对

    肾脏长度通过ELMo解析器提取,按性别分层后定义异常阈值。

Results

验证集显示词级模型对双侧回声增强的识别准确率达96%。多变量逻辑回归揭示:

  • 双侧回声增强:OR=7.642(95%CI 4.887-11.949)

  • 双侧小肾脏:OR=4.981(1.522-16.300)

    值得注意的是,无CKD诊断但eGFR<60 mL/min/1.73m2的患者中,双侧回声增强者平均eGFR显著更低(68.74 vs 83.55)。

Discussion

该研究突破性地证明:

  1. 词级NLP能有效捕捉"hyperechoic"等专业术语的细微差异

  2. 句法树结构可解析跨句关联(如"右肾9cm,皮质回声增强"的复合特征)

  3. 模型在13位放射科医师的报告间保持稳定性能

    临床转化价值体现在:

    • 对ICD未编码的早期CKD患者(eGFR 30-59)具有筛查潜力

    • 双侧小肾脏的识别可提示移植评估时机

局限性包括单中心数据、未纳入皮质厚度等次要特征。未来方向涵盖跨机构验证和实时临床决策支持系统开发。研究为利用常规超声报告实现CKD风险分层树立了新范式。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号