基于深度学习的听力图数字化:面向听力大数据的结构化提取与匿名化处理

【字体: 时间:2025年06月16日 来源:Hearing Research 2.5

编辑推荐:

  【编辑推荐】针对纯音测听(PTA)数据因图像存储难以整合至电子病历(EMR)和通用数据模型(CDM)的痛点,研究者开发了基于CNN的听力图数字化系统。该系统通过预处理、模式分类、图像分析(IAC)和后处理四模块,实现95.01%(右耳)/98.18%(左耳)的识别准确率,处理速度较人工提升17.72倍,并集成OCR与数据匿名化技术,为构建听力大数据和AI诊断奠定基础。

  

全球约有4.66亿人受听力损失困扰,预计2050年将突破7亿。尽管纯音测听(PTA)是诊断金标准,但临床中大量听力图以图像形式存储,导致数据难以整合至电子病历(EMR)和通用数据模型(CDM),严重阻碍大样本研究和AI应用。传统人工数字化方法效率低下(单图耗时63.27秒),且易引入主观误差。为此,Sunghwa You等研究者开发了基于深度学习的自动化系统,相关成果发表于《Hearing Research》。

研究团队采用卷积神经网络(CNN)架构,结合Tesseract光学字符识别(OCR)技术,构建包含预处理、模式分类、图像分析(IAC)和后处理的四模块框架。系统首先对8,847个听力学符号进行训练,通过灰度化、归一化消除图像噪声,随后CNN模型定位频率与阈值符号,OCR提取患者信息后实施匿名化处理。测试集包含2,443个符号,验证了模型效能。

【性能表现】
模型对右/左耳符号识别准确率达95.01%和98.18%,单图处理仅需3.57秒,较人工效率提升17.72倍。结构化输出可直接对接CDM,满足欧盟《通用数据保护条例》(GDPR)匿名化要求。

【技术突破】
区别于既往研究仅关注分类预测,本系统首次实现端到端的数值化输出:

  1. 预处理模块通过自适应二值化消除背景干扰
  2. 模式分类采用ResNet-50架构识别7类听力学符号
  3. IAC模块通过U-Net分割坐标轴并解析dB HL值
  4. 后处理模块校验逻辑关系(如气骨导间距)

【临床价值】
研究解决了三大核心问题:

  1. 数据壁垒:打破图像数据与EMR系统的互操作性障碍
  2. 效率瓶颈:为多中心研究提供标准化数据处理流程
  3. 隐私合规:通过伪匿名化(pseudonymization)技术平衡数据效用与隐私保护

讨论部分强调,该框架为构建全球听力流行病学数据库奠定技术基础,未来可扩展至言语测听(SA)等复杂场景。Young Joon Seo团队指出,系统误差主要源于模糊图像符号(约2.3%),后续将通过生成对抗网络(GAN)增强数据质量。这项研究标志着听力学数据正式迈入结构化、可计算时代,为AI驱动的新型诊疗模式提供关键基础设施。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号