基于深度学习的听力图数字化：面向听力大数据的结构化提取与匿名化处理

首页今日动态人才市场新技术专栏中国科学人云展台
BioHot
云讲堂直播会展中心特价专栏技术快讯免费试用

生物通官微
陪你抓住生命科技
跳动的脉搏

生物通首页 > 今日动态 > 正文

【字体：大中小】 时间：2025年06月16日 来源：Hearing Research 2.5

编辑推荐：

　　【编辑推荐】针对纯音测听(PTA)数据因图像存储难以整合至电子病历(EMR)和通用数据模型(CDM)的痛点，研究者开发了基于CNN的听力图数字化系统。该系统通过预处理、模式分类、图像分析(IAC)和后处理四模块，实现95.01%（右耳）/98.18%（左耳）的识别准确率，处理速度较人工提升17.72倍，并集成OCR与数据匿名化技术，为构建听力大数据和AI诊断奠定基础。

全球约有4.66亿人受听力损失困扰，预计2050年将突破7亿。尽管纯音测听(PTA)是诊断金标准，但临床中大量听力图以图像形式存储，导致数据难以整合至电子病历(EMR)和通用数据模型(CDM)，严重阻碍大样本研究和AI应用。传统人工数字化方法效率低下（单图耗时63.27秒），且易引入主观误差。为此，Sunghwa You等研究者开发了基于深度学习的自动化系统，相关成果发表于《Hearing Research》。

研究团队采用卷积神经网络(CNN)架构，结合Tesseract光学字符识别(OCR)技术，构建包含预处理、模式分类、图像分析(IAC)和后处理的四模块框架。系统首先对8,847个听力学符号进行训练，通过灰度化、归一化消除图像噪声，随后CNN模型定位频率与阈值符号，OCR提取患者信息后实施匿名化处理。测试集包含2,443个符号，验证了模型效能。

【性能表现】
模型对右/左耳符号识别准确率达95.01%和98.18%，单图处理仅需3.57秒，较人工效率提升17.72倍。结构化输出可直接对接CDM，满足欧盟《通用数据保护条例》(GDPR)匿名化要求。

【技术突破】
区别于既往研究仅关注分类预测，本系统首次实现端到端的数值化输出：

预处理模块通过自适应二值化消除背景干扰
模式分类采用ResNet-50架构识别7类听力学符号
IAC模块通过U-Net分割坐标轴并解析dB HL值
后处理模块校验逻辑关系（如气骨导间距）

【临床价值】
研究解决了三大核心问题：

数据壁垒：打破图像数据与EMR系统的互操作性障碍
效率瓶颈：为多中心研究提供标准化数据处理流程
隐私合规：通过伪匿名化(pseudonymization)技术平衡数据效用与隐私保护

讨论部分强调，该框架为构建全球听力流行病学数据库奠定技术基础，未来可扩展至言语测听(SA)等复杂场景。Young Joon Seo团队指出，系统误差主要源于模糊图像符号（约2.3%），后续将通过生成对抗网络(GAN)增强数据质量。这项研究标志着听力学数据正式迈入结构化、可计算时代，为AI驱动的新型诊疗模式提供关键基础设施。

热点排行

新闻专题

联系信箱：

粤ICP备09063491号