
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于深度学习的听力图数字化:面向听力大数据的结构化提取与匿名化处理
【字体: 大 中 小 】 时间:2025年06月16日 来源:Hearing Research 2.5
编辑推荐:
【编辑推荐】针对纯音测听(PTA)数据因图像存储难以整合至电子病历(EMR)和通用数据模型(CDM)的痛点,研究者开发了基于CNN的听力图数字化系统。该系统通过预处理、模式分类、图像分析(IAC)和后处理四模块,实现95.01%(右耳)/98.18%(左耳)的识别准确率,处理速度较人工提升17.72倍,并集成OCR与数据匿名化技术,为构建听力大数据和AI诊断奠定基础。
全球约有4.66亿人受听力损失困扰,预计2050年将突破7亿。尽管纯音测听(PTA)是诊断金标准,但临床中大量听力图以图像形式存储,导致数据难以整合至电子病历(EMR)和通用数据模型(CDM),严重阻碍大样本研究和AI应用。传统人工数字化方法效率低下(单图耗时63.27秒),且易引入主观误差。为此,Sunghwa You等研究者开发了基于深度学习的自动化系统,相关成果发表于《Hearing Research》。
研究团队采用卷积神经网络(CNN)架构,结合Tesseract光学字符识别(OCR)技术,构建包含预处理、模式分类、图像分析(IAC)和后处理的四模块框架。系统首先对8,847个听力学符号进行训练,通过灰度化、归一化消除图像噪声,随后CNN模型定位频率与阈值符号,OCR提取患者信息后实施匿名化处理。测试集包含2,443个符号,验证了模型效能。
【性能表现】
模型对右/左耳符号识别准确率达95.01%和98.18%,单图处理仅需3.57秒,较人工效率提升17.72倍。结构化输出可直接对接CDM,满足欧盟《通用数据保护条例》(GDPR)匿名化要求。
【技术突破】
区别于既往研究仅关注分类预测,本系统首次实现端到端的数值化输出:
【临床价值】
研究解决了三大核心问题:
讨论部分强调,该框架为构建全球听力流行病学数据库奠定技术基础,未来可扩展至言语测听(SA)等复杂场景。Young Joon Seo团队指出,系统误差主要源于模糊图像符号(约2.3%),后续将通过生成对抗网络(GAN)增强数据质量。这项研究标志着听力学数据正式迈入结构化、可计算时代,为AI驱动的新型诊疗模式提供关键基础设施。
生物通微信公众号
知名企业招聘