
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于多设备声学特征的模拟排尿声数据集构建及其在尿流率估计中的应用
【字体: 大 中 小 】 时间:2025年06月14日 来源:Scientific Data 5.8
编辑推荐:
本研究针对传统尿流率检测(Uroflowmetry, UF)的临床局限性,创新性地构建了首个公开的模拟排尿声数据集(1-50 ml/s),采用高精度蠕动泵(L600-1F)和三重录音设备(Ultramic384k麦克风/智能手机/智能手表),为开发AI驱动的声学尿流测定(Sound-based Uroflowmetry, SU)算法提供标准化数据基础,推动居家泌尿健康监测技术发展。
泌尿系统疾病诊疗长期面临一个临床难题:传统尿流率检测(Uroflowmetry, UF)需要患者在特定医疗设备上排尿,这种"实验室环境"会导致"厕所羞怯症"(paruresis),显著影响检测结果的真实性。更棘手的是,单次UF检测难以反映患者日常排尿模式,而频繁往返医院又降低治疗依从性。西班牙德乌斯托大学Marcos Lazaro Alvarez团队在《Scientific Data》发表的研究,通过构建首个多设备协同采集的模拟排尿声数据集,为破解这一难题提供了创新解决方案。
研究团队采用L600-1F高精度蠕动泵模拟1-50 ml/s尿流,通过6 mm直径喷嘴(模拟男性尿道)从73-86 cm高度冲击马桶水面,同步使用专业级Ultramic384k麦克风(采样率192 kHz)、小米Mi A1手机(48 kHz)和Oppo智能手表(44.1 kHz)三重设备采集声学数据。特别设计15米长硅胶管隔离泵体噪音,并通过量筒校准确保流量精度(误差<2.1%),最终获得153段60秒纯净音频(WAV格式),包含50个流量梯度及静音对照。
【Flow generating device】
关键技术包括:(1)采用可编程蠕动泵实现1-50 ml/s精准流量控制,使用YZII25泵头搭配生物硅胶管;(2)三维录音系统覆盖专业、消费级和可穿戴设备;(3)标准化数据采集流程,包含80秒原始录音和60秒修剪版本;(4)通过量筒校准验证流量准确性,对低流量段(5-20 ml/s)进行专项校准。
【Data Records】
数据集包含三个子集:Ultramic_1min、Phone_1min和Oppo_1min,每个子集含51个WAV文件(50个流量梯度+静音对照)。文件命名采用"[device]f[flow]_60s.wav"格式,元数据标注流量值、设备和采样率。数据存储在Figshare平台(DOI:10.6084/m9.figshare.27606642),配套提供Python处理脚本(sound dataset_processing.ipynb)。
【Technical Validation】
流量验证显示:高流量段(25-50 ml/s)误差<2.1%,但低流量段(5-20 ml/s)因管路阻力初始误差达10%。经专项校准后,低流量段误差降至1-1.67%。设备性能方面,Ultramic384k可捕捉96 kHz高频成分,而智能手表数据更贴近实际应用场景。
【Usage Notes】
该数据集突破三大应用边界:(1)支持开发跨设备通用算法,通过MFCC(梅尔频率倒谱系数)等特征提取实现流量回归预测;(2)为添加环境噪音的对抗训练提供纯净基底;(3)高采样率专业数据助力声学机理研究。需注意数据集模拟的是站立男性排尿场景(85 cm喷射高度),实际应用需考虑性别差异和如厕姿势影响。
这项研究填补了声学尿流测定领域缺乏标准化数据的空白,其创新性体现在:首次实现实验室级精度与消费级设备的协同验证,为开发居家泌尿健康监测系统奠定基础。未来可扩展女性排尿模型、坐姿场景数据,并探索基于智能手表的实时分析算法,最终实现"数字排尿日记"的临床转化,这对前列腺增生、神经源性膀胱等LUTS疾病的长期管理具有重要价值。
生物通微信公众号
知名企业招聘