
-
生物通官微
陪你抓住生命科技
跳动的脉搏
"MMDental:首个融合3D CBCT影像与专家病历的多模态牙科数据集推动AI智能诊疗革命"
【字体: 大 中 小 】 时间:2025年07月10日 来源:Scientific Data 5.8
编辑推荐:
针对牙科AI研究中多模态数据匮乏的瓶颈,研究团队构建了首个包含660例患者3D锥形束CT(CBCT)影像与详细专家病历的多模态数据集MMDental,通过标准化采集流程和严格质控,为开发智能诊断、治疗规划等AI应用提供了关键资源,显著提升了牙科疾病三维可视化分析与临床决策支持的研究水平。
在口腔健康日益受到关注的今天,全球有超过35亿人受口腔疾病困扰,从常见的龋齿、牙龈疾病到严重的牙周炎,这些问题不仅造成剧烈疼痛,还可能导致牙齿脱落甚至引发全身感染。传统诊断依赖二维X光片和视觉检查,存在信息缺失和误诊风险。随着人工智能(AI)在医疗领域的快速发展,牙科智能诊疗迎来新机遇,但现有公开数据集多为单模态影像,严重制约了AI模型的开发。
杭州电子科技大学电子设计自动化技术创新中心的研究团队在《Scientific Data》发表了突破性研究成果。他们收集了来自杭州口腔医院的660例患者数据,创建了首个同时包含三维锥形束计算机断层扫描(CBCT)影像和专家病历的多模态牙科数据集MMDental。该数据集包含161,200张CBCT切片和2,125份病历,涵盖8类常见口腔疾病,患者年龄跨度5-86岁,性别比例均衡(男51.06%,女48.94%)。
研究采用四阶段标准化流程:数据采集阶段使用HiRes 3D-Plus等设备获取640×640×400体素的CBCT影像;预处理阶段将DICOM格式转换为NIFTI格式,医疗记录通过百度OCR转为CSV;隐私处理阶段采用数字重编码技术匿名化;最终整合为结构化数据集。质量控制方面,由5名护士初筛后,2名资深牙科专家独立复核,确保诊断准确性与数据一致性。
数据特征分析显示:



该研究的创新价值体现在三方面:首先,填补了牙科AI领域缺乏高质量多模态数据的空白;其次,严格的专家标注体系为模型训练提供了可靠标准;最后,年龄分层分析为开发适应性AI诊断工具奠定了基础。数据集已通过Figshare平台开源,采用CC-BY-NC-ND 4.0协议共享,为智能牙科诊疗系统的研发提供了重要基础设施。未来可通过多中心合作进一步扩大数据多样性,探索跨模态融合算法在临床决策支持中的应用潜力。
生物通微信公众号
知名企业招聘