基于BRAR锚定的全景放射影像多模态数据集:推动牙周骨吸收分级研究的新资源

《Scientific Data》:BRAR-anchored multimodal dataset of panoramic radiographs for periodontal bone resorption grading

【字体: 时间:2025年12月16日 来源:Scientific Data 6.9

编辑推荐:

  本研究针对牙周病诊断中缺乏大规模、专家标注的多模态数据集问题,研发了基于骨吸收年龄比(BRAR)的全景放射影像多模态数据集。该数据集整合了1104例患者的全景影像、人口统计学信息和临床指标,通过BRAR实现牙槽骨吸收的客观分级。研究成果为AI辅助诊断模型开发和大型临床研究提供了高质量数据基础,显著推进牙周病精准诊疗进程。

  
牙周病作为全球范围内导致牙齿丧失的主要慢性疾病,其病理核心是牙槽骨的进行性吸收。准确评估牙槽骨吸收程度对于疾病诊断、治疗计划制定及预后判断至关重要。然而,传统的评估方法主要依赖临床医生对放射影像的主观视觉判读,这一过程不仅耗时,且易出现观察者间差异。尽管人工智能技术有望实现骨吸收评估的自动化和标准化,但其发展受到训练和验证所需的大规模、专家标注数据集稀缺的严重制约。
在众多影像模态中,全景放射影像因其可及性、低成本和低辐射剂量,成为人群筛查和纵向监测的理想工具。但令人遗憾的是,尽管全景影像在临床中广泛应用,目前仍缺乏整合影像与关键临床元数据的公开数据集。这种数据短缺与其他影像领域(如胸部X光或锥形束计算机断层扫描)形成鲜明对比,后者因拥有完善的大规模数据库而在自动分析和临床应用方面取得显著进展。牙周病学领域相关资源的缺失,极大地限制了人工智能驱动诊断、客观疾病分层及流行病学研究的进程。
为应对这一迫切需求,由Xia, Yiru、Li, Zhi等研究人员组成的团队在《Scientific Data》上发表了题为"BRAR-anchored multimodal dataset of panoramic radiographs for periodontal bone resorption grading"的研究论文。该研究推出了一个包含1104例患者的多模态数据集,创新性地引入了骨吸收年龄比(BRAR)这一标准化、年龄校正的指标,实现了牙槽骨吸收严重程度的客观量化。
本研究的关键技术方法包括:回顾性收集2025年1月1日至3月31日期间在上海口腔医院接受检查的1104例患者的临床数据;使用Oc 200D全景放射影像设备获取标准化影像;由经过培训的牙周专家独立进行影像标注,并采用BRAR=(BL/RL)/Age公式计算骨吸收程度;通过严格的匿名化处理保护患者隐私;使用EfficientNet-B0架构建立计算基准验证数据质量。
数据收集与处理
研究团队从上海口腔医院牙周科就诊患者中回顾性纳入了1104例符合入选标准的病例。所有患者均提供了书面知情同意,研究获得医院伦理委员会批准。数据收集包括完整的人口统计学信息、高质量全景放射影像以及详细的临床指标。影像采集采用标准化流程,由经验丰富的放射技师操作,确保影像质量符合诊断要求。所有个人身份信息均经过严格匿名化处理,仅保留患者ID、性别和年龄用于研究目的。
BRAR分级系统的建立
本研究的核心创新是提出了骨吸收年龄比(BRAR)这一新型指标。BRAR定义为BRAR=(BL/RL)/Age,其中BL表示放射影像上的骨吸收量(牙骨质釉质界到牙槽嵴顶的垂直距离),RL表示相应牙根长度(牙骨质釉质界到根尖),Age为拍摄影像时的实际年龄。基于BRAR值,将骨吸收严重程度分为三级:1级(BRAR<0.25)、2级(0.25-1.0)和3级(>1.0)。这一分级系统与2018年牙周病分类标准保持一致,将患者级别的骨吸收百分比定义为牙列中最大牙齿级别的骨吸收百分比,避免了全口平均值可能低估局部严重病变的问题。
数据质量验证
为确保标注的可靠性,研究评估了两名主治医师之间的评估者间一致性,Cohen's kappa统计量为0.88,表明强一致性。所有影像均使用预设标准进行质量评级,仅接受"可接受"或"次优"的影像纳入数据集。通过自动化脚本和人工检查验证数据完整性和一致性。
计算基准验证
为验证数据的计算效用和专家标注的完整性,研究团队开发了基于EfficientNet-B0架构的深度学习模型,用于牙槽骨吸收的自动分类。该模型在未见测试集上达到63.3%的整体准确率,显著超过随机猜测基线。模型对2级(中度)病例的召回率达到83.5%,而对1级和3级的召回率分别为44.8%和34.8%,反映了临床数据中存在的自然类别不平衡特性。接收者操作特征分析显示,模型对1级骨吸收的曲线下面积达到0.83,表明轻度骨吸收的影像特征具有高度区分性。
数据集组成与可及性
该数据集已上传至Figshare平台公开可用,包含高质量全景JPG格式影像文件、标注CSV文件、代码本和评估协议。标注文件包含人口统计学详细信息、骨吸收数据、BRAR值以及牙齿级别指标(缺失牙齿、种植体、残根、功能性牙齿对)。数据集采用分层方式组织,便于研究人员使用。
研究结论与讨论表明,这一BRAR锚定的多模态数据集通过整合影像、结构化临床标注和新型定量分级系统,为研究界提供了坚实基础。它不仅加速基于人工智能的诊断模型的发展和基准测试,支持大规模流行病学研究,还推进牙周病学的精准诊断。数据集的独特价值在于其大规模多样化样本、丰富的多模态整合、新颖客观的疾病分级以及严格的专家验证。
然而,研究也存在一定局限性,包括全景影像固有的几何变形、叠加和焦槽敏感性等限制;可能存在的未捕获混杂因素(如吸烟、血糖控制/糖化血红蛋白、药物治疗史);以及相对较短的采集窗口和单中心抽样可能引入的人口统计学或转诊偏倚。研究人员建议使用者在解释分级分布时考虑这些限制,并采用敏感性分析和模型校准策略来应对这些因素。
该数据集的发布标志着牙周病影像学研究的重要进展,为开发更复杂的人工智能模型、探索年龄相关骨改建机制以及推进牙周病精准医疗提供了宝贵资源。通过促进数据共享和协作,这一工作有望推动牙周病诊断和治疗领域的创新发展。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号