基于深度神经网络与贝叶斯网络的可解释性野生兰花自动识别方法研究

【字体: 时间:2025年09月04日 来源:Engineered Regeneration CS22.5

编辑推荐:

  为解决深度学习模型在植物识别中缺乏解释性的问题,研究人员开发了一种结合深度神经网络(DNN)和贝叶斯网络(BN)的可解释集成分类器。该研究通过提取花卉形态特征构建BN模型,并与端到端图像分类DNN形成互补验证,最终实现89.4%的协同准确率,在人工参与验证下提升至98.1%。该创新方法首次将概率图模型与深度学习结合,为可信赖的植物鉴定系统提供了新范式。

  

在生物多样性保护与植物学研究领域,准确识别野生兰花物种具有重要意义。传统分类方法依赖专业植物学家对花部形态特征的观察,而近年来基于深度学习的图像识别技术虽能达到93-98.5%的准确率,却因"黑箱"特性难以解释决策依据。这种不可解释性严重制约了系统在科研和教育中的应用价值,正如Petkovic(2023)强调的,可信系统需要同时具备高精度和可解释性。

为突破这一技术瓶颈,荷兰特温特大学Diah Harnoni Apriyanti团队创新性地将两种机器学习范式相结合:通过深度神经网络(DNN)提取花卉图像特征,同时构建基于植物分类学知识的贝叶斯网络(BN)。研究选取6个关键形态特征——包括唇瓣纹理(T)、花序类型(IN)、花朵数量(NF)、花色(CF)、唇瓣色(CL)和唇瓣形状(LC),采用Xception架构训练专用特征分类器。这些特征通过虚拟证据节点以概率形式融入BN,形成可追溯决策路径的"白箱"模型。

关键技术方法包括:1) 使用Xception网络进行多标签特征提取;2) 采用半监督结构学习构建包含63种兰花的BN拓扑;3) 开发集成分类算法协调DNN与BN的预测结果;4) 基于d-分离原理实现可解释推理。实验采用6300张平衡分布的兰花图像,通过分层抽样进行5折交叉验证和自助法验证。

研究结果显示:

  1. 1.

    贝叶斯网络性能

    通过比较四种BN结构(双重朴素、半朴素、禁忌搜索和爬山法),发现基于禁忌搜索的BN在独立测试集上达到87.6%的top-1准确率,top-5提升至93.5%。特征提取的不确定性是限制性能的主要因素,如唇瓣纹理识别的真阳性率(TPR)为86.9%。

  2. 2.

    集成系统优势

    当DNN(95.1%准确率)与BN预测一致时,系统可信度最高(占89.4%案例)。在人工参与验证的案例中,通过对比特征证据与预期特征(如将误判为"斑点纹理"的案例修正),系统准确率提升至98.1%。图8-10展示了三种典型决策场景的可视化解释。

  3. 3.

    解释性比较

    相较于LIME和SHAP等事后解释方法,BN能直接输出符合植物学描述的特征解释。如将Cypripedium californicum的识别归因于"紫色-黄色花色组合"和"囊状唇瓣"等分类学特征,而非像素级热图。

这项发表于《Engineered Regeneration》的研究开创性地实现了植物识别的"双轨验证"机制:DNN捕捉图像深层特征,BN保障分类过程符合分类学逻辑。该方法不仅适用于兰花鉴定,其"概率图模型+深度学习"的框架可扩展至其他需要可解释性的生物识别领域。正如讨论部分指出,该工作首次证明将快速直觉式(DNN)与慢速理性式(BN)认知模式相结合,能同时满足Kahneman提出的双重系统理论在AI系统中的实现。未来研究可探索更多植物特征的表征方式,并优化人机协同决策流程。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号