
-
生物通官微
陪你抓住生命科技
跳动的脉搏
利用可解释人工智能的堆叠集成学习模型提高自闭症谱系障碍的检测能力
《BioData Mining》:Enhance autism spectrum disorder detection using stacking ensemble learning model with explainable AI
【字体: 大 中 小 】 时间:2026年06月09日 来源:BioData Mining 6.1
编辑推荐:
摘要自闭症谱系障碍(ASD)是一种神经发育障碍,表现为对声音和触觉等感官的异常敏感。自闭症儿童在沟通、社交互动和行为模式方面常常存在问题,这些方面也会受到媒体或卡通角色的影响,有时会导致不可预测或危险的行为。及时干预和检测对于促进其发展非常重要。在这项研究中,我们提出了一种数据驱
自闭症谱系障碍(ASD)是一种神经发育障碍,表现为对声音和触觉等感官的异常敏感。自闭症儿童在沟通、社交互动和行为模式方面常常存在问题,这些方面也会受到媒体或卡通角色的影响,有时会导致不可预测或危险的行为。及时干预和检测对于促进其发展非常重要。在这项研究中,我们提出了一种数据驱动的机器学习(ML)框架,用于早期检测儿童的自闭症。该方法首先进行整体数据处理,包括处理缺失值、分类数据处理以及基于信息增益和皮尔逊相关性的特征选择,以确定最重要的特征。为了克服类别间的不平衡,采用了合成少数样本过采样技术(SMOTE)。所提出的模型采用堆叠集成方法,其中KNN、RF、SVM和NB作为基础学习器,而随机森林(Random Forest)作为元分类器。通过超参数优化进一步提升了模型的性能。模型评估采用了准确率、精确度、召回率和F1分数等指标。实验结果表明,所提出的集成模型比单独的分类器更有效,在Saudi幼儿数据集上的准确率为99%,在Q-CHAT数据集上的准确率为98%,在Nao和融合数据集上的准确率为99%。此外,还应用了Shapley解释方法来确定特征的重要性及其对模型预测的影响。研究结果表明,该框架可以帮助医疗工作者进行自闭症筛查和决策制定,成为一种有前景且高效的早期自闭症检测方法。
自闭症谱系障碍(ASD)是一种神经发育障碍,表现为对声音和触觉等感官的异常敏感。自闭症儿童在沟通、社交互动和行为模式方面常常存在问题,这些方面也会受到媒体或卡通角色的影响,有时会导致不可预测或危险的行为。及时干预和检测对于促进其发展非常重要。在这项研究中,我们提出了一种数据驱动的机器学习(ML)框架,用于早期检测儿童的自闭症。该方法首先进行整体数据处理,包括处理缺失值、分类数据处理以及基于信息增益和皮尔逊相关性的特征选择,以确定最重要的特征。为了克服类别间的不平衡,采用了合成少数样本过采样技术(SMOTE)。所提出的模型采用堆叠集成方法,其中KNN、RF、SVM和NB作为基础学习器,而随机森林(Random Forest)作为元分类器。通过超参数优化进一步提升了模型的性能。模型评估采用了准确率、精确度、召回率和F1分数等指标。实验结果表明,所提出的集成模型比单独的分类器更有效,在Saudi幼儿数据集上的准确率为99%,在Q-CHAT数据集上的准确率为98%,在Nao和融合数据集上的准确率为99%。此外,还应用了Shapley解释方法来确定特征的重要性及其对模型预测的影响。研究结果表明,该框架可以帮助医疗工作者进行自闭症筛查和决策制定,成为一种有前景且高效的早期自闭症检测方法。