医疗决策领域人工智能应用评估工具的研制与验证：一项针对伊朗医疗机构的心理测量学研究

《Scientific Reports》：Psychometric evaluation of an instrument measuring artificial intelligence utilization in decision-making domains of healthcare organizations

【字体：大中小】 时间：2025年10月23日 来源：Scientific Reports 3.9

编辑推荐：

　　为解决医疗决策过程中AI应用水平缺乏有效评估工具的问题，研究人员开展了"医疗决策领域人工智能应用评估工具的研制与验证"研究。该研究采用心理测量学方法开发了包含12个条目的评估工具，结果显示该工具具有优异的效度和信度（Cronbach's α=0.95，ICC=0.95），并发现伊朗医疗机构中AI应用水平普遍较低。这项研究为医疗机构评估AI应用状况提供了可靠工具，对推动AI在医疗决策中的系统化应用具有重要意义。

在当今医疗健康领域，决策制定过程面临着诸多挑战。医疗决策往往需要在不确定性和模糊性的条件下进行，同时还要兼顾患者偏好和参与度。有些患者倾向于将决策权交给医生，而另一些则希望在决策过程中发挥更积极的作用。这种复杂性使得医疗决策成为卫生系统政策和医疗服务中的核心环节。

人工智能技术的兴起为改善医疗决策带来了新的希望。人工智能能够执行需要智能和分析的任务，如问题解决和学习过程。机器学习作为人工智能的一个分支，可以使计算机从数据中自主学习并不断适应新数据，而无需显式编程。在医疗技术领域，机器学习和深度学习是两个主要应用分支，包括人工神经网络、随机森林、支持向量机和决策树等方法。

尽管人工智能在医疗领域展现出巨大潜力，但文献中缺乏经过验证的工具来测量不同医疗领域中人工智能的应用水平。特别是在共享决策、临床决策和组织决策这三个医疗决策领域，虽然已有研究探讨了人工智能的适用性，但尚未有专门针对医疗机构层面的人工智能应用评估工具。这一空白限制了医疗机构系统评估和推进人工智能应用的能力。

在此背景下，伊朗的研究团队开展了一项创新性研究，旨在开发并验证一个用于评估医疗机构决策领域中人工智能应用水平的工具。该研究于2024-2025年在伊朗进行，采用方法学研究设计，最终形成了一份具有良好心理测量学特性的评估工具。

研究团队基于先前发表的系统评价，初步构建了包含15个条目的问卷。为确保工具的科学性和可靠性，研究进行了全面的效度和信度评估，包括表面效度、内容效度、结构效度和信度分析。

在表面效度评估阶段，研究邀请了10名专家和10名利益相关者参与评估，同时有4名波斯语专家确保语言准确性。内容效度采用Lawshe方法，20名专家参与评估内容效度比和内容效度指数。结构效度通过探索性因子分析进行，样本量达到120人。信度分析则采用Cronbach's α和组内相关系数，样本量为30人。

研究结果显示，最终版本的评估工具包含12个条目，这些条目平均分布在临床决策、组织决策和共享决策三个维度中。工具表现出优异的心理测量学特性，平均因子载荷为0.8，主成分解释了总方差的65.31%。信度指标显示，Cronbach's α和组内相关系数均为0.95，表明工具具有极高的内部一致性和可靠性。

在内容效度评估中，所有条目的内容效度比得分在0.6-0.8之间，内容效度指数在0.8-0.9之间，均达到可接受标准。专家建议将三个条目与其他条目进行整合，以提升工具的整体质量。

探索性因子分析前，研究首先评估了数据进行因子分析的适宜性。KMO（Kaiser-Meyer-Olkin）取样适切性量数为0.7，Bartlett球形检验卡方值为580.12（p<0.001），表明数据适合进行因子分析。

碎石图显示，研究工具的条目主要负载于一个主要成分上，该成分能够解释大部分方差，支持工具的单维性特征。

最终确定的12个条目涵盖了人工智能在医疗决策中的关键应用领域，包括临床数据管理分析、住院需求预测、疾病模式识别、诊断准确性提升、药物开发、管理决策支持、服务需求预测、资源优化、财务风险管理、员工教育、医疗咨询和个性化护理计划制定等。

应用该工具对伊朗医疗机构进行评估的结果显示，人工智能在伊朗医疗体系中的应用水平普遍较低。这一发现与伊朗面临的特定挑战相关，包括信息系统不完善、资金支持不足、基础设施欠缺等因素。国际制裁导致的设备进口限制也增加了人工智能发展的成本和难度。

与沙特阿拉伯等国家相比，伊朗在人工智能医疗应用方面相对滞后。沙特通过"2030愿景"等国家战略，在人工智能医疗应用方面取得了显著进展，包括早期疾病检测、个性化治疗、预测流行病学等领域。这种差异凸显了国家政策支持对人工智能在医疗领域发展的重要性。

该研究的创新性在于首次开发出专门用于评估医疗机构层面人工智能应用水平的有效工具。与以往主要关注个体对人工智能态度的研究不同，该工具为机构层面的评估和规划提供了科学依据。

研究也存在一些局限性。由于样本量和资源限制，未能评估人工智能应用对决策领域绩效改善的影响程度。此外，研究仅针对伊朗单一国家，未纳入国际专家视角，限制了工具的跨文化适用性。

该研究对医疗政策制定者和管理者具有重要启示。通过使用这一评估工具，医疗机构可以识别自身在人工智能应用方面的现状，为有针对性、有计划地推进人工智能技术应用提供依据。同时，通过持续评估和反馈，可以建立人工智能在组织决策中系统性扩展的基础。

未来研究可以在此基础上开发针对特定医疗决策领域的专门化工具，纳入更广泛的国际样本，采用验证性因子分析等不同分析方法，进一步提升工具的综合性和适用性。此外，探索人工智能应用与医疗决策质量提升之间的具体关联机制，也将是重要的研究方向。

这项发表在《Scientific Reports》上的研究不仅为医疗机构提供了一份可靠的人工智能应用评估工具，更重要的是为全球医疗体系推进人工智能在决策领域的应用提供了方法论支持和实践指引。随着人工智能技术在医疗领域的深入发展，这样的评估工具将有助于推动人工智能在医疗决策中的科学性、系统性和有效性应用，最终提升医疗服务的质量和效率。

热点排行

新闻专题