人工智能驱动虚拟助手在促进身体活动中的作用:与传统策略比较的系统综述

【字体: 时间:2025年10月07日 来源:ARTIFICIAL INTELLIGENCE REVIEW 13.9

编辑推荐:

  本刊推荐:为解决全球身体活动不足这一公共卫生问题,研究人员开展人工智能驱动虚拟助手(AIVA)促进身体活动(PA)的系统综述,发现AIVA整合目标设定、反馈等行为改变技术(BCT),在步数、中高强度身体活动(MVPA)等指标上呈现积极效果,且可扩展性和用户自主性优势显著,为克服传统人工干预的可扩展性障碍提供新路径。

  
在全球范围内,身体活动不足已成为一个重大的公共卫生问题。据世界卫生组织(WHO)估计,全球超过四分之一的成年人未能达到推荐的身体活动水平,这直接导致了疾病负担的增加和经济成本的上升——如果当前 inactivity 趋势持续,2020至2030年间将新增近5亿可预防疾病病例,相关医疗支出高达5200亿国际元。面对这一严峻挑战,各国虽已制定多种促进身体活动的政策,但传统干预模式存在明显的局限性:它们通常依赖人力提供咨询、教育和社会支持,不仅成本高昂、可扩展性差,而且难以维持长期用户参与,也无法动态适应个体不断变化的需求。
正是在这样的背景下,人工智能(AI)驱动的虚拟助手(Artificial Intelligence-driven Virtual Assistants, AIVA)——包括聊天机器人(chatbots)、虚拟教练(virtual coaches)和会话代理(conversational agents)——近年来迅速兴起,为身体活动促进提供了新的解决方案。这些基于自然语言处理(NLP)和机器学习(ML)技术的工具,能够模拟人类对话,提供个性化建议,指导锻炼计划,并提供持续的动力支持。然而,尽管AIVA具备24/7可用、低成本、可大规模部署的潜力,其实际效果如何?与传统干预措施相比又有哪些优势和不足?为回答这些问题,研究人员在《ARTIFICIAL INTELLIGENCE REVIEW》上发表了这篇系统综述,对AIVA在促进身体活动中的应用进行了全面评估。
为开展本项研究,作者团队系统检索了Scopus、Web of Science、PubMed和Cochrane Central Register of Controlled Trials(CENTRAL)等多个数据库,时间截至2025年5月。最终纳入8项干预研究,这些研究均采用AIVA作为主要干预工具,并以身体活动作为主要或次要结局指标。研究者使用ROB 2(针对随机试验)和ROBINS-I(针对非随机研究)工具进行偏倚风险评估,并提取了干预特征、结局指标和行为改变策略等数据进行综合合成。
关键技术方法包括:基于自然语言处理的对话系统构建、结合可穿戴设备(如ActiGraph、Fitbit)的实时数据集成、行为改变技术(Bechavior Change Techniques, BCT)的算法化实现(如目标设定、动态反馈、动机性访谈)、以及 Ecological Momentary Interventions(EMI)框架下的即时适应性干预。部分研究还采用大型语言模型(LLM)增强对话能力,并纳入来自一般成人、超重/肥胖人群和老年群体的样本队列进行效果验证。

3.1 纳入研究的特点

纳入的8项研究发表年份介于2013至2025年间,涵盖多种研究设计,包括随机对照试验(RCT)、准实验研究、因子实验和可行性研究。地理分布广泛,涉及澳大利亚、新西兰、美国、新加坡、英国和荷兰。样本量从28到954不等,参与者包括健康成年人、超重/肥胖人群和老年人,以女性为主。

3.2 干预措施的特征

AIVA的表现形式多样,包括聊天机器人、虚拟教练和会话代理,通过消息平台、在线门户或定制化应用程序交付。干预时长从7天到12个月不等,交互频率包括每日更新、每周总结和实时情境化提示。这些干预整合了多种行为改变技术,如目标设定(goal setting)、行动规划(action planning)、实验性学习(experimenting)和动态反馈(dynamic feedback)。值得注意的是,部分系统还采用具身会话代理(Embodied Conversational Agents, ECA)设计,通过人性化形象、社交对话和同理心表达等关系要素增强用户参与。

3.3 结局测量方式

研究采用主客观结合的方式评估干预效果。客观指标包括通过加速度计、活动追踪器测得的日均步数、中高强度身体活动(MVPA)时间和身体活动能量消耗(PAEE);主观指标则借助国际身体活动问卷(IPAQ)、Active Australia Survey等自评工具。此外,部分研究还记录了体重、BMI、血压等生理指标,以及动机、自我效能感、参与度和用户满意度等心理和行为结局。

3.4 干预的有效性与局限性

多项研究报告了AIVA对身体活动水平的积极影响。例如,To等人发现干预6周后每日步数显著增加(平均差+1686步/天);Maher等人注意到MVPA的改善以及体重、腰围的下降;Bickmore等人也观察到短期内步数上升,尽管效应在12个月后减弱。此外,关系型聊天机器人(如具有个性化问候和共情回应功能)表现出更高的用户参与度和满意度。然而,结果并不一致:Hajna等人和Collombon等人均未发现干预组与对照组在PAEE或MVPA上的显著差异,提示效果可能受人群特征、干预时长和技术可用性调节。更重要的是,这些研究普遍存在方法学局限,如样本量小、缺乏对照组、随访期短、技术故障等,限制了结论的稳健性。

3.5 质量评估结果

使用RoB 2和ROBINS-I工具评估显示,随机研究中三篇存在“高风险偏倚”,两篇有“一些担忧”;非随机研究中两篇为“严重风险偏倚”,一篇为“关键风险偏倚”。主要问题涉及随机化过程缺失、结果选择性报告和混杂控制不足。
本研究通过系统总结现有证据,表明AIVA在促进身体活动方面展现出显著潜力,尤其体现在可扩展性、用户自主性和参与度上。这些工具成功整合了多种经过验证的行为改变技术,能够提供传统人工干预难以实现的实时、个性化支持。然而,当前证据也存在明显异质性和方法学缺陷,效应量中等到微弱,长期效果维持仍不确定。与传统策略相比,AIVA缺乏人际互动的深度和情感适应性,但在可及性和成本效益上优势突出。
未来研究应优先采用更严谨的设计(如大样本RCT)、延长随访时间、探索混合干预模式(结合人力与AI要素),并关注伦理问题(数据隐私、算法透明性)和不同人群(如老年人、低数字素养者)的可及性。总之,AIVA有望成为身体活动促进领域的补充工具,尤其适用于大规模公共卫生项目,但需进一步优化技术可靠性和个性化能力才能真正发挥其变革性影响。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号