当前位置:首页 > 今日动态 > 科研动态/国外
  • 一种用于视觉语言模型(VLM)集成型真实世界自动驾驶的层次化测试平台

    摘要 视觉语言模型(VLMs)由于其强大的多模态推理能力,在自动驾驶领域展现了巨大的潜力。然而,将VLMs从通用数据适配到对安全性要求极高的驾驶场景中时,会遇到一个显著挑战,即“领域迁移”问题。现有的基于仿真和数据集的评估方法难以准确再现现实世界的复杂性,缺乏可重复的闭环评估机制和灵活的情景操控能力。此外,当前的真实世界测试平台通常只关注独立的模块,无法与基于VLM的系统进行全面的交互。因此,亟需一种能够整合感知、规划和控制模块的综合性测试架构,以支持基于VLM的系统的测试,并能够配置多样化的真实世界测试场景。在本文中,我们提出了一个专门用于严格评估集成VLM

    来源:ACM Transactions on Internet of Things

    时间:2025-11-08

  • ForenThings:一个用于物联网取证中犯罪现场重建的交互式框架

    摘要在物联网(IoT)平台上,设备和传感器可以通过智能应用程序进行交互,这些应用程序利用用户预先配置的自动化设置,从而产生大量的潜在取证数据。现有的物联网取证方法可以通过静态代码分析和仪器技术来确定智能环境中特定活动的相关数据来源。然而,像SmartThings这样的新型物联网平台不再在其基础设施上运行应用程序代码,这使得现有的物联网取证解决方案无法访问源代码。为了解决这一难题,本文介绍了ForenThings,这是一个用于智能环境中的犯罪现场重建的交互式框架。其主要思想是将每个物联网设备和智能应用程序转换为一个响应式代理,使它们能够协同参与安全事件的取证调查。ForenThings不是依赖静

    来源:ACM Transactions on Internet of Things

    时间:2025-11-08

  • EvoRL:一个基于GPU加速的进化强化学习框架

    摘要进化强化学习(EvoRL)通过将进化计算(EC)范式与强化学习(RL)相结合,成为一种克服传统强化学习局限性的有前景的方法。然而,EC基于种群的特性显著增加了计算成本,从而限制了在大规模环境中的算法设计选择和可扩展性。为了解决这一挑战,我们推出了EvoRL,这是第一个针对GPU加速进行优化的端到端EvoRL框架。该框架在整个训练过程中都在加速器上执行,包括环境模拟和EC过程,通过向量化及编译技术实现层次化并行处理,从而大幅提升训练速度和可扩展性。这种设计使得在单台机器上高效训练大规模种群成为可能。除了注重性能外,EvoRL还提供了一个全面的EvoRL研究平台,涵盖了传统RL算法(如A2C、

    来源:ACM Transactions on Evolutionary Learning and Optimization

    时间:2025-11-08

  • 通过欺骗来建立信任?生成式人工智能的社会暗示对人们感知到的信任度的影响

    摘要像ChatGPT这样的生成式人工智能系统越来越多地被用于协助完成任务或获取信息。由于这些系统在生成内容方面的可靠性并不完美,人类用户需要谨慎判断可以对这些系统信任到何种程度(即所谓的“校准信任”)。然而,基于媒体方程的假设,可以推测系统展示的社会线索可能会引发超出实际需要的信任感。基于这一背景,本研究采用2x2被试间设计(N=617)探讨ChatGPT使用的“打字行为”和“个性化称呼”这两种社会线索是否能够提升用户对系统的信任感(包括善意、能力和诚信方面),以及这种效应是否受到感知相似性的影响,并是否受到拟人化倾向的调节。研究结果表明,“打字行为”这一社会线索显著提升了用户对系统善意方面的

    来源:ACM Transactions on Interactive Intelligent Systems

    时间:2025-11-08

  • 从外周生理信号中识别情绪:趋势、挑战与机遇的系统性综述

    摘要人机交互系统的适应性和直观性通过情感识别能力得到了提升,而情感识别技术的快速发展要求进行更新和更全面的调研。在这项综合研究中,我们筛选出了至少使用三种外周生理信号(皮肤电反应、心率和呼吸信号)中的一种的论文,共收集到386篇论文和448项研究。这些研究是按照整个情感识别流程进行评估的,而不仅仅基于信号类型和识别方法,这与以往的相关研究有所不同。通过这项研究,我们发现了情感识别领域在不同方面的趋势、挑战和机遇。研究发现,多模态方法因能够利用互补的生理信息而在该领域占据主导地位。用于引发情感的方法往往具有动态性,并正朝着实际应用方向发展。为了促进这类应用的发展,应考虑构建新的数据集。例如,可以

    来源:ACM Transactions on Interactive Intelligent Systems

    时间:2025-11-08

  • DiffGaze:一种用于模拟360°图像上人类细致注视行为的扩散模型

    摘要在360度图像上对人类注视行为进行建模对于各种人机交互应用非常重要。然而,现有方法仅限于预测离散的注视序列或聚合的显著性图,从而忽略了诸如眼跳运动等精细的注视行为,而这些行为可以通过商用眼动追踪器捕捉到。我们提出了一项更具挑战性的任务——精细注视序列生成。该任务旨在为给定的刺激生成类似眼动追踪器的数据。我们提出了DiffGaze,这是一种基于扩散的方法,用于在360度图像的基础上生成真实且多样的精细人类注视序列。我们在两个360度图像基准测试中评估了DiffGaze的性能,这两个测试分别针对精细注视序列生成以及两个下游任务:路径预测和显著性预测。评估结果表明,DiffGaze在所有任务中都

    来源:ACM Transactions on Interactive Intelligent Systems

    时间:2025-11-08

  • Urania:用于基于自然语言的数据探索的数据分析流程可视化工具

    摘要探索性数据分析(EDA)是检查新数据集的一个重要但繁琐的过程。为了便于进行这一过程,自然语言界面(NLIs)可以帮助人们通过数据导向的问题直观地探索数据集。然而,现有的NLIs主要侧重于提供问题的准确答案,很少有界面提供数据分析流程的解释或展示。这样的展示对于EDA至关重要,因为它们增强了答案的可解释性和可靠性,同时帮助用户理解分析过程并从中获得见解。为了填补这一空白,我们推出了Urania,这是一个能够可视化用于解决输入问题的数据分析流程的自然语言交互系统。它结合了一个自然语言界面,允许用户通过问题来探索数据,以及一种新颖的数据感知问题分解算法,该算法将每个输入问题分解为一个数据分析流程

    来源:ACM Transactions on Interactive Intelligent Systems

    时间:2025-11-08

  • “不要被外表所迷惑”:揭示用户在社交人机交互中的期望与体验

    摘要预计社交机器人在社会各个领域的应用将会逐渐增加。因此,研究用户期望在长期与这些机器人互动过程中所起的作用以及这些期望如何影响用户体验是必要的。采用解释性和基于洞察力的方法,我们的目标是探究人类与配备了OpenAI GPT-3语言模型的社交机器人Pepper进行面对面互动时的体验。我们从31名参与者那里收集了62段与Pepper互动的视频记录以及后续访谈的定性数据,并应用了体验性反思主题分析法。主要研究发现包括不同层次的互动质量、多种互动策略,以及影响用户期望和体验的因素,这些因素被综合成一个连贯的框架。结果表明,参与者会根据自己的期望和他们对机器人能力的认知来调整互动策略,从而影响他们的体

    来源:ACM Transactions on Human-Robot Interaction

    时间:2025-11-08

  • 老年人在社交多机器人互动中对不同智能水平机器人的认知

    摘要社交机器人为支持老龄化社会带来了巨大潜力,然而它们如何融入老年人的生活仍需要大量研究。现有研究探讨了影响老年人对机器人态度的多种因素,但很少有研究直接干预他们对机器人智能的认知。我们认为,老年人可能在技术使用方面缺乏信心,因此对机器人的能力表现更为敏感,而这正是他们信任和接受机器人的基础。本研究采用“人-多机器人”交互模式,将社交互动置于一个同时包含人机交互和机器人间交互的群体环境中。与仅关注二元交互或单独使用多个机器人提供互补辅助的研究不同,我们在一个结构化的实验中模拟了群体(三方)互动,参与者需同时与两个具有不同认知能力的社交机器人进行认知游戏。这种设计旨在通过机器人之间的比较来影响老

    来源:ACM Transactions on Human-Robot Interaction

    时间:2025-11-08

  • 通过主动信息收集对人群进行内部状态估计

    摘要准确估计人类的内在状态(如人格特征或行为模式)对于提高人机交互的有效性至关重要,尤其是在多智能体环境中。这些见解在从社交导航到自闭症诊断等各种应用中都具有重要意义。然而,以往的方法受到可扩展性和被动观察的限制,使得在复杂的多人环境中进行实时估计变得困难。在这项工作中,我们提出了一种用于人群中主动估计人类人格的实用方法,重点关注与自闭症谱系障碍(ASD)相关的应用。我们的方法结合了基于艾森克三因素理论的人格条件行为模型,以及一种通过滚动时域规划器触发人类行为的主动机器人信息收集策略。然后通过贝叶斯推理更新机器人对人类人格的认知。我们通过仿真验证概念研究、与普通成年人的用户研究以及涉及ASD参

    来源:ACM Transactions on Human-Robot Interaction

    时间:2025-11-08

  • “这个机器人应该为我编程”:用户测试评估一款用于帮助老年人融入社会的远程呈现机器人

    摘要远程呈现机器人能够促进老年人与远距离社交联系者之间的沟通,从而有助于他们的社会融入。本实验室测试研究探讨了老年人成功使用远程呈现机器人的情况(研究问题1,RQ1),以及他们对使用该机器人的满意度(RQ2)、易用性感知(RQ3)、实用性感知(RQ4)、社交存在感感知(RQ5)以及长期使用该机器人进行机器人中介沟通(RMC)的意愿(RQ6)。研究采用了半结构化访谈、观察和问卷调查方法,对象为14位居住在德国的老年人。参与者分别完成了导航任务(作为远程用户)和人际沟通任务(作为本地用户)。结果显示,老年人在执行这些任务时能够成功使用远程呈现机器人(RQ1)。此外,在访谈中,他们普遍表示对使用该机

    来源:ACM Transactions on Human-Robot Interaction

    时间:2025-11-08

  • AI解释的包容性设计:仅仅是为那些之前被忽视的人服务吗?

    摘要动机:可解释人工智能(XAI)系统旨在提升用户对人工智能的理解,但相关研究显示,许多XAI解释措施对某些用户有帮助,而对另一些用户则无效。在非AI系统中,软件开发者采用包容性设计方法来解决类似问题,有时能够创造出既惠及弱势群体也惠及其他用户的改进方案。这表明包容性设计方法也可能为AI解释带来类似的改进效果。目标:我们的研究旨在探讨一个AI产品团队在采用包容性设计方法(GenderMag)改进其XAI原型时所产生的潜在效果。方法:我们进行了一项涉及69名无AI背景参与者的实验。其中34名参与者使用原始版本的XAI原型,其余参与者使用经过改进后的版本。随后我们比较了两组参与者在概念理解方面的得

    来源:ACM Transactions on Interactive Intelligent Systems

    时间:2025-11-08

  • 利用智能手机上的位置传感器数据实现跨平台预测抑郁症治疗效果

    摘要摘要目前,抑郁症的治疗依赖于密切监测患者对治疗的反应,并根据需要调整治疗方案。然而,使用自我报告或医生填写的问卷来监测治疗反应存在主观性、成本较高以及回忆偏差等问题。在本文中,我们探讨了利用智能手机上被动收集的位置感知数据来预测治疗结果的可能性。为了解决Android和iOS这两种主流智能手机平台上数据收集的异质性问题,我们采用了领域适应技术将它们的数据映射到一个共同的特征空间,然后联合使用这些数据来训练机器学习模型。我们进一步探索了将对比学习与领域适应相结合的方法,以增强数据质量和学习特征嵌入。这些学习到的特征嵌入随后被用来训练机器学习模型,以预测抑郁症的治疗结果。评估结果显示,通过结合

    来源:ACM Transactions on Intelligent Systems and Technology

    时间:2025-11-08

  • 通过语言模型的伪微调在区块链上匹配账户

    摘要基于区块链技术的Web 3.0注重用户隐私和自主权,为金融系统带来了新的机遇,同时也增加了对非法活动的监管难度。在这项研究中,我们提出了一种名为“伪微调”(Pseudo Fine-tuning,简称PFT)的新基础设施,该基础设施能够提供账户匹配服务,以打击基于账户的区块链上的金融犯罪,例如通过洗钱服务进行的资金混兑。PFT的重要性在于它克服了在账户匹配过程中对真实标签的需求,因为可用于该任务的标记账户对数量有限。具体而言,我们的设计包括:(1)从不同时间段内的账户交易中生成伪标记对;(2)对语言模型进行微调,以从这些伪标记对中提取可转移到目标任务的知识。我们进行了深入分析,研究了伪微调过

    来源:ACM Transactions on Intelligent Systems and Technology

    时间:2025-11-08

  • 一种针对大型语言模型的改进自回归评估范式

    摘要自ChatGPT问世以来,人工智能领域见证了多种聊天风格的大型语言模型(LLMs)的出现。尽管在这一领域取得了显著进展,但评估这些模型仍然是一个重大挑战。人类或GPT-4这样的“预言机”所提供的评估结果常被视为黄金标准,但这些方法既不自动化也不具备可扩展性。最近,一系列基于LLMs的评估模型(开源)被引入,但它们往往存在模型特定的偏见,例如,LLaMA系列的评估模型更倾向于偏好同系列的模型。另一方面,自回归评估指标虽然有可能解决上述问题,但目前仍尚未得到充分探索。其中,基于似然的指标(如困惑度(perplexity)和负对数似然(NLL)被广泛采用,并且在跟踪LLMs的预训练进度方面证明了

    来源:ACM Transactions on Intelligent Systems and Technology

    时间:2025-11-08

  • EmbodiedFly:一种基于自主可重构无人机的具身大型语言模型(LLM)代理

    摘要大型语言模型(LLMs)在推理和生成数字内容方面展现了类似人类的强大能力。然而,它们自由感知、交互和操控物理世界的能力仍受到三个根本性挑战的限制:(1)物理环境需要针对不同任务使用专门的传感器,但为每个应用部署专用传感器并不现实;(2)感兴趣的事件和物体通常位于大空间中的小范围内,这使得使用静态传感器网络难以检测到它们;(3)基础模型需要具备灵活的操控能力才能与物理世界进行有意义的交互。为了解决这一差距,我们提出了EmbodiedFly,这是一个结合了基础模型框架和可重构无人机平台的具身LLM代理,用于观察、理解和与物理世界互动。我们的协同设计方法包括:1)一个FM协调框架,用于连接多个L

    来源:ACM Transactions on Internet of Things

    时间:2025-11-08

  • WMTP:一种用于自动驾驶的小波-Mamba轨迹预测器

    摘要车辆轨迹对自动驾驶至关重要。相对分散的轨迹数据点使得在空间和时间维度上建模运动的连续性变得困难。此外,从轨迹中识别车辆的驾驶模式也是一个重大挑战。这些隐含的特征模式难以从复杂的轨迹数据中分辨出来。为了解决这些问题,我们提出了一个名为Wavelet-Mamba Trajectory Prediction(WMTP)的新框架,该框架结合了小波分析和状态空间建模,以捕捉驾驶模式的整体趋势以及车辆运动的细节。该方法使用离散小波变换(DWT)将轨迹数据分解为不同时间和频率下的小波系数,然后利用这些系数通过逆离散小波变换(IDWT)生成轨迹。我们提出了一种编码器-解码器神经架构,用于从输入的轨迹序列中

    来源:ACM Transactions on Internet of Things

    时间:2025-11-08

  • SA-MBKT:基于替代模型的多技能贝叶斯知识追踪

    摘要知识追踪(Knowledge Tracing,KT)是教育数据挖掘中的一个基本任务,主要关注追踪学生技能的动态知识状态。贝叶斯知识追踪(Bayesian Knowledge Tracing,BKT)因其良好的可解释性而得到了广泛的研究和应用,它使用隐马尔可夫模型(hidden Markov model)来模拟学生的答题过程。传统的BKT方法在每个问题中只考虑一项技能。为了解决这一限制,我们在之前的工作中提出了一种基于进化算法的多技能贝叶斯知识追踪(Multi-skills Bayesian Knowledge Tracing,MBKT)方法。MBKT采用进化算法作为BKT的优化方法,使其能

    来源:ACM Transactions on Evolutionary Learning and Optimization

    时间:2025-11-08

  • 强化学习辅助的多阶段进化约束多目标优化

    摘要多阶段进化算法将种群进化过程划分为多个阶段,在受限多目标优化问题中展现了其有效性。现有算法中的进化阶段通常在优化之前由人工确定,这显著影响了算法解决各种问题的性能。为了解决这一问题,提出了一种基于强化学习的阶段确定策略。具体而言,进化过程被划分为多个阶段,强化学习在优化过程中动态确定这些阶段。此外,还开发了一种包含两个候选进化阶段的进化算法,以验证所提出策略的有效性。在基准测试和实际问题上的实验结果表明,该算法优于现有的最先进算法。

    来源:ACM Transactions on Evolutionary Learning and Optimization

    时间:2025-11-08

  • Survival-LCS:基于规则的生存分析,不依赖于比例风险假设

    摘要生存分析被广泛用于生物医学、流行病学和工程学领域中,以建模事件发生的时间数据。然而,传统的生存分析方法(如Cox回归)存在较强的假设限制,例如假设风险比例恒定,这些方法往往无法充分捕捉高维数据或异质数据中的复杂非线性关系。基于规则的机器学习算法(如‘ExSTraCS’)能够在分类任务中清晰地建模复杂的生物医学关联。本研究将ExSTraCS扩展到右删失生存数据的分析中,开发出了‘Survival-LCS’——这是一种基于规则的生存分析算法,它能够处理异质特征类型和缺失值,并且不对基线风险或生存时间分布做出任何假设。通过使用综合布里尔分数(Integrated Brier Scores)和统计

    来源:ACM Transactions on Evolutionary Learning and Optimization

    时间:2025-11-08


页次:2744/9734  共194674篇文章  
分页:[<<][2741][2742][2743][2744][2745][2746][2747][2748][2749][2750][>>][首页][尾页]

高级人才招聘专区
最新招聘信息:

知名企业招聘:

    • 国外动态
    • 国内进展
    • 医药/产业
    • 生态环保
    • 科普/健康