当前位置:首页 > 今日动态 > 科研动态/国外
  • MV-Crafter:一种用于音乐引导视频生成的智能系统

    摘要音乐视频作为一种常见的多媒体娱乐形式,为观众提供了引人入胜的视听体验,在歌手和粉丝中获得了极大的流行度。创作者可以通过视觉元素自然地表达他们对音乐的理解。然而,音乐视频的创作过程需要掌握剧本设计、视频拍摄以及音乐与视频同步等方面的技能,这对非专业人士来说是一个重大挑战。以往的研究已经设计了自动音乐视频生成框架,但这些框架存在输入复杂性和输出质量较差的问题。为了解决这些问题,我们提出了MV-Crafter系统,该系统能够生成具有同步音乐节奏和风格的高质量音乐视频。我们的方法包括三个技术模块:剧本生成模块、视频生成模块和音乐与视频同步模块。MV-Crafter利用大型语言模型来生成考虑音乐语义

    来源:ACM Transactions on Interactive Intelligent Systems

    时间:2025-11-07

  • XAI的缺陷:影响人工智能辅助决策的各种现象

    随着人工智能(AI)在高风险决策场景中的广泛应用,人机交互领域开始探索可解释性AI(XAI)以提升AI建议的可理解性。然而,目前的研究主要关注AI建议本身的准确性对决策者行为的影响,而忽视了不准确解释的潜在影响。此外,已有研究表明,不仅不同的解释模态会影响决策者,人类因素也扮演着关键角色。本文旨在通过概念化适当依赖理论,并首次提出实证研究,分析影响人机协作的关键因素。研究发现,不完美的XAI会影响人类对AI的依赖程度以及人机团队的绩效,同时认知风格也会影响决策者在不同解释模态下的表现。因此,本文揭示了多种影响人机协作的因素,并为设计师提供了如何根据个体需求定制人机协作系统的指导。人工智能的引入

    来源:ACM Transactions on Interactive Intelligent Systems

    时间:2025-11-07

  • 提升密码集成电路的侧信道抗性:一种用于自动识别和保护泄漏路径的形式化框架

    摘要侧信道分析(SCA)攻击对加密集成电路(ICs)构成了重大威胁。尽管设计人员在集成电路开发阶段努力引入了各种对策,但其中许多解决方案在面积、功耗和性能方面带来了显著的开销。此外,它们通常需要完全定制的电路设计才能有效部署。这一问题的产生是由于缺乏系统化的方法论和分析工具,使得电路设计人员无法准确识别硬件设计中的侧信道泄漏源。在本文中,我们提出了侧信道追踪逻辑的概念,并在此基础上构建了一个新型框架,该框架能够无缝集成到商业设计流程中,自动识别并保护存在泄漏的路径。我们的方法首先通过动态相关性分析确定表现出最高信息泄漏的部分逻辑单元。随后,基于形式化的方法构建了以这些单元为中心的完整泄漏路径。

    来源:ACM Transactions on Embedded Computing Systems

    时间:2025-11-07

  • 基于深度Q学习的无线供电通信网络中移动充电器路径规划

    摘要无线供电通信网络(WPCN)是一种新范式,它使得低功耗无线设备能够交换数据包,并从电源接收稳定的能量传输,从而支持无需更换电池的自主和可持续网络运行。近年来,我们见证了WPCN在工业和消费物联网系统中的日益广泛应用,以支持基于时间触发和事件触发的监控应用。在本文中,我们提出了一种基于强化学习(RL)的按需路径规划框架,用于规划移动充电器(MC)的轨迹并安排无线设备的充电顺序,以维持网络运行。我们设计了一种改进的深度Q学习方法,通过平衡设备的剩余能量水平与设备到MC的距离来为无线设备充电。该方法在确保一组设备的剩余能量超过指定阈值的同时,最小化了MC的总行驶距离。来自基于Gazebo的高保真

    来源:ACM Transactions on Embedded Computing Systems

    时间:2025-11-07

  • 一种具有符号幅度表示法和双加法树的精确可扩展加速器

    摘要目前,有两种主流的加速方法:一种是混合精度(mixed precision),另一种是稀疏性(sparsity)。很少有加速器同时支持混合精度和稀疏性,而且大多数加速器只能在不同层之间配置精度,而无法在同一层内进行精度调整。此外,大多数加速器采用传统的二进制补码(2C)数据表示方法,我们发现这种表示方法在表示有符号数据时会生成许多无效的“1”,这不仅增加了混合精度的计算开销,还导致许多位级稀疏操作变得无效。因此,我们提出了一种高效加速器,该加速器采用了精度可扩展的符号-幅度处理单元(Sign-Magnitude Processing Element,简称SM-PE),这种单元采用了一种新的

    来源:ACM Transactions on Embedded Computing Systems

    时间:2025-11-07

  • 人机团队中动态情境感知的框架:一项访谈研究

    人类与机器人团队协作中的情境意识是一个关键的领域,尤其是在动态环境中。情境意识(Situational Awareness, SA)通常被定义为个体对环境要素的感知、对这些要素的理解以及对未来状态的预测能力。在人类与机器人团队(Human-Robot Teaming, HRT)中,情境意识被认为是成功协作的基础。然而,传统的观点认为,最佳的情境意识是知道一切,这种假设在实际操作中是存在问题的,因为情境意识的需求会随着环境条件、任务背景和团队成员的角色与能力而变化。本文通过访谈16位具有丰富和重复经验的HRT参与者,探讨了情境意识的动态性,并提出了一个框架,用于解释在HRT中所需情境意识的动态变

    来源:ACM Transactions on Human-Robot Interaction

    时间:2025-11-07

  • 你期待什么呢?将刻意保持积极的态度作为一种有前景的策略,用于对话型人工智能系统

    ### 深度解读:以积极对话促进老年人长期使用智能对话代理随着全球老龄化趋势的加剧,开发能够帮助老年人维持独立性的技术变得愈发重要。其中,对话代理(Conversational Agents, CAs)作为一种新兴的智能交互系统,展现出了巨大的潜力。语音技术尤其在这一领域具有显著的优势,因为它具备良好的可访问性和使用便捷性,能够成为老年人日常生活中不可或缺的助手。然而,尽管这些技术在社交互动方面可能有所帮助,但它们在长期用户参与和使用方面的挑战仍然存在。为此,本研究探索了一种替代性的对话策略,旨在通过鼓励用户进行积极的反思和情感表达,从而提升他们的使用体验和持续使用意愿。#### 研究背景与意

    来源:ACM Transactions on Interactive Intelligent Systems

    时间:2025-11-07

  • 基于多面体和的快速动态拍卖算法及其在瓦拉西亚均衡中的应用

    引言与经济模型本研究聚焦于计算瓦拉西亚市场均衡的计算和结构方面。考虑一个市场,其中包含一组具有拟线性效用(quasi-linear utilities)的买家,他们有兴趣购买一组商品。主要目标是找到商品的分配以及商品的价格,这些价格应满足以下属性:每个买家获得一个偏好捆绑(preferred bundle),即在该给定价格下最大化其效用的物品集合;没有商品被超额售出;所有商品都被售出;并且该分配是帕累托最优的(Pareto-optimal)。属性1-3共同构成了瓦拉西亚均衡条件,巧合的是,它也意味着属性4,这通常被称为第一福利定理(First Welfare Theorem)。动态拍卖(dyn

    来源:ACM Transactions on Economics and Computation

    时间:2025-11-07

  • VoxDepth:在边缘设备上对深度图像进行校正

    深度图像在自主移动机器人领域扮演着至关重要的角色,例如三维重建和视觉SLAM(同时定位与建图)。然而,这些图像中存在不准确之处会严重限制应用效果,导致结果不理想。商业深度相机生成的图像常常伴有噪声,表现为闪烁像素和错误区域。基于机器学习(ML)的方法虽然在深度图像修复方面表现优异,但其计算需求较高,难以在计算资源有限的边缘设备上运行。而非ML方法则速度较快,但精度有限,尤其是在处理由遮挡和相机运动引起的误差时效果不佳。因此,研究一种既高效又准确的深度图像修复方法成为亟需解决的问题。为应对这一挑战,本文提出了一种名为VoxDepth的新方法。该方法适用于边缘设备,如NVIDIA Jetson N

    来源:ACM Transactions on Embedded Computing Systems

    时间:2025-11-07

  • 在拟阵秩估值下实现公平分配的通用框架

    ### 解读:General Yankee Swap 的公平资源分配框架在资源分配领域,公平性是一个关键问题,尤其是在分配不可分割物品时。本文提出了一种名为 **General Yankee Swap** 的简单算法框架,该框架能够在满足某些轻微条件的情况下,高效地计算出最大化多种公平性标准的分配方案。这项工作对资源分配的理论研究和实际应用都具有重要意义,尤其是在涉及权重(即优先级)的情况下。---### 背景与问题陈述资源分配问题通常涉及将有限数量的物品(如课程名额、社区活动、公共资源等)分配给多个参与者,这些参与者对物品有不同的偏好。由于物品不可分割,且数量有限,传统的市场机制(如金钱交易

    来源:ACM Transactions on Economics and Computation

    时间:2025-11-07

  • 一种查询效率高的算法,用于找出双人零和矩阵游戏中的所有纳什均衡

    在博弈论和计算复杂性理论的交叉领域,研究者一直致力于探索在有限信息下计算纳什均衡(Nash Equilibrium, NE)所需的最小查询次数。纳什均衡是博弈论中描述策略稳定性的重要概念,特别是在两人零和矩阵博弈中,它表示双方策略组合的最优解。随着研究的深入,学者们逐渐意识到,查询复杂性(即算法需要访问输入矩阵中的元素数量)与博弈的解集的大小密切相关。本文的主要贡献在于,通过引入一个更全面的解决方案大小定义,刻画了在两人零和矩阵博弈中寻找所有纳什均衡的查询复杂性。首先,我们回顾了现有的一些研究成果。Fearnley 和 Savani 的工作表明,对于任何随机算法,存在一个 $ n \times

    来源:ACM Transactions on Economics and Computation

    时间:2025-11-07

  • 一种针对公共交通站点调度问题的端到端解决方案

    公共公交交通系统为现代社区的许多部分提供了关键的运输服务,因此准时性和维护可靠的服务质量至关重要。然而,由于拥挤、车辆故障和道路事故等突发事件,常常导致服务质量下降。尽管交通管理部门会保留有限数量的备用车辆并在发生故障时调度这些车辆来缓解受影响的路线,但这一过程通常是临时的,并且需要依赖人工经验和直觉来在不确定性中分配资源。本文描述了一种使用非短期的顺序决策程序来解决这个问题的方法,以回答两个相互关联的决策问题:(a)是否应该预判问题并主动将公交车辆停放在高可能性发生中断的区域;(b)决定是否以及选择哪辆车调度到特定的问题。我们的方法是在与WeGo Public Transit,一家位于田纳西

    来源:ACM Transactions on Cyber-Physical Systems

    时间:2025-11-07

  • 《国际儿童保护科学杂志》(ICCPPS)第24期特刊前言

    1 引言信息物理系统(CPS)研究不断推动计算、通信和控制技术在安全关键型及大规模基础设施中的整合。作为CPS-IoT周活动的一部分,ACM/IEEE国际信息物理系统会议(ICCPS)长期以来一直是传播这些研究成果和促进跨学科交流的重要平台。本期特刊精选了一些原创论文,这些论文扩展了在2024年5月13日至16日于香港举行的第15届ACM/IEEE国际信息物理系统会议(ICCPS)上展示的成果。入选本期特刊的三篇论文均获得了该会议的优秀论文奖提名。这些论文涵盖了CPS研究的多个方面,体现了方法论的严谨性和实际应用的影响力。具体来说,我们很高兴介绍以下内容:—《利用自然对抗性数据集评估学习驱动型

    来源:ACM Transactions on Cyber-Physical Systems

    时间:2025-11-07

  • 使用自然对抗性数据集评估具备学习能力的医疗信息物理系统的鲁棒性

    摘要医疗信息物理系统(MCPS)越来越多地采用具有学习能力的组件(LECs)来提升其决策能力。由于MCPS的安全性至关重要,这些系统必须在预期和非预期的输入数据下都能保持高性能。因此,确保LE-MCPS的鲁棒性对于其成功部署至关重要。现有研究主要集中在对合成对抗样本的鲁棒性上,这些样本是通过在干净输入数据中添加难以察觉的扰动来创建的。然而,这些合成对抗样本并不能准确反映最具有挑战性的现实世界场景,尤其是在医疗数据领域。因此,对合成对抗样本的鲁棒性并不一定能够转化为对自然发生的对抗样本的鲁棒性。我们提出了一种评估LE-MCPS对自然对抗样本鲁棒性的方法。该方法利用从自动弱监督标注中获得的概率标签

    来源:ACM Transactions on Cyber-Physical Systems

    时间:2025-11-07

  • PhayaThaiBERT:通过未融合的借词来增强预训练的泰语模型

    在现代自然语言处理(NLP)领域,预训练语言模型(Pre-trained Language Models, PLMs)已经成为一种标准工具,尤其在Transformer架构的推动下。这些模型通常通过在大量未标注文本上进行预训练,然后在特定任务的标注数据上进行微调,以达到优异的性能表现。PLMs的应用范围非常广泛,从简单的文本分类到复杂的多模态任务,如图像描述生成和语音识别等。对于某些语言而言,尤其是那些在文本中频繁出现外来词汇的语言,PLMs的性能往往受到词汇表覆盖范围的限制。例如,泰国语在实际使用中经常包含未经过拼写同化处理的英文外来词,这给传统的PLMs带来了挑战。在泰国语处理方面,Wan

    来源:ACM Transactions on Asian and Low-Resource Language Information Processing

    时间:2025-11-07

  • 在智能电网基础设施中,通过分层联邦学习实现鲁棒性和丢弃公平性

    随着智能电网基础设施的快速发展,它为电力系统中计算机和网络技术的集成提供了更大的可能性。这一趋势使得机器学习(Machine Learning, ML)技术在智能电网中的应用变得愈发重要。然而,机器学习的实施通常需要大量的数据,而这些数据在智能电网环境中可能包含大量关于用户个人的敏感信息。为了解决这一隐私问题,研究者们开始探索分布式机器学习,特别是联邦学习(Federated Learning, FL),它通过模型共享而非数据共享的方式,在保护数据隐私的同时实现模型训练。本文提出了一种名为“智能电网分层联邦学习”(Smart Grid Hierarchical Federated Learni

    来源:ACM Transactions on Cyber-Physical Systems

    时间:2025-11-07

  • ADKGD:基于双通道训练的知识图谱异常检测

    摘要在当前大型语言模型(LLMs)的开发过程中,确保基础数据源的准确性和可靠性至关重要。LLMs 对各种应用都具有重要意义,但由于训练数据中的知识空白,它们常常会出现幻觉和不准确的情况。知识图谱(KGs)作为一种强大的结构化工具,可以作为缓解上述问题的关键外部信息来源。通过提供对现实世界数据的结构化和全面理解,KGs 提高了 LLMs 的性能和可靠性。然而,在从非结构化数据中提取三元组以构建 KGs 时,KGs 中通常存在错误,这可能导致问答系统和推荐系统等下游任务的性能下降。因此,对 KGs 中的异常进行检测以识别和纠正这些错误是必不可少的。本文提出了一种基于双通道学习(ADKGD)的知识图

    来源:ACM Transactions on Asian and Low-Resource Language Information Processing

    时间:2025-11-07

  • 考虑学生的认知能力——基于实体层面和整体层面的教学评价情感分析

    摘要学生教学反馈情感分析(STFSA)在评估教学效果方面起着至关重要的作用,其分析结果受到教学过程组织方式以及学生对课程认知程度的影响。然而,当前对学生反馈的情感分析在整合细粒度实体级情感和多极情感方面存在挑战。因此,我们提出了一种新的情感分析策略,用于实体级和整体级的教学评估情感分析,该策略考虑了学生的认知能力(EETSC)。该策略采用了两级网络:一层基于双重注意力机制的实体级网络,用于对学生反馈进行细粒度的情感分析;另一层为整体情感分析网络,该网络整合了学生的个性化认知能力,以调整不同实体的情感特征,从而在整体层面获得更准确、更合理的情感表达。实验结果表明,与现有的最佳方法相比,EETSC

    来源:ACM Transactions on Asian and Low-Resource Language Information Processing

    时间:2025-11-07

  • 迈向第二语言韩语的鲁棒形态句法分析:评估与微调韩语语言模型

    在当前的语言技术领域,自然语言处理(NLP)技术被越来越多地应用于第二语言(L2)研究中,以帮助分析学习者的语言使用情况。然而,尽管这些技术在某些领域表现优异,但它们在L2语境下的准确性仍然存在诸多挑战。本文通过研究一个韩国语言模型在L2-Korean文本中的表现,探讨了如何通过模型优化来提升对学习者语言的分析能力,并分析了学习者语言水平对模型性能的影响。这一研究不仅有助于理解NLP工具在L2语言处理中的局限性,也为改进相关模型提供了新的视角。### 研究背景与意义韩国语言以其复杂的形态结构而闻名,尤其是在句子构建过程中,功能词(如助词、后缀)和句法结构对语法功能的标记至关重要。韩国语是典型的

    来源:ACM Transactions on Asian and Low-Resource Language Information Processing

    时间:2025-11-07

  • 通过联邦雾计算实现高效车辆流动的多智能体深度强化学习

    摘要优化车辆等待时间对于智能交叉口管理系统至关重要,因为它直接影响交通流量、公共安全以及整个交通网络的表现。传统的紧急车辆管理方法依赖于静态规则,这些规则无法适应动态的交通状况。本文介绍了MADQL-FFC,这是一种结合了联邦雾计算的多智能体深度Q学习框架,用于实现交叉口的实时交通信号控制,并优先考虑紧急车辆。在该框架中,深度Q网络智能体被部署在各个交叉口以做出本地化决策,而联邦雾计算架构则用于智能体之间的信息共享,以实现协调决策。这种方法有助于在无需中央控制的情况下实现分散式、低延迟的交通网络协调。所提出的方法使用了基于印度瓜廖尔市OpenStreetMap数据的真实交通模拟在Simulat

    来源:ACM Transactions on Cyber-Physical Systems

    时间:2025-11-07


页次:2834/9720  共194396篇文章  
分页:[<<][2831][2832][2833][2834][2835][2836][2837][2838][2839][2840][>>][首页][尾页]

高级人才招聘专区
最新招聘信息:

知名企业招聘:

    • 国外动态
    • 国内进展
    • 医药/产业
    • 生态环保
    • 科普/健康