当前位置:首页 > 今日动态 > 科研动态/国外
  • 基于Transformer的结构感知双流网络用于低光照图像增强

    摘要在本文中,我们提出了一种基于Transformer的端到端双流网络,该网络能够实现低光照条件下的图像增强,并充分考虑图像的结构特征。首先,我们将双流网络分为主线流和结构流:主线流用于生成增强后的图像,并向结构流提供结构信息;结构流则负责从主线流中提取结构特征,为图像增强过程提供丰富的结构支持。其次,我们设计了一种结构门控Transformer(Structure-Gated Transformer),通过并行多头自注意力机制与卷积操作相结合(这些操作位于多层感知器之后),从而在双流网络的编码器部分有效提取图像的全局和局部结构特征。最后,我们开发了一个基于交叉注意力的特征融合模块,该模块将不

    来源:ACM Transactions on Multimedia Computing, Communications, and Applications

    时间:2025-11-07

  • 利用强化学习与近端策略优化进行自适应网络入侵检测

    随着互联网的普及和网络连接的增强,网络安全问题日益严峻,对高效、精准的入侵检测系统提出了更高的要求。本文提出了一种创新的网络入侵检测方法,将传统的机器学习(ML)与先进的强化学习(RL)技术相结合,通过动态调整集成模型中基础模型的权重,优化其在不同数据集上的表现。该方法利用Proximal Policy Optimization(PPO)算法,不仅提升了模型的准确性,还增强了其适应复杂攻击模式的能力。此外,模型还引入了Multi-Layer Perceptron(MLP)作为元学习器,进一步优化预测结果,从而在多个数据集上实现了显著的性能提升。### 1. 网络安全的重要性与挑战随着网络活动的

    来源:ACM Transactions on Privacy and Security

    时间:2025-11-07

  • 基于多臂老虎机的通信高效联邦神经协同过滤

    摘要联邦学习(FL)在保护隐私和构建负责任的推荐系统中受到了广泛关注。最近的研究表明,在将联邦学习应用于常用的推荐方法(如协同过滤)时取得了令人满意的结果。然而,将联邦学习投入实际应用中的一个主要障碍是:随着系统中项目数量的增加,模型复杂性或需要通过通信渠道传输的梯度量会呈线性增长。为了解决这一挑战,我们提出了一种通信效率较高的联邦推荐系统中的神经协同过滤方法。首先,为了使我们的解决方案与其他深度神经架构保持一致,我们在联邦环境中构建了标准的神经协同过滤模型。其次,为了解决模型复杂性的问题,我们采用了多臂老虎机框架,该框架能够智能地为每次联邦模型训练选择较少的数据量。项目选择基于精心设计的奖励

    来源:ACM Transactions on Recommender Systems

    时间:2025-11-07

  • UISA:用于商品推荐策略的用户信息分离架构与深度强化学习

    摘要商品推荐在人们的日常生活中扮演着重要角色。在这一背景下,深度强化学习方法在提升推荐系统性能方面展现了显著的效果。然而,一些推荐系统直接使用原始特征信息作为决策的基础,这种方法显得过于简单且效率低下。此外,引入序列决策机制进一步增加了推荐任务的复杂性。为了最大化推荐系统的长期序列回报,我们提出了一种名为“用户信息分离架构”(User Information Separating Architecture,简称UISA)的新架构。该架构专为与经典强化学习算法兼容而设计,旨在通过离散处理静态和动态用户信息来提取用户的兴趣值。通过与深度强化学习的结合,该架构旨在实现长期利润的最大化,并适用于序列推

    来源:ACM Transactions on Recommender Systems

    时间:2025-11-07

  • 关于推荐系统深度强化学习专题的引言

    摘要深度强化学习(DRL)作为一种有前景的方法,受到了广泛关注,用于开发智能且适应性强的推荐系统。这种范式特别适用于那些用户环境动态变化、反馈信号存在时间延迟以及用户偏好持续变化的推荐场景。然而,在推荐系统中应用DRL会带来一系列复杂的挑战,包括设计有意义且与任务相匹配的奖励函数、在庞大而复杂的动作空间中有效导航,以及在数据稀疏的环境中保持样本效率。确保训练过程的稳定性和鲁棒性也增加了难度。本期特刊汇集了一系列前沿研究,这些研究解决了这些紧迫问题,展示了推动该领域向更加适应性强、稳定性高且个性化推荐系统发展的进展。

    来源:ACM Transactions on Recommender Systems

    时间:2025-11-07

  • 通过双向转换学习鲁棒表示,用于视觉强化学习

    摘要 视觉强化学习在解决具有高维观测特征的控制任务中表现出有效性。然而,从基于视觉的观测中提取出可靠且可泛化的表示仍然是一个核心挑战。受到人类思维过程的启发,当从观测中提取的视觉表示能够预测未来并追溯历史时,该表示在理解环境状态方面是可靠且准确的。基于这一概念,我们提出了一个双向转换(BT)框架用于表示学习。该框架利用前向和后向环境转换的双向预测作为辅助任务来提取可靠的表示。此外,我们还引入了一个逆向动态模型来预测导致环境状态转换的动作,从而学习状态表示与任务的相关性。我们的方法在DeepMind Control套件的两个场景中展示了具有竞争力的泛化性能和样本

    来源:ACM Transactions on Multimedia Computing, Communications, and Applications

    时间:2025-11-07

  • 语言引导的视觉跟踪:全面而有效的多模态信息融合

    摘要当前的视觉语言跟踪器在全面且有效地融合多模态信息方面存在困难,导致在多模态任务中的性能不佳。本研究介绍了LGTrack,这是一种新颖的基于语言的视觉跟踪框架,旨在实现更全面、更高效的视觉与语言信息融合。在编码阶段,提出了一个增强型多模态交互模块(Enhanced Multimodal Interaction Module),以实现完全的多模态融合,并利用该模块构建了早期语言多层次引导的多模态编码(Early Language Multilevel-guided Multimodal Encoding),该编码方法利用深度语义信息对视觉编码进行早期和多层次的引导。在解码阶段,提出了一种基于联

    来源:ACM Transactions on Multimedia Computing, Communications, and Applications

    时间:2025-11-07

  • IDPA:针对基于对比学习的预训练编码器的无差别数据投毒攻击

    摘要无差别数据投毒攻击对无监督学习具有很高的效果。然而,最近的研究表明,对比学习也容易受到数据投毒攻击的影响。在这种攻击方式中,攻击者会在干净的预训练数据集中添加恶意数据。本文提出了一种名为IDPA(Indiscriminate Data Poisoning Attack)的攻击方法,专门针对对比学习中的编码器进行攻击,其目标是直接破坏预训练的编码器。任何干净样本与被攻击样本的特征向量之间会表现出高度相似性,导致下游分类器将干净样本错误地分类为攻击者指定的样本。因此,本文将IDPA构建为一个双重优化问题,并定义了两个损失函数:攻击效果损失和模型效用损失。这两个损失函数分别对应于有效破坏预训练编

    来源:ACM Transactions on Privacy and Security

    时间:2025-11-07

  • 粗棉布:现实世界漏洞的零知识证明

    在现代软件开发中,安全性问题一直是一个重要挑战。当安全分析师发现关键软件系统中的漏洞时,他们面临着一个两难的局面:立即公开漏洞可能会对用户造成伤害,而仅向软件供应商披露则可能导致供应商忽视或优先级较低地处理安全风险,从而损害无意中受影响的用户。为了解决这一问题,近年来的研究工作提出了使用零知识(Zero-Knowledge,ZK)协议的方法,使得分析师可以在不透露漏洞细节或利用输入的情况下,证明他们知道漏洞的存在。然而,现有的ZK漏洞证明方法在规模和表达能力方面仍存在局限,主要是由于生成能够准确建模现实软件的证明语句以及直接表述违反性质的挑战。本文介绍了一种名为Cheesecloth的新颖证明

    来源:ACM Transactions on Privacy and Security

    时间:2025-11-07

  • Swarm:一种基于分布式账本的框架,利用ADS-B协议提升空中交通控制的安全性

    ### 无人机交通管理与区块链技术的融合:Swarm框架随着航空交通的快速增长,传统的雷达监控系统已显现出一定的局限性。为了提高监控精度并管理更多的飞行器,航空交通管制(ATC)系统正逐步转向基于卫星定位的自动相关监视广播(ADS-B)协议。ADS-B协议的开放设计虽然促进了信息共享,但同时也导致了安全漏洞,例如数据篡改、伪造位置信息和网络攻击等。为了解决这些问题,本文提出了Swarm框架,该框架基于分布式账本技术(DLT),旨在提升ADS-B系统的安全性,同时避免单点故障。Swarm框架的核心目标是通过分布式节点之间的协作,确保飞行器数据的准确性和完整性。它不依赖于单一的中心化认证机构,而是

    来源:ACM Transactions on Privacy and Security

    时间:2025-11-07

  • 利用零样本视觉-语言模型以及任务感知对象检测器的引导进行视频火灾识别

    火的检测在图像和视频中已成为近年来备受关注的研究领域,主要由于其应用的高重要性。随着技术的进步,许多可靠的实时检测器和高效的检索技术被开发出来,以处理由传感器网络收集的大量数据。尽管人工视觉方法的可靠性在过去几年有所提高,但仍然存在一些尚未解决的问题,尤其是在训练场景与实际场景不一致时,这些方法往往表现出较差的泛化能力。为了应对这一挑战,研究者们开始探索结合上下文信息的方法,特别是利用视觉语言模型(Vision-Language Models, VLMs)来理解并描述图像中的场景。本文提出了一种名为 FIRE-TASTIC 的新框架,该框架通过结合目标检测器与视觉语言模型,实现了对火灾的可靠检

    来源:ACM Transactions on Multimedia Computing, Communications, and Applications

    时间:2025-11-07

  • 通过安全多方计算进行支持向量机的隐私保护训练

    摘要机器学习的强大功能和普遍应用要求采取安全措施来保护敏感数据。安全多方计算(MPC)技术允许一组参与者在保持信息私密性的同时共同计算某个给定的函数。在这项工作中,我们设计了一个使用MPC技术私下训练支持向量机(SVM)的原型。我们深入研究了不同的SVM训练方法与现有最先进的MPC协议之间的相互作用,发现最小二乘(LS)方法是私下训练的最佳选择。随后,我们优化了定点精度,以确保在保持低运行时间和通信量的同时提高准确性。优化的技术细节涉及求解线性系统时梯度方法的步长限制,这可能具有独立的学术价值。我们进一步提出并分析了多种改进LS方法的方案,并比较了它们的性能。最佳改进方案使运行时间和通信复杂度

    来源:ACM Transactions on Privacy and Security

    时间:2025-11-07

  • 基于Rocq形式化验证的s-有限核概率编程语言语义建模研究

    数学基础与形式化背景概率编程语言(Probabilistic Programming Language, PPL)的语义建模需要坚实的测度论基础。在测度理论中,σ-代数(σ-algebra)是集合上满足包含空集、补集和可数并封闭的子集族。测度(measure)则是定义在σ-代数上的非负函数,满足空集测度为零和可数可加性。有限测度要求全空间测度有限,当全空间测度为1时称为概率测度。s-有限测度(s-finite measure)是关键概念,它可以表示为可数有限测度序列的和。MathComp-Analysis库为Rocq证明助手提供了测度与积分理论的形式化基础。该库定义了可测类型(measurab

    来源:ACM Transactions on Probabilistic Machine Learning

    时间:2025-11-07

  • Turing.jl:Julia语言中的概率编程系统及其在生命科学建模中的应用与进展

    Turing.jl的概率编程范式与架构设计Turing.jl作为Julia语言生态中的概率编程语言(Probabilistic Programming Language, PPL),其核心设计理念是通过声明式语法将概率模型规范与推断算法实现分离。该系统采用@model宏实现非侵入式模型定义,用户只需编写标准的Julia函数即可描述生成过程。例如线性回归模型可通过y ~ Normal(x' * β + γ, σ)语句直观表达,其背后通过DynamicPPL.jl将~操作符转换为assume(假设)、observe(观测)或fix(固定)三种指令,分别对应先验分布、似然函数和确定性变量操作。系统的

    来源:ACM Transactions on Probabilistic Machine Learning

    时间:2025-11-07

  • 通过按需视觉增强提升文本问答能力

    在文本问答(Textual Question Answering, TQA)领域,尽管过去十多年的研究已经取得了显著进展,但仍然存在许多挑战。传统上,TQA模型主要依赖于文本信息,通过自然语言处理技术来提取答案。然而,随着人工智能的发展,特别是Transformer网络和预训练模型的引入,这一领域的进展有了质的飞跃。尽管如此,一个被忽视的重要环节是外部视觉信息的整合。在本研究中,我们提出了一种新颖的TQA方法,称为“按需文本问答”(On-Demand Textual Question Answering, OD-TQA),通过引入按需视觉基础,提升机器对问题的理解能力,从而增强答案的相关性和准

    来源:ACM Transactions on Multimedia Computing, Communications, and Applications

    时间:2025-11-07

  • 交互式图像检索结合大型语言模型和视觉语言模型实现查询重写

    图像检索在多媒体和计算机视觉领域中扮演着至关重要的角色,其应用场景广泛,从互联网搜索到医学诊断,无处不在。传统的图像检索系统主要依赖于单次查询流程,即通过文本或视觉查询从数据库中检索出最相关的候选结果。然而,这类方法存在诸多局限性,例如可能因词汇不匹配或语义鸿沟导致检索结果不够准确或召回率较低。此外,随着应用场景的复杂化,用户期望的检索体验也在不断变化,传统方法难以满足这些需求。为了解决这些问题,我们提出了一种交互式图像检索系统,该系统能够在多轮交互中根据用户的反馈不断优化查询,从而提升检索的准确性和全面性。### 1. 交互式图像检索的重要性图像检索系统的核心目标是通过某种方式,将用户的查询

    来源:ACM Transactions on Multimedia Computing, Communications, and Applications

    时间:2025-11-07

  • 机器学习对抗攻击在问题空间中的深层特性:形式化框架与Android恶意软件攻击验证

    问题空间对抗机器学习攻击的形式化框架本研究首次建立了问题空间对抗攻击的系统化形式化框架。与特征空间攻击不同,问题空间攻击面临特征映射不可逆和不可微的核心挑战。研究团队明确定义了四个关键约束条件:可用变换集(T)规定了问题空间中允许的修改操作;语义保持约束(Υ)通过测试套件确保修改前后对象的功能语义一致性;合理性约束(Π)要求生成的对象在人类审查下显得真实自然;预处理鲁棒性约束(Λ)确保对抗样本能够抵抗各种非ML检测技术的分析。框架创新性地提出了副作用特征(η)的概念,揭示了在满足问题空间约束时必然引入的额外特征变化。这些特征不仅包含攻击者期望修改的目标特征,还包括为满足约束条件而不得不引入的伴

    来源:ACM Transactions on Privacy and Security

    时间:2025-11-07

  • 基于速率的会话类型:物联网系统的周期性通信建模与安全验证

    引言:物联网系统中的通信挑战物联网系统的核心特征体现在资源受限设备间复杂的周期性通信交互。传统会话类型理论虽然能保证通信协议的结构正确性,但无法处理不同速率周期任务间的兼容性问题。在实际物联网应用场景中,如智能手表传感器数据处理或实时高通过滤器(LPF),各组件以固有周期运行,若通信速率不匹配会导致系统死锁或数据丢失。这揭示了现有理论在建模实时系统方面的局限性,迫切需要建立能够融合时间约束的形式化框架。RBST理论框架构建本研究提出基于速率的会话类型(RBST)系统,通过扩展π演算语法引入周期性递归构造。核心创新点在于定义了两种周期性进程:静态定义prd(n)X(x̃,k̃)=P表示周期为n的

    来源:ACM Transactions on Programming Languages and Systems

    时间:2025-11-07

  • 菲亚特(FIAT):提升高阶有限元的性能与精度

    有限元方法(FEMs)为偏微分方程(PDEs)的数值求解提供了强大的工具集。有限元方法通过在有界域上定义各种阶数的分片多项式逼近空间,使得其在解决复杂工程和科学问题时具有广泛的应用性。同时,通过调整近似阶数,可以实现计算成本与精度之间的权衡。然而,实现这些广泛而复杂的逼近空间,特别是在各种阶数上,对软件设计提出了技术挑战。为了应对这一挑战,FIAT(FInite element Automatic Tabulator)应运而生,旨在提供一种通用的工具,以支持这些逼近空间的自动构建和评估。本文描述了 FIAT 最近的一些改进,旨在提升其运行效率、代码生成的准确性和计算性能。这些改进不仅适用于简单

    来源:ACM Transactions on Mathematical Software

    时间:2025-11-07

  • ReAL:通过真实的负样本库学习提升图像文本检索效果

    摘要目前用于图像文本检索的方法通常采用各种融合模块来实现鲁棒的视觉文本对齐,主要依赖于批量学习来指导匹配过程。一些后续方法试图增加负样本的数量以增强图像文本的对比学习效果。然而,这些方法经常面临语义一致负样本的挑战,即与真实标签存在对应关系的负样本,这会导致跨模态语义学习的混淆。为了解决这个问题,我们提出了一种新的方法Retrieve with Authentic Negative Repository Learning (ReAL),该方法构建了一个包含高质量负样本对的专用真实负样本库。通过引入具有区分性三元组排名损失的唯一负样本过滤器,ReAL能够通过相似性分布分析和阈值学习有效过滤掉语义

    来源:ACM Transactions on Multimedia Computing, Communications, and Applications

    时间:2025-11-07


页次:2829/9721  共194410篇文章  
分页:[<<][2821][2822][2823][2824][2825][2826][2827][2828][2829][2830][>>][首页][尾页]

高级人才招聘专区
最新招聘信息:

知名企业招聘:

    • 国外动态
    • 国内进展
    • 医药/产业
    • 生态环保
    • 科普/健康