-
利用神经查询空间邻近性进行查询性能预测
摘要信息检索(IR)方法在处理不同查询时的表现存在差异,这包括基于Transformer的最新神经检索器。为实现稳健且可靠的检索效果,这一挑战尤为突出。查询性能预测(Query Performance Prediction, QPP)旨在评估特定查询的检索方法效果,从而能够采取适应性策略来改善检索结果,尤其是对于难度较高的查询。然而,现有的QPP方法面临一些根本性问题:预检索方法通常依赖于表面的查询特征,这些特征无法捕捉查询与检索效果之间的细微关系;而 post-retrieval 方法则严重依赖于检索到的文档质量,但对于复杂查询来说,这种依赖性可能并不可靠。为此,我们提出了基于查询空间距离的
来源:ACM Transactions on Intelligent Systems and Technology
时间:2025-11-08
-
打击健康新闻中的虚假信息:利用DCNN-CapsNet进行跨领域健康虚假信息检测
摘要摘要:在数字信息时代,错误信息的传播构成了一个重大挑战,尤其是在疫情等危机期间。检测和打击错误信息对于保障公共卫生和安全至关重要。在这项研究中,我们专注于跨领域的健康新闻错误信息检测,利用新冠数据集训练了一个能够识别猴痘相关错误信息文章的模型。我们提出了一种新颖的混合模型,结合了深度卷积神经网络(DCNN)和胶囊神经网络(CapsNet)的优势,称为DCNN-CapsNet。该模型充分利用了这两种神经网络架构在分类任务中的优势。为了提升学习效果,我们采用了增量微调方法,使模型能够从动态的预训练词嵌入开始,并在训练过程中不断更新这些嵌入。这种方法确保了嵌入与错误信息检测的具体任务保持相关性,
来源:ACM Transactions on Intelligent Systems and Technology
时间:2025-11-08
-
动态测量、分析并预测在线社区中的情感韧性
摘要在线社区中的情感韧性是一个新兴且日益重要的概念。然而,目前用于衡量情感韧性的方法未能充分考虑韧性变化的动态特性,也无法全面考虑社区的整体背景。为填补这些空白,我们基于现有研究提出了动态韧性指数(DRI)模型,该模型结合了韧性理论、灾难理论以及隐马尔可夫模型。通过对案例数据进行实验和分析,我们验证了该方法的有效性,并得出了有趣的研究结果。首先,我们确定了最佳的韧性状态数量和观察序列长度,并计算出了具有最低困惑度的DRI值。其次,我们分析了DRI与网民位置及评论时间之间的关系,揭示了DRI的动态变化机制。第三,我们在动态且复杂的社区环境中对DRI进行了预测,探讨了时间窗口长度对预测性能的影响。
来源:ACM Transactions on Management Information Systems
时间:2025-11-08
-
不确定性挑战:在开源软件开发中,应该集中还是分散需求工程决策的权力?
摘要开源软件开发(OSSD)团队由于成员构成不断变化且大多为自愿参与,因此呈现出多样化的沟通结构。OSSD中的需求工程(RE)实践具有分布式和动态性,其效果取决于团队如何组织沟通和决策。OSSD的需求主要受到外部环境的影响,这些外部环境的变化体现在需求量的增减、变化速度的快慢以及需求知识的多样性上。这种环境状况挑战了“集中式或分散式需求工程决策是一种非此即彼的选择”这一观点。根据信息处理视角(IPV),是否采用集中式或分散式决策实际上取决于需求量、变化速度和需求多样性方面的不确定性程度和类型。IPV认为,在任务完成率方面,集中化能够提升OSSD团队的沟通效率和决策效果;然而,需求量的增加和变化
来源:ACM Transactions on Management Information Systems
时间:2025-11-08
-
弗莱雷昂:通过中毒增强功能实现全面的隐蔽后门注入攻击
摘要一旦成功,针对开源软件供应链的攻击可能会对关键任务应用造成重大损失。随着深度学习开源生态系统的蓬勃发展并变得越来越普遍,攻击者获得了前所未有的机会,在深度神经网络模型中注入恶意后门代码。本文提出了名为Flareon的攻击手段:这是一种小型、隐蔽且看似无害的代码修改技术,专门针对基于运动的触发条件来影响数据增强流程。Flareon既不会修改真实标签,也不会改变训练损失目标,同时也无需预先了解受害模型的架构、训练数据或训练超参数。然而,它对训练过程的影响却非常显著——在Flareon的影响下训练出的模型会学会强大的目标条件型(或称为“all2all”)后门功能。我们还提出了一个可学习的Flar
来源:ACM Transactions on Knowledge Discovery from Data
时间:2025-11-08
-
高斯增强原型网络在类增量式少样本关系分类中的应用
摘要关系分类(RC)是知识发现中的一个基本任务。在少量样本的关系分类任务中,通常会使用原型网络来应对标记数据的稀缺性和长尾关系问题,但这些方法往往忽略了分类的可靠性以及异常特征,可能导致相似性度量不够准确。在不断涌现新语义关系的动态环境中,增量式少量样本学习越来越受到关注,这种方法能够在新任务中同时学习基础关系和新关系,同时保留原有的基础关系知识。然而,随着新关系数量的增加,这种方法的挑战性也随之增大,模型需要减少对新任务的学习依赖,从而减少对基础关系的依赖。因此,本文提出了一种基于类增量式少量样本关系分类(CIFRC)的方法,该方法采用高斯增强原型网络(GA-Proto)。GA-Proto通
来源:ACM Transactions on Knowledge Discovery from Data
时间:2025-11-08
-
基于频率调制变压器自注意力的先进传染病预测模型
摘要传染病的时间序列预测对于应对重大的全球健康挑战至关重要。人工智能(AI),特别是深度学习(DL)算法,在序列建模方面取得了显著的成功;然而,由于疾病传播的非平稳特性和复杂的频率动态,这些算法在流行病学预测中的表现仍然受到限制。本研究提出了一种新颖的频率调制变换器(FMT)框架来应对这些挑战。FMT框架将时间序列数据分解为不同的频率调制信号,并利用自注意力机制来捕捉时间频率。随后,通过变换器编码器-解码器架构来预测和捕捉多尺度的时间依赖性,从而实现准确的预测。该方法的创新之处在于将输入时间序列分解为固有模态函数(IMFs),并通过基于熵的特征选择将频率特定的成分整合到变换器架构中。与传统方法
来源:ACM Transactions on Intelligent Systems and Technology
时间:2025-11-08
-
在车辆边缘计算中,利用SA-DDQN-DDPG算法进行DNN任务的联合服务迁移与资源分配
摘要随着车载边缘计算(VEC)和人工智能(AI)的快速发展,车载边缘智能的出现满足了实时车辆智能应用的需求。然而,深度神经网络(DNN)的运行需要大量的数据输入,这导致了执行DNN任务时需要大量的计算资源。这也给DNN任务的部署和边缘服务器的资源分配带来了了一定的负担。此外,由于车辆在VEC中的高移动性,车载边缘智能任务的回传延迟增加,影响了车辆的体验质量(QoE)。我们提出了一种服务迁移和资源分配的联合优化策略,旨在最小化平均任务完成延迟。该策略综合考虑了服务迁移行动和边缘服务器资源分配,被证明是一个混合整数非线性规划(MINLP)问题,因此我们将其表述为一个马尔可夫决策过程(MDP)。为了
来源:ACM Transactions on Intelligent Systems and Technology
时间:2025-11-08
-
Spectraformer:一种用于Transformer的统一随机特征框架
摘要使用各种核函数近似和核学习技术对注意力机制进行线性化研究已经显示出良好的前景。以往的方法在随机特征范式中仅使用了部分组件函数和权重矩阵的组合。我们认识到有必要系统地比较不同权重矩阵和组件函数组合在Transformer注意力学习中的效果。因此,我们提出了,这是一个用于近似和学习Transformer注意力机制中核函数的统一框架。我们的实证结果首次证明,基于随机特征的方法在具有挑战性的Long Range Arena基准测试中能够达到与高性能的稀疏和低秩方法相当的性能。由此,我们为基于随机特征的高效Transformer建立了新的技术标准。该框架还提供了多种变体,这些变体在准确性、训练时间和
来源:ACM Transactions on Intelligent Systems and Technology
时间:2025-11-08
-
在2.4 GHz ISM频段中的爱与恨:LoRa™与IEEE 802.11g的故事
摘要长距离通信(LoRa)是用于低功耗广域网(LPWAN)的主要调制技术之一。近年来,LoRa的应用范围已从亚GHz频段扩展到了2.4 GHz的工业、科学和医疗(ISM)频段,从而构建出具有全球互操作性的LPWAN,且不受占空比限制的影响。然而,LoRa与2.4 GHz ISM频段内其他无线技术的共存仍是一个具有挑战性的问题。在本文中,我们首次对LoRa与无线保真(Wi-Fi)传输之间的干扰进行了性能评估,分析了多个参数:LoRa信道占用情况、部署拓扑结构、LoRa物理层参数以及所使用的频率信道。我们还通过仿真将实验结果扩展到了其他配置场景。所采用的性能评估方法具有通用性,可应用于其他无线技术
来源:ACM Transactions on Internet of Things
时间:2025-11-08
-
融合多模态数据中的跨领域知识以解决物理世界中的问题
摘要人工智能的蓬勃发展催生了多种应用,这些应用架起了数字世界与物理世界之间的桥梁。由于物理环境过于复杂,无法通过单一的信息采集方法进行建模,因此融合来自不同来源(如传感器、设备、系统和人类)的多模态数据对于解决现实世界中的问题至关重要。不幸的是,为每个问题从头开始部署新的资源来收集原始数据既不可行也不可持续。因此,当某个领域的数据不足时,从其他领域已有的多模态数据中提取知识就显得十分重要。我们将这种过程称为跨领域知识融合。现有的研究主要集中在单一领域内的多模态数据融合上,假设来自不同数据集的知识在本质上是对齐的;然而,在跨领域知识融合的场景中,这一假设可能并不成立。在本文中,我们正式定义了跨领
来源:ACM Transactions on Intelligent Systems and Technology
时间:2025-11-08
-
基于人工智能的汽车系统的早期可靠性评估
摘要强大的人工智能(AI)算法的出现推动了汽车领域先进功能的发展,对于实现自动驾驶和半自动驾驶车辆的部署至关重要。然而,由于多种因素,将这些先进且复杂的功能集成到汽车系统中颇具挑战性,这些因素包括:i) 必须严格遵守严格的安全法规,这需要有效的策略来确保及时开发的同时进行彻底的可靠性评估;ii) 市场投放时间较短,限制了开发、验证和确认的周期。特别是,由于目标系统(包括硬件和软件)的复杂性,分析影响基于AI的应用程序的故障效应变得十分困难。可靠性分析通常依赖于故障注入技术。然而,故障注入实验往往耗时过长,并且仅限于整个系统的某些组件,因此无法全面考虑故障对车辆层面的影响。本文提出了一种新的方法
来源:ACM Transactions on Internet of Things
时间:2025-11-08
-
数据缺失情况下的相似性搜索
摘要相似性搜索是一个基础的研究问题,在数据挖掘、信息检索和机器学习等多个研究领域有着广泛的应用。其核心思想是根据特定的相似性度量标准,在大规模数据库中找到与查询项最相似的数据样本,并且该样本的相似性得分最高。然而,相似性搜索可能会面临高昂的计算成本和存储成本,这促使我们需要在各种场景下设计高效且快速的相似性搜索算法。但在现实世界中,数据缺失是不可避免的,这会导致相似性得分不准确,进而使得相似性矩阵也不准确。因此,在观测数据不完整的情况下,获得一个准确的相似性矩阵并非易事。为了解决这个问题,我们提出了一种相似性矩阵校准方法,用于估计高质量的相似性矩阵,从而提高相似性搜索的性能。首先,我们定义了一
来源:ACM Transactions on Intelligent Systems and Technology
时间:2025-11-08
-
在大语言模型时代,利用文本可信度信号进行自动可信度评估的调查研究
摘要在社交媒体和生成式人工智能的时代,自动评估在线内容可信度的能力变得越来越重要,这补充了传统的虚假信息检测方法。可信度评估依赖于将各种可信度信号(如内容的主观性、偏见或说服技巧的存在)汇总成一个最终的可信度标签/分数。然而,当前关于自动可信度评估和可信度信号检测的研究仍然非常分散,许多信号都是孤立研究的,缺乏整合。值得注意的是,同时检测和汇总多种可信度信号的方法很少。这些挑战还因缺乏一个全面且最新的研究综述而加剧,该综述能够将这些研究工作置于一个共同的框架下,并识别出共同的趋势、挑战和未解决的问题。在这项调查中,我们通过系统地回顾了175篇研究论文来填补这一空白,这些论文主要集中在自然语言处
来源:ACM Transactions on Intelligent Systems and Technology
时间:2025-11-08
-
验证在线安全特性以确保深度强化学习的安全性
摘要确保强化学习(RL)的安全性对于在实际应用中部署智能体至关重要。在训练过程中,现有的安全RL方法通常依赖于指示性成本函数,这些函数提供的反馈信息较为有限,从而导致两个主要问题:(i)由于缺乏邻近状态的安全性信息,样本效率低下;(ii)对成本-价值函数的依赖性导致收敛过程不稳定,性能不佳。训练完成后,虽然可以通过深度神经网络的形式化验证方法(FV)来保证安全性,但这些方法的计算复杂性限制了其在训练过程中的应用。为了解决使用成本函数所带来的问题,我们提出了一种基于“违规”值的安全RL方法——该值反映了策略决策在状态空间某部分所伴随的风险。我们的方法会验证可能导致不安全行为的“安全属性”(即状态
来源:ACM Transactions on Intelligent Systems and Technology
时间:2025-11-08
-
基于Dempster-Shafer理论的类推理方案,用于学习模糊分类系统
摘要决策过程对机器学习模型的预测结果有着显著影响。这一点在基于规则的系统中尤为重要,例如学习型模糊分类系统(LFCSs),其中规则的选择和应用直接决定了预测的准确性和可靠性。LFCSs结合了进化算法和监督学习来优化模糊分类规则,从而提高了系统的可解释性和鲁棒性。尽管具有这些优势,但关于改进LFCSs中决策机制(即类别推理方案)的研究仍然有限。大多数LFCSs使用基于投票或单一获胜者的推理方案。这些方案依赖于训练数据上的分类性能,在未见过的数据上可能表现不佳,存在过拟合的风险。为了解决这些问题,本文提出了一种基于Dempster-Shafer证据理论(DS理论)的新型类别推理方案。该方案能够很好
来源:ACM Transactions on Evolutionary Learning and Optimization
时间:2025-11-08
-
RAG-IoE:在工业4.0时代,利用大型语言模型实现物联网场景感知的信息检索
摘要以人为中心的设计、智能化以及无缝的互联互通是工业4.0(Industry 5.0)的核心支柱。在这些场景中,一个关键挑战是如何在万物互联(Internet of Everything, IoE)网络中高效地检索出与工作相关且具有上下文意识的信息。传统的信息检索技术难以处理工业环境中产生的异构性和动态性数据。为了解决这一问题,我们为IoE场景定义了一个具有上下文意识的数据模型,并在此基础上提出了RAG-IoE,这是一种新颖的检索增强生成(Retrieval-Augmented Generation, RAG)解决方案,能够实现从结构化和非结构化数据源中自适应、可扩展且基于上下文的信息检索。我
来源:ACM Transactions on Internet of Things
时间:2025-11-08
-
《不信任的根源:探究基于人工智能的新闻聊天机器人如何影响用户的信任与认知》
摘要21世纪20年代初,随着生成式人工智能大型语言模型(如Chat-GPT)的兴起,人工智能迎来了一个新时代。这些AI聊天机器人通过让用户提问和查询更多信息,提供了一种交互式的服务。然而,以往的研究仅探讨了大型语言模型是否存在政治偏见或特定立场,而没有研究有偏见的模型如何影响用户的观点和信任。我们的研究通过一个具体场景填补了这一空白:用户先阅读在线新闻文章,然后与一个具有特定立场的交互式AI聊天机器人进行交流。有趣的是,参与者更倾向于接受聊天机器人的观点,而非持相反立场的新闻文章。当聊天机器人的立场与新闻内容一致时,他们更倾向于采纳其观点——这一现象在对照组(仅阅读新闻文章的参与者)中更为明显
来源:ACM Transactions on Interactive Intelligent Systems
时间:2025-11-08
-
数据已进入聊天环节:数据工作者如何与生成式人工智能(GenAI)代理进行探索性视觉分析对话
摘要我们研究了利用大型语言模型(LLMs)的代码生成能力,通过对话式用户界面(CUIs)来支持探索性视觉分析(EVA)的潜力。我们开发了一种技术工具,并通过两项研究部署了该工具,共有50名数据工作者参与了研究,以探索EVA过程中视觉分析对话的结构和流程。我们使用主题分析方法分析了这两项研究中的对话内容,并绘制了一个状态转换图,总结了参与者话语的四种状态(分析任务、编辑操作、详细说明与丰富内容以及指令性命令)与生成式AI(GenAI)代理响应的两种状态(可视化结果、文本)之间的对话流程。我们根据每种状态以及状态之间的转换,将GenAI代理的能力和局限性描述为三个相互关联的循环:分析、详细说明和解
来源:ACM Transactions on Interactive Intelligent Systems
时间:2025-11-08
-
基于人工智能的感知增强:探索一款用于支持遗传学专业人员的生成式人工智能助手的设计
摘要生成式人工智能(Generative AI)有潜力改变知识工作的方式,但需要进一步的研究来了解知识工作者如何设想使用和与生成式人工智能进行互动。我们研究了开发用于支持领域专家进行知识工作的生成式人工智能工具,探讨了任务分配以及人机交互的设计问题。我们的研究重点在于设计一种生成式人工智能助手,以帮助遗传学专业人士分析全基因组序列(WGS)和其他临床数据,从而辅助诊断罕见疾病。通过对17位遗传学专业人士的访谈,我们发现了WGS分析中当前面临的一些挑战。随后,我们与六位遗传学专业人士进行了共同设计会议,确定了可以通过人工智能助手协助完成的任务以及设计人与人工智能助手交互时需要考虑的因素。根据研究
来源:ACM Transactions on Interactive Intelligent Systems
时间:2025-11-08