当前位置:首页 > 今日动态 > 科研动态/国外
  • 基于错误的人类评估对大型语言模型在句子简化任务中的深入评估

    摘要句子简化是一种将句子改写得更容易阅读和理解的技术,对于帮助有各种阅读困难的人来说非常有帮助。随着先进的大型语言模型(LLMs)的兴起,评估它们在句子简化方面的表现变得至关重要。最近的研究使用了自动指标和人类评估来评估LLMs的简化能力。然而,现有的评估方法是否适合LLMs仍存在疑问。首先,当前自动指标在评估LLMs的简化能力方面的适用性仍然不确定。其次,目前用于句子简化的人类评估方法往往陷入两个极端:要么过于肤浅,无法清晰地了解模型的表现;要么过于详细,使得注释过程变得复杂且容易出错,从而影响评估的可靠性。为了解决这些问题,本研究深入探讨了LLMs的表现,并确保了评估的可靠性。我们设计了一

    来源:ACM Transactions on Intelligent Systems and Technology

    时间:2025-11-08

  • 通过特征贡献和MDI特征重要性来解读Deep Forest模型

    摘要Deep Forest是一种不可微分的深度学习模型,在各种应用中取得了令人瞩目的实证成功,尤其是在分类/符号或混合建模任务中。许多应用领域更倾向于使用可解释的模型,例如随机森林,它能够为每个预测提供特征贡献的局部解释;同时,Mean Decrease Impurity(MDI)算法可以提供全局特征重要性。然而,作为随机森林的级联结构,Deep Forest仅在第一层具有可解释性。从第二层开始,许多树的分裂是基于前一层生成的新特征进行的,这使得现有的随机森林解释工具无法适用。为了揭示深层原始特征的影响,我们设计了一种计算方法:该方法包括估计步骤和校准步骤,针对每一层分别进行计算,并提出了用于

    来源:ACM Transactions on Knowledge Discovery from Data

    时间:2025-11-08

  • 基于提示的掩码语言模型在数值推理中的应用

    摘要标题生成是摘要生成中的关键任务,其目标是将整篇文章总结成一条简洁的句子。尽管序列到序列的编码器-解码器模型和基于Transformer的大型语言模型在文本生成和摘要生成方面表现出色,但生成包含新闻正文中数字的标题仍然是一个重大挑战。生成能够识别数字的标题需要模型具备解决数字问题和进行数学推理的能力,以推断新闻正文中数字之间的关系。鉴于在生成能够识别数字的标题以及进行新闻正文中数字推理方面存在的挑战,本研究采用多种策略(包括预训练、少样本提示和思维链提示)对大型语言模型(LLMs)进行了实证研究,以探讨其在生成能够识别数字的标题和进行数字推理方面的能力。基于我们对大型语言模型在生成能够识别数

    来源:ACM Transactions on Intelligent Systems and Technology

    时间:2025-11-08

  • RMTrans:在潜在威胁下用于患者预后预测的强大多模态变换器

    摘要Transformer模型凭借其自注意力机制和位置编码能力,在建模长距离依赖关系方面表现出色。这一特性使其在整合多模态信息(如临床记录和放射图像)以捕捉复杂疾病模式方面具有巨大潜力。然而,由于Transformer依赖于预训练的深度神经网络从大型数据集中提取特定模态的特征,因此容易受到后门攻击,这对其在医疗应用中的部署构成了重大挑战。为了解决这些安全问题,我们提出了一种基于Transformer的强大多模态框架RMTrans,该框架能够减轻包含后门触发机制的恶意影像数据对模型的影响,同时提升模型的鲁棒性。在影像数据预处理阶段,我们采用了一种高效的基于补丁的处理方法,使模型更倾向于学习全局特

    来源:ACM Transactions on Intelligent Systems and Technology

    时间:2025-11-08

  • 具有改进表示能力和个性化聚合的医学联邦学习

    摘要联邦学习是一种将机器学习方法与多中心医疗数据连接起来的有前景的桥梁。它利用本地数据训练模型,并保护数据的隐私。有许多用于联邦学习的方法来聚合模型,尤其是个性化方法,这些方法表现出相对优异的性能。然而,大多数方法在聚合过程中过分关注全局信息和局部信息,而忽略了随机成分,这限制了它们在准确性、特异性和敏感性等指标上的表现。我们提出了一种方法(称为FedDiv),旨在在这些指标之间取得平衡。其基本思想是在提取全局特征的同时过滤随机成分,并进行个性化聚合。这些全局特征能够吸引编码器的注意力,从而提高个性化模型在特异性和敏感性方面的性能。此外,它们包含更多的全局和局部信息,这对个性化聚合有利。同时,

    来源:ACM Transactions on Knowledge Discovery from Data

    时间:2025-11-08

  • 利用分层强化学习共同优化基站的部署和天线配置

    摘要多个基站(BS)的协同部署以及天线配置的调整在确保高质量通信服务方面发挥着关键作用,尤其是在大城市中密集部署5G基站的情况下。然而,传统的优化方法(如启发式算法和强化学习(RL)在处理涉及数百个基站协调的问题时面临挑战,因为这些方法在处理大规模场景的复杂性和规模方面存在局限性。为了解决这些挑战,本文提出了分层多智能体近端策略优化与表示学习相结合的方法(HMAPPO-RL)。通过采用分层结构,我们将优化问题有效地分解为两个子问题:基站部署和天线参数调整。与逐步优化基站位置和天线的传统方法不同,HMAPPO-RL通过一种巧妙的交互机制实现了这两个问题的联合优化,充分考虑了基站位置和天线之间的相

    来源:ACM Transactions on Knowledge Discovery from Data

    时间:2025-11-08

  • MCSS:基于样本稳定性在多视图聚类中发现一致确定的关系

    摘要多视图聚类旨在发现广泛存在的多视图数据中的群体知识。一致性是有效处理多视图数据聚类问题的基本因素之一。观察发现,存在两种类型的一致性关系:一致模糊关系和一致确定关系,它们对聚类的影响分别为负面和正面。然而,大多数现有的多视图聚类方法在处理一致性关系时并未加以区分。本文定义了样本在多视图聚类意义上的稳定性,以识别一致确定的关系。理论上,稳定性较高的样本在所有视图中与其他样本之间具有一致确定的关系,表明具有清晰的聚类结构。通过实验分析验证了样本在多视图中的稳定性的合理性。进一步提出了一种基于样本稳定性的多视图聚类方法(MCSS)。该方法首先计算样本的稳定性,并将样本划分为稳定区域和不稳定区域;

    来源:ACM Transactions on Knowledge Discovery from Data

    时间:2025-11-08

  • PHE:针对大规模异构图的图神经网络的结构与语义增强预训练

    摘要近年来,图神经网络(GNNs)促进了图数据挖掘的发展。然而,训练GNNs需要大量的带有标签的、特定于任务的数据,而这往往成本高昂且难以获取。为了减少对标记数据的依赖,最近的研究提出采用自监督的方式对GNNs进行预训练,然后将预训练好的GNNs应用于标记数据有限的下游任务。然而,大多数现有方法仅针对同质图(而现实世界中的图大多是异质的)进行设计,并未考虑语义不匹配问题(即原始数据与理想数据之间的语义差异,后者包含更多可迁移的语义信息)。在本文中,我们提出了一个有效的框架,用于在大规模异质图上对GNNs进行预训练。首先,我们设计了一个关注图结构的预训练任务,旨在捕捉异质图中的结构特征;接着,我

    来源:ACM Transactions on Knowledge Discovery from Data

    时间:2025-11-08

  • 在IT/ICS企业中,居家办公的安全性有多不理想?——为管理者提供的战略组织理论

    摘要COVID-19大流行(尤其是第一波和第二波疫情)迫使许多企业(组织)不得不将其大部分员工(甚至全部员工)转变为居家办公(WFH)模式。行业数据显示,尽管居家办公模式带来了显著的工作灵活性等好处,但也增加了组织的网络安全风险,并导致IT系统及IT与OT系统(如工业控制系统ICS)中的网络安全漏洞数量增加。这引出了一个重要的根本性问题:居家办公模式是否总体上对IT和物联网驱动的ICS安全构成威胁?虽然漏洞分析和实证数据可能在一定程度上支持这一观点,但迄今为止尚未进行严格、基于实际需求的战略性成本效益分析来明确地证明:与非居家办公模式相比,居家办公模式是否以及在多大程度上会导致IT/ICS系统

    来源:ACM Transactions on Management Information Systems

    时间:2025-11-08

  • 探索用于科学问题解答的大型语言模型:通过自然语言处理将问题转换为SPARQL查询

    摘要将用自然语言表达的科学问题转换为可以在知识图谱上执行的SPARQL查询,仍然是问答领域中的一个重大挑战。最近,出现了几个重要的基准测试,特别是SciQA和DBLP-QuAD,用于评估该领域的性能。在本文中,我们对语言模型在这些基准测试上的表现进行了全面分析,并评估了各种优化策略。我们的结果表明,结合使用微调和提示技术(尤其是在结合策略性少量样本选择时)在两个基准测试上都取得了优异的结果。这些发现凸显了迫切需要更具挑战性的基准测试来更好地评估模型能力。我们识别了关键见解、常见的错误模式以及潜在的迁移学习机会,并讨论了它们对优化大型语言模型在基于知识图谱的问答任务中的性能的影响。

    来源:ACM Transactions on Intelligent Systems and Technology

    时间:2025-11-08

  • 在具有时空动态特性的网格和道路网络上的轨迹表示学习

    摘要城市基础模型(Urban Foundation Models, UFMs)作为一种变革性范式,正在逐渐成为理解和管理复杂城市系统的工具,为改善和改造城市环境提供了新的能力。轨迹数据(例如车辆移动轨迹)包含了人类移动性和城市动态的丰富时空模式,这些模式对于理解整个城市的移动行为、交通模式以及交通系统运行至关重要。有效地对这类轨迹数据进行建模对于UFMs来说至关重要,但由于原始轨迹的高维特性及其复杂的时空动态,这一任务面临诸多挑战。轨迹表示学习通过将原始轨迹数据转换为紧凑且有意义的表示形式来应对这些挑战,从而捕捉到关键的移动模式,并便于将其应用于各种城市任务中,如轨迹相似性计算、旅行时间估算或

    来源:ACM Transactions on Intelligent Systems and Technology

    时间:2025-11-08

  • LKAFormer:一种轻量级的Kolmogorov-Arnold变换模型,用于图像语义分割

    摘要基于Transformer的语义分割方法通过利用全局自注意力机制有效捕捉长距离依赖关系,展现了出色的性能。然而,现有研究中仍存在两个问题:1) 大多数方法使用全秩权重矩阵来支持自注意力机制和前馈网络,以建模补丁/像素之间的长距离依赖关系,这在训练和推理过程中都会导致较高的计算成本;2) 大多数方法在图像分辨率恢复过程中忽略了高层语义与低层结构之间的信息交互,从而导致分割具有复杂边界的物体时性能下降。为了解决这些问题,提出了一种轻量级的Kolmogorov-Arnold Transformer模型(LKAFormer)用于图像语义分割,该模型包含一个双流轻量级Transformer编码器和一

    来源:ACM Transactions on Intelligent Systems and Technology

    时间:2025-11-08

  • 企业应如何量化和分析其工业物联网网络中(多方参与的)APT(高级持续性威胁)网络风险暴露?

    摘要工业物联网(IIoT)网络(例如智能电网工业控制系统)在全球范围内日益普及,尤其是在智慧城市中。这些网络不仅满足了民用社会的日常需求(如电力、水、制造业、交通运输),还提高了社会企业的效率、生产力和盈利能力。然而,众所周知,物联网设备的安全配置往往不够完善,这增加了针对IIoT网络的隐蔽性传播型高级持续性威胁(APT)恶意软件攻击的风险,这类攻击可能在很长一段时间内未被发现。此类攻击通常会对拥有这些IIoT网络基础设施的公司造成负面的服务质量(QoS)影响,并带来财务损失。这种影响涉及“空间”(即整个IIoT网络或其子网络)和“时间”(即业务中断的持续时间),对于在这些网络上运营的企业管理

    来源:ACM Transactions on Management Information Systems

    时间:2025-11-08

  • 图中欧拉路径的快速评估及其应用

    摘要在图中枚举或计算组合对象是数据挖掘中的一个基本任务。我们考虑评估有向图中欧拉路径数量的问题,该问题表述如下:给定一个有向图 G=(V, E),其中包含 |V|=n 个节点和 |E|=m 条边,以及一个整数 z,我们需要判断欧拉路径的数量 #ET(G) 是否至少为 z。这个问题在数据隐私、计算生物学、数据压缩和交通网络等多个领域都有应用。目前,从业者通常使用著名的BEST定理来解决这个问题,但实际上BEST定理只是计算欧拉路径的数量,而不是仅仅判断欧拉路径的数量是否大于或等于某个阈值 #ET(G)。不幸的是,这种解决方案需要执行 O(nω 次算术运算,其中 ω2.373 表示“矩阵乘法指数”

    来源:ACM Transactions on Knowledge Discovery from Data

    时间:2025-11-08

  • SR-HyperFM:一种基于样本关系感知的超图分解模型,用于特征交互建模

    摘要特征交互建模利用特征之间的交互信息,在各种应用中得到了广泛研究。最近,提出了许多基于图或超图结构的模型来通过预测节点之间的边或超边的存在来模拟特征交互。然而,这些模型缺乏捕捉样本之间内在可比性的能力,而多个样本通常同时表现出共享特征和独特特征,这种可比性对于预测往往是有益的。为此,我们提出了SR-HyperFM(样本关系感知超图因子化机器),该模型将样本之间的可比关系纳入特征交互建模中,同时利用共享特征和样本之间的关键差异。具体来说,引入了样本关系感知的超图构建模块,以完全捕捉样本之间的可比关系并发现有益的高阶特征交互。此外,双重超图消息传递模块通过利用这些内在关系显式地对特征交互进行建模

    来源:ACM Transactions on Knowledge Discovery from Data

    时间:2025-11-08

  • 关于评估大型语言模型(LLM)在机器人架构中的集成

    摘要大型语言模型(LLMs)正越来越多地被集成到具身机器人系统中。LLMs为机器人带来的一个有用功能是将人类自然语言指令转化为可执行的机器人动作。然而,这些集成方式在很大程度上是临时性的,且相关研究较少,因为它们往往没有考虑到人类交流中的句法、语义以及语用等多个方面。目前缺乏的是对将LLMs集成到机器人架构中的不同方法的系统描述,以及一套能够评估配备LLM的机器人是否能够正确理解这些人类指令各个方面的评估指标。在本文中,我们提出了一套评估指标和数据增强技术,这些技术和指标借鉴了认知科学和人类交流领域的理论,用于评估这些集成方案。为了说明这些指标和增强技术的应用效果,我们进行了实验,比较了两种集

    来源:ACM Transactions on Intelligent Systems and Technology

    时间:2025-11-08

  • 在多方数据上捕捉不变性以用于去中心化信用评分

    摘要随着金融市场的快速发展,各种机构可以合作开发信用评分模型。这种合作显著增加了用于训练模型的观测数据数量,从而提高了信用评分模型的性能。然而,这种合作面临隐私泄露和数据分布偏移的问题。为了解决这些问题,我们提出了一种基于联邦学习的新颖去中心化方法——不变且协作的信用评分(ICS)。具体而言,我们设计了一种不变特征提取器,通过最小化不变风险来从多方数据中提取不变特征。此外,我们还提出了一种混合建模策略,用于预测借款人是否会违约,并减少损失差异,以提升不变特征提取器的性能。实证评估表明,所提出的方法在区分性能和审批性能方面均显著优于基准方法。消融研究进一步揭示了ICS中每个设计元素对性能提升的核

    来源:ACM Transactions on Management Information Systems

    时间:2025-11-08

  • 才能:针对性挖掘非重叠的序列模式

    摘要随着序列模式挖掘(SPM)算法的广泛应用,允许存在间隙约束的序列模式对于从生物数据(如DNA和蛋白质序列)以及某些非生物数据中发现知识具有重要意义。这种方法在连续约束SPM和传统SPM之间取得了平衡,能够在满足用户定义的间隙需求的同时,发现更广泛的模式。在所有类型的带间隙约束的挖掘方法中,非重叠SPM能够发现互不重叠的有趣模式,同时满足抗单调性属性(即Apriori属性,即一个模式的支持度不会大于其子模式的支持度)。然而,现有算法并未针对目标序列模式进行搜索,从而导致不必要的重复模式生成。目标模式挖掘是一种用于发现与用户感兴趣的项目直接相关的项集或序列模式的技术。在本文中,我们定义并形式化

    来源:ACM Transactions on Management Information Systems

    时间:2025-11-08

  • 一种半监督协同训练算法,用于实现鲁棒的推荐系统

    摘要推荐算法已在多个领域得到广泛应用。然而,用户在对隐式反馈的评估中存在的不确定性会引入误报信号,导致用户行为与真实偏好不符,并产生干扰。这使得传统推荐方法难以同时实现鲁棒性和准确性。在本文中,我们提出了一种半监督协同训练算法(SSCDL),用于推荐系统中的去噪学习。该算法结合了监督学习和半监督学习的方法。首先,我们采用高斯混合模型(GMM)作为置信度估计模块,根据反馈的内在特征将隐式反馈划分为两个互不相交的数据集:一个可靠的数据集和一个不可靠的数据集。为了实现双重鲁棒性,我们设计了一个迭代式交叉协同训练模块,该模块包含两个关键部分:两阶段的可靠学习过程和跨样本传输机制。两阶段的可靠学习过程允

    来源:ACM Transactions on Knowledge Discovery from Data

    时间:2025-11-08

  • 利用梯度混淆进行隐私保护的表示学习,以对抗推荐系统中的属性推断

    摘要现代且高效的推荐系统不仅利用用户与物品之间的交互信息,还利用用户的私有属性来提升推荐性能。保护用户的私有属性不被对手推断出来,已成为推荐系统中的一个关键问题。在这项工作中,我们提出了一个名为“隐私保护表示学习用于推荐”(PrP-Rec)的问题。PrP-Rec的设计目的是生成用户和物品的嵌入向量,以便有效抵御两种推断攻击:一种是基于物品的属性推断攻击(IAI-Attack),另一种是基于嵌入的属性检索攻击(EAR-Attack)。为了解决PrP-Rec问题,我们提出了一个名为“隐私保护贝叶斯个性化排名”(PBPR)的新框架。该框架的核心是创建一个可学习的梯度混淆向量,并将其注入用户和物品的嵌

    来源:ACM Transactions on Knowledge Discovery from Data

    时间:2025-11-08


页次:2741/9734  共194674篇文章  
分页:[<<][2741][2742][2743][2744][2745][2746][2747][2748][2749][2750][>>][首页][尾页]

高级人才招聘专区
最新招聘信息:

知名企业招聘:

    • 国外动态
    • 国内进展
    • 医药/产业
    • 生态环保
    • 科普/健康