当前位置:首页 > 今日动态 > 科研动态/国外
  • B-TTDb:一个用于预测最受欢迎的百个表情符号的土耳其推文数据库

    emoji预测是一项重要的研究任务,旨在为特定文本快速而轻松地找到最合适的emoji(表情符号)。随着土耳其语成为全球使用人数最多的20种语言之一,且在社交媒体上有大量用户,研究土耳其语中的emoji预测具有重要意义。本研究构建了一个名为“Bitirim's Turkish Tweets Database (B-TTDb)”的土耳其语推文数据库,用于学术和工业领域的emoji预测研究。B-TTDb由四个数据集组成,分别是原始推文数据集(RTD)、整理后的推文数据集(OTD)、预处理后的推文数据集(PPTD)以及最终的Bitirim数据集(B-D)。B-D包含158,201条独特的推文,这些推文

    来源:ACM Transactions on the Web

    时间:2025-11-07

  • 简约至上:受自然数据行为启发的固态硬盘(SSD)垃圾回收管理艺术

    摘要随着固态硬盘(SSD)在各种计算环境中的使用日益广泛,有效的垃圾回收(GC)管理对于提升性能和延长使用寿命至关重要。现有的GC策略依赖于复杂的数据分类技术来区分热数据和冷数据。这一过程不仅计算成本高昂,而且效率低下。本文介绍了一种革命性的简化GC管理方法,我们将其称为SUP-GC,其核心设计原则是“简单性是最高原则”。SUP-GC几乎不需要任何计算,并自然地重新定义了数据存储模式:所有新写入的数据默认被视为热数据并直接存储在热数据块中;在GC过程中需要移动的数据被视为冷数据,并统一迁移到冷数据块中。我们的策略消除了对数据状态进行精确但资源密集型实时分析的需求,而是采用了一种与数据自然属性高

    来源:ACM Transactions on Storage

    时间:2025-11-07

  • 通过基于矩阵的建模实现Ceph文件系统的敏捷且审慎的元数据负载均衡

    摘要为了应对大规模元数据访问的需求,Ceph分布式文件系统(CephFS)采用了“动态子树分区”方法,将层次化的命名空间拆分,并将各个“子树”分布到多台元数据服务器上。然而,这种方法存在严重的不平衡问题,可能导致性能下降,原因包括不平衡预测的准确性不足、未考虑工作负载特性以及不必要的或无效的迁移操作。为了解决这些效率问题,我们提出了Lunule——一种新型的CephFS元数据负载均衡器。Lunule利用“不平衡因子模型”来精确判断何时触发重新平衡,并能够容忍无害的不平衡状态。此外,Lunule还采用了“基于工作负载的迁移规划器”来合理选择需要迁移的子树。最后,我们将Lunule升级为Lunul

    来源:ACM Transactions on Storage

    时间:2025-11-07

  • 在基于分层存储的键值存储系统中保持层间平衡

    随着存储技术的不断发展,现代存储系统的目标是提升性能并降低存储成本。为了满足这一目标,研究者提出了多种基于键值存储(Key-Value Store, KV store)的设计方案,特别关注异构存储系统。其中,Log-Structured Merge-Tree(LSM树)被广泛用于优化写入密集型工作负载和闪存存储。然而,基于LSM树的键值存储在异构存储系统中却面临严重的性能下降和查询延迟增加的问题。这一问题主要源于“写入停滞”约束的引入,即系统在设计时只考虑单一存储层级,无法充分利用多层级存储架构的优势。此外,异构存储系统中不同存储层级之间的性能差异会导致“存储间不平衡”问题,这会进一步影响系统

    来源:ACM Transactions on Storage

    时间:2025-11-07

  • 并非所有异常情况都是一样的:在现实世界的企业中如何对错误日志进行分类处理

    摘要像Java异常这样的错误日志在诊断和解决行业内的问题中起着至关重要的作用。然而,在大规模的Java系统中,由于Java异常的生成频率过高,开发者可能难以有效处理这些异常,从而导致“异常疲劳”现象。遗憾的是,目前关于这一问题的严重性、普遍性以及解决方案的研究还十分有限。为了填补这一空白,我们首先对中国一家知名互联网企业——阿里巴巴进行了全面的研究,证实了“异常疲劳”现象在该行业中的重要性。随后,我们提出了一种名为ABEL的新解决方案,该方案能够自动识别与软件故障最相关的异常。主要挑战在于异常的随机性,这使得基于序列的分析方法无法发挥作用。为了解决这一难题,ABEL建立了Java异常与应用程序

    来源:ACM Transactions on Software Engineering and Methodology

    时间:2025-11-07

  • TM-Training:一种用于神经处理单元(NPU)中深度学习训练的高效分层内存系统

    在当今的深度学习加速系统中,动态随机存取存储器(DRAM)占据着系统总拥有成本(TCO)的较大比例。随着深度学习模型的规模不断增大,对内存容量的需求也随之上升,这促使了对分层内存系统的探索。分层内存系统通过使用不同性能和密度的存储技术来实现内存容量和性能的平衡,其中高层通常配备高性能但成本较高的技术,而低层则采用高密度但性能较低的技术。然而,无论分层内存系统的设计如何,数据在各层之间的迁移仍然消耗大量能源。特别是在模型规模和内存需求持续增长的情况下,这种数据迁移变得更为频繁,从而对能源效率构成了挑战。为了解决这一问题,研究者们提出了一些创新性的方案,其中一种思路是通过预测性地将数据放置到合适的

    来源:ACM Transactions on Storage

    时间:2025-11-07

  • 分析移动存储工作负载中I/O时间行为的请求波动性

    摘要基于闪存的存储子系统的设计与性能优化对于提升基于Android的智能手机的系统性能至关重要。然而,这一优化在很大程度上依赖于从智能手机应用程序的存储工作负载研究中获得的经验。从时间角度来看,我们的突发性分析表明,33款智能手机应用程序中的I/O请求到达过程具有显著的突发性,尤其是读请求。本文研究了读写请求之间的到达时间相关性,并比较了四种相同类型智能手机应用程序中读写请求的相关性。我们首先观察到,85%的应用程序的读请求和88%的应用程序的写请求在较长的时间范围内存在一定程度的相关性。随后,我们使用成熟的统计工具对这些应用程序进行了Hurst参数估计。所有估计的Hurst参数均大于0.5,

    来源:ACM Transactions on Storage

    时间:2025-11-07

  • 利用大型语言模型为盲人用户区分图形用户界面组件的状态

    摘要图形用户界面(GUI)是用户与移动应用程序(app)交互的主要媒介。在这些GUI中,可编辑的文本视图、按钮和其他视觉元素在用户操作后会显示不同的状态。然而,开发者通常仅通过不同的颜色来表示这些状态,而没有为盲人用户提供文字提示。这导致盲人用户难以辨别组件状态的变化,从而影响他们执行后续操作的能力。传统的基于规则的方法和属性设置往往难以适应多种组件样式,并且无法处理受上下文影响的组件状态变化。最近,预训练的大型语言模型(LLM)在各种下游任务中展示了其泛化能力。在这项工作中,我们利用LLM开发了一个名为Component states distinguishing GPT(CasGPT)的工

    来源:ACM Transactions on Software Engineering and Methodology

    时间:2025-11-07

  • SnapCC:利用系统化状态探索进行有效的文件系统一致性测试

    现代文件系统在功能上日益丰富和复杂,这使得确保其崩溃一致性变得愈发困难。崩溃一致性指的是在系统发生意外故障(如电源中断、磁盘故障或人为错误)时,文件系统能够保持其内部数据结构和用户数据的有效性,从而在恢复后仍能维持一致状态。尽管已有的工具如B3和Hydra在发现崩溃一致性问题上取得了一定成效,但它们在测试覆盖范围、发现新错误的能力以及适应现代文件系统复杂性的方面仍存在局限性。本文提出了一种新的测试方法,通过系统性地探索文件系统的持久状态,提升崩溃一致性测试的有效性。文件系统需要将数据写入非易失性存储设备,以确保其在系统重启后仍能正确恢复。然而,随着文件系统功能的扩展,例如Linux的BTRFS

    来源:ACM Transactions on Software Engineering and Methodology

    时间:2025-11-07

  • GitHub项目中Copilot生成代码的安全漏洞:一项实证研究

    摘要利用大型语言模型(LLMs)等AI模型的现代代码生成工具因其能够生成功能性代码而越来越受欢迎。然而,这些工具的使用也带来了安全挑战,常常导致不安全的代码被合并到代码库中。因此,评估生成代码的质量,尤其是其安全性,至关重要。尽管以往的研究探讨了代码生成的各个方面,但对安全性的关注仍然有限,主要集中在受控环境中生成的代码,而非开源开发场景。为了解决这一不足,我们进行了一项实证研究,分析了GitHub Copilot以及另外两种AI代码生成工具(CodeWhisperer和Codeium)从GitHub项目中生成的代码片段。我们的分析发现了733个存在安全漏洞的代码片段,其中Python代码片段

    来源:ACM Transactions on Software Engineering and Methodology

    时间:2025-11-07

  • DRLMutation:深度强化学习系统中 mutation 测试的综合性框架

    摘要深度强化学习系统已被越来越多地应用于各个领域。然而,对它们的测试仍然是一个重要的未解决研究问题。变异测试是一种流行的测试套件评估技术,用于分析测试套件检测注入故障的能力。该技术已在传统软件和深度学习领域得到广泛研究。但由于深度强化学习系统与传统软件在环境交互、网络决策和数据效率等方面存在根本差异,之前的变异测试技术无法直接应用于深度强化学习系统。在本文中,我们提出了一个专为深度强化学习系统设计的综合变异测试框架DRLMutation,以进一步填补这一空白。首先,我们分析了深度强化学习的特性,并基于训练过程和训练后的智能体模型,从对象、操作方法和注入方法三个维度考虑了各种组合。这种方法为深度

    来源:ACM Transactions on Software Engineering and Methodology

    时间:2025-11-07

  • ContrastRepair:通过对比测试用例对提升基于对话的自动化程序修复能力

    随着软件系统日益复杂,软件中的错误和漏洞变得不可避免。这些问题可能导致系统故障、安全漏洞以及用户体验的下降。手动调试和修复这些问题是一个耗时且繁琐的过程,需要开发人员投入大量资源和精力。据报告,每年用于发现和修复错误的支出高达数十亿美元,而开发人员大约有50%的时间用于调试和修复错误。鉴于这一挑战,自动程序修复(APR)作为一种解决方案,逐渐受到重视,它通过自动产生补丁来修复错误。传统的APR技术可以分为基于模板、启发式和基于约束的方法。然而,这些传统方法的效果仍不令人满意。基于模板的APR需要手动设计模板,这需要大量的开发人员工作量和领域知识,因此它们的泛化能力有限,通常只在特定类型的错误上

    来源:ACM Transactions on Software Engineering and Methodology

    时间:2025-11-07

  • 一个高效的分量压缩框架,无缝集成到了内联去重功能中

    摘要Delta压缩可以通过压缩非重复数据块来进一步减少冗余,从而补充数据去重功能。然而,在将Delta压缩应用于基于去重的备份系统时,会出现两个主要问题,这些问题会降低内联去重的性能。首先,备份和恢复过程中会引入额外的I/O操作来检索基础数据块,从而减慢系统速度。其次,重写技术会阻止某些数据块作为Delta压缩的基础数据块使用,从而影响恢复性能,导致压缩效率降低。在本文中,我们提出了LoopDelta框架,该框架将Delta压缩无缝集成到备份存储的内联去重过程中,通过以下三种技术解决了上述问题:(1)基于双重局部性的相似性跟踪机制,利用逻辑和物理局部性来检测大部分相似的数据块;由于这些数据块的

    来源:ACM Transactions on Storage

    时间:2025-11-07

  • 一种专为现代固态硬盘(SSD)设计的高性能、可扩展的用户空间日志结构文件系统

    AugeFS 是一种针对现代固态硬盘(SSD)设计的可扩展用户空间日志结构文件系统。随着非易失性存储技术的迅速发展,现代SSD具有极低的I/O延迟和极高的吞吐能力。例如,三星Z-SSD、英特尔Optane SSD和东芝XL-Flash等产品可以实现低于10微秒的I/O延迟,并且可以达到高达7.0GB/s的I/O带宽。然而,这些先进的SSD仍然在随机访问中表现出比顺序访问更低的性能。这为构建一种能够充分利用现代SSD顺序访问特性的文件系统提出了挑战。当前的用户空间文件系统(如uFS、Strata等)通常在用户空间中运行,以减少内核的参与,从而提高数据操作的性能。然而,它们通常依赖于内核或受信任的

    来源:ACM Transactions on Storage

    时间:2025-11-07

  • FairyWREN:一种适用于新兴的读写擦除型闪存接口的可持续缓存解决方案

    在数据中心运营中,碳排放问题正日益受到关注。当前数据中心的碳排放量预计将在2038年达到全球排放量的20%,并在2050年达到33%。为了实现净零排放目标,许多公司正在积极采用可再生能源,如太阳能和风能。然而,这种能源转换并未减少数据中心的“隐含碳排放”,即制造、运输和处置组件过程中产生的碳排放。一旦数据中心转向可再生能源,隐含碳排放将占总排放量的80%以上。由于闪存(Flash)在数据中心存储中的重要性,其隐含碳排放问题尤为突出。闪存虽然在每比特的碳排放方面比动态随机存取存储器(DRAM)低12倍,但由于其有限的写入耐久性,使用闪存进行缓存会带来更大的挑战。新一代闪存密度越高,其写入耐久性却

    来源:ACM Transactions on Storage

    时间:2025-11-07

  • SquirrelFS:使用Rust编译器来检查文件系统崩溃时的一致性

    在当今的计算机系统中,文件系统的可靠性和数据完整性是至关重要的特性。特别是在面对突发的系统崩溃或电源中断时,确保文件系统能够恢复到一致的状态,是开发和维护文件系统时需要解决的核心问题之一。传统的文件系统设计通常依赖于运行时的测试或验证机制,但这些方法存在各自的局限性。例如,测试虽然能够发现一些潜在的问题,但无法保证系统完全无误;而验证虽然能够提供更强的保证,但其开发成本高昂,且对开发人员的专业技能要求较高。因此,开发一种既能够提供强一致性保障,又能够在开发效率和实现复杂性之间取得平衡的文件系统,成为了一个值得深入研究的方向。为了应对这一挑战,本文提出了一种新的方法,即通过静态类型检查实现文件系

    来源:ACM Transactions on Storage

    时间:2025-11-07

  • 异构FPGA系统高级综合生态系统的分类学

    随着摩尔定律逐渐接近其极限,领域特定硬件加速器成为维持性能和效率提升的关键路径之一。尽管领域特定加速器在特定任务上表现出卓越的性能和效率,但它们的开发和优化过程却相对繁琐,导致其在异构FPGA系统中的应用受到一定限制。为了克服这些挑战,FPGA(现场可编程门阵列)的高阶综合(High-Level Synthesis, HLS)工具逐渐成为一种重要解决方案。HLS工具通过将软件语言转换为可综合的硬件描述语言(HDL),使开发人员能够以更高的抽象级别进行设计,从而提升生产力。然而,当前HLS相关工具的分类和设计方法仍存在一定的混乱,使得研究者难以统一评估和比较这些工具。因此,本文旨在建立一个明确的

    来源:ACM Transactions on Reconfigurable Technology and Systems

    时间:2025-11-07

  • SLoRa+:一种提升LoRaWAN抗干扰能力的系统框架

    摘要LoRa技术在众多物联网(IoT)应用中发挥着关键作用,它能够实现长距离通信且能耗较低。然而,由于其低功耗特性,LoRa设备容易受到使用相同未经授权频段的其他无线技术的干扰(称为跨技术干扰,CTI)。现有的解决方案主要通过信号分析和编码技术来应对这一问题。尽管已经取得了一定进展,但关于CTI抑制的研究仍需更进一步——即设计一个系统化的框架以提升抗干扰能力。本文提出了SLoRa+这一框架,该框架将符号恢复技术与软解码相结合,从而显著提升LoRa系统的抗干扰性能。SLoRa+的符号恢复过程分为两个阶段,能够以较低的成本恢复受损的LoRa信号,并通过考虑LoRa信号本身及干扰信号的特性来评估恢复

    来源:ACM Transactions on Sensor Networks

    时间:2025-11-07

  • 在ISAC辅助的VEC中,针对对延迟敏感的任务,改进了基于TD3的资源分配优化算法

    摘要车载边缘计算(VEC)应运而生,旨在应对智能车辆服务中大量数据和多样化应用对无线网络日益增长的需求。然而,由于传感器的大量部署导致频谱利用率低、高速移动引起的信号衰减以及计算资源分配问题,智能车辆的实时安全运行受到了阻碍。因此,我们提出了一种基于集成感知与通信(ISAC)技术和正交时频空间(OTFS)技术的资源分配优化方法。具体而言,OTFS被用于复用路边单元(RSU)的雷达资源,从而提高频谱效率。我们建立了通信、车辆移动性、感知和能耗等方面的综合模型,并构建了一个延迟最小化资源分配问题。该问题被建模为一个马尔可夫决策过程,并采用改进的双延迟深度确定性策略梯度(TD3)算法进行求解,该算法

    来源:ACM Transactions on Sensor Networks

    时间:2025-11-07

  • 基于意图的偏好学习网络,用于个性化会话推荐

    摘要如今,基于会话的推荐系统(SRSs)的研究是推荐领域中的热点之一。现有的方法主要根据用户在一个会话中的当前意图(也称为短期偏好)来提供推荐,往往忽略了与这些意图相关的具体偏好。实际上,用户对于不同的意图通常表现出多样的偏好,即使对于相同的意图,不同用户之间的偏好也可能存在显著差异。随着用户在会话中与物品互动,他们的意图也会相应地发生变化。为了提高推荐质量,不仅要考虑用户的意图,还要动态地学习这些意图变化时的偏好变化。在本文中,我们提出了一种新颖的、对用户意图敏感的推荐学习网络(IPLN),该网络包括三个主要模块:意图识别器(intention recognizer)、偏好检测器(prefe

    来源:ACM Transactions on Recommender Systems

    时间:2025-11-07


页次:2827/9721  共194410篇文章  
分页:[<<][2821][2822][2823][2824][2825][2826][2827][2828][2829][2830][>>][首页][尾页]

高级人才招聘专区
最新招聘信息:

知名企业招聘:

    • 国外动态
    • 国内进展
    • 医药/产业
    • 生态环保
    • 科普/健康