生物通-更多新闻

当前位置：首页 > 今日动态 > 科研动态/国外

代码审查中的责任机制：内在驱动因素的作用以及大型语言模型（LLMs）的影响

在软件开发领域，责任（accountability）是构建团队协作与组织稳定的重要机制。它不仅是一种对个人行为的约束，更是一种在社会系统中个体如何与他人互动并维护自身形象的动态过程。随着软件工程（Software Engineering, SE）实践日益依赖人工智能技术，特别是大型语言模型（Large Language Models, LLM）的引入，如何保持责任机制的完整性成为研究的重要议题。本文旨在探讨代码审查过程中，社会因素如何影响软件工程师对代码质量的责任感，并分析LLM辅助审查对责任机制的潜在影响。### 责任在软件工程中的重要性在软件工程中，责任是维持系统稳定性和推动个体决策向积极

来源：ACM Transactions on Software Engineering and Methodology

时间：2025-11-07
《Saga：解读移动应用评论中的故事》

摘要在线故事讲述是用户表达自身经历和观点的重要渠道，从而影响网络社会。然而，尽管其重要性不言而喻，但在社交媒体上对故事的理解方法并未取得足够进展。目前的方法可以对大量故事进行高层次的汇总分析，但无法深入理解单个故事。我们关注了一个重要的社会行为来源——应用评论，但令人惊讶的是，这类评论在社交媒体研究中的研究相对较少。我们发现应用评论中通常包含一个或多个故事，这些故事具有复杂的结构，并且常常以非自然顺序呈现。因此，我们提出了Saga这一方法，它能够深入分析应用评论中出现的基于事件的结构和子结构。Saga的主要贡献在于其在识别细粒度故事（子结构）方面超越了现有技术的水平。此外，该方法还支持根据这些

来源：ACM Transactions on the Web

时间：2025-11-07
针对文件缓存页面的细分内存管理

在当前的计算机系统设计中，随着数据密集型应用的迅速发展，传统的集中式内存架构面临着越来越多的挑战。这些应用通常需要处理大规模的数据集，而物理内存的容量往往无法满足其需求，尤其是在处理机器学习、大数据处理等场景时。为了解决这一问题，研究者们开始探索如何通过“内存解耦”技术来扩展系统内存的使用范围，使内存资源能够更高效地被多个客户端共享，从而提升整体性能并减少内存浪费。本文介绍了一种名为BalloonStasher的创新解决方案，它基于RDMA（远程直接内存访问）技术，专门用于扩展文件回写页（file-backed pages）的缓存容量，从而优化数据密集型应用的性能表现。### 内存解耦与文件回

来源：ACM Transactions on Storage

时间：2025-11-07
在移动电子健康应用程序中更好地支持人类需求：改进指南的制定与验证

随着移动设备的普及，eHealth应用在健康管理和医疗护理中扮演着越来越重要的角色。这些应用旨在帮助用户进行自我管理，提供居家治疗方案，并通过教育、感知和互动等方式实现个性化护理。然而，eHealth应用的用户群体极为多样，涉及年龄、性别、认知能力、情绪状态、语言水平、社会经济状况、教育背景以及各种身体和心理挑战等因素。许多现有的eHealth应用未能充分考虑这些多样性，导致其在实际使用中效果不佳甚至无法使用。因此，本文提出了一套更全面且可操作的指导原则，以更好地支持这些多样化的用户需求。我们不仅讨论了如何在实际应用中解决关键的人类因素，如可用性、可访问性、可靠性和有效性，还通过收集专家开发人

来源：ACM Transactions on Software Engineering and Methodology

时间：2025-11-07
危机信息学中的大型语言模型在零样本和少样本分类中的应用

摘要本文探讨了使用预训练的大型语言模型（LLMs）进行危机分类的方法，以解决标注数据依赖性问题。我们提出了一种通过微调来增强开源LLMs的方法，从而创建出能够与传统的监督学习模型相媲美的零样本和少样本分类器，用于对危机相关信息进行分类。通过对比研究，评估了使用通用领域预训练的LLMs、特定危机领域的LLMs以及传统监督学习方法在危机分类任务中的表现，为该领域树立了基准。我们针对特定任务微调的Llama模型在分类人道主义信息时取得了69%的宏观F1分数——即使训练数据有限，这一成绩也比Llama基线模型提高了26%。此外，该模型在宏观F1分数上比ChatGPT4高出3%。当使用多任务数据进行微调

来源：ACM Transactions on the Web

时间：2025-11-07
针对两极分化事件中的社交媒体话语进行的无监督框架分析

摘要本研究探讨了在线极化领域中“框架”（frames）的概念，重点关注社交媒体平台。该研究深化了对框架的理解——这些框架是新兴的、复杂的，且往往具有微妙性——如何在极化的在线对话中变得突出。研究提出了一种综合方法，用于识别和描述这些框架，整合了机器学习技术、网络分析算法和自然语言处理工具。该方法旨在实现跨多个平台和用户参与类型的通用性。为了严格评估识别出的框架候选者，引入了两个新的指标：“同质性”（homogeneity）和“相关性”（relevance）。基于几个基本假设（包括主题和多词表达在框架构建中的作用），该研究揭示了框架如何在数字社区中形成并获得重要性。研究探讨的问题包括识别框架的方

来源：ACM Transactions on the Web

时间：2025-11-07
端到端轨迹生成：深度生成模型与语言模型的对比

随着科技的发展，定位技术的进步使得我们能够收集到大量关于移动物体的数据，包括GPS轨迹、车辆车队的离散签到数据以及基于位置的服务数据。这些数据的广泛应用推动了时空数据挖掘、数据管理以及交通规划和城市分析等领域的研究进展。然而，由于实际大规模数据集的获取存在一定的限制，合成轨迹数据在这些研究领域中发挥着关键作用。现有的轨迹生成方法大多依赖于预定义的启发式规则，无法学习到轨迹生成过程中的未知机制。为了解决这些问题，本文提出了一种新的端到端轨迹生成方法，包括一种基于深度生成模型的EETG-SVAE框架和一种受语言模型启发的EETG-LM方法。### 轨迹生成的挑战轨迹生成面临几个主要挑战。首先，如何

来源：ACM Transactions on Spatial Algorithms and Systems

时间：2025-11-07
IDEA中的物理索引与逻辑索引：具备倒排去重功能的索引

在当今信息检索领域，随着在线数据量的不断增长，保持可靠的数据索引变得尤为重要。这些数据不仅被用于数据挖掘和自然语言处理，还被大量的搜索引擎用户进行搜索。与此同时，越来越多的主存储系统采用数据去重技术，将重复的逻辑数据块替换为指向唯一物理副本的引用。然而，传统的索引机制并未考虑数据去重，这可能导致严重的效率问题。具体而言，索引的大小会随着逻辑数据量的增加而增加，与去重比例无关，从而消耗大量存储和内存资源，并且使得查找操作变慢。此外，逻辑上的连续访问在创建索引时会变成对物理数据块的随机且冗余访问，这会显著影响性能。目前，据我们所知，没有任何去重存储系统支持完整的关键词索引。本文提出了一种面向数据去

来源：ACM Transactions on Storage

时间：2025-11-07
2022年ACM SIGSPATIAL会议优秀论文特刊

这期特刊收录了2022年ACM SIGSPATIAL会议优秀论文的扩展版本。其中五篇论文由会议程序委员会联合主席推荐：加拿大温哥华东北大学的Mario Nascimento教授、美国明尼苏达大学的Shashi Shekhar教授以及中国微软研究院的Xing Xie教授。这些论文在会议程序委员会成员中获得了最高评价，并得到了联合主席的认可。五篇论文中有三篇的作者接受了扩展论文的邀请，并提交了扩展版本，以供ACM TSAS期刊发表。要符合ACM TSAS的发表标准，一个重要条件是扩展版本必须包含至少30%的新内容，相较于会议发表的原始版本。最终是否发表由ACM TSAS的审稿人和编辑委员会决定，他

来源：ACM Transactions on Spatial Algorithms and Systems

时间：2025-11-07
比较回音室效应检测指标：对Twitter和Reddit的跨模型及跨平台分析

社交媒体平台已成为公众讨论的核心场所，使不同用户群体能够交换思想和信息。然而，随着“回音室”现象的兴起，即用户通过反复与持相同观点的其他用户互动来强化自身的信念，这一现象对民主思想交流和信息混乱的潜在风险日益显著。本文旨在对主流文献中提出的回音室检测指标进行比较分析，并聚焦于由两个主要社交媒体平台构成的跨平台场景，即Twitter（现更名为X）和Reddit。回音室检测指标涵盖了网络分析、内容分析以及混合解决方案。本文的研究成果揭示了这两个社交媒体平台上回音室的独特动态，同时指出了各种指标在识别回音室时的优势与局限性，并探讨了它们在不同社会图谱建模和领域中的适用性。在社交媒体的使用日益普及的背

来源：ACM Transactions on the Web

时间：2025-11-07
在线情绪脉动：揭示动态社交媒体环境中的情感反应

在当今社会，社交媒体已经成为人们表达观点、分享信息和讨论事件的重要平台。这种信息环境的丰富性和动态性为研究人员、政策制定者以及企业提供了深入了解社会现象的契机。然而，社交媒体上的信息往往是高度异质化的，涉及广泛的话题和事件，使得从这些数据中理解社会行为变得复杂。为了应对这一挑战，我们提出了一种系统性的方法，用于检测和测量人们对现实事件的情绪反应，并通过基于Transformer的主题模型进一步解释这些反应。我们展示了这种方法在三个不同数据集上的应用效果，包括（1）2020年1月至8月的洛杉矶推文数据，揭示了黑人生命至上运动和新冠疫情对公众心理的深远影响；（2）美国关于堕胎权利的讨论数据，揭示了

来源：ACM Transactions on the Web

时间：2025-11-07
追溯2010年至2021年间Twitter上“暗黑模式”（Dark Patterns）的历史与演变

在当今数字化迅速发展的时代，技术设计与用户行为之间的互动关系日益受到关注。随着技术在生活中的广泛应用，设计者为了提升用户使用体验，采取了多种手段，其中一些被批评为具有欺骗性和操控性的设计策略。这些策略在学术界被广泛称为“暗模式”（dark patterns），并逐渐成为公众、隐私学者、法律学者以及监管机构关注的焦点。暗模式不仅影响了用户的选择自由和自主性，也引发了关于技术伦理、社会影响以及用户权益保护的广泛讨论。为了更深入地理解这一现象，本文探讨了从2010年6月至2021年4月期间，围绕“#darkpatterns”这一标签在Twitter上的讨论演变历程。通过结合定量和定性分析方法，研究揭

来源：ACM Transactions on Social Computing

时间：2025-11-07
BLA：一种适用于去中心化存储数据完整性的拜占庭容错懒审计框架

摘要随着区块链技术的兴起，去中心化的趋势已经扩展到远程存储领域，从而催生了去中心化存储这一有前景的存储模型。这种变化体现在其开放、公平的访问方式、对中间机构的依赖减少以及强大的隐私保护机制上。然而，与集中式存储类似，数据管理的去中心化也带来了一些挑战，例如所有权与控制权的分离，以及对外部管理数据的完整性审计需求。目前主流云存储所采用的集中式审计模型无法直接应用于去中心化存储环境。此外，基于同态验证标签（HVT）的审计模型存在计算成本高和审计效率低等显著问题。为了解决这些问题，我们提出了一种新的拜占庭容错懒审计框架（BLA），以确保去中心化存储环境中的数据完整性。该框架的一个关键创新在于其层次化

来源：ACM Transactions on Storage

时间：2025-11-07
基于认知模型的动态网络攻击者仿真及其在网络安全训练中的意义

研究背景与意义网络安全防御训练面临重大挑战，传统攻击仿真多采用静态、确定性策略，如BeelineRed和MeanderRed，这些策略虽高效但易于预测，难以真实模拟人类攻击者的适应性和随机性。认知模型，特别是基于实例的学习理论（Instance-Based Learning Theory, IBLT），能模拟人类决策中的动态学习和适应过程，为开发更真实的攻击者仿真提供了新途径。本文通过系统实验，评估了静态攻击策略与动态认知攻击者（IBLRed）在对抗不同防御者时的表现，旨在验证认知模型在提升网络安全训练效果方面的潜力。实验设计与方法实验采用网络防御任务环境，模拟包含用户子网、企业子网和操作子网

来源：ACM Transactions on Social Computing

时间：2025-11-07
HaParallel：一种基于命中率感知的并行式激进驱逐缓存管理算法，适用于固态硬盘（SSDs）

摘要固态硬盘（SSD）可以分为两种类型：带有内置缓存的和没有内置缓存的。在性能方面，带有缓存的SSD相比没有缓存的SSD具有显著的优势。本文的主要关注点是SSD中内置缓存的管理。通过大量先前的研究，我们发现对于大多数工作负载来说，缓存命中率仍然相对较低。首先，基于这一观察结果，我们采用了一种积极的驱逐策略，这种策略与传统基于按需驱逐的算法不同。其次，考虑到缓存数据的时间局部性和并行性，我们引入了多层链表来组织缓存数据。这样，可以通过较小的计算负载来提高触发高级命令的概率。最后，借鉴计算机网络中的拥塞控制算法，我们设计了一个能够感知缓存命中率的单元。该单元可以根据自身的状态采用不同程度的积极驱逐

来源：ACM Transactions on Storage

时间：2025-11-07
范围：无服务器计算的性能测试

摘要无服务器计算是一种流行的云计算范式，已在各种在线工作负载中得到广泛应用。它允许软件工程师将云应用程序开发为一组函数（称为“无服务器函数”）。然而，由于无服务器函数运行环境的高度动态性，准确测量其性能（即端到端响应延迟）颇具挑战性。为了解决这个问题，一种可能的解决方案是应用性能测试技术来确定在一系列输入条件下需要重复执行某个无服务器函数多少次，以适应性能波动。然而，现有文献中缺乏专门为无服务器计算设计的性能测试方法。在本文中，我们提出了首个面向无服务器计算的性能测试方法（SCOPE）。SCOPE考虑了无服务器函数的独特性能特性，如执行时间短和按需触发。因此，SCOPE被设计为一种细粒度的分析

来源：ACM Transactions on Software Engineering and Methodology

时间：2025-11-07
Resonance+：将保护性行动决策模型应用于为公共信息官员寻找有用信息

随着社交媒体在危机情境中的广泛使用，公众与官方应急响应渠道之间的互动变得更为频繁和多样化。这种互动形式为危机管理提供了更多机会，使公众能够参与危机信息的传播和讨论，从而形成更加开放的沟通环境。然而，面对海量的社交媒体信息，官方应急响应人员，尤其是公共信息官员（PIOs），在信息筛选和理解公众对风险的认知方面面临挑战。为了应对这一问题，研究人员提出了多种技术解决方案，但这些方法往往忽视了公众在危机中的认知和感知过程。因此，开发一种能够量化公众认知和感知变化的指标，对于提升危机信息管理的有效性至关重要。在危机管理中，公众对事件的感知和态度往往能够提供关键信息，帮助官方更准确地了解公众的需求和情绪反

来源：ACM Transactions on Social Computing

时间：2025-11-07
提升Android恶意软件检测能力：ChatGPT对以决策为中心的任务的影响

随着大型语言模型（如ChatGPT）的兴起，其非决策性模型特性被应用于多种任务中。此外，ChatGPT也引起了对传统决策性任务的Android恶意软件检测的关注。尽管学者们提出了许多有效的检测方法，但这些方法在可解释性方面存在明显不足。具体而言，这些方法在对应用程序进行良性或恶意分类时表现出色，能够检测恶意行为，但在解释其决策过程方面往往无法提供详细的分析和解释。这一挑战引发了对现有检测方案可靠性的担忧，并质疑了这些方法是否真正理解复杂数据的能力。在本研究中，我们探讨了非决策性模型ChatGPT对传统决策性任务的Android恶意软件检测的影响。我们选择了三个最先进的解决方案，包括Drebin

来源：ACM Transactions on Software Engineering and Methodology

时间：2025-11-07
探究网络讨论中的自杀相关因素：对Reddit上的情感表达和主题内容的分析

摘要自杀仍然是一个严重的全球健康问题，尽管一直在努力预防，但每年导致死亡的人数仍在增加。当前的研究广泛探讨了影响自杀倾向的因素，强调了创伤、心理健康障碍和社会关系的重要性。然而，传统的研究往往依赖于传统的数据来源，并且通常孤立地考察风险因素，这可能无法完全捕捉到社交媒体平台上的动态变化。为了解决这些局限性，我们的研究利用了r/SuicideWatch和r/Teenagers的数据来分析与自杀念头相关的情感情绪和主题，其中r/Teenagers作为对比参考。通过运用自然语言处理（NLP）技术和统计方法（包括情感分析和BERTopic建模），我们旨在更深入地了解导致自杀念头的相关因素。使用Text

来源：ACM Transactions on the Web

时间：2025-11-07
AugmenToxic：利用强化学习优化大型语言模型（LLM）的指令微调，以增强数据增强效果，从而提升毒性检测能力

摘要应对在线讨论中的恶意语言问题对于开发有效的恶意语言检测模型至关重要。这项开创性的工作重点在于通过引入一种新的方法来增强恶意语言数据，从而解决恶意语言检测数据集不平衡的问题。我们通过使用强化学习与人类反馈（RLHF）来指导大型语言模型（LLMs）的微调，从而创建了一个平衡的数据集。鉴于从社交媒体平台收集足够的恶意样本以构建平衡数据集的挑战，我们的方法包括利用优化后的生成式LLMs对现有样本进行改写，以实现句子级别的文本数据增强。在利用生成式LLM的过程中，我们采用近端策略优化器（PPO）作为RL算法来进一步微调模型，并使其与人类反馈保持一致。换句话说，我们首先使用专门为改写任务定制的指令数据

来源：ACM Transactions on the Web

时间：2025-11-07

页次：2826/9721 共194410篇文章
分页：[<<][2821][2822][2823][2824][2825][2826][2827][2828][2829][2830][>>][首页][尾页]

高级人才招聘专区