-
SSD4Rec:一种用于高效序列推荐的结构化状态空间对偶模型
摘要在现代推荐系统中,序列推荐方法至关重要,因为它们能够根据用户过去的交互行为敏锐地理解用户兴趣的变化。然而,当前方法(例如基于RNN或Transformer的模型)面临的一个重大挑战是,如何通过建模长时间的行为序列来有效且高效地捕捉用户的偏好,这在用户交互频繁的短视频平台等场景中成为制约因素。最近,一种名为Mamba的新架构应运而生,该架构基于状态空间模型(SSM),并结合了高效的硬件感知设计,在序列建模方面展现了巨大潜力,为有效解决这一挑战提供了新的途径。受此启发,我们提出了一种新颖的、通用的高效序列推荐框架(SSD4Rec),该框架将Mamba架构进行了优化以适应推荐任务。具体而言,SS
来源:ACM Transactions on Information Systems
时间:2025-11-08
-
统一操作、一致的查询响应机制
摘要操作一致性查询回答(CQA)是一种新兴的CQA框架,它基于对修复操作和一致性答案的重新定义,从而实现了具有明确误差保证的高效近似方法。其核心思想是从一个不一致的数据库开始,通过迭代应用各种操作(例如删除事实),直到达到满足给定约束条件的数据库状态。这种方式允许我们灵活地控制操作的执行概率,进而计算出操作修复的成功概率,以及由此产生的答案的一致性概率。为操作分配概率的一种自然方法是使用均匀概率分布,这种分布可以应用于合理的范围,例如操作修复集合、能够导致操作修复的操作序列集合,以及在修复过程中某个阶段可用的操作集合。这种方法通常被称为“均匀操作CQA”。本研究的目标是对精确和近似的均匀操作C
来源:ACM Transactions on Database Systems
时间:2025-11-08
-
UNGER:通过语义和协同集成实现统一代码的生成式推荐系统
摘要随着生成式范式的兴起,生成式推荐系统受到了越来越多的关注。其核心组成部分是项目“代码”,通常通过量化协作式或语义表示来生成,作为上下文中的候选项目标识符。然而,现有方法通常为每种模式分别生成代码,这导致计算和存储成本增加,并阻碍了它们互补优势的整合。鉴于这一限制,我们试图将两种不同的模式整合到一个统一的代码中,从而充分发挥它们之间的互补作用。尽管如此,这种整合仍然具有挑战性:通过简单的连接方法得到的集成嵌入可能会导致协作知识的利用率低下,从而影响推荐效果。为了解决这个问题,我们提出了一种名为UNGER的新方法,该方法将语义知识和协作知识整合到一个统一的代码中,用于生成式推荐。具体来说,我们
来源:ACM Transactions on Information Systems
时间:2025-11-08
-
TreeTracker Join:简单、高效、快速
摘要我们提出了一种新的线性时间无环连接算法——TreeTracker Join(简称TTJ)。该算法可以理解为一种带有一些特殊处理的流水线式二进制哈希连接算法:当哈希查找失败时,TTJ会将执行流程重置到导致失败的元组绑定处,并将该元组从关联关系中移除。与目前已知的最佳线性时间无环连接算法Yannakakis算法相比,TTJ具有相同的渐进复杂度,同时开销更低。此外,我们证明了通过计算哈希查询次数来衡量查询性能时,TTJ在相同的查询计划下能够达到或超过二进制哈希连接算法的性能。这一特性与查询计划本身以及数据结构的无环性无关。通过引入一种称为“树卷积”(tree convolution)的新超图分解
来源:ACM Transactions on Database Systems
时间:2025-11-08
-
执行证明:通过推测性执行实现低延迟共识
摘要比特币的引入推动了基于区块链的弹性数据管理系统的开发,这些系统能够抵御故障、实现联邦数据管理,并支持数据溯源。决定此类弹性数据管理系统性能的关键因素是系统用于在所有参与者之间复制客户端事务的共识协议。不幸的是,现有的高吞吐量共识协议成本较高,且会显著增加事务处理的延迟,这使得它们无法用于响应速度快的高性能数据管理系统中。在这项工作中,我们通过引入“执行证明共识协议”(Proof-of-Execution,简称PoE)来改善这一状况。PoE是一种专为高性能、低延迟的弹性数据管理设计的共识协议。该协议引入了“推测性执行”机制,即在达成共识之前就开始执行事务,同时通过“执行证明”机制来确保事务能
来源:ACM Transactions on Database Systems
时间:2025-11-08
-
在使用通用语言的分布式离散事件系统中实现零延迟循环
摘要离散事件(DE)系统是一种并发程序,其组件通过带有标签的事件进行通信,这些标签来自一个完全有序的集合。分布式离散事件(DDE)系统则是组件(反应器)通过网络进行通信的离散事件系统。大多数执行平台要求,对于包含循环的DDE系统,每个循环必须至少包含一个逻辑延迟,并且事件的标签会递增。有些平台还施加了更严格的限制,即不允许任何组件产生与触发输入具有相同时间戳的输出(组件的“前瞻性”必须大于零)。然而,这些限制并不符合离散事件优雅的定点语义。唯一的基本要求是程序必须是构造性的,即不存在因果循环。在本文中,我们提出了一种协调DDE系统执行的方法,该方法能够运行任何构造性程序,甚至是包含零延迟循环(
来源:ACM Transactions on Modeling and Computer Simulation
时间:2025-11-08
-
光传输算子的谱理论
摘要光传输算子(Light Transport Operators,LTOs)是计算机图形学中的一个基本概念,它们将虚拟环境中的单次光线反射过程建模为无限维空间上的线性算子。尽管LTOs在渲染过程中起着关键作用,但以往的研究主要集中在光场的光谱分析上,而非算子本身。本文对LTOs的光谱特性进行了深入研究。由于LTOs的非紧凑性,传统的光谱分析技术在处理这类问题时面临挑战。然而,许多实用的渲染方法实际上采用了紧凑的近似方法,这表明非紧凑性并非绝对的障碍。我们展示了这些近似方法的重要性,并建立了LTOs光谱的各种路径积分表述形式。这些发现加深了对光传输过程的理论理解,为提高渲染效率和精度提供了新的
来源:ACM Transactions on Graphics
时间:2025-11-08
-
利用几何场实现稳健的Biharmonic剥皮算法
摘要有界双调和权重是一种常用的工具,用于在动画中操纵和变形角色、计算降阶模拟以及为几何处理定义特征描述符。这种技术需要对由表面围成的体积进行四面体划分,但这可能会导致网格划分异常或四面体划分失败。我们提出了一种“无网格”且“鲁棒”的自动皮肤生成技术,其生成的权重效果可与当前最先进的方法相媲美,即使在开放表面、三角形集合或点云等当前方法无法处理的场景中也能稳定工作。我们通过利用硬件光线追踪技术实现的专用拉格朗日表示法来实现这一目标,这种方法无需使用有限元,同时能够优化双调和能量并满足边界条件。我们的技术框架具有灵活性,允许在优化过程中通过权重绘制来实现艺术化的控制效果。我们对该方法进行了全面的定
来源:ACM Transactions on Graphics
时间:2025-11-08
-
迈向基于代理的建模中验证实践的标准化:一个分层式的ABM验证框架
摘要基于代理的建模(ABM)由于其能够准确表示多种代理的行为和交互而获得了广泛关注。然而,要确保ABM的可靠性和被广泛接受,需要进行严格的验证。遗憾的是,现有文献往往缺乏将代表性的验证方法整合到一个统一的框架中,这阻碍了标准化验证实践的发展。本研究旨在提出一个全面且实用的验证框架。首先,我们明确了三个基本概念:校准、验证和确认。接着,我们回顾了17种不同的验证方法,并根据它们的数据需求和适用于各种仿真方法的程度对它们进行了分类。为了与ABM的流程保持一致,我们引入了一个分层ABM验证(HAV)框架,该框架分为三个层次:代理层、模型层和输出层。每个层次根据数据的可用性推荐相应的验证方法,从而提高
来源:ACM Transactions on Modeling and Computer Simulation
时间:2025-11-08
-
揭开膀胱炎(Cystitis Cystica)的神秘面纱——病例系列分析及文献综述
膀胱炎囊性变(Cystitis Cystica, CC)是一种与膀胱黏膜过度增生相关的疾病,其特征是黏膜下陷窝中的移行上皮细胞形成液体填充的囊性腔隙。这些陷窝也被称为“Brunn nests”,在慢性炎症刺激下可能经历腔化过程,进而发展为囊性改变。此外,部分病例可能进一步出现腺样化(Cystitis Cystica et Glandularis, CCG)或肠化(Intestinal Metaplasia, IM)等变化。CC的确切发病率尚不清楚,但有研究表明,其与多种潜在的危险因素密切相关,如慢性尿路感染(UTI)、机械性刺激(如结石)、留置导尿管、神经源性膀胱、慢性膀胱出口梗阻以及膀胱外翻
来源:JU Open Plus
时间:2025-11-08
-
采用“海星手术”后,四部位肌电假肢系统的功能结果与患者满意度:病例系列研究
摘要 引言 部分手部截肢会显著影响精细运动技能和日常功能。肌电假肢是一种功能性解决方案,但受到手部信号传输效果不佳以及可用控制点位有限的限制。 “海星手术”(starfish procedure)增强了残余肢体肌肉与假肢传感器之间的连接,从而改善了对假肢手指的控制。 方法 这项前瞻性病例系列研究评估了部分手部截肢患者在接受“海星手术”后安装商用四点肌电假肢的功能结果和患者满意度。评估指标包括南安普顿手部评估程序(SHAP)、夹子移动测试(CRT)、NAS
来源:JPO: Journal of Prosthetics and Orthotics
时间:2025-11-08
-
综述:遗传性平滑肌瘤病中的肾癌与肾细胞癌:流行病学、临床特征、治疗及预后的综述
Hereditary Leiomyomatosis and Renal Cell Cancer (HLRCC)是一种由fumarate hydratase(FH)基因胚系致病性变异引起的罕见常染色体显性遗传综合征。该综合征以皮肤和子宫平滑肌瘤(ULs)为典型临床表现,并伴随肾细胞癌(RCC)的高风险,患者终身患癌风险可达10%-20%。尽管已有较多研究关注FH基因突变与RCC的关联性,但关于该疾病从流行病学特征到临床管理的系统性证据仍存在显著缺口。近期一项覆盖382例患者的深度综述研究,通过整合病例报告、队列研究和临床试验数据,揭示了HLRCC相关RCC的临床特征、诊疗挑战及未来研究方向。##
来源:JU Open Plus
时间:2025-11-08
-
利用矢状长度区分PRI-MUS 4和PRI-MUS 5病变
微超声(micro-US)作为一种新兴的影像技术,已被证明在前列腺癌(PCa)的检测方面与多参数磁共振成像(MRI)具有相当的准确性。然而,与用于MRI的前列腺影像报告和数据系统(PI-RADS)不同,PRI-MUS系统在区分4分和5分病灶时并不依赖肿瘤的大小。这种依赖于声学特征的分类方式可能导致不同操作者之间的解释差异,进而影响前列腺癌的检测率。因此,本研究旨在评估是否可以将病灶的矢状长度作为区分PRI-MUS 4和5分病灶的一个客观标准,以提高检测准确性。在研究中,研究人员回顾性分析了275例在加州大学洛杉矶分校(UCLA)医疗中心接受微超声引导活检的男性患者。这些患者在活检时被分配了PR
来源:JU Open Plus
时间:2025-11-08
-
基于序列对树的2.5D集成电路热感知芯片片级封装
摘要本研究开发了一种高效的热感知芯片组布局工具,该工具采用了序列对表示法。它提供了基于线长驱动的布局方案以及热感知布局方案。基于线长驱动的方案结合了基于序列对的树状结构、并行分支定界算法以及先进的布局/剪枝技术,从而能够高效地找到最小线长布局。热感知方案则将基于线长驱动的方案与热感知的网权重决策方法以及芯片组放置后的优化流程相结合,有效地在芯片组的线长和温度之间进行权衡。与现有的最先进的基于线长驱动的芯片组布局工具相比,本研究开发的工具不仅能够找到相同或更短的最小线长布局,而且运行速度最多可以提高两个数量级。在考虑热效应的情况下,热感知方案能够在保证所有情况均满足热约束的前提下,将最大温度降低
来源:ACM Transactions on Design Automation of Electronic Systems
时间:2025-11-08
-
喷墨打印电子产品的布局分解与打印时间优化
摘要喷墨打印电子器件是一种适用于大规模生产的低成本方案。为避免制造缺陷,近期研究考虑了设计约束(如拉普拉斯约束和相邻元件之间的冲突),将布局分解为多个层次,并依次进行打印。最先进的研究通过优化层数和干燥时间来缩短制造时间。在本研究中,我们试图从新的角度提高制造效率,同时优化喷墨打印电子器件的打印时间和布局分解方式。我们提出了一种整数线性规划模型和动态规划算法,用于确定布局分解和层次分配,并通过仔细考虑打印特性和设计约束来估算总打印时间。实验结果表明,整体打印时间显著缩短,从而提升了制造效率。
来源:ACM Transactions on Design Automation of Electronic Systems
时间:2025-11-08
-
一种高效且有效的优化算法,用于AQFP电路中缓冲器和分离器的插入
摘要绝热量子通量参量器(Adiabatic Quantum-Flux Parametron,AQFP)是一种超导技术,与传统CMOS结构相比具有极低的功耗。由于AQFP逻辑门均采用交流电流驱动,因此需要额外的缓冲单元来平衡数据路径的长度。此外,由于AQFP逻辑门的输出电流较弱,无法同时驱动多个逻辑门,因此还需要分流单元来分路多输出端的逻辑门的信号。对于AQFP电路而言,所需的额外缓冲单元和分流单元的数量可能远超过逻辑门的数量,这会显著影响电路的功耗、性能和面积。在这项工作中,我们提出了几种技术来:(i)减少所需缓冲单元和分流单元的总数;(ii)调整逻辑门的电平,以寻找更多的优化机会。实验结果表
来源:ACM Transactions on Design Automation of Electronic Systems
时间:2025-11-08
-
DeepVerifier:学习更新测试序列以实现基于覆盖率的验证
摘要验证对于确保现代复杂计算系统的可靠运行至关重要。然而,随着处理器设计的日益复杂,传统的静态验证技术难以生成能够实现全面覆盖的高质量测试序列。基于动态仿真的方法利用覆盖驱动的目标,可以提高对处理器正确功能的信心,但由于生成冗余测试序列和较大的计算开销,这些方法的验证效率往往较低。为了解决这些问题,本文提出了一种名为DeepVerifier的新颖覆盖引导测试生成框架,该框架利用数据驱动的方式学习现有测试序列及其相关的覆盖反馈。DeepVerifier使用语言模型来学习测试序列的语义表示,确保遵循语法规范,并估计测试序列与覆盖分数之间的关系。通过更新具有更高覆盖率的测试序列,DeepVerifi
来源:ACM Transactions on Design Automation of Electronic Systems
时间:2025-11-08
-
G-kway:一种利用任务图并行性的多层GPU加速k-way图划分器
摘要图划分对于许多CAD算法的设计至关重要。然而,随着图规模的不断扩大,图划分的工作量变得日益繁重。最近的研究引入了利用多核CPU或GPU的并行图划分器。不过,现有CPU图划分器的加速效果通常仅限于少数几个核心,而基于GPU的解决方案的性能则受到可用GPU内存的限制。为了解决这些问题,我们提出了G-kway,这是一种高效的多级GPU加速的k-way图划分器。G-kway采用了一种基于并查集的有效粗化算法以及一种新颖的基于独立集的细化算法,显著提升了粗化和细化阶段的处理速度。此外,当细化算法中的内核启动开销较大时,G-kway会使用CUDA Graph技术进行去粗化操作,以降低开销并提升性能。实
来源:ACM Transactions on Design Automation of Electronic Systems
时间:2025-11-08
-
AiTPO:KAN-UNet异构网络用于全局路由中的时序预测与优化
摘要在集成电路设计中,路由是实现时序闭合的关键步骤。由于详细路由(DR)过程耗时较长、缺乏准确的路由信息以及全局路由(GR)期间拥堵的影响,在全局路由阶段快速获得精确的时序信息以指导后续的时序优化是一个重大挑战。这些挑战导致GR阶段估计的时序与DR后的实际结果之间存在显著差异,从而使得对芯片性能的评估不准确。为了解决这个问题,我们提出了一个有效的时序预测和优化框架AiTPO。创新的KAN-UNet异构时序预测模型有效地结合了UNet和KAN网络。通过将UNet提取的空间特征与数值数据融合,该模型能够学习多模态数据之间的复杂关系,从而提高其鲁棒性和准确性。此外,在全局路由过程中,我们引入了两种时
来源:ACM Transactions on Design Automation of Electronic Systems
时间:2025-11-08
-
基于簇的多引脚基板布线优化,用于细间距球栅阵列
摘要作为集成电路(IC)与印刷电路板(PCB)之间的重要纽带,封装基板中的布线在信号和电源传输的效率与准确性方面起着关键作用。尽管许多研究致力于改进基板布线方式,以规避低效、耗时且容易出错的手动流程,但很少有研究真正解决多引脚网络(尤其是引脚数量较多的网络)的布线问题。本文提出了一种针对细间距球栅阵列(BGA)封装的多引脚网络布线框架,该框架包括引脚分组、最小生成树拓扑生成以及组拓扑连接三个阶段。该框架将网络连接分为不同类别,优先确定其布线顺序,并采用多种布线方法和策略来提升整体的布线可行性。通过对六个实际工业设计案例的实验验证,结果表明,与现有最先进技术相比,我们的框架能够同时且高效地处理双
来源:ACM Transactions on Design Automation of Electronic Systems
时间:2025-11-08