一种具有交错执行和动态执行功能的、面积效率高的机器学习分布式排序（ML-DSA）加速器

首页今日动态人才市场新技术专栏中国科学人云展台
BioHot
云讲堂直播会展中心特价专栏技术快讯免费试用

生物通官微
陪你抓住生命科技
跳动的脉搏

生物通首页 > 今日动态 > 正文

《IEEE Transactions on Circuits and Systems I: Regular Papers》：An Area-Efficient ML-DSA Accelerator With Interleaved and Dynamic Execution

【字体：大中小】 时间：2025年12月29日 来源：IEEE Transactions on Circuits and Systems I: Regular Papers 5.2

编辑推荐：

　　ML-DSA硬件加速器通过多时钟策略、交错执行与动态执行优化，结合多模多项式算术模块、预加载统一SHA-3模块和BRAM优化提示模块，显著提升面积效率，在三种安全强度下面积-时间积指标分别提升1.21～4.62倍、1.25～5.31倍和1.37～5.49倍，成为当前最面积高效的ML-DSA加速器设计。

摘要：

基于格的数字签名算法CRYSTALS-Dilithium已在NIST后量子密码学（PQC）竞赛后被标准化为ML-DSA。由于ML-DSA具有较高的计算复杂性和大量的数据交互，其硬件实现面临着占用面积大和效率低的问题。本研究通过多种优化措施来实现一个面积效率更高的ML-DSA硬件加速器。具体来说，我们在架构中采用了多时钟策略来最大化模块性能，并引入了交错执行和动态执行技术以提高并行性并减少模块间的等待延迟。此外，我们还设计了几种优化模块来提升该架构的效率，包括多模式多项式算术模块、具有预加载功能的统一SHA-3模块以及基于BRAM的Usehint模块。与现有技术相比，我们的实现分别在三种安全强度下，在面积时间乘积（ATP）指标上实现了1.21～4.62×1.25～5.31×1.37～5.49×的改进。这使我们的设计成为迄今为止面积效率最高的ML-DSA加速器。

热点排行

新闻专题

联系信箱：

粤ICP备09063491号