一种具有交错执行和动态执行功能的、面积效率高的机器学习分布式排序(ML-DSA)加速器
《IEEE Transactions on Circuits and Systems I: Regular Papers》:An Area-Efficient ML-DSA Accelerator With Interleaved and Dynamic Execution
【字体:
大
中
小
】
时间:2025年12月29日
来源:IEEE Transactions on Circuits and Systems I: Regular Papers 5.2
编辑推荐:
ML-DSA硬件加速器通过多时钟策略、交错执行与动态执行优化,结合多模多项式算术模块、预加载统一SHA-3模块和BRAM优化提示模块,显著提升面积效率,在三种安全强度下面积-时间积指标分别提升1.21~4.62倍、1.25~5.31倍和1.37~5.49倍,成为当前最面积高效的ML-DSA加速器设计。
摘要:
基于格的数字签名算法CRYSTALS-Dilithium已在NIST后量子密码学(PQC)竞赛后被标准化为ML-DSA。由于ML-DSA具有较高的计算复杂性和大量的数据交互,其硬件实现面临着占用面积大和效率低的问题。本研究通过多种优化措施来实现一个面积效率更高的ML-DSA硬件加速器。具体来说,我们在架构中采用了多时钟策略来最大化模块性能,并引入了交错执行和动态执行技术以提高并行性并减少模块间的等待延迟。此外,我们还设计了几种优化模块来提升该架构的效率,包括多模式多项式算术模块、具有预加载功能的统一SHA-3模块以及基于BRAM的Usehint模块。与现有技术相比,我们的实现分别在三种安全强度下,在面积时间乘积(ATP)指标上实现了1.21~4.62×1.25~5.31×1.37~5.49×的改进。这使我们的设计成为迄今为止面积效率最高的ML-DSA加速器。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号