《Results in Engineering》:Pre-occupation evaluation of perceived indoor environmental quality with a BIM-integrated single-score assessment
编辑推荐:
本文针对传统CMOS技术能效瓶颈,提出了一种基于碳纳米管场效应晶体管(CNTFET)的近似混合乘法器。通过优化4:2和5:2压缩器结构,消除了冗余进位依赖,在32nm工艺下实现功率7.95μW、延迟0.315ns的优异性能。图像处理验证显示PSNR达54.23dB,SSIM为98.5%,为边缘AI和实时多媒体系统提供了高能效解决方案。
随着物联网和边缘计算的快速发展,对低功耗高性能计算芯片的需求日益迫切。传统CMOS技术面临着短沟道效应、漏电流和能效瓶颈等挑战,难以满足下一代智能系统对计算效率和能耗的严苛要求。在此背景下,碳纳米管场效应晶体管(CNTFET)因其高载流子迁移率、近弹道传输特性和纳米尺度下的优异可扩展性而备受关注。同时,近似计算作为一种创新的设计范式,通过有意识地放松计算精度来大幅提升能效,特别适用于图像处理、机器学习和多媒体等容错应用领域。
在这项发表于《Results in Engineering》的研究中,Arun Kolukulapally等人创新性地将CNTFET技术与近似计算相结合,提出了一种基于CNTFET的混合近似乘法器架构。该研究通过系统性的器件建模、电路设计和架构优化,在保持高精度的同时显著提升了能效比。
研究团队采用了多项关键技术方法:首先基于斯坦福32nm CNTFET模型进行器件特性建模,通过Cadence Virtuoso平台实现电路设计与仿真;其次开发了新型的4:2和5:2近似压缩器结构,通过布尔简化消除了冗余进位依赖;最后构建了8×8位Dadda乘法器架构,并采用MATLAB进行图像处理验证,评估峰值信噪比(PSNR)和结构相似性指数(SSIM)等指标。
2.3. 压缩器架构研究
研究人员对传统的4:2和5:2压缩器进行了深入分析,发现传统设计中存在的冗余进位依赖关系增加了逻辑复杂性和晶体管数量。通过真值表分析和布尔简化,研究团队提出了无进位输入的优化压缩器设计,显著降低了电路复杂度。
3.1. 4:2和5:2压缩器优化
提出的4:2压缩器将逻辑门数量从9个减少到7个,功率从0.394μW降低至0.268μW(降低32%),延迟从24.7ps减少至19.3ps(降低22%)。5:2压缩器更是将逻辑门从18个大幅减少至9个,功率从0.415μW降至0.297μW,延迟从31.6ps降至26.4ps。
4.2. 器件特性与比较分析
CNTFET与传统MOSFET的对比显示,CNTFET在导通电流、开关特性和阈值电压灵敏度方面均优于MOSFET。n型CNTFET的阈值电压约为0.3V,比MOSFET低约0.1V,实现了更早的导通和更快的开关速度。
4.3. 提出的近似压缩器
优化的压缩器设计在保持功能准确性的同时,显著减少了逻辑深度和内部开关活动。4:2压缩器的功率延迟乘积(PDP)为0.0062fJ,5:2压缩器为0.0099fJ,较现有设计有显著提升。
4.4. 乘法器级性能分析
完整的8×8混合近似乘法器在0.9V电源电压下,功率消耗仅为7.95μW,最大延迟为0.315ns,PDP为2.50fJ。与现有设计相比,功率降低33.5%,延迟减少30.6%,PDP改善超过54%。
4.5. 应用级评估(图像处理)
在实际图像处理任务中,该乘法器表现出色,PSNR达到54.23dB,SSIM为98.5%,视觉质量损失可忽略不计,显著优于其他近似乘法器设计。
研究结论表明,这种CNTFET基近似混合乘法器成功实现了高性能、低功耗和高精度的平衡。通过消除冗余逻辑路径和优化压缩器结构,该设计在纳米尺度下展现了卓越的能量效率。PVT(工艺-电压-温度)分析和蒙特卡洛仿真进一步验证了设计在变化环境下的鲁棒性,所有关键时序参数的变异系数均低于1%。这项研究为下一代边缘计算设备、便携式成像系统和实时多媒体处理平台提供了有前景的解决方案,展示了CNTFET技术在突破传统硅基电子学限制方面的巨大潜力。未来工作将聚焦于更大规模乘法器的实现、硬件原型制作以及更先进的变异感知模型开发,进一步推动该技术向实际应用迈进。