《Systems》:From House of Quality to Neural Architecture: Quality-Informed Neural Networks for Interpretable Classification, with an EU AI Act Compliance Application
编辑推荐:
随着软件系统日益将机器学习(ML)、深度学习(DL)和生成式人工智能(GenAI)组件与经典确定性逻辑相结合,在应用程序代码中系统性地检测基于人工智能的算法元素对于软件审计、符合欧盟人工智能法案(EU AI Act,Regulation (EU) 2024/1
随着软件系统日益将机器学习(ML)、深度学习(DL)和生成式人工智能(GenAI)组件与经典确定性逻辑相结合,在应用程序代码中系统性地检测基于人工智能的算法元素对于软件审计、符合欧盟人工智能法案(EU AI Act,Regulation (EU) 2024/1689)以及质量保证变得至关重要。研究人员介绍了一种称为质量感知神经网络(Quality-Informed Neural Networks, QINN)的架构,其中编码在质量功能展开(Quality Function Deployment, QFD)质量屋(House of Quality, HoQ)中的结构化知识,通过QFD派生的二元结构掩码和知识校准的初始化嵌入到网络拓扑和权重初始化中——直接类比于物理信息神经网络(Physics-Informed Neural Networks, PINNs)。QFD关系矩阵充当结构先验,通过强制网络连接上的领域专家验证的稀疏性,将假设空间约束为质量一致的解决方案,同时可选的QFD正则化损失项为学习到的权重结构提供额外的软约束。作为概念验证,QINN在其掩码架构配置中实例化,用于软件仓库的二分类(AI使能或经典)。在AIC-199概念验证数据集上,所提出的QINN在QFD信息结构掩码下达到了交叉验证AUC为99.47%(±1.18%)、召回率为100.00%(±0.00%)和F1分数为99.02%(±1.34%),在召回率上比非学习的QFD评分基线高出37.37个百分点,在AUC上超过交叉验证的随机森林集成(Random Forest ensemble)2.47个百分点(W = 0, p < 0.05),同时产生了三个QFD基础的解释层次——特征显著性、命名的技术证据激活和每个准则的质量需求分数——直接符合欧盟人工智能法案(EU AI Act)的文件义务。在更大、独立策划的数据集上的验证以及QFD引发过程的敏感性分析被确定为未来工作的优先事项。研究人员提供了一个领域通用的七阶段应用协议。
随着机器学习(ML)、深度学习(DL)和生成式人工智能(GenAI)与经典确定性逻辑的融合,应用程序代码中基于人工智能(AI)算法元素的系统性检测对软件审计、欧盟人工智能法案(EU AI Act, Regulation (EU) 2024/1689)合规及质量保证至关重要。现有方法未能将结构化的质量工程知识作为神经网络(NN)训练的先验约束,且缺乏针对AI/经典软件范式的可解释分类工具。研究人员提出质量感知神经网络(QINN),将质量功能展开(QFD)质量屋(HoQ)中的关系矩阵映射为二元结构掩码、知识校准初始化及可选的Frobenius正则化项,约束网络拓扑与权重学习。在AIC-199数据集(含199个开源仓库,100个AI系统、99个经典系统)上,QINN(选项B)采用27:9:7:1网络架构,缩放共轭梯度算法训练,实现交叉验证AUC 99.47%、召回率100.00%、F1分数99.02%,超越非学习QFD基线(召回率提升37.37个百分点)及随机森林集成(AUC提升2.47个百分点,W=0, p<0.05),并生成三层可解释性链(特征显著性、命名技术证据激活、按准则质量需求分数),直接支撑EU AI Act文档义务。研究人员还提供了领域通用的七阶段应用协议。
研究结果部分保留每个小标题如下:
**4.1 域分类与数据集**:研究人员定义了AI系统(学习统计/参数模型的软件)与经典系统(规则/确定性逻辑)的二元分类,构建了包含199个开源仓库的AIC-199数据集(100个AI、99个经典),涵盖18个AI子类与13个经典子类。
**4.2 输入特征规范**:输入层包含27个可静态提取的仓库指标(归为6个功能组),每个特征具有QFD原理,对应层1技术证据神经元的证据关系。
**4.3 QFD关系矩阵M
1与M
2**:M
1(9×27)将27个输入特征映射到9个命名技术证据神经元(如依赖证据、推理证据、训练证据等);M
2(7×9)将技术证据映射到7个质量需求神经元(如推理/预测能力、模型运行、训练/适应能力等)。矩阵值采用QFD标准序数标度(0,1,3,9),经专家启发得出。
**4.4 网络架构与训练配置**:QINN采用四层前馈网络27:9:7:1,层1与层2使用tansig激活,输出层使用sigmoid。评估三种选项:选项A(仅QFD初始化)、选项B(QFD初始化+结构稀疏掩码,训练时强制禁止连接)、选项C(选项B基础上添加Frobenius正则化)。使用缩放共轭梯度算法训练,最大1000轮,早停耐心25轮。
**4.5 分类性能**:选项B在五折交叉验证下达到准确率98.97%(±1.40%)、召回率100.00%(±0.00%)、F1分数99.02%(±1.34%)、AUC 99.47%(±1.18%)、MCC 0.979(±0.0275)。阈值扫描显示0.05阈值下召回率与准确率均达100.00%,表明两类分数完全分离。
**4.6 嵌入式可解释性**:QINN提供三层可解释性:特征级(W
(1)权重幅度识别最影响特征,如预测/推理调用密度、嵌入操作等);神经元级(9个技术证据神经元激活图显示AI类与经典类明显区隔,如h
11依赖证据在AI类一致高激活);需求级(7个质量需求神经元激活反映每项准则的满足程度,直接对应EU AI Act定义组件)。
**4.7 与基线分类器的比较**:QINN选项B在召回率上较非学习QFD评分基线(召回率62.63%)提升37.37个百分点;在AUC上较交叉验证随机森林(AUC 97.00%)提升2.47个百分点(W=0, p<0.05),且方差更小。所有三个QINN选项均超越随机森林。
**4.8 泛化与可重复性**:QFD掩码将有效参数从332降至约200,参数-样本比约1.0,结合结构正则化防止过拟合。五折交叉验证标准差低(AUC ±1.18%),分数分布显示分离间隙0.9994。QFD矩阵提供版本控制,更新可局部传播至架构。
讨论部分总结:QINN作为通用方法论贡献,将QFD知识转化为神经网络的结构先验,类比PINN但知识来源为专家共识。在AI/经典软件判别应用中,QINN解决了EU AI Act下系统识别AI组件的操作化空白,其三层可解释性链直接支撑法案文档义务。研究人员提供了七阶段应用协议,适用于医疗器械合规、结构工程、生物医学信号分析等领域。结论部分翻译如下:本文引入了QINN,一种将QFD质量屋结构化知识嵌入神经网络拓扑、权重初始化和损失函数中的框架,直接类比于PINN。QFD关系矩阵M
1和M
2被转化为二元结构掩码约束网络连接、Frobenius范数正则化项锚定学习权重至专家指定关系强度,以及屋顶矩阵派生相关性惩罚确保指标间一致性。通过这三种机制,专家知识主动塑造网络的假设空间与损失景观。在AIC-199概念验证数据集上,选项B(QFD信息结构掩码,最佳结果)实现交叉验证AUC 99.47%、召回率100.00%、F1分数99.02%,分数分离间隙0.9994确认完全双峰区分。相比非学习QFD评分基线,召回率提升37.37个百分点;相比交叉验证随机森林集成,AUC提升2.47个百分点(W=0, p<0.05),同时提供三层内在可解释性链,直接支撑EU AI Act(Regulation (EU) 2024/1689)的文件与审计义务。方法论层面,QINN证明质量工程知识构成神经网络训练的有效归纳偏置。应用层面,实验确立QFD结构先验在法规相关任务中的性能与可解释性优势。社会与法规层面,该应用直接填补EU AI Act操作化中的空白。研究人员提供了领域通用的七阶段应用协议,展示通过替换QFD矩阵即可将框架转移至任意质量关键分类问题。未来工作将扩展至五类别AIC分类、进行QFD矩阵敏感性分析、完整选项C训练以及深层层级化HoQ形式学拓展。