
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于单变量压接力曲线的数据驱动时间序列分析数据集:助力制造业质量控制的创新研究
【字体: 大 中 小 】 时间:2025年08月27日 来源:Scientific Data 6.9
编辑推荐:
本研究针对制造业中数据驱动的质量控制系统开发面临的数据瓶颈问题,聚焦压接工艺(crimping)这一关键连接技术,通过采集2,439条压接力曲线(crimp force curves),构建了首个包含多级质量标注的开放数据集。研究人员采用半自动压接机(semi-automatic crimping machine)和应变传感器(strain sensor SDS100),结合人工制备的三种缺陷类型(Missing Strands/Crimped Insulation),建立了包含基线校正(baseline correction)和感兴趣区域(RoI)提取的数据处理流程。该数据集为开发基于机器学习的质量监测系统提供了基准资源,其有效性已通过前期研究验证,在异常检测和多分类任务中显著优于传统监测系统(CFM)。
在制造业数字化转型浪潮中,压接工艺(crimping)作为电线连接的核心技术,其质量直接关系到电气设备的安全性和可靠性。传统质量监测依赖人工特征提取和阈值判断,如同"盲人摸象"难以捕捉复杂缺陷特征。更棘手的是,机器供应商与制造商间的"数据主权鸿沟"——前者缺乏生产数据,后者欠缺分析能力,导致先进的数据驱动技术长期束之高阁。这种困境在汽车线束等安全关键领域尤为突出,一个未被检测到的压接缺陷可能引发整车线路故障。
为破解这一困局,Friedrich-Alexander-Universit?t Erlangen-Nürnberg的Bernd Hofmann团队在《Scientific Data》发表了开创性研究。他们构建了包含2,439条压接力曲线的标注数据集,涵盖0.35mm2和0.50mm2两种导线截面,通过人工制备三类缺陷样本(Missing Strands/Crimped Insulation),首次实现了从二元异常检测(OK/NOK)到多级质量分类的跨越。
研究采用三项关键技术:
1)使用配备应变传感器的半自动压接机(Schaefer CrimpLine 240)采集原始力信号(3,566数据点);
2)通过基线校正(公式1)和RoI提取(公式2)构建标准化处理流程;
3)结合工业监测系统(BB07i)的自动标注与人工多级分类验证。实验采用模块化快换工具(MQC)确保工艺一致性,通过控制剥离长度(4mm/3mm)精确生成缺陷样本。
【数据特征】
数据集包含两个导体-端子组合的力曲线,其中Crimped Insulation类在RoI起始段(约150数据点)呈现显著陡峭特征,而Missing Strands类则表现为轻微波动。0.50mm2导体的峰值压力比0.35mm2高出约30%,反映出材料特性的关键影响。
【技术验证】
通过四项维度验证数据质量:完整性(无缺失数据)、准确性(与工业标准吻合)、一致性(缺陷类标准差达OK类的2-3倍)和唯一性(无重复样本)。特别值得注意的是,监测系统与人工标注在8%样本存在差异,这实际反映了工业标准对缺股容忍度(如12芯导线允许10%缺股)的现实考量。
【应用价值】
该数据集已成功应用于多项前沿研究:在Hofmann等人2025年的工作中,基于该数据训练的模型在跨设备迁移任务中保持85%以上准确率;另一项研究则证明,结合注意力机制的时间序列网络可识别传统系统无法检测的"边缘缺陷"。数据集特有的500点RoI结构,更为UniTS等单变量时序算法提供了理想测试平台。
这项研究的突破性在于:首次建立了连接工业标准(如IEC 60352-2)与机器学习研究的桥梁,其标注体系既包含符合行业规范的二元标签(CFM_label_encoded),又提供精细化的五级分类(Sub_label_encoded)。正如作者强调,这种"双轨制"标注策略,使得数据集既能满足现有工业检测需求,又能支持更智能的质量预测系统开发。随着该数据集在Harvard Dataverse的开放获取,预计将加速制造业质量控制的范式变革——从"阈值报警"迈向"缺陷预诊"的新时代。


生物通微信公众号
知名企业招聘