
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于图生成对抗学习的非平衡时间序列分类方法ITS2Graph研究
【字体: 大 中 小 】 时间:2025年06月29日 来源:Neural Networks 6.0
编辑推荐:
为解决时间序列分类(TSC)中类别不平衡导致的模型偏差问题,研究人员提出ITS2Graph框架,通过图结构捕捉时间序列高阶关联,结合生成对抗网络(GAN)增强少数类样本表征。实验表明,该方法在21个UCR数据集和医疗数据集上AUC、F1和G-mean指标显著优于11种基线模型,为工业故障预测、疾病诊断等场景提供新思路。
在医疗诊断和工业监测等领域,时间序列数据常呈现严重的类别不平衡问题——例如罕见病病例或设备故障样本远少于正常样本。这种分布不均导致传统分类模型倾向于忽略少数类,严重影响关键场景的预测性能。现有方法如过采样(SMOTE)或代价敏感学习往往难以捕捉时间序列间复杂的高阶关联,而图神经网络(GNN)虽能建模关系数据,却缺乏针对类别不平衡的生成能力。
为解决这一挑战,中国国家自然科学基金支持的研究团队提出创新性框架ITS2Graph。该方法首次将时间序列分类重构为图节点分类任务:先通过自编码器提取时序潜在特征,构建基于相似性的图结构;再设计图生成器合成少数类节点的特征与拓扑连接,配合图卷积网络(GCN)判别器进行对抗训练。这种设计使模型能同时利用原始数据分布和隐式关联信息,显著提升对少数类的识别能力。
关键技术包括:1) 基于自编码器的时序特征提取;2) 节点相似性图构建;3) 融合拓扑结构的图生成对抗网络(Graph-GAN);4) 21个UCR基准数据集和真实医疗数据集验证。
Graph Construction
通过自编码器将原始时间序列压缩为低维向量,计算余弦相似度构建k近邻图,使相似时序在图中形成连接。该步骤将传统TSC问题转化为节点分类,为捕捉跨序列依赖奠定基础。
Graph-Based Generative Adversarial Learning
生成器通过聚合邻居节点特征合成逼真的少数类样本,判别器采用两层GCN区分真实与生成节点。对抗训练过程中,生成器逐步学会保留原始数据流形结构的合成策略,有效缓解过拟合。
Experiment
在极端不平衡场景(少数类占比<10%)下,ITS2Graph在F1分数上平均提升12.7%,G-mean指标优于次优模型9.3%。医疗数据测试显示其对心电异常节律的召回率达89.2%,显著高于传统方法。
研究证实,通过图结构建模时序数据的高阶关联,结合对抗生成增强少数类表征,能突破传统样本级方法的局限。该成果发表于《Neural Networks》,为金融欺诈检测、工业设备预警等需要识别罕见模式的场景提供了新范式,尤其对样本稀缺的医疗辅助诊断具有重要应用价值。
生物通微信公众号
知名企业招聘