《PLOS One》:Bidirectional fusion heterogeneous graph networks for semi-supervised Bitcoin transaction anomaly detection in dynamic transaction graphs
编辑推荐:
比特币交易网络中的异常检测对于保障区块链安全与稳定至关重要。该网络的异构性结构(heterogeneous structure)与动态特性,加之异常标签的稀缺性,对传统基于图的方法构成了重大挑战。为应对上述问题,研究人员提出了双向融合异构图网络(Bidirec
比特币交易网络中的异常检测对于保障区块链安全与稳定至关重要。该网络的异构性结构(heterogeneous structure)与动态特性,加之异常标签的稀缺性,对传统基于图的方法构成了重大挑战。为应对上述问题,研究人员提出了双向融合异构图网络(Bidirectional Fusion Heterogeneous Graph Network, BF-HGN),一种面向比特币交易异常检测任务的半监督动态模型。BF-HGN设计了多类型特征嵌入与对齐策略,以有效统一异构交易–地址节点间的特征。研究人员提出了双向时序融合机制,以捕获单向模型常遗漏的长程时序依赖关系。为缓解类别不平衡与标注受限问题,研究设计了类别平衡分类器(Class-balanced Classifier, CBC),并结合邻接自适应(Adjacency Adaptation, AA)损失与自适应特征空间调控(Adaptive Feature Space Regulation, AFSR)损失,生成与真实异常高度相似的伪异常节点,从而改善判别边界。在Elliptic++数据集上的实验表明,BF-HGN优于现有方法,交易节点与地址节点的F1分数分别达到0.6301和0.5784,为比特币交易异常检测建立了新的基准。
比特币作为一种去中心化数字货币,凭借其透明性与安全性获得广泛关注。尽管比特币交易在链上可观测,其匿名性亦助长了洗钱、暗网交易等非法活动,对金融健康与稳定构成威胁。因此,比特币交易异常检测成为研究焦点,其准确识别可增强网络安全性并为监管提供支持。在此背景下,基于交易所的"了解你的客户"(Know Your Customer, KYC)程序数据尤为重要,因其能够有效识别目标存款地址及其背后的行为主体。在数据处理阶段,比特币交易数据中的异常样本标注依赖专业知识且成本高昂,而正常样本标注相对容易。因此,本研究提出了一种特殊的半监督学习框架,即仅标注少量正常样本。此外,链上交易数据包含交易节点与地址节点,二者在语义含义和拓扑角色上存在差异,但以往多数研究将交易建模为单一类型节点,忽略了重要的跨类型关系信息。基于上述数据特征,研究人员整合Elliptic++数据集,构建了首个比特币动态异构图数据集。
近年来,图神经网络(Graph Neural Network, GNN)逐渐成为比特币交易网络分析的研究热点。与传统方法相比,GNN能够高效建模图结构、学习节点嵌入并进行多层次信息整合,有效处理网络复杂性并生成低维嵌入表示。常用技术包括图卷积网络(Graph Convolutional Network, GCN)和图自编码器(Graph Autoencoder, GAE)。然而,GCN-based方法在处理长距离依赖方面存在局限,GAE-based方法虽适用于无监督和半监督任务,但在数据极度不平衡时易出现过拟合。具体而言,Pareja等提出EvolveGCN,将GCN扩展至动态图表示学习;Zhao等提出GraphSMOTE,仅关注交易数据中的类别不平衡问题;Liu等开发EvolveGAN,强调动态图中时序演化特征的捕获。但这些方法未能同时解决交易数据的异构性、类别不平衡和时序动态性挑战。
为同时应对上述问题,研究人员提出了BF-HGN,该网络由基于多特征融合的特征提取模块和类别平衡分类器(Class-balanced Classifier, CC)组成。在特征提取阶段,异构图包含特征维度和语义空间各异的节点类别(交易节点和地址节点)。为处理这种异构性,研究人员实验了多种异构特征预处理策略并确定了最优方案。该方案首先对交易节点和地址节点分别组成的同质子图应用独立GCN,以实现各类别内部的特征维度统一和语义对齐。基于处理后的嵌入,重构动态异构图,并设计基于关系图卷积网络(Relational Graph Convolutional Network, RGCN)的网络以提取跨类型高阶关系特征,增强模型对异构信息的表示能力。
同时,在比特币交易网络的动态建模中,时序演化是重要方面。但基础RGCN无法显式编码相邻时间步之间的时序依赖。为解决此局限,研究人员引入EvolveGCN的思想,将长短期记忆网络(Long Short-Term Memory, LSTM)与图卷积耦合,提出扩展框架EvolveRGCN。然而,传统动态模型通常采用单向LSTM,当时序跨度较大时,其学习长程依赖的能力受限。为克服此局限,受双向LSTM(Bidirectional LSTM, Bi-LSTM)在动态信号异常检测中设计的启发,研究人员进一步提出两种双向变体——Bi-EvolveGCN和Bi-EvolveRGCN——用于本任务中的特征提取。它们融合前向和后向时序迭代的节点特征,以增强模型对长期动态交易的建模能力。以时间点2的子图为例,融合特征由时间点2的前向特征和反向特征聚合生成,该机制有效增强了模型挖掘节点间长时跨关联特征的能力。
在分类阶段,为解决未标记异常样本导致的严重类别不平衡问题,研究人员提出CC。其目标是生成与真实困难异常节点特征相似的伪异常节点。生成过程综合考虑真实异常节点的两个核心特征:其一源于真实异常节点与正常节点在邻接关系上的差异,研究人员设计AA损失函数以调整伪异常节点的邻接关系,具体而言,通过参考真实异常节点集的邻接关系,对正常节点集的邻接关系进行调整,生成伪异常交易节点集和地址节点集;其二针对任务核心难点——部分异常节点在特征上与正常节点高度相似,AFSR损失函数通过调控伪异常节点集与正常节点集在特征空间的分布,优化模型识别困难异常的能力。
BF-HGN包含两个核心模块:多类型特征融合提取器(Multi-type Feature Fusion Extractor, MFFE)和CC。在特征提取阶段,MFFE在提取基本特征的基础上,丰富交易节点与地址节点间的异构信息,采用双向时序融合机制嵌入时序信息,深入挖掘跨时间子图依赖关系。Bi-EvolveGCN的核心在于:以时间点t为例,基于两个EvolveGCN网络分别实现,二者核心差异在于参数更新的时间方向相反,通过融合双向特征信息构建Bi-EvolveGCN。具体而言,前向可学习权重参数在时间t输入LSTM单元进行更新,反向参数则由反向时间LSTM更新机制处理。基于上述输出,进一步执行前向和后向节点特征更新操作,最终将双向节点特征拼接得到Bi-EvolveGCN提取的节点特征。
Bi-EvolveRGCN基于RGCN设计,同样采用双向时序依赖可学习参数更新策略。RGCN与GCN的核心差异在于,前者通过分别聚合多类边的邻域节点实现异构图特征提取,而GCN未设计特殊机制处理多类边的邻域聚合。研究中,节点的前向和后向特征分别由RGCN在不同时间方向更新,包含基于各类邻接关系的学习偏置和归一化操作。
特征变换方法是筛选最优预处理策略的关键。研究人员比较并分析了多种方案,包括使用全连接层(Fully Connected layer, FC)、GCN等进行节点集特征变换,以及对低维特征节点集进行扩展操作。经对比,选择融合Bi-EvolveGCN和Bi-EvolveRGCN的特征提取方案,该方案有效实现多类别节点特征转换与提取,性能优异。
CC的设计旨在完成多类节点的有效分类任务。首先,按一定比例随机选择有标签正常节点作为待转换节点集,以控制生成异常节点的比例,帮助BF-HGN学习正常与异常节点的特征差异。接着,通过对相应邻域节点嵌入获得初始伪异常节点集,并预生成服从特定正态分布的噪声矩阵加入其中。加入噪声的目的是在特征空间与正常节点集形成对称,符合困难异常节点的特性,引导伪异常节点生成偏向困难异常节点。随后经FC和ReLU激活层处理,将正常节点特征与该处理结果拼接,并替换图中的伪异常节点集,最终引入由三层FC和两层ReLU组成的多层感知机(Multilayer Perceptron, MLP)执行节点分类任务。
为生成更有利于模型学习的异常节点,研究提出AA损失函数和AFSR损失函数约束伪异常节点生成,同时设置二元交叉熵(Binary Cross-entropy, BCE)损失作为基础损失函数。
AA损失函数旨在将异常节点的图结构先验信息融入异常节点生成过程。BF-HGN利用邻接聚集度差异特征,强制伪异常节点对其邻居的聚集度低于正常节点。具体计算目标节点与其各类邻居节点间的归一化相似度矩阵,与原邻接矩阵相乘获得加权相似度矩阵,进而计算目标节点对图中不同类相邻节点的聚集度。基于各类正常/异常节点的聚集度均值,推导AA损失函数,反映BF-HGN生成的伪异常节点的正负聚集度差异与期望差异之间的偏离程度。
AFSR损失函数关注特征空间分布的关联性,建模与正常节点集特征高度相似的异常节点集,增强模型学习复杂决策边界的能力。该函数计算伪异常节点与加噪正常节点特征差的平方、开方,并求取均值,以反映特征整体差异程度。
整体损失函数在AA和AFSR损失基础上,引入BCE损失函数,通过超参数λ进行加权求和,调整不同损失对BF-HGN的影响。
实验在Elliptic++数据集上进行,该数据集为目前最大的公开比特币交易异构数据集,包含交易(Tr)和地址(addr)两种节点类型,以及四种边关系类型。数据集按时间分为49个时间点,其中1–30为训练集,31–35为验证集,36–49为测试集。预处理包括按时点划分边关系以明确时序相关性,以及将标注异常样本重新标记为未知类别。Tr节点包含167维特征,共203,769个节点;addr节点包含56维特征,共920,691个节点。
研究人员采用精确率(Precision)、召回率(Recall)和F1值作为评估指标。实验基于PyTorch框架,使用NVIDIA RTR 3090 GPU加速,优化器采用Adam,初始学习率设为0.001。每次随机选择五个连续时间点的子图作为训练样本,训练配置为100个轮次。类别权重λ
b1和λ
b0分别设为0.35和0.65。
与现有方法对比实验表明,BF-HGN显著优于各类基线方法。与静态半监督方法GCN和Skip-GCN相比,BF-HGN在Tr和Addr节点集上F1分别提升19.97%和8.24%,验证了时序信息嵌入和跨节点类异构信息引入的显著作用。与静态无监督方法AEGIS和T playbook相比,BF-HGN较优的TAM方法在Tr和Addr节点集上F1分别提升11.8%和8.27%。与动态无监督方法GADY相比,BF-HGN亦分别提升10.27%和7.4%,表明利用部分标记正常节点训练可增强模型针对性并提升性能泛化。与动态半监督任务中基于EvolveGCN-O优化的GPN相比,BF-HGN在Tr和Addr节点集上F1仍分别提升2.49%和2.17%,确认异构信息嵌入可丰富模型输入并增强特征表达能力。
与异构图方法HAN、HGT和HetGNN的对比进一步验证BF-HGN的优越性:较HAN在Tr和Addr节点集上F1分别提升14%和4.94%,较HGT提升18.9%和14.69%,较HetGNN提升8.37%和2.64%。三种特征变换/扩展方法(BF-HGN (& FC)、BF-HGN (& FE)和BF-HGN)的对比实验表明,联合Bi-EvolveGCN和Bi-EvolveRGCN的特征提取策略最优。整体而言,BF-HGN在Tr节点集上表现优于Addr节点集,结合数据集特征分析,Tr节点集数据量更小、异常节点比例更低,表明该方法在处理小样本和低比例异常数据集时具有显著优势。
消融实验验证了各创新模块的有效性。相较于基线方法(EvolveGCN + EvolveRGCN + MLP),BF-HGN在Tr和Addr数据集上F1分别提升10.61%和10.58%。双向时序特征嵌入方法相比单向机制具有显著优势,通过双向时序信息融合嵌入更高效地捕获上下文依赖。在长时距依赖捕获能力探索中,选择时间点35–49的子图进行实验比较,双向时序嵌入方法在长程时序依赖捕获上显著优于基线。节点级案例研究进一步验证:随机选取的时间点35的Tr节点(ID: 54771037)和Addr节点(ID: 1Ej…isz),在时间点42之后,BF-HGN对两类节点类别关联异常节点的准确检测数量几乎始终高于基线模型,尤其在时间点46,BF-HGN比基线模型多检测13个与1Ej…isz关联的异常Addr节点。
计算复杂度分析表明,双向时序融合机制虽需前向和后向传播,但得益于参数共享机制,整体时间复杂度为O(T × (N
2 + M
2) × d),较基线仅增加常数因子(小于两倍),空间复杂度与基线一致为O((N + M) × d + L × d
2)。鉴于Elliptic++数据集特征维度仅为56和167,特征提取阶段神经网络层数仅4层,额外内存开销几乎可忽略。
超参数定量实验确定了最优配置:Bi-EvolveGCN层数为1、Bi-EvolveRGCN层数为2时性能最佳;损失函数比例参数λ取0.5;伪异常样本比例δ在Tr和Addr节点集上均为0.2时达到最优。
可视化实验选取时间点5的子图,采用t-SNE降维算法呈现特征空间。结果表明,BF-HGN生成的伪异常节点在空间分布上与正常节点相似但存在微妙差异,集中于特征空间边界位置,具有高度隐蔽性和难挖掘性,为异常检测模型提供了更具挑战性的训练样本。
研究结论部分指出,本研究系统开展了比特币交易异常检测任务研究,首次定义了"动态异构图半监督比特币异常检测"任务,设计了BF-HGN构建基础框架;在特征提取中,基于RGCN改进构建EvolveRGCN,结合EvolveGCN设计渐进方案,引入LSTM捕获时序特征并通过融合策略深入挖掘动态特征,提出多类型特征融合提取器以增强动态关系建模能力;针对未标记异常样本导致的类别不平衡问题,设计类别平衡分类器,通过AA和AFSR损失函数约束生成伪异常节点以平衡训练数据类别分布。未来研究可扩展至更广泛的金融交易场景,进一步优化特征提取与融合策略,持续改进损失函数优化路径以提升伪异常节点生成质量,同时需将监管、伦理和社会考量纳入异常检测系统设计,以支持负责任和可信赖的金融科技发展。