
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于Jaya算法与蜻蜓优化算法的医疗数据扰动隐私保护与分类研究
【字体: 大 中 小 】 时间:2025年05月12日 来源:Franklin Open
编辑推荐:
本研究针对医疗数据隐私保护与分类的挑战,提出了一种基于Jaya算法的扰动隐私保护方法,并结合蜻蜓优化算法(DIC)实现高效分类。研究通过扰动威斯康星乳腺癌预后数据集(WBC),显著提升了隐私指标(如Secrecy、VD等),同时保持了分类准确性(>90%)。结果表明,Jaya算法在隐私保护和抗ICA攻击方面优于传统方法(2DRT/3DRT),DIC分类器性能接近决策树和随机森林,为医疗数据安全共享提供了新思路。
在数字化医疗时代,海量敏感健康数据的云端存储与共享成为刚需,但随之而来的隐私泄露风险却像达摩克利斯之剑高悬。传统加密技术虽可靠却成本高昂,而主流扰动方法如2DRT/3DRT又面临隐私-效用平衡难题——就像在钢丝上跳舞,稍有不慎就会导致数据要么保护不足,要么失去分析价值。更棘手的是,现有分类算法对扰动数据的适应性参差不齐,这迫使研究人员寻找更智能的解决方案。
中国某高校的研究团队在《Franklin Open》发表的研究中,创造性地将自然界启发的元启发式算法引入医疗数据保护领域。他们采用Jaya算法对威斯康星乳腺癌预后数据集(WBC)中高Pearson相关系数的6个关键属性进行扰动,通过3次迭代生成抗重构的隐私数据。令人惊喜的是,团队开发的蜻蜓优化分类器(DIC)在扰动数据上展现出93.57%的分类准确率,媲美传统决策树(95.32%),同时隐私指标Secrecy达到11.1681,远超2DRT的1.0968。这项研究为医疗数据"可用不可见"提供了创新范式。
研究团队运用了三大关键技术:1)基于热力图(Heatmap)的Pearson相关系数特征选择;2)Jaya算法多目标优化扰动框架,以最小化属性值总和为目标函数;3)蜻蜓优化分类器(DIC),通过动态调整质心距离实现分类优化。特别选用WBC数据集(569例,30个数值属性)验证方案有效性。
隐私保护性能分析
通过6项隐私指标系统评估显示,Jaya算法在Secrecy(11.1681 vs 3DRT的1.0688)、VD(1.4480 vs 0.7399)等核心指标上显著领先。Kolmogorov-Smirnoff检验(p<0.05)证实扰动数据与原始数据分布迥异,而ICA攻击后重构数据仍保持统计差异(p=4.35×10-263),证明隐私保护的鲁棒性。
分类器性能对比
在扰动数据上,DIC以93.57%准确率超越多数传统算法(KNN 65.50%,GNB 66.08%),仅次于随机森林(94.74%)。值得注意的是,DIC在扰动数据上的表现反而优于原始数据(89.47%),这种"逆势提升"现象暗示其特殊的噪声适应机制。Friedman检验显示DIC的FMR达2.7,显著高于PSO衍生算法。
资源效率权衡
Jaya算法虽以O(N2D)时间复杂度(对比2DRT的O(ND))和907KB内存占用暂居劣势,但其隐私-效用平衡优势显著:在保持90%+分类精度的同时,RP值达170.7836,较3DRT提升68%。这种"以空间换安全"的策略在医疗场景中具有特殊价值。
这项研究的突破性在于双轮驱动创新:一方面,Jaya算法通过无参数优化的特性,打破了传统扰动方法依赖矩阵运算的局限,使抗ICA攻击能力提升2.43倍;另一方面,DIC分类器首次证明元启发式算法在扰动数据分类上的可行性,其独特的五行为模型(分离/对齐/凝聚/捕食/逃生)实现了93.57%的准确率。这些发现为医疗数据共享提供了新的技术路径,特别是在需要兼顾数据效用与隐私保护的分布式学习场景中。未来,通过融合电子滤波降噪等技术,或将进一步释放扰动数据的潜在价值,为精准医疗时代的隐私计算开辟新天地。
生物通微信公众号
知名企业招聘