
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于机器学习的数据扰动技术,用于实现隐私保护的数据挖掘
《Scientific Reports》:Machine learning–driven data perturbation techniques for privacy-preserving data mining
【字体: 大 中 小 】 时间:2026年06月08日 来源:Scientific Reports 3.9
编辑推荐:
摘要随着数字信息的迅速增长,数据挖掘活动中敏感个人信息的泄露问题日益突出。隐私保护数据挖掘(PPDM)旨在在允许对数据进行深入分析的同时,保护其中的机密信息。传统的隐私保护方法(如匿名化)通常会降低数据的实用性,而加密方法计算成本较高。本文提出了一种基于扰动的PPDM模型,该模型
随着数字信息的迅速增长,数据挖掘活动中敏感个人信息的泄露问题日益突出。隐私保护数据挖掘(PPDM)旨在在允许对数据进行深入分析的同时,保护其中的机密信息。传统的隐私保护方法(如匿名化)通常会降低数据的实用性,而加密方法计算成本较高。本文提出了一种基于扰动的PPDM模型,该模型将K-means聚类算法与翻转旋转扰动(FRP)算法以及基于层次分析法(AHP)的决策模型相结合。在扰动之前对特征进行降维处理,既能提高隐私保护效果,又能保持分类准确性。实验测试表明,与传统的朴素贝叶斯和模糊逻辑方法相比,该模型在准确性、精确度、召回率和F值方面表现更优。这些结果证实,所提出的框架在平衡数据利用性和隐私保护方面具有很好的效果。