基于LIME可解释性与Gustafson-Kessel模糊聚类的简历语义分组及文本摘要方法研究

《Knowledge-Based Systems》:Leveraging LIME explainability and Gustafson-Kessel fuzzy clustering for resume grouping and text summarization

【字体: 时间:2025年10月21日 来源:Knowledge-Based Systems 7.6

编辑推荐:

  本文创新性地将可解释人工智能(XAI)技术与Gustafson-Kessel(GK)模糊聚类算法相结合,通过Sentence-BERT生成简历的上下文嵌入表征,利用GK算法捕捉语义关联并生成聚类摘要,同时引入LIME和SHAP解释模型为聚类结果提供局部与全局可解释性,为人力资源管理的简历自动处理提供了透明可信的解决方案。

  
亮点
本研究提出了一种融合可解释人工智能(XAI)与Gustafson-Kessel(GK)模糊聚类的新方法,通过语义嵌入和可解释性分析增强简历分组的透明度与实用性,为人力资源决策提供支持。
研究思路
我们通过Sentence-BERT模型生成简历的上下文嵌入,利用GK模糊聚类算法对语义相似的简历进行分组,并结合LIME和SHAP技术解释聚类结果,提升聚类过程的可信度和可解释性。
GK模糊聚类在简历文本摘要中的适配
本节详细介绍了如何将GK模糊聚类算法应用于简历文本的特征向量聚类。GK算法通过个体协方差矩阵生成椭圆形聚类,有效捕捉简历语句间复杂的语义关系,显著提升聚类质量。
GK模糊聚类的可解释性
模糊聚类算法(如GK)通过软隶属度分配数据点至多个聚类,能够建模复杂重叠模式(如简历嵌入的语义相似性),但软隶属值也增加了结果解释的难度。为提升透明度,我们引入可解释性技术,通过随机森林代理模型近似模糊聚类结果,并利用LIME和SHAP分别提供局部和全局解释,帮助用户理解聚类归属的决策依据。
实验结果
本节综合评估了多种聚类方法在Sentence-BERT嵌入的简历数据上的表现。所提出的GK模糊聚类算法与FCM、k-means、GMM、Agglomerative Clustering、DBSCAN及HDBSCAN等方法进行比较,通过内部聚类质量指标(轮廓系数、Davies–Bouldin指数(DBI)、Calinski–Harabasz指数(CHI)、调整兰德指数(ARI))及可解释性分析验证其优越性。
结论
本研究提出了一种结合GK算法、嵌入摘要与可解释人工智能(XAI)技术(如LIME和SHAP)的简历聚类与摘要新方法。该方法针对简历数据的高维性、语义复杂性及弱特征关联等挑战,在保证性能的同时增强了结果的可解释性。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号