基于LIME可解释性与Gustafson-Kessel模糊聚类的简历语义分组及文本摘要方法研究
《Knowledge-Based Systems》:Leveraging LIME explainability and Gustafson-Kessel fuzzy clustering for resume grouping and text summarization
【字体:
大
中
小
】
时间:2025年10月21日
来源:Knowledge-Based Systems 7.6
编辑推荐:
本文创新性地将可解释人工智能(XAI)技术与Gustafson-Kessel(GK)模糊聚类算法相结合,通过Sentence-BERT生成简历的上下文嵌入表征,利用GK算法捕捉语义关联并生成聚类摘要,同时引入LIME和SHAP解释模型为聚类结果提供局部与全局可解释性,为人力资源管理的简历自动处理提供了透明可信的解决方案。
本研究提出了一种融合可解释人工智能(XAI)与Gustafson-Kessel(GK)模糊聚类的新方法,通过语义嵌入和可解释性分析增强简历分组的透明度与实用性,为人力资源决策提供支持。
我们通过Sentence-BERT模型生成简历的上下文嵌入,利用GK模糊聚类算法对语义相似的简历进行分组,并结合LIME和SHAP技术解释聚类结果,提升聚类过程的可信度和可解释性。
本节详细介绍了如何将GK模糊聚类算法应用于简历文本的特征向量聚类。GK算法通过个体协方差矩阵生成椭圆形聚类,有效捕捉简历语句间复杂的语义关系,显著提升聚类质量。
模糊聚类算法(如GK)通过软隶属度分配数据点至多个聚类,能够建模复杂重叠模式(如简历嵌入的语义相似性),但软隶属值也增加了结果解释的难度。为提升透明度,我们引入可解释性技术,通过随机森林代理模型近似模糊聚类结果,并利用LIME和SHAP分别提供局部和全局解释,帮助用户理解聚类归属的决策依据。
本节综合评估了多种聚类方法在Sentence-BERT嵌入的简历数据上的表现。所提出的GK模糊聚类算法与FCM、k-means、GMM、Agglomerative Clustering、DBSCAN及HDBSCAN等方法进行比较,通过内部聚类质量指标(轮廓系数、Davies–Bouldin指数(DBI)、Calinski–Harabasz指数(CHI)、调整兰德指数(ARI))及可解释性分析验证其优越性。
本研究提出了一种结合GK算法、嵌入摘要与可解释人工智能(XAI)技术(如LIME和SHAP)的简历聚类与摘要新方法。该方法针对简历数据的高维性、语义复杂性及弱特征关联等挑战,在保证性能的同时增强了结果的可解释性。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号