基于LIME可解释性与Gustafson-Kessel模糊聚类的简历语义分组及文本摘要方法研究

首页今日动态人才市场新技术专栏中国科学人云展台
BioHot
云讲堂直播会展中心特价专栏技术快讯免费试用

生物通官微
陪你抓住生命科技
跳动的脉搏

生物通首页 > 今日动态 > 正文

《Knowledge-Based Systems》：Leveraging LIME explainability and Gustafson-Kessel fuzzy clustering for resume grouping and text summarization

【字体：大中小】 时间：2025年10月21日 来源：Knowledge-Based Systems 7.6

编辑推荐：

　　本文创新性地将可解释人工智能（XAI）技术与Gustafson-Kessel（GK）模糊聚类算法相结合，通过Sentence-BERT生成简历的上下文嵌入表征，利用GK算法捕捉语义关联并生成聚类摘要，同时引入LIME和SHAP解释模型为聚类结果提供局部与全局可解释性，为人力资源管理的简历自动处理提供了透明可信的解决方案。

亮点

本研究提出了一种融合可解释人工智能（XAI）与Gustafson-Kessel（GK）模糊聚类的新方法，通过语义嵌入和可解释性分析增强简历分组的透明度与实用性，为人力资源决策提供支持。

研究思路

我们通过Sentence-BERT模型生成简历的上下文嵌入，利用GK模糊聚类算法对语义相似的简历进行分组，并结合LIME和SHAP技术解释聚类结果，提升聚类过程的可信度和可解释性。

GK模糊聚类在简历文本摘要中的适配

本节详细介绍了如何将GK模糊聚类算法应用于简历文本的特征向量聚类。GK算法通过个体协方差矩阵生成椭圆形聚类，有效捕捉简历语句间复杂的语义关系，显著提升聚类质量。

GK模糊聚类的可解释性

模糊聚类算法（如GK）通过软隶属度分配数据点至多个聚类，能够建模复杂重叠模式（如简历嵌入的语义相似性），但软隶属值也增加了结果解释的难度。为提升透明度，我们引入可解释性技术，通过随机森林代理模型近似模糊聚类结果，并利用LIME和SHAP分别提供局部和全局解释，帮助用户理解聚类归属的决策依据。

实验结果

本节综合评估了多种聚类方法在Sentence-BERT嵌入的简历数据上的表现。所提出的GK模糊聚类算法与FCM、k-means、GMM、Agglomerative Clustering、DBSCAN及HDBSCAN等方法进行比较，通过内部聚类质量指标（轮廓系数、Davies–Bouldin指数（DBI）、Calinski–Harabasz指数（CHI）、调整兰德指数（ARI））及可解释性分析验证其优越性。

结论

本研究提出了一种结合GK算法、嵌入摘要与可解释人工智能（XAI）技术（如LIME和SHAP）的简历聚类与摘要新方法。该方法针对简历数据的高维性、语义复杂性及弱特征关联等挑战，在保证性能的同时增强了结果的可解释性。

热点排行

新闻专题

联系信箱：

粤ICP备09063491号