基于Q-Rung图模糊集理论的集成学习方法在信用风险评估中的应用

《Knowledge-Based Systems》:Q-Rung Picture Fuzzy Sets Theory-Based Ensemble Learning Method for Credit Risk Assessment

【字体: 时间:2026年02月21日 来源:Knowledge-Based Systems 7.6

编辑推荐:

  信用风险评估研究提出融合q-RPFS特征选择与堆叠集成学习的创新框架,通过专家知识量化不确定性并筛选关键变量,显著提升德国信用数据集的预测性能(准确率0.768,AUC0.792),并优于传统模糊AHP、BWM和CRITIC方法。

  
?eyma Yücel Altaya|Betül Turano?lu ?irin
软件工程系,阿塔图尔克大学,埃尔祖鲁姆,25240,土耳其

摘要

信用风险评估旨在评估客户的信用偿还能力并确定相关风险水平。传统方法在有效建模不确定性和管理大型数据集方面常常面临限制,这凸显了改进银行风险管理流程的必要性。此外,评估信用风险对于指导金融机构的决策机制至关重要;然而,传统方法往往难以应对其中的复杂性和不确定性。q-阶梯图模糊集(q-RPFSs)因其处理不确定性的能力而广为人知,为解决这些挑战提供了重要潜力。在本研究中,我们提出了一种新框架,将基于q-RPFS的特征选择与堆叠集成学习方法相结合,以提高预测性能。该框架在德国信用数据集上进行了测试。测试结果表明,该方法的有效性很高,在德国数据集上的准确率为0.768,AUC为0.792,属于文献中表现最好的方法之一。此外,还使用了几种广泛采用的模糊MCDM方法进行了比较实验,包括模糊层次分析法(fuzzy-AHP)、模糊最佳-最差法(fuzzy-BWM)和通过标准间相关性确定标准重要性的方法(fuzzy-CRITIC)。结果表明,基于q-RPFS的方法在预测性能方面始终优于这些替代技术。因此,通过将q-RPFS与机器学习相结合,该方法不仅为金融行业带来了创新解决方案,还为处理现实世界决策中的不确定性提供了强大的框架,从而推动了智能系统的进步。

引言

近年来,消费者信用风险评估有了显著发展,采用了多种方法。最初,该领域依赖于主观判断分析方法,信用专家根据以往决策的经验来评估风险[1]、[2]。然而,这种方法往往不一致、耗时且资源密集,尤其是在处理大型数据集时。随着统计和计算技术的进步,逻辑回归(LR)、决策树(DTs)和神经网络等机器学习方法的有效应用解决了这些挑战[3]、[4]。信用评分是这一过程的关键方面,通常被建模为二元分类任务,使分类器能够利用历史数据来评估消费者信用风险。
信用评分是一种有效的工具,通过减少信息不对称性来管理信用风险。其主要目标是建立一个评分系统,将申请人分类为“信用良好”或“信用风险”。这种评估方法主要关注违约的可能性,通常被视为一种分类任务[5]。创建可靠的信用评分方法的动力基于两个关键因素。首先,这些模型的效率可以显著影响金融机构的盈利潜力。在交易量大的信用市场中,即使模型效率有轻微提高,也能带来巨大的财务收益。其次,对信用风险管理的监管日益严格,进一步凸显了改进这些模型的重要性[6]。
文献综述表明,机器学习技术在信用风险评估过程中显著提高了估计准确性[6]、[7]、[8]、[9]。这些方法分析各种因素,如申请人的过去财务行为、收入水平和债务状况,以生成风险评分。这种评分使金融机构能够更快、更准确地做出决策。
信用风险评估涉及多个标准,确定这些标准对评估过程的影响程度或其相对重要性可以提高评估效果。最关键的标准可以用作机器学习模型中的属性,从而实现更快、更有效的评估。
专家可以使用多标准决策(MCDM)方法有效利用信用数据集的特征。这种方法允许在各种标准的框架内评估多种替代方案[10]。在现实问题中,它提供了一种系统化的解决方案,使决策者能够避免由于偏见和直觉造成的错误。该方法旨在通过考虑所有客观和现实的要素来做出决策[11]。
MCDM支持各个领域的决策过程,包括商业、金融、工程、医疗保健和政治[12]、[13]。在商业中,它用于供应商选择、投资决策和营销策略[14]、[15]。在金融领域,它用于企业的财务绩效评估和风险分析[16]、[17]。在工程领域,它有助于优化设计、选择材料和提高性能。在医疗保健领域,它有助于比较治疗选项和高效分配资源[18]、[19]。在政治领域,它有助于制定公共政策和项目优先级[20]。
信用风险评估本质上是一个多因素问题,因为它依赖于多样的财务、行为和人口统计属性。传统的MCDM方法为评估这些因素提供了有用的工具,但它们往往缺乏捕捉变量之间复杂非线性关系和相互作用的能力[21]。相比之下,集成学习模型提供了一个强大的框架,可以整合多个预测因子,同时减少方差并提高鲁棒性。这些模型不仅提高了预测性能,还提供了一种更系统的方法来处理异构数据源。因此,评估信用风险时需要考虑多个因素,这自然促使人们使用集成学习方法,而不仅仅是依赖MCDM技术。
信用风险评估需要根据各种人口统计和财务属性将申请人分类为“良好”或“不良”。尽管机器学习模型已经取得了显著的预测性能,但大多数现有方法将这项任务视为纯粹的数据驱动问题,忽视了领域专家提供的宝贵知识。专家对信用相关标准重要性的评估往往不精确、犹豫或依赖于具体情境,但在实践中起着关键作用。传统的MCDM方法提供了一种整合专家判断的方法,但通常缺乏捕捉特征之间复杂非线性关系的灵活性。为了解决这些限制,我们设计了一个系统,通过q-RPFS将专家知识整合到信用评分过程中,并将其与集成学习技术相结合,以提高鲁棒性和预测准确性。
在这项研究中,开发了一种基于q-RPFS的集成学习方法用于信用风险评估。所提出的方法使用文献中常用的德国信用数据进行了测试,并使用基于q-RPFS的MCDM方法进行了特征选择。为此,利用了多位金融专家对特征的看法和评估,从而将专家见解整合到信用风险评估过程中。然后,使用堆叠集成方法进行信用风险评估。
我们研究的主要贡献如下:
  • 本研究将q-RPFS理论应用于信用风险评估中的特征选择。这一点很重要,因为金融风险数据涉及不确定性、模糊性和主观判断,这些无法通过清晰的表现形式充分捕捉。通过同时建模正面、中性和负面的成员度,q-RPFS基于专家知识实现了对特征重要性的更丰富评估,为机器学习模型提供了更具信息量和情境意识的输入。
  • 开发了一种将基于q-RPFS的特征选择与多种机器学习算法相结合的新框架。这种集成很重要,因为它结合了关注不确定性的模糊建模和数据驱动的预测学习,将特征评估的可解释性与强大的分类能力结合起来。据我们所知,这是第一项在信用风险评估的机器学习流程中使用q-RPFS的研究,为混合智能分析提供了新的方向。
  • 将金融专家知识整合到特征选择阶段,增强了建模过程的决策相关性。与仅依赖统计标准相比,基于专家的评估使框架能够反映特定领域的风险见解,提高了所选特征的鲁棒性和实际解释性。
  • 所提出的混合框架使用文献中广泛采用的基准数据集进行了验证,允许与现有研究进行透明比较。这不仅证明了该方法的预测准确性,还证明了其在已建立的信用风险评估情境中的可重复性和适用性。
  • 为了验证所提出方法的有效性,与广泛使用的模糊MCDM技术(fuzzy-AHP、fuzzy-BWM和fuzzy-CRITIC)进行了比较分析。结果表明,基于q-RPFS的框架在预测性能方面始终优于这些替代方法,证实了其在处理不确定性和增强信用风险评估方面的更强能力。
  • 本文的其余部分组织如下:第2节回顾了信用风险评估相关的机器学习和MCDM方法。第3节详细描述了本研究中使用的信用数据集。第4节介绍了所采用的方法,第5节介绍了将基于q-RPFS的特征选择与堆叠集成方法相结合的框架。第6节报告了实验结果并讨论了发现。最后,第7节总结了本文并概述了未来研究的方向。

    相关文献

    相关研究

    为了提供文献的结构化概述,本节分为三个小节。第2.1节回顾了广泛应用于信用风险预测的机器学习方法,强调了它们的优点和局限性。第2.2节讨论了将MCDM技术整合到信用风险评估中的研究,特别强调了如何对专家知识和不确定性进行建模。最后,第2.3节总结了现有研究中的局限性

    信用数据集描述

    在本研究中,使用了来自UCI机器学习存储库[76]的德国信用数据。该数据集根据个体的属性将他们分类为良好或不良信用风险,并提供了两个版本。原始文件(‘german.data’)由Hofmann教授提供,包含工作类型、住房状况和用途等分类/符号属性。为了便于使用需要纯数值输入的算法,斯特拉斯克莱德大学制作了一个替代版本

    方法

    基于堆叠的集成模型旨在通过利用多种ML算法的互补优势来提高预测准确性和可靠性。这种方法通过聚合多个基础模型的输出并通过元学习器进行评估。在信用风险评估中,如DT、RF、SVM、KNN和LR等模型可以单独分析风险。然而,堆叠方法利用这些模型的输出创建了一个更强大的预测机制。这不仅减少了

    提出的框架

    本研究提出了一种新颖的混合集成方法,该方法结合了基于q-RPFS的特征选择来评估信用风险。为了提高清晰度,逐步过程也在算法1中进行了总结。这个伪代码说明了在可复现的工作流程中整合基于专家的特征选择与集成学习。
    所提出模型的一般框架如图1所示。如图所示,该模型分为三个关键阶段:

    实验结果

    本节将在以下小节中介绍我们的实验设置和结果。

    结论

    贷款是金融机构的基本活动,为利益相关者提供了巨大好处。然而,由于信息不对称,信用市场可能会出现市场失败,如信用限制和风险[86]。信用风险对这一市场构成了重大威胁,并对金融机构产生了深远影响,尤其是在次贷危机期间。这场危机对发达国家和发展中国家都造成了重大且持久的后果。

    CRediT作者贡献声明

    作者们对本研究做出了平等的贡献。

    资助

    本研究得到了阿塔图尔克大学科学研究项目协调单位的支持,项目编号为15119。

    写作过程中生成式AI和AI辅助技术的声明

    在准备这项工作时,作者使用了ChatGPT来改进语言和可读性。使用该工具后,作者根据需要审查和编辑了内容,并对出版物的内容承担全部责任。

    CRediT作者贡献声明

    ?eyma Yücel Altaya:写作——审阅与编辑,撰写初稿,可视化,验证,方法论,概念化。Betül Turano?lu ?irin:写作——审阅与编辑,撰写初稿,可视化,验证,软件,方法论,概念化。

    利益冲突声明

    作者声明他们没有已知的竞争性财务利益或个人关系可能影响本文报告的工作。
    相关新闻
    生物通微信公众号
    微信
    新浪微博
    • 搜索
    • 国际
    • 国内
    • 人物
    • 产业
    • 热点
    • 科普

    知名企业招聘

    热点排行

      今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

      版权所有 生物通

      Copyright© eBiotrade.com, All Rights Reserved

      联系信箱:

      粤ICP备09063491号