近年来,消费者信用风险评估有了显著发展,采用了多种方法。最初,该领域依赖于主观判断分析方法,信用专家根据以往决策的经验来评估风险[1]、[2]。然而,这种方法往往不一致、耗时且资源密集,尤其是在处理大型数据集时。随着统计和计算技术的进步,逻辑回归(LR)、决策树(DTs)和神经网络等机器学习方法的有效应用解决了这些挑战[3]、[4]。信用评分是这一过程的关键方面,通常被建模为二元分类任务,使分类器能够利用历史数据来评估消费者信用风险。
信用评分是一种有效的工具,通过减少信息不对称性来管理信用风险。其主要目标是建立一个评分系统,将申请人分类为“信用良好”或“信用风险”。这种评估方法主要关注违约的可能性,通常被视为一种分类任务[5]。创建可靠的信用评分方法的动力基于两个关键因素。首先,这些模型的效率可以显著影响金融机构的盈利潜力。在交易量大的信用市场中,即使模型效率有轻微提高,也能带来巨大的财务收益。其次,对信用风险管理的监管日益严格,进一步凸显了改进这些模型的重要性[6]。
文献综述表明,机器学习技术在信用风险评估过程中显著提高了估计准确性[6]、[7]、[8]、[9]。这些方法分析各种因素,如申请人的过去财务行为、收入水平和债务状况,以生成风险评分。这种评分使金融机构能够更快、更准确地做出决策。
信用风险评估涉及多个标准,确定这些标准对评估过程的影响程度或其相对重要性可以提高评估效果。最关键的标准可以用作机器学习模型中的属性,从而实现更快、更有效的评估。
专家可以使用多标准决策(MCDM)方法有效利用信用数据集的特征。这种方法允许在各种标准的框架内评估多种替代方案[10]。在现实问题中,它提供了一种系统化的解决方案,使决策者能够避免由于偏见和直觉造成的错误。该方法旨在通过考虑所有客观和现实的要素来做出决策[11]。
MCDM支持各个领域的决策过程,包括商业、金融、工程、医疗保健和政治[12]、[13]。在商业中,它用于供应商选择、投资决策和营销策略[14]、[15]。在金融领域,它用于企业的财务绩效评估和风险分析[16]、[17]。在工程领域,它有助于优化设计、选择材料和提高性能。在医疗保健领域,它有助于比较治疗选项和高效分配资源[18]、[19]。在政治领域,它有助于制定公共政策和项目优先级[20]。
信用风险评估本质上是一个多因素问题,因为它依赖于多样的财务、行为和人口统计属性。传统的MCDM方法为评估这些因素提供了有用的工具,但它们往往缺乏捕捉变量之间复杂非线性关系和相互作用的能力[21]。相比之下,集成学习模型提供了一个强大的框架,可以整合多个预测因子,同时减少方差并提高鲁棒性。这些模型不仅提高了预测性能,还提供了一种更系统的方法来处理异构数据源。因此,评估信用风险时需要考虑多个因素,这自然促使人们使用集成学习方法,而不仅仅是依赖MCDM技术。
信用风险评估需要根据各种人口统计和财务属性将申请人分类为“良好”或“不良”。尽管机器学习模型已经取得了显著的预测性能,但大多数现有方法将这项任务视为纯粹的数据驱动问题,忽视了领域专家提供的宝贵知识。专家对信用相关标准重要性的评估往往不精确、犹豫或依赖于具体情境,但在实践中起着关键作用。传统的MCDM方法提供了一种整合专家判断的方法,但通常缺乏捕捉特征之间复杂非线性关系的灵活性。为了解决这些限制,我们设计了一个系统,通过q-RPFS将专家知识整合到信用评分过程中,并将其与集成学习技术相结合,以提高鲁棒性和预测准确性。
在这项研究中,开发了一种基于q-RPFS的集成学习方法用于信用风险评估。所提出的方法使用文献中常用的德国信用数据进行了测试,并使用基于q-RPFS的MCDM方法进行了特征选择。为此,利用了多位金融专家对特征的看法和评估,从而将专家见解整合到信用风险评估过程中。然后,使用堆叠集成方法进行信用风险评估。
我们研究的主要贡献如下:
•本研究将q-RPFS理论应用于信用风险评估中的特征选择。这一点很重要,因为金融风险数据涉及不确定性、模糊性和主观判断,这些无法通过清晰的表现形式充分捕捉。通过同时建模正面、中性和负面的成员度,q-RPFS基于专家知识实现了对特征重要性的更丰富评估,为机器学习模型提供了更具信息量和情境意识的输入。
•开发了一种将基于q-RPFS的特征选择与多种机器学习算法相结合的新框架。这种集成很重要,因为它结合了关注不确定性的模糊建模和数据驱动的预测学习,将特征评估的可解释性与强大的分类能力结合起来。据我们所知,这是第一项在信用风险评估的机器学习流程中使用q-RPFS的研究,为混合智能分析提供了新的方向。
•将金融专家知识整合到特征选择阶段,增强了建模过程的决策相关性。与仅依赖统计标准相比,基于专家的评估使框架能够反映特定领域的风险见解,提高了所选特征的鲁棒性和实际解释性。
•所提出的混合框架使用文献中广泛采用的基准数据集进行了验证,允许与现有研究进行透明比较。这不仅证明了该方法的预测准确性,还证明了其在已建立的信用风险评估情境中的可重复性和适用性。
•为了验证所提出方法的有效性,与广泛使用的模糊MCDM技术(fuzzy-AHP、fuzzy-BWM和fuzzy-CRITIC)进行了比较分析。结果表明,基于q-RPFS的框架在预测性能方面始终优于这些替代方法,证实了其在处理不确定性和增强信用风险评估方面的更强能力。
本文的其余部分组织如下:第2节回顾了信用风险评估相关的机器学习和MCDM方法。第3节详细描述了本研究中使用的信用数据集。第4节介绍了所采用的方法,第5节介绍了将基于q-RPFS的特征选择与堆叠集成方法相结合的框架。第6节报告了实验结果并讨论了发现。最后,第7节总结了本文并概述了未来研究的方向。