离散选择建模中机器学习方法的决策性能提升分析

《Decision Analytics Journal》:An analysis of machine learning approaches for enhancing decision-making in complex discrete choice tasks

【字体: 时间:2026年02月16日 来源:Decision Analytics Journal CS10.9

编辑推荐:

  本研究探讨了如何利用机器学习突破传统参数化离散选择模型的局限,以更灵活的数据驱动方法学习个体异质性下的偏好。研究人员评估了四种机器学习模型(多项逻辑回归、广义可加模型、孪生神经网络和高斯过程)在五种重要行为科学选择规则下的表现。蒙特卡洛模拟和真实能源政策偏好数据的案例研究均表明,半参数与非参数模型总体上优于参数模型,尤其在高维属性和训练数据有限时优势更明显。该研究为政策中心的离散选择建模提供了模型选择的实践指导,展示了机器学习在复杂决策偏好获取中的可行性与前景。

  
理解个体在多个离散选项之间如何做出决策,是行为科学、经济学和公共政策制定等多个领域的核心问题。无论是在交通方式选择、能源政策偏好还是医疗方案决策中,我们都需要预测和理解人们的行为。传统的离散选择建模(Discrete Choice Modeling, DCM)通常依赖于参数化模型(如混合Logit模型),这些模型虽然有效,但存在一个根本性局限:它们必须预先假设一个描述人类选择行为的特定函数形式。这种参数化假设在面对现实中复杂的、非线性的、异质性的个体决策模式时,往往会显得力不从心,导致模型灵活性和准确性受限。
那么,能否采用一种更“智能”的方式,直接从数据中学习个体的决策规则,而无需施加严格的先验假设呢?近年来兴起的机器学习(Machine Learning, ML)方法为此提供了新的可能。机器学习擅长从高维、复杂数据中发现模式,理论上可以更好地捕捉个体决策的异质性和复杂性。然而,一个关键问题尚未得到充分解答:在个体偏好存在显著差异(个体异质性)且训练数据有限——这是实际偏好获取(Preference Elicitation)中常见的挑战——的背景下,不同的机器学习模型究竟在多大程度上能够准确地学习和预测个体遵循的潜在“选择规则”(Choice Rule)?
为了回答这个问题,来自卡尔加里大学(University of Calgary)的Sheng Lun (Christine) Cao、Destenie Nock和Alex Davis在《Decision Analytics Journal》上发表了一项研究。他们进行了一项系统的基准评估,旨在比较参数化、半参数化和非参数化机器学习方法在学习和预测多种心理学驱动的离散选择规则方面的能力。这项研究不仅填补了离散选择建模与心理学决策过程建模之间的理论鸿沟,也为政策制定者、市场研究人员和行为科学家在选择合适的分析工具时提供了宝贵的实证依据。
为开展这项研究,研究人员主要采用了以下关键技术方法:首先,他们设计了一个数据生成过程,模拟个体使用五种经典选择规则(线性强效用、单调强效用、理想点、词典序半序和多属性线性弹道累加器)进行二选一强制选择任务,并通过改变属性数量、训练集规模和选择规则确定性等参数来创建多样化的实验场景。其次,他们选用了四种具有代表性的机器学习模型进行对比:参数化的多项逻辑回归(Multinomial Logistic Regression, MNL)和孪生神经网络(Twinned Neural Network, TNN),半参数化的广义可加模型(Generalized Additive Model, GAM),以及非参数化的高斯过程(Gaussian Process, GP)。最后,研究采用蒙特卡洛(Monte Carlo)模拟来确保结果的稳健性,并使用贝叶斯信息准则(Bayesian Information Criterion, BIC)等多种指标全面评估模型性能。此外,他们还利用一项真实的能源政策偏好调查数据进行案例研究,验证模型在实际应用中的表现。
4. 结果
4.1. 大选择集实验
该实验评估了当选择方案属性数量从2个增加到15个时,各模型的预测性能。结果表明,没有单一模型在所有选择规则上都表现最佳。
  • 模型性能总结:GAM在预测线性强效用规则(平均BIC=690.6)和MLBA规则(851.2)时表现最好;GP在预测理想点规则(1723.8)和单调强效用规则(1787.1)时表现最佳;而TNN则在预测词典序半序规则(389.9)时最优。
  • 属性数量增加的影响:随着属性数量的增加,模型性能变化因规则而异。对于线性和单调强效用规则,所有模型的BIC平均下降了24%至41%,意味着模型拟合度随信息量增加而改善。对于理想点规则,GAM和GP的性能提升了约10-11%,而MNL和TNN则下降了6%。相反,对于词典序半序和MLBA规则,所有模型的BIC均大幅增加(49%至120%),表明在这些复杂非线性规则下,属性增加会导致模型预测误差显著增大。蒙特卡洛模拟的不确定性在大多数情况下随属性增加而降低。
4.2. 小选择集实验
该实验考察了在训练数据有限(仅10至100个选择集)的情况下模型的性能。
  • 模型性能总结:在小训练集场景下,GAM在线性强效用、单调强效用和词典序半序规则上表现最佳,而GP在理想点和MLBA规则上领先。
  • 训练集规模扩大的影响:普遍而言,增加训练选择集的数量能显著改善所有模型在所有选择规则上的预测性能,BIC降幅在5%到96%之间。同时,模型预测的蒙特卡洛不确定性也随着训练数据的增加而降低。
4.3. 确定性实验
该实验通过调整确定性系数α(从0到10),评估了当个体选择从完全随机(α=0)趋向完全确定(α=10)时模型的性能变化。
  • 主要发现:随着选择规则确定性的增强,所有模型的预测性能均得到改善,BIC降幅在0%到55%之间。这表明,当个体的选择行为更一致、噪声更小时,机器学习模型能更有效地学习其背后的决策规则。
4.4. 能源政策偏好案例研究
研究还利用来自美国东北部家庭的实际能源政策偏好数据进行了案例验证。结果显示,在真实数据背景下,TNN模型取得了最低的BIC值(13.351),表现最佳,其次是GP和GAM,而MNL表现最差。这进一步证实了半参数和非参数模型在处理真实世界、复杂偏好数据时的潜力。
5. 结论与讨论
本研究的核心结论是,半参数化和非参数化的机器学习模型(GAM和GP)在恢复多种心理学离散选择规则方面,通常优于传统的参数化模型(MNL)。这一优势在训练数据有限、选择规则高度非线性或确定性较强的情况下尤为明显。研究强调了“任务情境驱动模型选择”的重要性:例如,GAM在处理线性和单调强效用规则时表现卓越,GP擅长捕捉理想点等更复杂的规则,而TNN在特定规则(如词典序半序)上也可能有优异表现。
这项工作的主要贡献在于,它首次系统地将心理学中的经典离散选择规则与不同的机器学习建模范式进行了对接和基准测试,为离散选择建模领域提供了宝贵的性能基准。它证明,机器学习,特别是更灵活的模型,能够有效捕捉个体决策的异质性和复杂性,从而减少对可能不准确的参数化假设的依赖。这对于旨在精准理解公众偏好的政策设计(如能源转型、交通规划)和市场策略制定具有重要的实践意义。未来的研究方向可以包括测试更广泛的机器学习模型(如随机森林、深度神经网络)、探索模型在跨群体异质性和更复杂选择架构(如多于两个选项)中的表现,以及开发能同时进行规则推断和参数估计的混合方法。总之,这项研究为利用数据驱动方法深化对人类决策行为的理解,并在此基础上构建更稳健的政策分析工具,迈出了坚实的一步。
相关新闻
生物通微信公众号
微信
新浪微博

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号