
-
生物通官微
陪你抓住生命科技
跳动的脉搏
中国城市内部收入不平等:基于可解释机器学习方法的城乡差距与住房价格影响机制解析
【字体: 大 中 小 】 时间:2025年08月26日 来源:Applied Geography 5.4
编辑推荐:
这篇研究运用可解释机器学习方法(SHAP分析),基于2000-2015年人口普查数据,揭示了中国城市内部收入不平等的驱动机制。研究发现:城乡差距(urban-rural gap)取代技能差异成为主要诱因,个体因素(性别/年龄)与城市因素(房价)呈现非线性交互作用;通过Gini系数和标准差椭圆分析,证实城市因素解释力持续上升(R2 0.664),为"共同富裕"政策提供新视角。
Highlight
本研究采用前沿的可解释机器学习技术,如同打开"收入黑箱"的分子探针,精准解码中国城市收入不平等的驱动密码。通过SHAP(SHapley Additive exPlanation)算法的"特征贡献值成像"技术,首次量化了城乡鸿沟与房价飙升对收入差距的"剂量-效应"关系。
Model building
基于城市经济学经典理论,我们构建了包含18个"个体-城市"双维度特征的预测模型。这如同设计了一套"收入PCR扩增引物",其中个体层面包含性别、年龄等"遗传标记",城市层面则整合了房价、经济水平等"微环境因子"。
Materials and methods
研究方法如同设计精密的"流式细胞分选实验":首先通过Spearman相关性筛选特征变量(相关系数>0.7),接着用6种机器学习算法进行"多组学交叉验证",最终采用SHAP进行"特征重要性排序"。特别设计的时空验证队列(CFPS数据)确保了结果的"跨期稳定性"。
Income prediction model and its accuracy
模型预测展现出优异的"诊断效能":XGBoost算法在测试集的R2达0.664,堪比临床检测的AUC值。特征重要性热图显示,城乡户籍的贡献度如同"促癌基因"般显著,而房价的边际效应呈现典型的"剂量依赖性"增长曲线。
Discussion
研究发现颠覆了传统"技能决定论"的认知范式:城乡差异的"甲基化修饰"效应解释了38.7%的收入变异,而房价的"空间压迫"效应使高技能群体也面临"代谢综合征"式的收入阻滞。这种"分子-环境"交互模式为SDG10目标提供了新的干预靶点。
Conclusions
该研究构建了首个中国城市收入不平等的"全息图谱",揭示城市本身正在成为"不平等增殖的培养基"。建议政策制定需采用"精准医疗"思维,针对不同城市发展阶段实施差异化的"抗不平等靶向治疗"方案。
生物通微信公众号
知名企业招聘