基于TF-IDF算法的政策文本挖掘:揭示中国养老服务体系转型路径(2018-2022)

【字体: 时间:2025年07月06日 来源:BMC Geriatrics

编辑推荐:

  面对中国快速老龄化(60岁以上人口达2.8亿)的严峻挑战,中南大学研究团队创新性采用TF-IDF文本挖掘技术,量化分析2018-2022年112份国家级养老政策。研究发现政策聚焦四大方向:疫情防控下的脆弱群体保护、医养结合(Yiyang Jiehe)的本土化实践、商业养老保险创新及智慧养老技术应用。该研究首次通过政策周期性比较(结合十九大政治节点),揭示了政策主题从"中医医疗"向"智慧化+金融保障"的转型,为全球老龄化社会提供系统性治理范式。

  

论文解读

中国正经历全球规模最大、速度最快的人口老龄化进程。截至2022年,60岁及以上人口突破2.8亿(占总人口19.8%),预计2029年将达4.6亿(占比32%)。这种"未富先老"的格局对传统养老模式构成严峻挑战,亟需通过政策创新构建可持续的养老服务体系。然而,既往研究多采用定性分析方法,难以系统捕捉政策文本中隐含的演变规律与主题关联。为填补这一研究空白,中南大学公共管理学院团队创新性地引入文本挖掘技术,对后十九大时期(2018-2022年)中国养老政策展开量化解析。

研究团队从国务院及部委官网筛选112份核心政策文件,建立严格的纳入标准:仅保留中央级政策,剔除地方文件及程序性复函;按"命令/公告/通知/意见"四类划分政策形式,其中"通知"类占比80%,体现政策执行导向。采用混合研究方法:首先通过TF-IDF(Term Frequency-Inverse Document Frequency)算法提取政策特征词,其计算公式为:
TF?IDF=1kNk,jNi,j×logDF+1D
从1000个高频词中人工筛选出44个核心特征词(如"智慧养老""医养结合""养老保险")。随后利用Ochiai系数构建词汇共现矩阵与相异矩阵,通过多维标度分析(Multidimensional Scaling, MDS)实现政策主题聚类,最终Stress值0.16453(<0.2标准)和RSQ值0.87759(>0.6阈值)验证模型可靠性。

研究结果揭示四大政策集群

  1. 疫情防控与脆弱群体保护(特征词:疫情/环境/质量/上门服务)
    如《民政部办公厅关于加强疫情防控期间特殊困难老年人关爱服务的通知》要求通过微信等数字平台建立动态管理台账,重点保障失能老人的机构照护资源供给。值得注意的是,尽管疫情相关词汇频现,但其TF-IDF权重显著低于其他主题,表明政策核心仍聚焦长期结构性挑战。

  2. 医养结合本土化实践(特征词:健康/照护/康复)
    "十四五"国家老龄事业规划提出建立长期护理保险制度,发展老年健康服务体系。各地探索出三类模式:医疗机构嵌入养老服务、养老机构增设医疗模块、社区医养综合体,2022年国家卫健委牵头建设150个示范街道和50个示范基地推动标准化。

  3. 养老金融产品创新(特征词:养老保险/监督管理/试点)
    国务院《关于推动个人养老金发展的意见》与银保监会《关于开展养老保险公司商业养老金业务试点的通知》共同构建"基本养老保险+企业年金+商业保险"三支柱体系。截至2023年,基本养老保险参保人数较2011年增长1.84倍,第三支柱产品覆盖率达38%。

  4. 智慧养老技术赋能(特征词:智慧化/信息化/示范)
    工信部等《智慧健康养老产业发展行动计划》要求开展5G、AI技术在健康管理中的应用。上海建立"养老服务平台"微信端,浙江开发"浙里办"一键养老应用,但政策同时警示需解决老年人"数字鸿沟"问题(仅23%能独立操作智能设备)。

政策周期性比较发现重大转向
相较2013-2017年政策核心词"中医医疗/信息平台",十九大后特征词转变为"商业保险/疫情防控/智慧化"。这种转变契合十九大报告提出的"医养结合+智慧养老"战略,印证了政治周期理论(Political Cycle Theory)的核心观点——党代会作为政策议程设置的关键节点,重塑地方政府养老治理的优先序。多维流框架(Multiple Streams Framework)分析显示,2019年政策发布峰值(30份)既响应老龄化问题流(Problem Stream),也受益于政治流(Political Stream)中银保监会机构改革的政策窗口。

研究结论强调四维创新路径

  1. 建立分级应急机制,将居家社区机构养老纳入公共卫生事件响应体系
  2. 开发适老化智能终端,配套"数字反哺"培训以消除技术应用壁垒
  3. 扩大个人养老金税收优惠,推动商业长期护理保险省级统筹
  4. 通过"时间银行"制度激励老年人参与社区治理,提升社会参与感

该研究首次将TF-IDF算法与政治周期理论结合,不仅揭示中国养老政策的主题跃迁规律(如图4所示),更为日本、韩国等东亚老龄化社会提供可借鉴的量化政策分析框架。未来需进一步探索省级政策差异,并融合Word2Vec模型提升语义分析精度。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号