
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于专业网络情感词典的绿色债券指数预测方法创新研究
【字体: 大 中 小 】 时间:2025年09月08日 来源:Sustainable Futures 4.9
编辑推荐:
本研究针对中国债券市场特有俚语和微妙表达难以捕捉的问题,创新构建了中文债券评论情感词典(COBC),并结合ARMA-SVR-BiLSTM-Attention混合预测模型,显著提升了中国绿色债券指数(CBI)的预测精度。实证表明该模型平均降低67.5%的均方误差(MSE),为政策制定者提供了先进的情绪监测工具,对引导绿色债券市场稳定发展具有重要意义。
在全球气候变化和可持续发展背景下,绿色债券作为锚定可持续金融的重要工具,其市场表现受到越来越复杂的因素影响。然而,现有研究存在两个显著短板:通用情感词典难以捕捉中国债券市场特有的网络俚语表达;传统预测模型要么解释性强但预测性能弱(如统计模型),要么预测性能强但缺乏解释性(如深度学习模型)。这些问题导致对债券投资者情绪评估的准确性不足,制约了绿色债券市场的预测能力。
针对这些挑战,江南大学商学院的研究团队开展了一项创新性研究。他们首先从东方财富网"债券吧"抓取1367条投资者评论,通过人工标注构建了专业的中文债券评论情感词典(COBC),包含88个积极词和102个消极词。这些词汇充分体现了中国网络语言的复杂性、多义性和幽默特征,如"加仓"、"破蛋"、"夕阳红"等生动表达。结合已有的金融情感词典,研究团队开发出集成词典,在债券网络语言情感分析中的准确率比通用词典提高87.2%。
在模型构建方面,研究人员设计了一个创新的两阶段混合预测框架。第一阶段采用ARMA(自回归移动平均模型)-SVR(支持向量回归)组合处理绿色债券指数的时间序列数据,通过网格搜索确定最优参数为ARMA(0,1,1)和SVR(C=1, γ=0.001, ε=0.01)。第二阶段将处理后的残差数据与投资者情绪指标共同输入BiLSTM-Attention模型。这个双向长短期记忆网络配备注意力机制,能够自适应地识别时间序列中最重要的信息段。实验表明,当时间步长设为30天、学习率为0.017、dropout率为0.2时,模型性能最优。
研究结果展现出显著优势:在预测中国债券绿色债券总收益指数(CBI)方面,BiLSTM-Attention模型的均方误差(MSE)仅为0.0129,比传统LSTM模型降低83.14%,比BiLSTM模型降低90.77%。决定系数R2达到0.9905,显示出极佳的拟合优度。特别值得注意的是,模型在指数低谷期的预测准确率尤为突出,这可能与投资者情绪在下跌行情中更趋一致有关。
在技术方法上,研究主要采用了:1)网络爬虫技术抓取东方财富网债券吧评论数据;2)基于人工标注和机器学习的情感词典构建方法;3)ARMA-SVR混合模型处理时间序列数据;4)BiLSTM-Attention深度学习架构进行预测分析。
研究结论部分指出,这项工作的理论意义在于首次将债券市场特有的网络语言纳入情感分析框架,证实了投资者情绪对绿色债券市场的预测价值。实践层面,该模型为监管机构提供了量化工具,可通过监测网络论坛情绪来预判市场波动。例如,当指数处于低谷时,政策制定者可及时出台激励措施引导市场预期。研究也发现模型对峰值预测存在低估现象,这可能与投资者乐观情绪的非线性特征有关,为后续研究指明了方向。
该成果发表在《Sustainable Futures》期刊,不仅填补了中文债券领域专业情感词典的空白,也为绿色金融的量化研究提供了新范式。未来研究可进一步扩大数据来源,纳入社交媒体和新闻文本,并探索区域差异对预测效果的影响,持续优化这一具有重要应用价值的预测体系。
生物通微信公众号
知名企业招聘