基于K-means聚类的马来西亚衍生品市场投资者行为剖析:市场细分与风险管理的新范式

【字体: 时间:2025年09月18日 来源:Frontiers in Artificial Intelligence 4.7

编辑推荐:

  本研究运用K-means聚类算法对马来西亚衍生品市场(Bursa Malaysia)超过1100万条交易记录进行深度分析,首次系统性地识别出五大投资者行为集群:高频高风险持续亏损型、保守稳健增长型、高频高收益型、保守低收益型和谨慎低活跃新手型。通过逆向双曲正弦(IHS)转换处理极端异常值,并结合决策树分类器验证集群特征,为衍生品市场的精准风险管理、个性化服务及监管政策制定提供了数据驱动的理论依据。

  

引言

衍生品作为价值源于标的资产(如商品、股票或指数)的金融工具,在风险对冲、投机和投资组合优化中扮演重要角色。马来西亚最活跃的衍生品包括与 crude palm oil 价格挂钩的FCPO(Futures Crude Palm Oil)和追踪 Bursa Malaysia Kuala Lumpur Composite Index 的FKLI(Futures Kuala Lumpur Index)。尽管股票市场的投资者分群研究较为成熟,但衍生品市场因其底层资产、市场行为和风险动态的差异,亟需专门的研究框架。

文献综述

现有研究表明,投资者经验与平均收益呈正相关,且在线交易平台的普及显著改变了交易行为模式。先前研究多集中于股票市场,如 Shin and Sohn(2004)通过交易总量和代表辅助交易金额特征识别出三类客户;Wang et al.(2009)基于交易频率和资产占比将投资者分为保守型、投机型和适度型;而 Goshima et al.(2019)则通过订单取消率和库存比率对交易台进行分层。衍生品市场的行为分群研究仍存在明显空白。

方法论

数据描述

研究采用 BURSA Malaysia 提供的2022年全年数据,包含11,222,606笔交易记录,涵盖FCPO和FKLI产品。经筛选后保留马来西亚注册交易者数据11,117,203条,对应9,852个独立账户(9,773个有效分析样本)。数据包含投资者类型、性别、年龄段、交易偏好和主要策略类型(NRM或SPD)等分类变量。

特征工程与转换

研究构建了六个关键特征:总交易次数(Total Number of Trades)、总交易金额(Total Traded Amount)、总实现利润(Overall Realized Profit)、平均投资回报率(Average ROI)、最大账户存续期(Maximum Account Vintage)和持仓天数中位数(Median Holding Days)。为处理极端异常值,采用逆向双曲正弦变换(IHS),其定义为 sinh-1x = ln(x + √(x2 + 1)),有效压缩了极端值同时保留分布特性。

K-means聚类

K-means算法通过最小化簇内平方和(WCSS)将数据划分为k个簇。算法步骤包括:初始化k个中心点,基于欧氏距离(d(xi, cj) = ||xi - cj||2)分配数据点,并通过迭代更新中心点位置直至收敛。

结果与讨论

通过肘部法、轮廓系数、Davies-Bouldin指数和Calinski-Harabasz指数共同确定最优聚类数k=5。五个集群在降维后的PCA空间中呈现明显分离:

  • 集群1(20.4%):高频高风险但持续亏损型,特征为总实现利润<-51.85千令吉、总交易额>17.57百万令吉、持仓天数<2.22天;

  • 集群2(14.6%):保守稳健增长型,平均ROI>0.139%、持仓天数>0.299天、交易次数<364.5;

  • 集群3(21.1%):高频高收益型,总实现利润>40.938千令吉、交易额>15.882百万令吉、持仓<0.993天;

  • 集群4(12.0%):保守低收益型,平均ROI<-0.205%、交易次数<306.5;

  • 集群5(31.9%):谨慎低活跃新手型,交易次数<156.5、账户存续期<3.337年、利润<40.487千令吉。

分类变量分析表明:

  • 零售投资者主导所有集群,而机构投资者(RTIP/Local)多集中于集群1和3;

  • 男性交易者占比约80%,集群3女性比例最高(22%);

  • NRM策略占主导(83-90%);

  • 年轻交易者(18-35岁)集中于集群5,年长交易者多在集群2;

  • FCPO偏好见于集群1、3、5,FKLI偏好多见于集群2、4。

结论与展望

本研究首次系统性地将机器学习聚类技术应用于衍生品市场投资者行为分析,揭示了五大显著差异的行为模式。这些分群结果为券商开展精准服务、风险管理及监管机构制定差异化政策提供了实证基础。未来研究可整合问卷调查数据以关联人口统计学特征与交易行为,并纳入时间维度分析跨周期行为演变,同时探索未实现利润的计算方法以更全面评估交易者表现。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号