基于LinkedIn企业画像的无监督机器学习分析:揭示欧洲可持续包装行业的发展趋势

《Journal of Environmental Management》:Exploring the sustainable packaging sector through European companies’ LinkedIn profiles with unsupervised machine learning

【字体: 时间:2026年01月17日 来源:Journal of Environmental Management 8.4

编辑推荐:

  本文针对可持续包装行业缺乏实时商业数据分析的问题,研究人员通过分析516家欧洲企业的LinkedIn公开资料,运用HDBSCAN和LDA等无监督机器学习方法,发现企业主要聚焦可持续解决方案创新和品牌战略两大主题,揭示了化妆品、食品饮料等行业将可持续包装作为核心竞争要素的新趋势,为政策制定和市场监测提供了数据支撑。

  
随着全球对环境保护意识的不断提升,可持续包装已成为各国企业和政策制定者关注的焦点。然而,传统研究方法往往难以实时捕捉商业领域的动态发展趋势。在这背景下,来自希腊克里特技术大学的Georgios Tsironis等人创新性地利用商业社交平台LinkedIn的公开数据,结合无监督机器学习技术,对欧洲可持续包装行业进行了全景式分析,相关成果发表在《Journal of Environmental Management》上。
为了深入探索这一领域,研究团队首先从LinkedIn平台获取了516家将"可持续包装"纳入公司简介的欧洲企业数据。在分析方法上,主要采用了两种无监督机器学习技术:潜在狄利克雷分配(Latent Dirichlet Allocation, LDA)和基于分层密度的噪声应用空间聚类(HDBSCAN)。通过Python 3和Jupyter Notebooks环境,研究人员对文本数据进行了预处理,包括去除停用词和词干提取,最终得到39,678个有效标记。LDA模型通过测试不同主题数量(2、5、10)和超参数配置,最终确定2主题模型具有最高 coherence score(0.374)。HDBSCAN则通过BERTopic架构进行语义聚类,识别出三个主题群集。
4.1 主题建模结果
HDBSCAN分析识别出三个语义集群,其中集群1代表数据集中的核心主题领域,重点聚焦企业的可持续包装解决方案和市场参与度;集群0作为次要主题,强调可持续发展在品牌建设中的应用;集群-1(噪声主题)则包含了如"咖啡"、"CBD"等未能归入主要集群的碎片化概念。通过t-SNE和UMAP两种降维技术可视化验证,结果显示各主题群集具有明显的区分度。
4.2 LDA主题建模结果
LDA分析进一步验证了主题结构的稳定性,识别出两个主要话题:话题1关注可持续包装解决方案及相关商业层面,话题2则更侧重于有机和化妆品等特定行业的可持续包装应用。两个话题在多维标度图中显示出明显的分离,表明其主题独特性。
5. 讨论与意义
研究发现与当前市场趋势高度吻合:"包装与容器"行业在LinkedIn上表现最为活跃,其次是"食品饮料"、"化妆品"、"零售"和"消费品"行业。地理分布显示英国(187家公司)处于领先地位,其次是德国、荷兰、意大利和西班牙。研究还揭示了企业将可持续包装既作为运营创新驱动,又作为品牌战略的双重定位,这一发现与欧盟最新出台的《包装和包装废物条例》(EU 2025/40)等政策导向相一致。
该研究的创新之处在于将商业社交平台数据与无监督机器学习相结合,为可持续包装领域的趋势分析提供了新的方法论视角。然而,研究也存在一定局限性,如可能低估了主要使用本国语言建立档案的地区性公司,以及无法验证企业声明的真实性等。未来研究可扩展至其他地理区域,或结合企业可持续发展报告等进行多源数据验证。
这项研究为理解可持续包装行业的商业实践提供了宝贵见解,不仅有助于企业把握市场趋势、优化可持续发展战略,也为政策制定者提供了基于实际数据的决策支持,同时对学术界的相关研究方法创新具有重要启示意义。
相关新闻
生物通微信公众号
微信
新浪微博

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号