在隧道掘进机(TBM)运行数据的机器学习中,采用主动学习方法以实现最优特征组合选择

《AUTOMATION IN CONSTRUCTION》:Active learning for optimal feature combination selection in machine learning of TBM operational data

【字体: 时间:2026年02月14日 来源:AUTOMATION IN CONSTRUCTION 11.5

编辑推荐:

  针对硬岩隧道掘进机(TBM)数据特征选择问题,提出了一种基于主动学习的特征组合优化方法。通过动态评估特征子集的模型性能,自适应选择最优特征组合,有效平衡了模型预测精度与计算效率。该方法成功应用于中国饮马河项目,验证了其有效性和效率,未来将扩展至更多隧道工程验证。

  
张晨昊|王宇|李旭
香港城市大学建筑与土木工程系,香港九龙达赤大道

摘要

尽管来自硬岩隧道掘进机(TBM)的丰富运营数据能够利用机器学习(ML)提取出许多用于不同预测任务的特征,但将所有TBM数据特征纳入ML可能会导致高昂的计算成本和潜在的模型性能下降。这给TBM数据的ML带来了重大挑战,即如何确定最佳的TBM特征组合以提高模型的准确性和效率。为了解决这一挑战,本文提出了一种主动学习方法,该方法通过评估从精心挑选的特征子集中开发的模型性能,并自适应地调整特征组合来智能选择更优的特征组合。该方法通过中国的一个输水隧道项目进行了说明。它提供了一个强大的框架,能够在确保可靠预测的同时简化数据处理流程。在未来的研究中,将进一步验证该方法的泛化能力。

引言

隧道掘进机(TBM)已被广泛用于深埋和长隧道的建设[1]。在TBM掘进过程中,安装在TBM上的传感器会收集大量运营数据,可以从这些数据中提取出许多特征[2]、[3]。这使得机器学习(ML)能够用于预测隧道前方岩体分类(例如[4]、[5]、[6]、[7]、[8])、估计后续隧道施工中的关键TBM运行参数(例如[9]、[10]、[11]、[12]、[13]),以及预测潜在的地质灾害(例如[14]、[15]、[16]、[17]、[18]),从而提高隧道施工的安全性和效率。然而,将所有TBM特征纳入ML可能会导致高昂的计算成本和潜在的模型性能下降[19]、[20]、[21],因此选择最佳的TBM特征组合至关重要。为了优化特定ML模型的性能,理论上需要穷尽所有可能的TBM特征组合。假设从TBM数据中提取了< />
从所有提取的特征中经验性地选择TBM特征是ML中常用的一种方法[24]。通常选择诸如掘进速度、刀头旋转速度、穿透指数、推力和扭矩等关键TBM运行参数作为ML的输入特征(例如[24]、[25]、[26])。使用这些关键TBM特征开发的模型具有较低的复杂度和较高的计算效率[27]。然而,这种主观的选择方法可能会忽略其他可能对模型性能有显著影响的特征[6]。因此,需要一种客观的特征选择方法来全面评估所有TBM特征。特征重要性排序是一种有效的方法,用于评估每个TBM特征对模型性能的贡献,并已在以往的研究中广泛用于特征优化[6]、[28]、[29]。例如,近年来基于随机森林(VIM-RF)的可变重要性度量已被用于TBM特征的ML选择(例如[4]、[28]、[30]),它使用称为Gini不纯度的模型特定指数来评估每个特征的重要性[31]、[32]。然而,不同的ML算法可能采用不同的数学原理和假设,从而导致特征选择的偏好不同。这表明,使用模型特定特征重要性排序方法选出的特征在不同的ML模型中可能不是最优的。更重要的是,这些方法无法考虑不同特征之间的交互效应,可能会忽略特征组合对模型性能的累积影响。因此,有必要开发一种能够适应不同ML方法的稳健特征选择方法,以确定最佳的特征组合来提升模型性能。
为了解决这一挑战,本研究提出了一种高效的主动学习方法,用于优化TBM特征组合的选择,并利用TBM隧道项目中先前挖掘步骤收集的数据开发ML模型。然后使用最佳TBM特征组合开发的ML模型对隧道项目后续的挖掘步骤进行预测(例如预测岩体分类)。主动学习方法可以利用已知信息(即先前选定的特征组合及其对应的模型性能)来指导最佳TBM特征组合的搜索[33]。它能够发现更优的特征组合,减少不必要的或冗余特征的使用,从而提高模型性能和效率。本研究的其余部分组织如下:第2节提出了一个用于优化TBM特征组合的主动学习框架;第3节详细描述了实施程序;第4节通过为中国松花江输水项目(Yin-song项目)开发ML模型来说明所提出的方法;第5节提供了总结和结论。

章节摘录

用于优化TBM特征组合选择的主动学习框架

所提出的主动学习方法旨在以高效的方式确定能够最大化模型性能的最佳TBM特征组合。该方法适用于不同ML方法中TBM特征组合的优化。在本研究中,定义了一个样本(或数据对)来表示一个TBM特征组合及其使用该特征组合训练的模型的相应性能。在主动学习过程之前,会随机选择几个TBM特征组合

所提出的主动学习方法的实施程序

图5展示了所提出的用于选择最佳TBM特征组合的主动学习方法的实施程序。关键步骤总结如下:
  • (1)
    从大量TBM数据中提取$d$个候选TBM特征{x_11, x_2, x_3, , x_d
  • (2)
    定义一个$d$维向量p来表示TBM特征组合,其中每个元素< />
    的范围是[0, 1],表示选择相应TBM特征< />( = 1, 2, …, d)的概率。
  • (3)
    设置< />
    为随机选择的特征组合数量
  • 示例说明

    为了说明所提出的主动学习方法在优化TBM特征组合选择方面的有效性,使用Yin-song项目的TBM数据进行了岩体分类的ML预测,并结合了所提出的主动学习方法。首先描述了Yin-song项目的概况和数据收集过程,然后开发了ML模型和主动学习的基本设置。之后,选择了最佳的TBM特征组合

    结论

    选择最佳的TBM特征组合对于提升ML模型的性能至关重要,尤其是在收集了大量TBM运行参数的情况下。本文提出了一种用于最佳选择TBM特征组合的主动学习方法。该方法使用向量表示有效地生成了TBM特征组合。然后使用生成的特征组合训练ML模型,并通过性能指标进行评估

    CRediT作者贡献声明

    张晨昊:撰写 – 审稿与编辑,撰写 – 原稿,可视化,验证,软件,方法论,调查,形式分析,数据整理,概念化。王宇:撰写 – 审稿与编辑,撰写 – 原稿,监督,资源管理,项目行政,方法论,资金获取,概念化。李旭:撰写 – 审稿与编辑,撰写 – 原稿,资源管理,项目行政,资金获取,数据整理。

    利益冲突声明

    作者声明他们没有已知的可能会影响本文报告工作的财务利益或个人关系。

    致谢

    本工作得到了香港科技大学沿海城市气候韧性重点实验室(项目编号:ITC-SKLCRCC26EG01)和国家自然科学基金(项目编号:52130805)的共同支持。
    相关新闻
    生物通微信公众号
    微信
    新浪微博
    • 搜索
    • 国际
    • 国内
    • 人物
    • 产业
    • 热点
    • 科普

    知名企业招聘

    热点排行

      今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

      版权所有 生物通

      Copyright© eBiotrade.com, All Rights Reserved

      联系信箱:

      粤ICP备09063491号