一种改进的、结合检索结果的长期灌浆强度预测方法:剔除相似度较低的检索结果
《Engineering Applications of Artificial Intelligence》:An improved retrieval-augmented long-term grouting power prediction method: Rejecting low-similarity retrievals
【字体:
大
中
小
】
时间:2025年10月23日
来源:Engineering Applications of Artificial Intelligence 8
编辑推荐:
注浆功率长期预测中引入拒绝替换机制提升检索增强模型可靠性,通过动态评估历史数据相似度阈值,低匹配检索结果替换为TimeXer模型预测,结合GRU网络融合优化,实验验证其预测精度和稳定性显著优于传统方法。
近年来,随着人工智能和大数据技术的迅猛发展,工程领域的预测模型正变得越来越智能和高效。在水利与土木工程中,注浆技术作为一种常见的基础处理手段,被广泛应用于提高岩体的密实度和防渗性能。然而,注浆过程中功率的控制是一项复杂而关键的任务,它直接影响着注浆效果的实现。在实际应用中,注浆功率的长期预测不仅有助于优化施工方案,还能提高工程的安全性和经济性。为此,研究人员一直在探索更有效的预测方法,尤其是在面对复杂和动态变化的施工环境时。
传统的注浆功率长期预测方法通常依赖于迭代更新机制,即随着施工过程中新数据的积累,需要不断调整模型参数以提高预测精度。然而,这种方法不仅耗时耗力,而且在面对数据质量不一致或缺失的情况下,容易导致预测结果的不稳定。近年来,检索增强型方法(Retrieval-Augmented Generation, RAG)因其能够利用外部数据库中的历史数据,从而提高预测的准确性和效率,逐渐成为研究的热点。RAG的核心思想是通过构建一个领域相关的知识库,从海量数据中检索与当前查询相关的信息,并将其与模型生成的结果进行融合,以增强预测的可靠性。
尽管RAG在提升预测性能方面展现出良好的潜力,但其仍然存在一定的局限性。当前的RAG框架通常采用无条件的检索策略,即将所有检索到的序列直接输入到融合模块中,无论其与查询之间的相似度高低。这种做法虽然能够利用更多的历史数据,但也可能导致低相似度或不相关的信息被引入预测过程,从而增加预测结果的噪声,降低模型的稳定性。尤其是在注浆功率预测这种对模型可靠性要求极高的应用场景中,这种问题尤为突出。如果模型在面对低相似度的检索结果时无法有效识别和处理,可能会误导融合机制,进而影响最终的预测效果。
为了解决这一问题,本研究提出了一种改进的检索增强型方法,引入了“拒绝-替换”机制,从而实现了对检索结果的有条件筛选和有效融合。该机制首先对输入上下文与检索到的序列之间的相似度进行评估。如果相似度低于预设的阈值,表明该检索结果的质量较低,此时将其替换为TimeXer模型的预测结果;如果相似度高于阈值,则保留检索结果。通过这种方式,模型能够更有效地利用高质量的历史数据,同时避免低质量数据对预测结果的干扰。最终,将筛选后的结果通过门控循环单元(GRU)网络进行融合,生成最终的注浆功率预测结果。
为了验证该方法的有效性,本研究在多个数据集上进行了实验,包括专门用于注浆功率预测的数据库以及一个公开可用的基准数据集。实验结果表明,引入“拒绝-替换”机制后,预测精度得到了显著提升,尤其是在面对低相似度检索结果时,模型的鲁棒性和稳定性得到了增强。此外,实验还表明,该方法在处理不同预测时间范围时表现良好,能够适应多种工程需求。通过与传统方法的对比,本研究证明了所提出方法在预测准确性和系统可靠性方面的优势。
本研究的方法不仅适用于注浆功率预测,还可以推广到其他时间序列预测任务中。在时间序列预测领域,RAG已经成为一种重要的技术手段,尤其是在面对数据量庞大、更新频繁的场景时,其优势尤为明显。例如,在短期预测任务中,RAG能够通过检索相关的历史数据,提高预测的准确性;而在长期预测任务中,RAG则能够通过整合多个时间尺度的数据,增强模型的泛化能力。然而,当前的RAG框架在实际应用中仍然存在一定的问题,尤其是在处理低相似度检索结果时,需要一种更有效的机制来识别和筛选。
本研究提出的“拒绝-替换”机制正是为了解决这一问题而设计的。该机制通过动态评估检索结果的质量,能够有效避免低质量数据对预测结果的干扰。具体来说,该机制首先对输入上下文与检索到的序列之间的相似度进行计算,如果相似度低于预设的阈值,则将该检索结果替换为TimeXer模型的预测结果。TimeXer模型是一种专门用于时间序列预测的模型,其能够提供较为稳定的预测结果,尤其适用于在没有足够历史数据的情况下进行预测。通过这种方式,模型能够在保证预测准确性的同时,提高其对不同情况的适应能力。
此外,本研究还设计了一种分阶段的训练流程,以确保模型在不同阶段的训练效果。首先,TimeXer模型被独立训练,以确保其在单独预测任务中的性能。然后,GRU融合模块在完整的检索数据支持下进行训练,以学习如何有效地整合不同来源的数据。最后,相似度阈值通过蚁群优化算法(Ant Colony Optimization, ACO)进行优化,以确保模型在不同预测时间范围下的适应性和稳定性。这种分阶段的训练方式不仅提高了模型的训练效率,还增强了其对不同数据环境的适应能力。
本研究的主要贡献包括以下几个方面:首先,提出了一种新的注浆功率长期预测方法,该方法基于改进的检索增强型框架,能够更有效地利用历史数据,提高预测的准确性;其次,引入了“拒绝-替换”机制,该机制能够有效筛选低质量的检索结果,从而提高预测的鲁棒性和稳定性;第三,设计了一种分阶段的训练流程,通过独立训练、融合训练和阈值优化三个阶段,确保模型在不同阶段的训练效果;最后,通过大量实验验证了该方法的有效性,展示了其在预测精度和系统可靠性方面的优势。
在实验设置方面,本研究使用了NVIDIA RTX 4090显卡,其配备了16GB的显存,为模型的训练和预测提供了强大的计算支持。数据收集和处理阶段,研究人员对原始数据进行了预处理,包括数据清洗、特征提取和时间序列分割。在预测过程中,研究人员采用了不同的参数设置,包括一个较高的top-k值(k=3),以确保模型能够获取到足够多的相关历史数据。此外,相似度阈值的优化过程采用了蚁群优化算法,以确保模型在不同预测时间范围下的适应性和稳定性。
在实验结果方面,研究人员通过多个数据集进行了测试,包括专门用于注浆功率预测的数据库和一个公开可用的基准数据集。实验结果表明,所提出的方法在预测精度和系统稳定性方面均优于传统方法。特别是在面对低相似度检索结果时,该方法能够有效筛选并替换,从而提高预测的可靠性。此外,实验还表明,该方法在不同预测时间范围下的表现良好,能够适应多种工程需求。通过与基线方法的对比,研究人员发现所提出的方法在预测精度和稳定性方面具有显著优势。
本研究的结论表明,通过引入“拒绝-替换”机制,检索增强型方法能够有效提高注浆功率预测的准确性与稳定性。该方法不仅克服了传统RAG框架在处理低质量检索结果时的不足,还通过分阶段的训练流程确保了模型在不同阶段的适应性和可靠性。此外,该方法在多个数据集上的实验结果表明,其在预测精度和系统稳定性方面均优于传统方法,能够适应不同的工程需求。通过与基线方法的对比,研究人员发现所提出的方法在预测精度和稳定性方面具有显著优势。
在作者贡献方面,本研究的作者们分别承担了不同的任务。Baoxi Liu负责撰写原始稿件、方法设计、研究调查、数据分析和概念设计;Liangsi Xu负责撰写、审阅和编辑,可视化、验证、软件开发;Bingyu Ren负责撰写、审阅和编辑,以及资金获取;Chengyu Yu负责可视化、软件开发和方法设计;Hongling Yu负责撰写、审阅和编辑,监督项目进展、项目管理、数据管理;Xiangyu Chen负责软件开发和方法设计;Xinyu Liu负责可视化和软件开发。这些作者们在各自的专业领域内为本研究的完成做出了重要贡献。
在写作过程中,作者们使用了Qwen这一生成式人工智能工具,以提高文本的语言表达和可读性。在使用Qwen之后,作者们对文本进行了审阅和编辑,确保其内容的准确性和完整性。同时,作者们声明没有已知的与本研究相关的竞争性利益或个人关系,以确保研究的公正性和客观性。
最后,本研究得到了国家自然科学基金的支持(项目编号:52222907),这一资金支持对研究的顺利进行起到了关键作用。作者们对这一支持表示衷心的感谢,并希望未来能够进一步探索检索增强型方法在时间序列预测领域的应用,以提高模型的预测精度和系统可靠性。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号