基于监督学习技术的机会网络分组投递增强

首页今日动态人才市场新技术专栏中国科学人云展台
BioHot
云讲堂直播会展中心特价专栏技术快讯免费试用

生物通官微
陪你抓住生命科技
跳动的脉搏

生物通首页 > 今日动态 > 正文

基于监督学习技术的机会网络分组投递增强

《Array》：Enhancing packet delivery in opportunistic networks using supervised learning techniques

【字体：大中小】 时间：2026年06月09日 来源：Array 4.5

编辑推荐：

　　在本文中，研究人员分析了如何应用机器学习（ML）技术来提高机会网络（Opportunistic Networks）中的分组投递可靠性。这类网络适用于连接性稀疏的场景，例如灾难恢复或农村地区，因为它们无需建立基础设施即可实现通信。然而，由于机会网络（OppNet

在本文中，研究人员分析了如何应用机器学习（ML）技术来提高机会网络（Opportunistic Networks）中的分组投递可靠性。这类网络适用于连接性稀疏的场景，例如灾难恢复或农村地区，因为它们无需建立基础设施即可实现通信。然而，由于机会网络（OppNets）拓扑结构动态变化、资源受限以及连接不规律，有效路由是一个重大挑战。通过集成能够预测分组投递成功可能性并选择最可靠中继节点的监督学习模型，本研究旨在改进路由算法。所提框架的三个主要目标是：利用预测模型增强路由选择；发现具有相似移动模式的节点簇以最大化转发机会；以及使用网络特定指标和机器学习指标评估路由性能。研究探讨了多种ML模型，包括用于预测节点移动性的神经网络（Neural Networks）、根据成功概率优先投递的支持向量机（Support Vector Machines）、用于简单高效分类的逻辑回归（Logistic Regression）以及从历史数据中提取投递模式的随机森林（Random Forest）。模型在模拟数据集上使用准确率、召回率和F1分数进行训练和评估，以量化预测质量，这些指标直接反映了投递率和延迟方面的路由性能。结果表明，随机森林在动态环境下表现出优异的鲁棒性，并在预测准确率（91%）和召回率（95%）之间取得了最佳平衡。这些结果意味着在困难环境中，基于ML的预测路由可以显著提高通信效率和分组投递可靠性。此外，本研究为将轻量级且灵活的机器学习模型集成到实用机会路由策略中提供了新的见解。

**论文解读文章**

**研究背景、现存问题与研究动机**
机会网络（Opportunistic Networks, OppNets）是延迟容忍网络（Delay-Tolerant Network, DTN）的子类，其运行于无法保证端到端持续连接的环境中。与依赖稳定基础设施的传统网络不同，OppNets依赖移动节点之间的随机、不可预测的接触来转发数据，采用“存储-携带-转发”（store-carry-and-forward）机制。这种动态和不可预测的特性导致分组丢失、传输时间长以及服务质量低下。现有路由协议（如 Epidemic、PROPHET、Spray-and-Wait）各自存在局限性：Epidemic 泛滥复制消息导致资源开销巨大；PROPHET 基于历史接触预测，在动态环境中表现欠佳；Spray-and-Wait 在稀疏网络中可能性能不佳。此外，现有协议多基于简单假设，难以适应真实场景中的节点行为多变和网络条件变化。因此，亟需更智能、自适应的路由解决方案。本研究旨在利用监督学习技术预测分组投递成功概率，优化中继节点选择、缓存管理和转发决策，从而提升OppNets中的分组投递可靠性和资源利用效率。该论文发表在《Array》。

**关键技术方法概述（不超过250字）**
研究人员采用监督学习框架，核心步骤包括：数据收集（利用ONE仿真器和GNS-3生成模拟数据集，包含节点数、移动模式、接触持续时间、传输范围、缓存大小、历史投递成功率等属性）、特征工程（提取关键特征如接触频率、节点速度、历史成功率和投递延迟，并通过相关性分析识别重要性排序，确认节点速度、历史成功率和投递延迟为最显著特征）、模型训练与集成（训练并对比多种算法：K近邻、支持向量机、多层感知机、随机森林和逻辑回归），最后将最优模型嵌入经典路由协议（PROPHET和Spray-and-Wait）中，通过自适应阈值机制动态调整转发决策。数据来源为仿真生成，未使用真实队列样本。

**研究结果**
（保留原文小标题并简述结论）

**4.1 数据预处理**
研究人员对原始模拟数据实施了严格预处理：编码分类变量（如移动模式映射为数值）、对数值特征进行最小-最大归一化、提取高级特征（接触频率、节点中心性等），并通过分层抽样将数据集划分为80%训练集和20%验证集，以消除类别不平衡并减轻过拟合风险。

**4.2 选定的机器学习模型**
研究人员评估了K近邻（KNN）、支持向量机（SVM）、多层感知机（MLP）、随机森林（RF）和逻辑回归（LR）。通过ROC曲线和学习曲线分析发现：KNN的AUC达0.97，具有良好的分类判别能力但预测成本高；SVM的验证准确率约80–85%，存在中度过拟合；MLP训练损失持续下降，但缺乏验证曲线，需正则化预防过拟合；RF的AUC为0.90，展现出鲁棒的判别能力；LR的AUC为0.96且收敛快速，适合作为轻量级基线。

**4.3 模型评估与讨论**
基于分类指标（准确率、精确率、召回率、F1分数）和回归指标（均方误差MSE、均方根误差RMSE、平均绝对误差MAE、决定系数R²）的综合评估显示：随机森林（RF）以91%准确率、95%召回率和95% F1分数表现最佳，回归误差最低（MSE=0.05，R²=0.90）。KNN和MLP紧随其后，LR和SVM则因线性假设或高计算成本排名靠后。在计算效率上，决策树（DT）和RF能耗极低（约100–105 mJ），而SVM执行时间极长（2600秒），MLP和KNN能耗较高。最终综合排名：RF第一，LR第二，KNN第三，MLP第四，SVM第五，DT第六。

**4.4 路由性能分析**
将最优模型（RF）集成到经典协议后，ML增强版本（PROPHET-ML、Spray-and-Wait-ML、Epidemic-ML）在投递率、平均延迟和能耗上均显著超越原始版本。例如，PROPHET-ML投递率达91.8%（提升9.7%），平均延迟降低16%（从196.2秒降至164.5秒），能耗降低约23%（从1135 J降至870 J）。这归因于预测模型能选择更可靠的中继节点并避免冗余传输。

**4.5 使用真实世界移动轨迹验证**
研究人员进一步采用CRAWDAD数据集中的Infocom和Haggle真实移动轨迹进行验证，提取接触持续时间、相遇频率、缓存占用等特征，证实所提框架在不同移动模式下仍保持良好泛化能力。

**总结讨论与结论**
讨论部分指出，虽然随机森林在仿真中表现最优，但真实轨迹验证仍需拓展。研究承认仅依赖GNS-3合成数据的局限性，未来应纳入更多真实数据集评估鲁棒性。研究结论（原文翻译）：本文提出了一个基于机器学习（ML）的框架，用于提高机会网络（OppNets）中分组投递的可靠性。研究表明，预测模型能有效指导关键路由决策，包括中继选择、缓存管理以及转发或携带分组的决策。用于训练和评估模型的数据集完全通过GNS-3仿真生成，该仿真环境能捕捉协议级行为与移动动态，为OppNets条件提供了有意义的表示。在所评估的模型中，随机森林算法整体表现最佳，准确率达91%，召回率达95%，证实了其在处理异构OppNets数据时的鲁棒性。当集成到经典路由协议（如PROPHET和Spray-and-Wait）中时，ML辅助版本显示出显著改进，包括投递率提升（最高+9.7%）、延迟降低（–16%）以及能耗减少（–23%）。这些结果验证了将ML预测与传统路由启发式相结合，能在高度动态和无基础设施的环境中实现更自适应、高效且可靠的数据分发，这主要归功于ML模型能够选择更合适的中继节点并避免冗余传输。本研究还引入了一套完整的预处理和特征工程流水线，用于处理仿真OppNets环境生成的异构数据，确保一致性并提升模型就绪度，同时对多种监督学习算法进行了比较评估，确定随机森林为预测分组投递成功的最可靠模型。此外，研究提出将ML决策模块无缝集成到经典路由协议（如PROPHET和Spray-and-Wait）中，实现自适应且上下文感知的路由决策，并通过大量仿真验证了其在投递可靠性、延迟降低和能效方面均优于基准协议。尽管成果显著，但研究承认仅依赖GNS-3合成数据可能无法完全捕捉真实移动和接触动态，未来工作将聚焦于引入CRAWDAD等真实数据集，以进一步评估所提方法在真实条件下的泛化能力和鲁棒性。

联系信箱：

粤ICP备09063491号

热点排行