
-
生物通官微
陪你抓住生命科技
跳动的脉搏
一种利用区块链和基于TRPO(Time-Reward Propagation of Odds)的多智能体学习技术的智能药品供应链管理及推荐框架
《Scientific Reports》:An intelligent drug supply chain management and recommendation framework using blockchain and TRPO-driven multi-agent learning
【字体: 大 中 小 】 时间:2026年06月12日 来源:Scientific Reports 3.9
编辑推荐:
摘要制药公司在追踪产品供应链方面面临着越来越多的困难,这使得造假者能够销售假冒药品,从而造成巨大的经济损失和严重的健康风险。因此,一种能够在每个阶段追踪和监控药品流动的机制至关重要。区块链为安全透明的供应链追踪提供了有前景的基础。本文介绍了一个由两个模块组成的框架。该框架将基于区
制药公司在追踪产品供应链方面面临着越来越多的困难,这使得造假者能够销售假冒药品,从而造成巨大的经济损失和严重的健康风险。因此,一种能够在每个阶段追踪和监控药品流动的机制至关重要。区块链为安全透明的供应链追踪提供了有前景的基础。本文介绍了一个由两个模块组成的框架。该框架将基于区块链的药品供应链管理系统(DSCM)与由信任区域策略优化(TRPO)驱动的多智能体推荐模型相结合。第一个模块使用定制的区块链来持续记录、监控和验证模拟智能制药环境中的药品流动情况。第二个模块是情感分析(SA),它在区块链安全的环境中与两个TRPO智能体协同工作。为了提高策略性能,TRPO智能体采用了熵正则化技术。这种设置特别解决了情感分析中的关键问题,包括处理未标记数据、特征选择以及缓解类别不平衡问题。第一个智能体对高置信度的未标记样本应用半监督学习(SSL)并使用伪标签来扩展训练集;第二个智能体执行情感分析,利用Shapley加性解释(SHAP)进行特征排序,并通过奖励机制来提高代表性不足类别的性能。该框架在两个大型真实世界药品评论数据集Drugs.com和Druglib.com上进行了评估。在Drugs.com上,区块链模块的延迟为3.015秒,吞吐量为172.322 tps;情感分析模型的准确率为93.250%,F值为94.329%。在Druglib.com上,延迟为2.930秒,吞吐量为189.538 tps,准确率为95.192%,F值为96.257%。这些结果证明了该框架在分析患者评论方面的有效性。它在受控的实验条件下成功实现了安全的供应链记录和基于情感的分析洞察。