
-
生物通官微
陪你抓住生命科技
跳动的脉搏
多目标进化算法在RNA序列设计中的实验分析:探索分区函数、集合多样性与核苷酸组成的优化策略
【字体: 大 中 小 】 时间:2025年06月05日 来源:Engineering Applications of Artificial Intelligence 7.5
编辑推荐:
研究人员针对RNA逆折叠问题这一生物医学工程关键挑战,创新性地将问题建模为多目标优化问题(MOOP),引入分区函数(f1 )、集合多样性(f2 )和核苷酸组成(f3 )三大目标函数,结合相似性约束(σ),采用实值染色体编码。通过系统比较NSGA-II、SMS-EMOA、NSGA-III和C-TAEA四种多目标进化算法与六种交叉算子的48种组合性能,发现SMS-EMOA结合指数交叉(EXP)表现最优。该研究为人工智能在RNA设计领域的应用提供了重要方法论支撑,显著提升了序列设计的稳定性和可靠性。
在合成生物学和生物医学工程领域,设计能够折叠成特定结构的RNA序列是实现基因调控、药物开发和纳米生物技术应用的关键。然而,RNA逆折叠问题——即根据目标二级结构反向推导核苷酸序列——因其组合爆炸特性(复杂度达4n
)被证明是NP难问题。传统方法如暴力搜索在长链RNA设计中效率低下,而现有算法往往忽视序列的稳定性和多样性平衡。这一瓶颈严重制约了功能性RNA在治疗性核酶、核糖开关等领域的应用。
中国的研究团队在《Engineering Applications of Artificial Intelligence》发表的研究中,开创性地将RNA逆折叠问题构建为三目标优化模型:最小化分区函数(f1
)以提高结构稳定性,最小化集合多样性(f2
)增强预测可靠性,最小化核苷酸组成(f3
)避免序列偏差,同时强制相似性约束(σ=1)确保目标结构匹配。研究采用维也纳RNA包(ViennaRNA 2.5.1)计算能量参数,通过pymoo框架实现四种多目标进化算法(MOEA)与六种交叉算子的系统比较,最终在RFAM基准集的24种结构上完成31次独立实验验证。
关键技术包括:1)实值染色体编码方案,将序列映射为|B|+|U|维向量(B为碱基对位置集,U为非配对位置集);2)多项式变异(PM)保持种群多样性;3)基于超体积(HV)和反向世代距离(IGD)的量化评估体系;4)动态参考点调整策略。
研究结果显示:在算法层面,SMS-EMOA凭借稳态选择和超体积贡献机制,其EXP交叉变体在HV指标上以144分(满分240)显著优于其他组合。交叉算子比较中,指数交叉(EXP)在65%的测试案例中进入前三,而差分进化(DE)表现最差,尤其在C-TAEA中完全失效。值得注意的是,NSGA-II_Tournament_PM_SBX(即传统m2dRNAs算法)仅排名中游,验证了新框架的优越性。
讨论部分强调,该研究首次系统论证了目标函数权重分配与算子选择的关联性:当优化f1
时,SBX和1P
生物通微信公众号
知名企业招聘