综述:基于人工智能的抗癌肽发现
《iMetaOmics》:Artificial intelligence-driven anticancer peptide discovery
【字体:
大
中
小
】
时间:2025年11月07日
来源:iMetaOmics
编辑推荐:
抗肿瘤多肽(ACP)的AI筛选框架研究。系统综述68种ACP预测模型,发现其存在数据集偏差、可解释性不足及湿实验验证缺失等问题。提出包含数据整合、特征提取、模型优化、可解释性分析(SHAP/Grad-CAM)及湿实验验证的多阶段AI驱动ACP筛选框架,整合多组学数据、合成生物学及纳米递送技术,推动ACP从发现到临床转化。
癌症已经成为全球健康领域的一大威胁,其高发病率和高死亡率给全球公共卫生体系带来了沉重的负担。尽管现代医学在癌症诊断和治疗方面取得了显著进展,例如靶向治疗和免疫治疗的应用,但目前的治疗策略仍然面临诸多挑战。传统化疗虽然在抗肿瘤方面具有一定的效果,但其缺乏细胞特异性,导致不仅对癌细胞造成伤害,还可能对正常组织产生严重的副作用,如骨髓抑制、胃肠道毒性以及免疫功能紊乱,从而对患者健康造成显著影响。此外,癌症细胞在治疗过程中可能通过基因突变、药物外排泵激活或治疗靶点消失或突变等机制产生对药物的耐受性,导致治疗效果下降甚至治疗失败。这种双重困境——耐药性和毒性——严重限制了现有癌症药物的有效性。因此,开发具有更高选择性和更低毒性的新型抗癌药物,以克服现有治疗瓶颈,已成为癌症研究的重要方向。
抗癌肽(Anticancer Peptides, ACPs)是一类具有抗癌活性的生物活性肽。与传统化疗药物相比,ACP具有高选择性和低毒性。它们可以特异性地识别癌细胞表面的受体或膜成分,从而实现对癌细胞的精准靶向,减少对正常组织的伤害。此外,ACP还能通过多种机制发挥抗癌作用,包括诱导癌细胞凋亡、抑制增殖以及调控肿瘤微环境,显示出其对多靶点的调控能力。在药物毒性方面,ACP的毒性显著低于传统化疗药物,其副作用如免疫功能障碍或胃肠道毒性也较为轻微,使其成为无法耐受传统疗法的患者的有效替代方案。一些天然来源的ACP已经通过酶解法从食品蛋白质中成功提取,通过选择特定的蛋白酶和反应参数,可以控制肽的长度和序列,使其适合大规模工业生产。例如,Lin等通过使用胰蛋白酶、木瓜蛋白酶、菠萝蛋白酶和碱性蛋白酶对海藻进行酶解,从中分离出具有抗癌活性的ACP。其中,胰蛋白酶酶解产生的七肽显示出最强的抗癌活性。Zhang和Mu研究了使用六种蛋白酶制备的甘薯蛋白水解物对HT-29结肠癌细胞的抑制作用。在分子量小于3kDa的片段中,某些片段表现出最强的抗增殖效应,通过诱导G2/M细胞周期阻滞、增加p21和Bax表达、减少Bcl-2表达以及激活caspase-3,从而诱导细胞凋亡。Sah等人对从乳蛋白中生成的ACP进行了全面综述,强调了酪蛋白和乳清蛋白中存在具有抗癌潜力的生物活性肽。这些发现凸显了食品来源ACP在开发天然抗癌剂和功能性乳制品中的广阔前景。
尽管通过酶解法可以从天然来源高效获得ACP,但如何从蛋白质片段中识别和筛选这些肽仍然是一个重大挑战。传统的肽识别方法依赖于高效液相色谱(HPLC)和质谱(MS),这些技术可以提供精确的肽质谱信息。然而,MS生成的大数据量使得传统筛选方法难以实现快速挖掘和准确定位。高效、准确且快速的具有抗癌活性的肽筛选已成为开发基于肽的药物的关键瓶颈。近年来,人工智能(Artificial Intelligence, AI)凭借其强大的数据处理能力,逐渐成为快速发现生物活性肽的新兴工具。AI可以通过学习许多肽序列与其生物活性之间的关系,构建预测模型,识别具有潜在抗癌活性的肽。基于机器学习(ML)和深度学习算法,AI可以分析和处理大规模的肽序列数据,提取肽结构特征与抗癌活性之间的模式,从而为肽的快速发现提供一条高效的路径。这种方法不仅能够识别ACP,还能提升其发现效率。
然而,当前基于AI的ACP模型主要缺乏可解释性分析和湿实验验证。可解释性分析有助于解码预测结果的生物意义和可靠性,而缺乏清晰的可解释性则会限制ACP预测模型的生物基础和可信度。此外,虽然AI可以提高ACP发现的准确性,但其精度并非100%,筛选结果仍需要通过湿实验进行验证。湿实验可以揭示AI模型可能忽略的问题,如肽的稳定性、毒性以及与其他生物分子的相互作用。遗憾的是,目前在AI驱动的ACP筛选框架中,可解释性分析和湿实验验证的有效整合仍较为有限。为了应对这一挑战,我们系统地收集并整合了68个ACP模型(见表S1),总结了这些模型的数据集、算法、性能指标和应用。我们还分析了当前ACP预测模型的局限性,重点在于缺乏可解释性分析和湿实验验证。这些局限性影响了这些模型在实际应用中的可靠性和有效性。同时,我们还提出将AI筛选的ACP与多组学和生物技术相结合,以提高ACP的靶向性、稳定性和疗效。基于此,本综述提出了一个全面的基于AI的ACP筛选框架,涵盖了模型构建过程、可解释性分析、湿实验验证以及与其他生物技术的整合。该框架旨在提升ACP筛选的效率、准确性和适用性,推动新型ACP的发现和临床应用。
为了提高ACP的预测能力,本研究还系统地总结了68个ACP模型,这些模型涵盖了多种机器学习和深度学习算法。在这些模型中,传统的机器学习方法包括支持向量机(SVM)、随机森林(Random Forest, RF)、K-最近邻(K-Nearest Neighbor, KNN)和朴素贝叶斯(Naive Bayes, NB)等。这些方法能够从氨基酸描述符中构建特征矩阵,并基于传统的机器学习算法进行训练。在深度学习方法中,常见的包括人工神经网络(Artificial Neural Networks, ANNs)、循环神经网络(Recurrent Neural Networks, RNNs)、卷积神经网络(Convolutional Neural Networks, CNNs)、图神经网络(Graph Neural Networks, GNNs)以及混合模型。这些深度学习模型适用于大规模数据集,并能够自动从大量数据中提取复杂特征,从而提升模型性能。当数据量较大时,传统的机器学习模型可能面临特征工程和过拟合的挑战,而深度学习模型凭借其强大的特征学习能力和自动优化机制,更适用于处理复杂、高维数据,并实现更高的预测精度。
在这些模型中,SVM在处理高维数据方面表现出色,具有较强的抗过拟合能力。其性能主要依赖于核函数和关键参数的选择和调整。常用的径向基函数(Radial Basis Function, RBF)核能够适应不同的数据分布,而正则化参数则影响模型的复杂性和泛化能力。这些设置通常通过交叉验证进行优化,以确保模型在不同数据集上的最佳性能。Wan等人利用SVM框架结合序列最小优化(Sequence Minimal Optimization)方法,构建了基于AAC、N5C5、K空间和PSSM的特征矩阵,以优化机器学习模型的性能,从而有效区分ACP和抗菌肽。iDACP模型基于LIBSVM框架,采用两步机器学习方法来识别和分类ACP。该模型分析了肽的N端和C端的氨基酸组成,根据正电荷残基的分布,将ACP分为三个主要亚型。通过结合序列特征与物理化学性质,iDACP提高了预测的准确性。Ge等人开发了EnACP模型,该模型结合了多种特征表示,包括序列组成、序列顺序和物理化学性质,以高效且准确地识别ACP。
随机森林(Random Forest, RF)作为一种集成方法,通过多个决策树的组合来提高准确性和鲁棒性。其性能取决于树的数量、深度、样本分割和特征选择的随机性。更多的树可以提高稳定性,但也会增加计算成本;过深的树或过少的分割可能导致过拟合,而相反则可能导致欠拟合。ACPred模型利用RF框架构建预测模型,并通过评估不同特征的重要性来区分ACP和非ACP。应用RF方法后,ACPred识别了影响ACP活性的关键特征,包括疏水残基、α-螺旋结构和β-折叠结构。经过交叉验证后,该模型在识别ACP方面总体准确率为95.61%。RFaaindexACP模型使用RF算法训练和计算特征重要性,以识别与ACP相关的氨基酸的物理化学特性。该模型最终识别了19个关键的物理化学特性,可用于预测肽序列的抗癌潜力。Deng等人开发了ACP-MLC模型,该模型采用两阶段预测方法,首先使用RF算法预测给定肽序列是否为ACP序列,然后采用二元相关算法预测该序列所针对的组织类型。
K近邻(K-Nearest Neighbor, KNN)是一种基于距离计算的分类方法,其性能主要受到K值和距离度量选择的影响。较小的K值可能导致过拟合,而较大的K值可能造成欠拟合。此外,距离度量的选择对预测性能有显著影响,常见的度量包括欧几里得距离、曼哈顿距离和闵可夫斯基距离,选择合适的度量可以提高预测准确性。Alsanea等人提出了一种集成分类器,结合了SVM、RF和KNN算法,以精确识别ACP。这种集成方法通过整合多个分类器的优势,提高了预测的准确性和鲁棒性。在基准数据集和独立数据集上的实验结果分别达到了97.09%和98.25%的准确率。
深度学习模型在ACP筛选和预测中也得到了广泛应用,包括人工神经网络(Artificial Neural Networks, ANNs)、循环神经网络(Recurrent Neural Networks, RNNs)、卷积神经网络(Convolutional Neural Networks, CNNs)、图神经网络(Graph Neural Networks, GNNs)以及混合模型。这些深度学习模型适用于大规模数据集,并能够自动从大量数据中提取复杂特征,从而提升模型性能。当数据量较大时,传统的机器学习模型可能面临特征工程和过拟合的挑战,而深度学习模型凭借其强大的特征学习能力和自动优化机制,更适用于处理复杂、高维数据,并实现更高的预测精度。混合模型成为深度学习领域的一个趋势,通过结合ANN、RNN、CNN和GNN,充分利用每种模型的优势,提高预测准确性。此外,将注意力机制引入混合模型中,可以让模型专注于ACP序列中的关键特征区域和关键氨基酸残基,从而增强预测性能和可解释性。
人工神经网络(Artificial Neural Networks, ANNs)是机器学习模型,模拟生物神经系统的结构,由输入层、隐藏层和输出层组成,通过调整连接权重进行学习(见图3A)。其性能受到网络结构、激活函数和学习率等因素的影响:隐藏层的数量和每层神经元的数量决定了模型的复杂性;激活函数如Sigmoid、ReLU和Tanh引入了非线性特征;学习率控制训练步长,需要适当设置以平衡稳定性和效率。Kaushik等人开发了A-CaMP模型,该模型利用ANN快速识别抗癌和抗菌肽。通过临床数据,A-CaMP可以提供关于野生型和突变型序列和肽的详细信息,支持癌症和细菌感染的治疗。ENNAACT采用神经网络框架和深度学习技术开发了一种基于序列的ACP活性分类器。经过交叉验证,该模型的准确率达到98.3%。
循环神经网络(Recurrent Neural Networks, RNNs)是深度学习模型,适用于序列数据,广泛应用于时间序列分析、自然语言处理和生物序列分析(见图3B)。然而,RNNs在处理长序列时往往面临梯度消失或梯度爆炸的问题,导致长距离依赖关系被遗忘,从而影响学习效果和模型性能。为了解决这一问题,引入了长短期记忆(Long Short-Term Memory, LSTM)和门控循环单元(Gated Recurrent Units, GRUs)等变体,其中LSTM在ACP深度学习模型中更为常见。ACP-DL结合了LSTM算法和二元特征图与K-mer稀疏矩阵,实现了高效的特征表示。交叉验证测试显示,ACP-DL在基准数据集上优于其他方法。此外,双向LSTM(Bidirectional LSTM, BiLSTM)通过正向和反向计算序列,特别适合肽序列分析,使模型能够捕捉正向和反向的上下文信息。ACP-DRL采用BiLSTM框架,并结合蛋白质语言模型进行ACP识别。利用BiLSTM提取氨基酸序列特征,ACP-DRL克服了序列长度限制,消除了手动特征提取的需要,从而推动了深度学习在ACP识别中的应用。
卷积神经网络(Convolutional Neural Networks, CNNs)由卷积和池化模块组成,通过滑动窗口自动提取局部特征,并降低维度,从而降低计算成本和过拟合的风险。通过重复的卷积和池化操作,CNNs能够从边缘和纹理等低级特征逐步推导出更高级的语义表示(见图3C)。ACP-2DCNN结合了2D-CNN结构和二肽偏差(Dipeptide Deviation from Expected Mean, DDE)方法进行特征提取。除了2D-CNN,1D-CNN结构也适用于一维肽序列特征。在处理肽序列或其他一维序列数据时,1D-CNN能够有效提取肽序列中的局部氨基酸特征。与传统的序列模型相比,1D-CNN在肽序列分析中表现出强大的特征学习能力,并能够自动从大规模数据集中学习有效的表示,从而减少手动特征工程的需要。Sun等人开发了AI4ACP模型,该模型结合了一种新的肽序列编码方法PC6,每种氨基酸代表六种物理化学性质。此外,AI4ACP结合了CNN模型框架,并采用五折交叉验证,实现了89%的准确率。Aziz等人利用二进制编码进行特征提取,并使用多通道CNN训练了ACP模型iACP-MultiCNN。他们还开发了一个网页服务器,以供模型使用。mACPpred 2.0结合了传统特征描述符和基于预训练自然语言处理的高级嵌入,采用堆叠深度学习(Stacked Deep Learning, SDL)方法和1D-CNN块进行模型训练。通过严格的交叉验证和独立测试,mACPpred 2.0优于其前一版本mACPpred。
图神经网络(Graph Neural Networks, GNNs)通过节点间的连接传播信息,能够有效捕捉图中的节点依赖性和结构特征。与传统的序列模型相比,GNNs更能表征拓扑结构和潜在空间结构,因此更适合于建模肽的结构特征(见图3D)。ACPScanner结合序列信息、物理化学性质、结构信息和蛋白质语义信息构建ACP特征空间,并结合LightGBM和GNN进行模型训练。LightGBM通过SVM-Prot、NetSurfP-3.0特征和ESM-1b嵌入的平均池化处理输入,使用每个氨基酸残基作为图中的节点属性,并通过从预测坐标中获得的接触图作为边,从而提高模型的竞争力。图卷积网络(Graph Convolutional Network, GCN)是GNN的一种特殊变体,主要区别在于特征聚合方法。传统GNNs依赖递归或循环传播机制更新节点表示,而GCN使用图卷积操作,利用图的拉普拉斯矩阵进行高效特征聚合,从而提高其捕捉图结构信息的能力。Rao等人使用one-hot编码提取ACP的特征,并将ACP预测任务转化为图分类问题。每个肽样本表示为图结构,GCN自动提取和学习其特征,构建ACP-GCN预测模型。
混合模型成为预测ACP的另一种趋势,其中许多模型结合了CNN和RNN。CNN提供了强大的局部特征学习能力,而RNNs则捕捉序列中的长期依赖关系,从而增强肽序列的整体建模能力(见图3E)。Yuan等人使用BiLSTM和CNN训练了ACP-OPE模型,并结合ML模块(基于LightGBM框架)进行训练。最终模型通过集成三个模型的分类结果,采用投票机制进行优化,提高了ACP预测的准确性。此外,将CNN、RNN和GNN与注意力机制结合,可以进一步提升模型性能。在注意力机制中,查询(Query, Q)、键(Key, K)和值(Value, V)是三种重要的向量概念,其中查询通常代表当前输入特征,键代表与输入特征相关的参考信息,而值代表实际值信息。注意力机制通过计算Q和K之间的匹配分数,并使用softmax函数将其转换为概率分布,作为对应V的权重。最后,通过加权求和,模型生成一个关注关键信息的特征表示。这种机制使模型能够动态调整对不同输入特征的关注,从而有效减少无关信息的干扰。ACPred-BMF模型结合了BiLSTM和注意力机制,以增强模型的特征提取能力。该模型通过分析氨基酸的定量和定性性质,结合二进制特征,将肽序列转化为数值表示。此外,注意力机制还被用于其他预测模型的可解释性分析中。例如,Zhang等人在Umami-BERT中使用注意力机制计算每个氨基酸的注意力值,并生成注意力热图,揭示了模型在处理鲜味肽时对不同氨基酸的关注程度。Shuai等人开发了ConTCR模型,该模型使用注意力分数热图进行可视化,捕捉了TCR-pMHC相互作用的信息。通过对比学习策略结合pMHC和TCR的序列特征,并利用注意力机制增强关键相互作用的焦点,ConTCR模型提供了对关键TCR-pMHC相互作用的理解。未来,随着注意力机制在ACP模型中的广泛应用,注意力热图有望成为ACP可解释性可视化的关键工具,帮助提高模型的透明度。
在AI驱动的生物活性肽预测任务中,高模型性能往往以复杂的非线性结构为代价,使得决策过程难以直接解释。这种“黑箱”问题限制了AI在实际应用中的可用性和可信度。在表S1中,仅16个模型进行了可解释性分析,占所有模型的不到四分之一,这可能是这些模型应用受限的原因之一。在临床转化中,AI模型的应用需要确保其可靠性和可重复性,而缺乏可解释性的黑箱模型难以在医学界获得认可。在医学应用中,医生和研究人员必须能够理解模型预测背后的推理过程,以在实际应用中信任其结果。例如,在新型抗癌药物的开发过程中,只有清晰的决策基础才能确保模型预测的候选肽具有临床疗效,并避免因模型判断错误而带来的潜在风险。可解释性分析可以揭示哪些特征对模型预测影响最大,从而帮助识别哪些肽序列可能成为有效的药物,并为临床试验设计提供数据支持。随着临床实验数据的积累,可解释性分析可以反馈到模型中,持续优化模型的性能和预测准确性,最终促进模型的临床转化。因此,为了提高ACP模型的透明度,应在模型训练流程中集成可解释性分析步骤,以深入探索肽数据中的因果逻辑和潜在关系。这种分析不仅有助于揭示影响ACP识别的关键特征,还为优化现有模型提供了清晰的理论基础,从而推动其临床转化。
湿实验是AI在科学应用中的关键步骤,通过将AI与生物实验相结合,可以提高研究效率并克服传统计算模型的局限性。华盛顿大学利用先进的AlphaFold模型和冷冻电子显微镜确定了核孔复合体的结构。AlphaFold能够高效预测结构,但其准确性受限于训练数据:结果可能会有偏差。这表明计算模型无法完全取代生物实验。Shan等人开发了一种使用几何深度学习方法优化抗体的AI模型,结合少量的湿实验,以实现对SARS-CoV-2变体的广泛中和活性优化。由于新冠病毒的众多突变位点和有限的先验信息,专家经验受到限制。他们采用了“AI模型 + 少量湿实验”的方法,利用AI模型扩展科学假设空间,从而增强抗体的亲和力和效果。然而,尽管许多ACP模型在理论和计算层面表现良好,但只有少数模型通过了生物实验验证。在68个ACP模型中,只有3个模型在其开发过程中包含了生物实验验证。这种验证的缺失直接影响了模型向临床应用的转化能力。生物实验验证的缺乏阻碍了模型泛化能力的全面评估,这对临床应用至关重要。实验室结果往往无法完全反映临床实践的复杂性,因为患者差异、环境影响和药物敏感性等因素会影响ACP的实际效果。未经过生物实验验证的模型可能无法准确预测ACP在不同临床环境中的生物活性、稳定性和安全性,从而降低其在临床治疗中的有效性和应用价值。
综上所述,我们建议通过体外和体内实验验证AI模型识别的ACP。体外实验应使用多种癌细胞系评估ACP的细胞毒性和选择性,常用的方法包括MTT实验、SRB方法、LDH释放实验和双染色法(如Calcein-AM/PI双重染色)来验证ACP的活性和机制。体内实验则应使用小鼠模型评估ACP在减少肿瘤生长、防止转移和评估整体生存率方面的效果。毒性研究则监测小鼠器官损伤、免疫反应和潜在副作用,为ACP的临床应用提供关键数据。此外,随着注意力机制在ACP模型中的广泛应用,注意力热图有望成为ACP可解释性可视化的重要工具,帮助提高模型的透明度。
在本研究中,我们提出了一种基于AI的ACP筛选框架,涵盖了数据集收集和组织、特征提取、模型构建和优化、可解释性分析以及湿实验验证等多个关键步骤。这一框架不仅整合了AI与可解释性分析和湿实验验证,还结合了多种生物技术,以实现ACP的快速筛选和高效应用。此外,该框架还整合了多组学、合成生物学、氨基酸修饰技术和纳米递送技术,以克服ACP在药物开发中的局限性。这些技术的整合可以提升AI筛选的ACP的生物活性、结构稳定性和可制造性。通过这种综合框架,研究人员可以逐步推进ACP的开发,从模型构建到临床应用的全过程。这种干湿闭环模型提供了反馈机制,AI筛选的ACP结果可以反馈到后续的湿实验验证阶段,从而提升模型的预测能力。湿实验验证结果和序列修饰结果为模型提供了新的数据,丰富了数据集,并推动了模型的迭代更新,使其在临床应用中更具可行性。
在实际应用中,AI模型的筛选结果需要经过多组学数据的整合,以提高其准确性。多组学方法通过整合转录组、基因组、蛋白质组和代谢组等多维度数据,构建更全面的ACP候选库,为AI模型提供数据支持。这些多组学数据可以帮助识别与癌症病理相关的关键生物标志物,并发现潜在的ACP序列。例如,基因组学可以揭示肿瘤细胞中的基因突变和基因表达变化,而蛋白质组学则能直接反映与肿瘤相关的蛋白质功能信息,从而帮助筛选和优化ACP。代谢组学数据则揭示了肿瘤细胞中代谢通路的变化和代谢产物的差异。通过结合这些多组学数据,AI模型可以基于差异基因和蛋白质的表达模式筛选潜在的肽分子,并从代谢组学数据中发现潜在的ACP候选,进一步预测其疗效和稳定性。Ma等人利用人类肠道微生物组和宏蛋白质组学数据构建了包含2349个抗菌肽候选的库,并通过深度学习模型进行筛选,最终选择了11种对耐药性革兰氏阴性细菌具有强抗菌作用的肽。体内实验表明,这些肽在小鼠肺部细菌感染模型中显著降低了细菌载量,展示了良好的治疗潜力。未来,结合健康个体和癌症患者的肠道微生物组谱的比较分析,以及多代谢组学数据,可以识别与癌症发生和进展密切相关的重要微生物和差异肽数据集。AI模型可以基于这些差异数据集筛选与肠道微生物变化相关的潜在ACP,从而推动其临床转化。
合成生物学技术通过基因编辑和细胞工厂的应用,为ACP的合成提供了新的解决方案。在目前的ACP筛选过程中,化学合成是主要的方法,但成本高昂,且难以确保肽的结构符合预期,可能导致结构偏差。例如,在化学合成过程中,难以实现肽链中二硫键的稳定性,这可能导致肽的折叠不完全和与靶点的结合能力下降。此外,半胱氨酸残基的存在可能导致肽链中二硫键的形成或多种分子聚集的杂质。随着半胱氨酸残基的配对位点增加,肽链中的二硫键可能错误配对或无法配对,从而显著增加结构的复杂性。为了克服这些问题,合成生物学技术通过基因编辑和细胞工厂的应用,为ACP的合成提供了新的途径。例如,Pei等人利用合成生物学技术,成功在大肠杆菌中异源表达Mechercharmycin A,该肽具有显著的抗癌活性和独特的结构。Pasupuleti等人研究了一种合成的反二肽R-DIM-P-LF11-215,该肽来源于乳铁蛋白,并在大肠杆菌中异源表达。通过亲和层析纯化后,他们发现该融合蛋白能够特异性地靶向和杀死Gb3+癌细胞。
为了提高ACP的治疗效果和临床应用潜力,AI筛选的肽序列可能需要一系列的修饰和优化。生物活性肽通常对蛋白酶敏感,容易在体内被酶解,导致其活性丧失。因此,氨基酸修饰或替代成为增强肽稳定性和生物活性的新策略。例如,环化可以增强肽的结构稳定性,减少其对蛋白酶的敏感性,提高其生物活性和靶向能力。环状肽通常比线性肽表现出更强的抗菌和抗癌活性,因此环化成为优化ACP性能的关键方法。Phakellistatin 13是一种由交替的L-和D-氨基酸残基组成的环状七肽,通过调控p53和MAPK信号通路诱导细胞周期阻滞,从而发挥抗肝癌作用。Hadianamrei等人通过将赖氨酸(K)替换为精氨酸(R)并添加两个异亮氨酸(I)残基于C端,提高了ACP的选择性和降低了对正常细胞的毒性,同时增加了肽的疏水性和α-螺旋含量,从而提高了其抗癌活性。此外,底物的甲基化也可以有效调节肽的功能和稳定性。甲基化作为一种重要的表观遗传修饰,可以显著影响肽与靶点的结合能力和生物活性。甲基化通过添加甲基基团改变了RNA分子的结构和功能,从而增强了肽对靶点的特异性并提高了其稳定性。Mtp1是一种由12个氨基酸组成的肽,能够特异性地结合m(6)A修饰的RNA,通过抑制FTO蛋白的结合,防止m(6)A去甲基化,从而提高m(6)A修饰的保留水平。这些修饰技术为ACP的优化提供了新的思路和可能性。
纳米递送系统为解决ACP面临的挑战提供了新的途径。除了容易受到蛋白酶降解外,AI筛选的ACP还可能受到细胞吞噬作用和器官排泄等因素的限制,难以有效穿过细胞膜并在靶细胞中释放其治疗作用。此外,肿瘤微环境中的缺氧、酸性条件和高浓度的活性氧等环境因素可能导致ACP的化学结构如硫基和酰胺键的降解,影响其稳定性。纳米技术的出现为克服这些挑战提供了新的方法。通过细胞特异性靶向和分子转运策略,纳米载体能够有效克服传统药物递送系统中的生物分布和细胞内转运障碍,调节ACP的血循环时间,从而提高其在肿瘤部位的浓度,增强治疗效果。使用来源于天然的生物相容性材料制备纳米载体,可以提高ACP的安全性,减少潜在的毒性,并增强其在临床应用中的兼容性。例如,DermaseptinPP是一种具有广谱抗肿瘤活性的ACP,但高剂量可能引发严重的溶血反应。为解决这一生物安全性问题,采用pH敏感的膜材料将其负载到纳米脂质体中,形成具有pH响应特性的系统。当环境pH低于6.5时,脂质体中的化学键断裂,释放DermaseptinPP,从而有效杀死肿瘤细胞。FA-EEYSV-NH?是一种新型的抗癌前药,结合了叶酸(folic acid, FA)靶向识别位点、二肽连接子和ACP。该肽分子可以在pH为7.0时自组装成纳米颗粒,而在弱酸性条件下形成纳米纤维。这种自组装特性增强了ACP的稳定性,并促进了其在肿瘤微环境中的靶向递送和释放。通过这些纳米递送技术,ACP能够更有效地进入靶细胞,提高其治疗效果。
本研究提出的基于AI的ACP筛选框架包括数据集收集和组织、特征提取、模型训练和优化、可解释性分析以及湿实验验证等多个关键步骤。这一框架的核心在于将AI与可解释性分析和湿实验验证相结合,并整合多种生物技术,以实现从模型开发到临床应用的高效转化。该框架的每个阶段的验证结果都可以反馈到后续阶段,从而形成一个闭环系统。湿实验验证结果和序列修饰结果为模型提供了新的数据,丰富了数据集,并推动了模型的迭代更新,使其在临床应用中更具可行性。通过这种综合框架,研究人员可以逐步推进ACP的开发,从模型构建到临床应用的全过程。这种干湿闭环模型为AI筛选的ACP提供了反馈机制,AI筛选的ACP结果可以反馈到后续的湿实验验证阶段,从而提升模型的预测能力。湿实验验证结果和序列修饰结果为模型提供了新的数据,丰富了数据集,并推动了模型的迭代更新,使其在临床应用中更具可行性。
通过本研究提出的基于AI的ACP筛选框架,研究人员可以系统地推进ACP的发现和开发。这一框架不仅整合了AI与可解释性分析和湿实验验证,还结合了多组学、合成生物学、氨基酸修饰技术和纳米递送技术,以克服ACP在药物开发中的局限性。这些技术的整合可以提升AI筛选的ACP的生物活性、结构稳定性和可制造性,从而提高其在癌症治疗中的疗效和临床转化潜力。未来,随着AI技术的不断发展和多组学数据的广泛应用,基于AI的ACP筛选和发现将更加高效和准确,为癌症治疗提供更多样化和有效的治疗选择。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号