编辑推荐:
为解决无法预测单细胞特性的问题,美国加利福尼亚大学圣地亚哥分校的研究人员开展用 AI 分析 3D 成像流式细胞仪数据预测细胞特性的研究。结果显示预测高蛋白质表达细胞准确率达 88% 等。该研究对医学和生物研究意义重大,值得一读。
在生命科学的研究领域,一直以来都有一个 “神秘的谜题” 等待着科学家们去解开:能不能从细胞的一些现有信息,预测每个细胞未来的 “命运” 呢?你看,我们都知道,从基因组学数据预测组织或生物体的特性,这在医学界已经比较常见了。就像通过查看一个人的基因信息,能大致了解他可能患某些疾病的风险。但是,具体到单个细胞,情况就复杂多了。
传统的单细胞基因组学方法,就像是一把 “双刃剑”。它确实能让我们深入了解细胞的分子层面信息,可问题在于,RNA 测序过程会直接把细胞 “破坏掉”。这就好比为了知道一个盒子里装了什么,直接把盒子砸了,这样一来,我们就没办法去验证之前对细胞未来特性的预测是否正确了。而且,目前大多数研究都集中在分析细胞当下的分子或形态特性,却没办法预测细胞在未来会有怎样的行为。这就好像我们只能看到细胞 “此时此刻” 的样子,却看不到它的 “未来走向”。
为了解开这个 “谜题”,来自美国加利福尼亚大学圣地亚哥分校电气与计算机工程系等机构的研究人员展开了一场科研 “冒险”。他们的研究成果发表在了《Scientific Reports》期刊上,论文题目是《Predicting cell properties with AI from 3D imaging flow cytometer data》。这场研究就像是一场 “细胞未来预测之旅”,他们最终发现,利用人工智能(AI)分析 3D 成像流式细胞仪获取的单细胞图像,能够预测细胞的特性,并且取得了相当不错的成果,这一发现有着极为重要的意义。
在这场 “冒险” 中,研究人员用到了几个关键的技术方法。首先是 3D 成像流式细胞仪,它就像是细胞的 “高清摄影师”,能够以高通量的方式拍摄单个细胞的无标记 3D 图像,为研究提供了丰富的细胞形态信息。还有位置跟踪细胞放置平台(CPP),它能准确地记录每个细胞的位置,就像给细胞们安排了 “专属座位”,方便后续观察。另外,融合卷积自动编码器分类器(CAE)发挥了重要作用,它就像一个聪明的 “数据解读大师”,通过对图像数据的分析,预测细胞的特性 。
下面我们来看看他们都有哪些有趣的研究成果。
预测细胞蛋白质表达水平
研究人员选择了稳定表达人源化 eGFP 荧光蛋白的中国仓鼠卵巢(CHO)细胞作为 “研究对象”。整个实验就像一场精心策划的 “演出”,分为三个主要 “节目”:样本制备和数据采集、AI 模型训练以及细胞蛋白质表达水平预测。
他们的实验系统有两个 “得力助手”:3D 成像流式细胞仪和机器人细胞分配器。3D-IFC 系统非常厉害,每秒能给 1000 个移动的细胞拍摄 3D 侧面散射、荧光图像以及 2D 透射图像。细胞 “拍完照” 后,会和标记珠一起,按照 “先来后到” 的顺序被分配到细胞放置平台上。这些标记珠的序列就像 “定位密码”,能帮助研究人员把细胞图像和细胞在放置膜上的位置对应起来。
实验开始了,研究人员先把 CHO 细胞培养好,然后将它们和标记珠混合,通过 3D-IFC 系统进行 “拍照”,再把细胞放在 CPP 上培养。在培养前(0 小时)和培养 48 小时后,用荧光显微镜测量每个细胞的 GFP 蛋白表达水平。接着,研究人员根据蛋白产生速率的直方图,把高表达水平组(前 10%)和其他细胞区分开来。他们用 3D SSC 图像作为机器学习模型(基于卷积自动编码器的分类器 CAE)的 “学习资料”,训练神经网络。结果令人惊喜,这个模型能以 88.2% 的平衡预测准确率,把高 GFP 表达水平的细胞和低 / 普通表达水平的细胞区分开。这就意味着,研究人员不用在细胞刚收获时就测量 GFP 表达水平,通过图像和模型就能提前知道哪些细胞未来会产生更多的 GFP!
预测细胞在应激后的特性变化
预测细胞因历史经历而产生的特性变化,对于了解疾病发展有着重要意义,就像提前知道哪些细胞可能 “变坏”,从而采取预防措施。研究人员让 CHO 细胞经历了两种 “考验”:热应激和营养剥夺,而且时间比较短,不会明显影响细胞的健康或活力。
实验开始前 48 小时,研究人员先把 CHO 细胞种在培养皿里,等它们进入对数生长期。然后,一组细胞被送到 40°C 的环境中热应激,一组细胞被剥夺葡萄糖,还有一组作为 “对照组” 正常培养。6 小时后,研究人员用 3D IFC 给所有细胞拍摄 “Day Zero” 图像。之后,把细胞都放在正常环境里培养,每隔 24 小时,用商业流式细胞仪监测细胞的形态变化,一直监测到 72 小时。
研究人员发现,在 0 小时的时候,用商业流式细胞仪几乎检测不出不同细胞组之间的差异。但是到了 72 小时,葡萄糖剥夺组的细胞在 FSC 和 BSC 信号直方图上有了一些变化,热应激组的变化相对较小。这说明,不用特定的生物标志物标记,很难判断单个细胞是否经历过应激或产生了应激诱导的形态变化。
不过,研究人员没有放弃。他们用一种融合卷积自动编码器(结合了 2D CAE 和 3D CAE)来检测细胞的应激历史,并预测应激后细胞的特性变化。这个模型就像一个 “细胞侦探”,能从细胞的 “Day Zero” 图像里找出线索。实验结果显示,对于葡萄糖剥夺组的细胞,这个模型的平均平衡预测 F1 分数达到了 0.994;对于热应激组的细胞,平均平衡预测 F1 分数是 0.814 。这表明这个模型能准确地检测细胞的历史,并预测应激后细胞的特性变化。
在研究的最后,研究人员对整个实验进行了总结和讨论。他们这次的研究,可是在细胞特性预测领域迈出了重要的一步。这是首次进行这样的实验,虽然结果还是初步的,但已经充满了希望。通过这次研究,他们发现利用 3D 成像流式细胞仪、机器人控制的细胞放置平台和融合 CAE 神经网络,能够满足预测细胞命运所需的技术要求。随着技术的不断进步,以后在这个领域肯定会有更多的研究。这不仅能让我们更深入地了解细胞生物学,还能在药物生产和预防医学等方面发挥大作用。想象一下,以后在生产药物的时候,我们可以提前筛选出那些 “优秀” 的细胞,提高生产效率;在预防医学方面,提前发现那些可能病变的细胞,及时进行干预。
不过,研究人员也很清楚,目前的研究还存在一些挑战和限制。比如说,现在的系统没办法获取 3D 小角度散射图像,这就限制了预测细胞特性可用的信息。而且,AI 网络在生物学背景下的可解释性也还需要进一步研究。但这些问题并不会阻挡科研人员前进的脚步,这次研究取得的成果,像预测高蛋白质生产细胞 88% 的准确率,检测细胞应激历史和预测应激后细胞特性 82% 和 99% 的准确率,已经为未来在这个新领域的探索铺好了路。相信在不久的将来,科学家们一定能解开更多细胞的 “秘密”,为生命科学和医学的发展带来更多的惊喜!