新方法跟踪人工智能的“学习曲线”来解码复杂的基因组数据

【字体: 时间:2025年01月13日 来源:AAAS

编辑推荐:

  引入可注释性——一个强大的新框架,通过研究人工神经网络如何学习标记基因组数据来解决生物学研究中的主要挑战。基因组数据集通常包含大量注释样本,但其中许多样本的注释要么不正确,要么含糊不清。借鉴了自然语言处理和计算机视觉领域的最新进展,该团队以一种非常规的方式使用了人工神经网络(ann):该团队不仅使用ann进行预测,还研究了他们学习标记不同生物样本的困难。有点类似于评估为什么学生发现一些例子比其他例子更难,研究小组利用这一独特的信息来源来识别细胞注释中的不匹配,改进数据解释,并揭示与发育和疾病相关的关键细胞途径。可注释性为分析单细胞基因组数据提供了一种更准确的方法,为推进生物学研究提供了巨大的潜力,从长远来看,可以改善疾病的诊断和治疗。

  

引入可注释性——一个强大的新框架,通过研究人工神经网络如何学习标记基因组数据来解决生物学研究中的主要挑战。基因组数据集通常包含大量注释样本,但其中许多样本的注释要么不正确,要么含糊不清。借鉴了自然语言处理和计算机视觉领域的最新进展,该团队以一种非常规的方式使用了人工神经网络(ann):该团队不仅使用ann进行预测,还研究了他们学习标记不同生物样本的困难。有点类似于评估为什么学生发现一些例子比其他例子更难,研究小组利用这一独特的信息来源来识别细胞注释中的不匹配,改进数据解释,并揭示与发育和疾病相关的关键细胞途径。可注释性为分析单细胞基因组数据提供了一种更准确的方法,为推进生物学研究提供了巨大的潜力,从长远来看,可以改善疾病的诊断和治疗。

由希伯来大学的Jonathan Karin, Reshef Mintz, Barak Raveh博士和Mor Nitzan博士领导的一项新研究发表在《自然计算科学》上,通过监测深度神经网络训练动态,引入了一个新的框架来解释单细胞和空间组学数据。该研究旨在解决细胞注释中固有的模糊性,并为理解复杂的生物数据提供了一种新的方法。

单细胞和空间组学数据改变了我们探索健康和疾病中的细胞多样性和细胞行为的能力。然而,这些高维数据集的解释是具有挑战性的,主要是因为难以将离散和准确的注释(如细胞类型或状态)分配给异质细胞群。这些注释通常是主观的、嘈杂的和不完整的,因此很难从数据中提取有意义的见解。

研究人员开发了一个新的框架,可注释性,它有助于识别细胞注释中的不匹配,并更好地表征生物数据结构。通过监测在注释数据上训练深度神经网络的动态和难度,Annotatability可以识别细胞注释不明确或错误的区域。该方法还强调了中间细胞状态和细胞发育的复杂性,连续性。

作为研究的一部分,该团队引入了一种信号感知图嵌入方法,可以对生物信号进行更精确的下游分析。该技术捕获与靶信号相关的细胞群落,有助于探索细胞异质性、发育途径和疾病轨迹。

该研究证明了可注释性在一系列单细胞RNA测序和空间组学数据集中的适用性。值得注意的发现包括错误注释的识别,发育和疾病相关细胞状态的描述,以及细胞异质性的更好表征。这些结果突出了这个框架在揭示复杂细胞行为和促进我们在单细胞水平上对健康和疾病的理解方面的潜力。

研究人员的工作在基因组数据解释方面迈出了重要的一步,为揭示细胞多样性和提高我们研究健康和疾病动态的能力提供了有力的工具。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号