专家指南:如何开展基因表达研究(三)[心得点评]

【字体: 时间:2012年12月21日 来源:生物通

编辑推荐:

  众所周知,在不同的情况下,在不同的组织中,基因表达的水平也不同。如今,研究人员可利用多种技术来追踪基因表达水平的差异,如定量PCR、芯片或测序。对于这些技术平台,如何选择?如何开展数据分析和验证?且看看专家的回答。

Q4:您在分析基因表达数据时通常借助哪些生物信息学工具?

Gary Hardiman(加州大学圣地亚哥分校)

• 利用内部脚本对读取进行QC
• 定位到参考基因组(Bowtie 2)
• 新的剪接检测(Cufflinks)
• 转录本定量(FPKM)
• 差异表达分析(edgeR, SAMR, cuffdiff)
• 选定基因或转录本的覆盖图
• 基因本体和通路分析
• 互作组分析(gene networks)

Chris Harrington(俄勒冈健康与科学大学)

我们使用仪器供应商提供的软件来初步处理每个表达谱平台的数据。我们实验室一般不提供全面的数据分析,因此在交付数据后,许多客户使用开源的软件工具,或与生物信息学机构合作。这些机构对RNA-seq或芯片分析很有经验,他们通常使用开源软件或定制流水线。我们认为GeneSifter、Partek Genomics Suite和MetaCore相对易用,且能满足很多客户的要求,特别是小的非临床研究。

Ralph Schlapbach(瑞士联邦理工学院)

对于芯片基因表达分析,我们依赖R/Bioconductor。这个框架为芯片分析的每一步提供了专用的软件包:预处理、标准化、差异表达计算和基因本体分析。Bioconductor软件包具有以下特征:支持所有厂商的所有芯片类型,执行最新的统计模型,支持重复研究,是开源的。具体来说我们使用Affymetrix的软件包来预处理Affy数据。对于其他芯片类型,我们自己编写流水线来执行预处理步骤。

对于NGS转录组数据的分析,我们依赖tophat来进行读取定位。我们评估数据质量,检查污染物,评估属于重复的读取比例,并评估片段大小分布、3’-偏向和剪接点的覆盖度。对于差异表达,我们依赖Bioconductor软件包的edgeR。我们利用goseq软件包对基因列表进行功能注释。对于相关通路的深度挖掘,我们建议使用一个商业软件产品,如GeneGo的MetaCore,因为它们的通路数据库比公开的通路资源更全面,更准确。

Q5:您如何确定绝对表达水平?

Gary Hardiman(加州大学圣地亚哥分校)

绝对定量应当利用数字PCR方法来进行,例如Bio-Rad的QX100。在缺乏数字仪器时,可以采用比较传统的方法,根据标准曲线和已知浓度的样品来确定未知浓度的样品。

Ralph Schlapbach(瑞士联邦理工学院)

就每个细胞中转录本拷贝的数量而言,无论是芯片,还是新一代测序,都不能提供绝对的表达水平。我们采用RSEM来计算样品中每个isoform的相对丰度。这种方法假定每个细胞中RNA的总量是恒定的,或RNA拷贝总量的变化不相关。如果这些假设不成立,那么我们建议与额外的加标(spike-in)一起测序,以控制起始材料的量。

Q6:您如何确认您的发现?

Gary Hardiman(加州大学圣地亚哥分校)

来自RNA-seq和芯片的表达数据可通过qPCR来确认。

Craig Praul(宾夕法尼亚州立大学)

我认为,如果研究人员仔细比较各个结果,那么他们会发现qPCR、芯片和新一代测序都得到了类似的结果。MAQC研究指出,你应当确保,在比较芯片和qPCR实验时,你在研究相同探针的表达水平。在将新一代测序结果与qPCR或芯片比较时也一样,你比较的读取应与探针覆盖的区域相同。你必须清楚,平台之间基因表达水平的差异可能仅仅在于它们测定了不同的外显子。在测定基因表达时,若未考虑剪接变体的差异表达,则会导致各平台之间某种程度的不一致。

我建议任何人使用新一代测序或芯片来发现他们认为表达有差异的基因,并利用实时定量PCR来确认这些发现。实时定量PCR让我们能够以更加合理的成本检查更大量的样品。分析更大量的重复,将为研究人员带来更多的统计可信度。

相关阅读:

专家指南:如何开展基因表达研究(一)

专家指南:如何开展基因表达研究(二)

订阅生物通快讯

订阅快讯:

最新文章

限时促销

会展信息

关注订阅号/掌握最新资讯

今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

版权所有 生物通

Copyright© eBiotrade.com, All Rights Reserved

联系信箱:

粤ICP备09063491号