组学做完后,如何挑选基因进行深入研究?

【字体: 时间:2020年07月06日 来源:吉凯基因

编辑推荐:

  当这些组学做完后,往往差异会达到上百,乃至上千。面对这些差异,我们如何确定进入后续验证步骤的基因呢?结合自己多年的科研经历,在这里我给大家提供几个原则,供大家参考。

“组学做完后,如何挑选基因进行深入研究?”经常有学者会遇到这样的问题。

在我们做研究中,为了寻找有创新性的基因,往往会进行组学筛选。比如收集临床病人样本和正常人样本,采用基因组、转录组、蛋白组、磷酸化蛋白组等组学技术进行疾病和正常组织、血浆等样本之间的差异基因筛选。

当这些组学做完后,往往差异会达到上百,乃至上千。面对这些差异,我们如何确定进入后续验证步骤的基因呢?

结合自己多年的科研经历,在这里我给大家提供几个原则,供大家参考。

1、创新性

科研的灵魂是创新,我们做组学的目的就是找有创新性的基因。因此,这个是第一要求。这一步,相对比较简单,拿基因跟所研究的临床问题到pubmed上查询一下,就知道是否具备创新性。

2、功能性

基因是从临床样品中筛选出来的差异基因,具有临床相关性。但在所研究临床问题中没有报道过,其是否在疾病中发挥功能呢?这一点决定了这个基因是此临床问题的因还是果。我们做临床基础研究是为了找到对疾病发生发展具有促进或抑制作用的功能基因-候选诊疗靶点,以期开发试剂和药物解决临床诊疗问题。

目前在功能(如增殖、转移)研究这个步骤,我们有功能高内涵筛选(HCS)的实验技术,一般来说蛋白编码基因HCS的成功率在10%,一般建议选择20个基因进行HCS筛选,以确保成功率,筛选到功能阳性基因。

 
图1 20个基因的HCS筛选结果

这一步骤,在确定候选基因时,首先,可以看一下已知报道的该基因的功能,看看已知报道的功能是否提示该基因存在与我们研究的临床问题存在相关性。比如我们研究糖尿病,研究β细胞损伤导致的糖尿病,从肥胖糖尿病动物模型中筛选到建模胰岛中表达增高的基因(如果有人的样品筛选,是最好)。这个基因在糖尿病中未见报道,但是在肿瘤中认为是抑癌基因,那么这种基因就入选。因为抑癌基因增高在肿瘤中是促凋亡的,那么我们看到其在肥胖糖尿病动物胰岛中增高,很可能也是促进胰腺β细胞损伤。

其次,借助于生物信息分析的GO、KEGG富集分析,我们可以得知基因参与的生物过程与分子功能、与哪些通路相关[1]。如果想关注某个GO term(体现功能表型)中的差异基因集,且该GO term恰好与我们研究的疾病相关,那么从这个GO term中的基因筛选候选基因是不是胜算更大一些?如果验证得顺利的话,这样就做到基因-功能-表型相一致了。

 
图2 基因的microRNA调控网络在细胞周期过程中富集[1]

另外,通过WGCNA识别相关功能的基因模块,根据某个功能模块绘制PPI互作网络图,找到在某个疾病模型中发挥作用的hub基因,hub基因位于蛋白互作网络的核心位置[2],hub基因可能是疾病研究过程中起关键性作用的driver gene。

 
图3  PPI网络图[2]

3、机制的故事性

一个课题的故事性包含多个方面,比如前面我们分享的nature文章[3],糖代谢的激酶,会直接磷酸化调控蛋白,从而通过这个路径参与肿瘤发生发展。这个点既有创新性又有故事性。再如,前面讨论国自然创新性中介绍的单细胞相关研究,新发现一类细胞参与疾病[4]。这类也是既有创新性又有故事性。

我们这里讨论的机制的故事性,是指在往后做机制时如何做深,做严谨。甚至跟热点相关。

从高水平杂志要求验证严谨的角度,机制上要求做到直接互作,那么我们在组学中选择基因时,如果能够考虑到这一点就一定要在这个地方考虑。很多课题,是筛选到了有创新性、有临床相关性、有功能的基因,但是,做机制时,没能做到直接互作机制,这时,很难说服高分杂志reviewer接受我的研究结论。

这一步骤,不少专家是考虑TF(转录因子)和酶。选择TF做机制,是找直接调控的靶基因;选择酶做机制,是找直接修饰的底物。

4、与热点的相关性

机制研究不但需要考虑机制的深度,也要考虑机制的热度。有创新性的A基因,其高度由B机制所决定。在做到机制探讨时,从A基因的下游(或上游)中找明星基因,把明星基因作为B机制,衬托我们A基因的重要性。实际中,当我们做到机制这一步,从A基因的下游(或上游)找不到明星基因,或者找到的B机制故事性不强。这时,也很难让高分杂志reviewer眼前一亮。

这一步骤,大部分情况下拿到有故事性的B机制,是可遇而不可求。

如果我们一定要发高水平杂志的文章,那么这里可以反过来做研究。根据明星基因找有创新性的基因。先根据明星基因,找跟明星基因有关的基因[5],从这些基因中找有创新性、有临床相关性、有功能的基因。这样的研究,有不少课题组在用,缺点是风险很高。根据明星基因不一定能够找到符合前面这些条件的基因。

如果您经费允许,建议两个路径同时进行,确保有成果的前提下,尽量提升。

午钜惠不过期,
5折代谢组学,单个样本低至650元
扫描下方二维码报名,联系我们就现在!



 
参考文献:

1. Yang J, Wang N. Genome‐wide expression and methylation profiles reveal candidate genes and biological processes underlying synovial inflammatory tissue of patients with osteoarthritis[J]. International journal of rheumatic diseases, 2015, 18(7): 783-790.

2. Chen PF, Wang F, Nie JY, et al. Co-expression network analysis identified CDH11 in association with progression and prognosis in gastric cancer. Onco Targets Ther. 2018;11:6425-6436. Published 2018 Oct 2.

3. Xu D, Wang Z, Xia Y, et al. The gluconeogenic enzyme PCK1 phosphorylates INSIG1/2 for lipogenesis[J]. Nature, 2020, 580(7804): 530-535.

4. Ziegler C G K, Allon S J, Nyquist S K, et al. SARS-CoV-2 receptor ACE2 is an interferon-stimulated gene in human airway epithelial cells and is detected in specific cell subsets across tissues[J]. Cell, 2020.

5. Jain AK, Xi Y, McCarthy R, et al. LncPRESS1 Is a p53-Regulated LncRNA that Safeguards Pluripotency by Disrupting SIRT6-Mediated De-acetylation of Histone H3K56. Mol Cell. 2016;64(5):967-981.

订阅生物通快讯

订阅快讯:

最新文章

限时促销

会展信息

关注订阅号/掌握最新资讯

今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

版权所有 生物通

Copyright© eBiotrade.com, All Rights Reserved

联系信箱:

粤ICP备09063491号