编辑推荐:
为解决早发性卵巢功能不全(POI)遗传病因不明等问题,广东妇女儿童医院研究人员开展 POI 转录组研究。他们发现众多转录本及相关特征,明确免疫细胞变化。该研究为 POI 诊疗提供新视角,强烈推荐科研读者阅读。
广东妇女儿童医院(Guangdong Women and Children Hospital)的研究人员 Zhaoyang Yu 等人在《Scientific Reports》期刊上发表了题为 “Analysis of post-transcriptional regulatory signatures and immune cell subsets in premature ovarian insufficiency based on full-length transcriptome” 的论文。这篇论文在早发性卵巢功能不全(Premature ovarian insufficiency,POI)研究领域意义重大,为深入探究 POI 的发病机制、转录后调控机制以及免疫靶点提供了全新视角,有助于推动该领域的医学研究进展,为未来 POI 的诊断和治疗开辟新方向。
论文摘要指出,POI 是一种生殖内分泌紊乱疾病,以不孕和围绝经期综合征为特征,其遗传病因高度异质且尚未完全明确。受短读长测序技术限制,POI 的全长转录本特征和结构变异一直不为人知。研究人员采集了 5 名 POI 患者和 5 名对照者的外周血样本,首次利用牛津纳米孔测序(Oxford Nanopore sequencing)技术对 POI 的全长转录本进行了表征分析。研究最终鉴定出 26,122 个转录本,其中包含 7,724 个新基因位点和 13,593 个新转录本,还识别出 382 个差异表达转录本(Differentially Expressed Transcripts,DETs)。通过转录本结构变异分析,发现了 8,834 个可变剪接事件(Alternative Splicing,AS)、65,254 个可变多聚腺苷酸化位点(Alternative Polyadenylation,APA)和 32 个基序。此外,研究还预测了 494 个高可信度的长链非编码 RNA(Long Non-Coding RNAs,lncRNAs)、1,768 个转录因子(Transcription Factors,TFs)以及新的基因编码区域。免疫细胞亚型分析显示,POI 患者中 CD8 + T 细胞和单核细胞的表达下调,且与抗苗勒管激素(Anti-Müllerian Hormone,AMH)显著正相关 ,表明它们可能成为 POI 潜在的诊断标志物和免疫治疗靶点。
研究背景
POI 指女性在 40 岁之前出现生殖内分泌功能障碍和卵泡耗竭的情况,主要临床表现为不孕和月经紊乱,以高促性腺激素性和低雌激素性闭经为特征。据估计,40 岁前 POI 的患病率为 1%,而 20 岁前约为 0.01% 。由于雌激素生成减少,POI 女性患心血管疾病、骨质疏松、泌尿生殖道症状和神经退行性疾病等长期并发症的风险更高。POI 的病因高度异质,虽然染色体异常、自身免疫性疾病和医疗因素(手术、放疗、化疗)等已被报道,但 90% 的病例病因仍不明,遗传因素被认为是促进 POI 发展的最重要因素。因此,探索 POI 的基因特征对于了解其发病机制和治疗靶点至关重要。
高通量测序技术的出现为遗传研究和生物医学带来了革命性突破。牛津纳米孔技术(Oxford Nanopore Technology,ONT)作为基于单分子电信号实时检测的第三代高通量测序技术,与以 Illumina 平台为代表的下一代测序技术相比,具有超长读长、测序周期短和实时获取结果等明显优势,且全长序列有助于更精确地完善基因组注释信息,探索复杂的转录本结构变异。在这样的背景下,研究人员开展了此项研究,旨在利用 ONT 技术完善 POI 转录本的功能注释,探索其转录后调控特征,并分析不同免疫细胞亚型的比例,为 POI 的研究提供新见解。
研究方法
- 参与者和样本采集:POI 的诊断标准为年龄小于 40 岁、至少 4 个月的少经 / 闭经以及两次间隔超过 4 周检测的血清卵泡刺激素(Follicle-Stimulating Hormone,FSH)浓度超过 25 IU/L 。对照组的纳入标准包括年龄和体重指数(Body Mass Index,BMI)匹配、因输卵管因素导致的不孕诊断、月经周期和卵巢功能正常。两组的排除标准一致,包括存在其他内分泌紊乱、有盆腔或卵巢手术史、在采血前 3 个月内使用过影响内分泌系统的激素或药物。研究人员采集了参与者空腹 12 小时后的 2.5ml 外周血样本,存于 -80°C ,同时收集了参与者的临床数据。本研究获得了广西医科大学第一附属医院伦理委员会批准,并取得了所有参与者的书面知情同意。
- cDNA 文库构建:使用 PAXgene Blood miRNA Kit 提取样本总 RNA,并用匹配试剂盒构建 cDNA 文库,随后利用 PromethION 平台进行全长转录组测序。对全长序列进行优化生成一致性序列,再与人类参考基因组比对,排除低质量序列后用于后续分析。
- 新转录本的鉴定和功能注释:将非冗余序列得到的 gff3 文件与参考基因组的 gff3 文件进行比较,将本测序结果中已鉴定但参考基因组未注释的转录本分类为新转录本,并通过与多个数据库比对获取其注释信息。
- 差异转录本的鉴定和富集分析:以每百万计数(Counts Per Million,CPM)量化转录本表达水平,使用 DESeq2 R 包进行差异表达分析,筛选出差异表达转录本,对其进行京都基因与基因组百科全书(Kyoto Encyclopedia of Genes and Genomes,KEGG)和基因本体论(Gene Ontology,GO)富集分析。
- 可变剪接和可变多聚腺苷酸化分析:利用 AStalavista 软件识别 AS 类型,对 POI 组特有的 AS 基因与 DETs 取交集并进行 KEGG 通路富集分析;使用 TAPIS 管道验证 APA 位点,分析其数量和位置,用 DREME 软件分析转录本 poly (A) 位点上游 50bp 的序列特征以确定基序。
- lncRNAs、编码序列(Coding Sequence,CDS)和简单序列重复(Simple Sequence Repeat,SSR)预测:定义特定条件的转录本为候选 lncRNAs,通过四种工具预测结果的交集确定高可信度 lncRNAs;使用 TransDecoder 软件识别 CDS;筛选特定长度的转录本进行 SSR 分析。
- 转录因子注释和结合位点预测:通过与数据库比对识别 TFs 类型,使用软件评估其活性并预测结合位点。
- DETs-TFs - 通路和蛋白质 - 蛋白质相互作用网络分析:利用数据库预测靶向 DETs 的 TFs 和相关通路,构建并可视化网络;将 DETs 上传至 STRING 数据库进行蛋白质 - 蛋白质相互作用(Protein-Protein Interaction,PPI)分析并进行网络分析。
- 免疫细胞亚型和临床相关性分析:使用 CIBERSORT 包对转录表达谱进行免疫细胞亚型分析,通过 T 检验分析两组间免疫细胞亚群的差异表达,计算 Pearson 系数分析差异细胞亚群与临床指标的相关性。
研究结果
- 全长转录组测序概述:与对照组相比,POI 组 FSH 和 LH 水平显著升高,AMH 水平显著降低,两组在年龄、BMI、E2、PRL 和 T 方面无显著差异。Nanopore PromethION 平台构建的外周血样本全长转录组文库,经数据处理后,每个样本的清洁数据输出均超过 3.77GB,全长序列比例在 90.2% - 92.84% 之间。
- 新转录本和差异表达转录本的鉴定及功能注释:共鉴定出 26,122 个转录序列,包含 7,724 个新基因位点和 13,593 个新转录本;识别出 382 个 DETs,其中 366 个下调,16 个上调。GO 功能注释分析显示 DETs 在生物过程中显著富集于病毒生命周期等;KEGG 富集分析表明其在多个通路显著富集。
- 可变剪接、可变多聚腺苷酸化和基序的特征:识别出 8,834 个 AS 事件,POI 组和对照组中各 AS 类型比例相似,ES 占比最大,MEE 占比最小。POI 组特有的 AS 基因与 DETs 交集基因显著富集于铁死亡通路。共鉴定出 65,254 个 APA 位点,两组中各类型 APA 位点比例相似,多数基因有 1 个 polyA 位点。分析得到 10 个基序,3′-UTR 上下游区域富含腺嘌呤(A)。
- 编码序列、长链非编码 RNA 和简单序列重复的特征:检测到 7,737 个开放阅读框(Open Reading Frames,ORFs),其中 4,171 个为完整 ORFs。通过四种方法预测得到 494 个高可信度 lncRNAs,包括多种类型,还鉴定出 7 种 SSR,单核苷酸 SSR 数量最多。
- 转录因子的特征和结合位点:预测出 1,768 个 TFs,zf-C2H2、Homeobox 和 bHLH 是数量最多的前三个 TF 家族。BCLB-ZBTB 家族在 POI 组中为正调控 TF,其余 TF 家族多为负调控。
- DET-TF - 通路和蛋白质 - 蛋白质相互作用网络分析:构建的网络有助于理解生物过程和疾病机制,PPI 网络中较大较深颜色的节点代表在 POI 发病和进展中可能起关键作用的 DETs。
- 免疫细胞亚型和临床相关性分析:免疫浸润分析显示 POI 组单核细胞和 CD8 + T 细胞水平显著低于对照组。AMH 与 CD8 + T 细胞和单核细胞呈正相关,FSH 与 CD8 + T 细胞呈负相关。
研究结论与讨论
本研究首次基于 ONT 技术对 POI 的转录后调控和免疫细胞亚群进行了表征分析。ONT 测序在识别全长转录本、预测 lncRNAs、TF 家族和 CDS 等方面展现出可行性和优势。可变剪接、可变多聚腺苷酸化位点和基序是转录后调控机制的关键步骤,揭示了转录本异构体、蛋白质和遗传复杂性的多样性来源。差异 AS 基因的富集分析表明铁死亡通路可能在 POI 发病机制中起重要作用。免疫细胞亚型分析显示 CD8 + T 细胞和单核细胞在 POI 中下调且与 AMH 和 FSH 显著相关,提示它们可能作为 POI 的诊断标志物和治疗靶点。
然而,研究也存在一定局限性。ONT 测序相对较高的错误率可通过优化技术逐步改善;样本量有限,需要更大规模的临床队列研究来进一步验证和推广研究结果;外周血中的 DETs、可变剪接和可变多聚腺苷酸化不能完全代表卵巢组织的转录特征和转录后调控机制,还需动物和细胞实验来明确它们在 POI 发病机制中的作用。尽管如此,这项研究为 POI 的研究提供了重要的基础和新的研究方向,有望推动 POI 在诊断和治疗方面取得新的突破,帮助更多受 POI 困扰的女性。