基于转录组学与机器学习解析肤色变异的分子基础:揭示黑色素生成、脂质代谢与干扰素-γ信号的新机制
《Scientific Reports》:Deciphering the molecular basis of skin color variation through transcriptomics and machine learning
【字体:
大
中
小
】
时间:2025年12月20日
来源:Scientific Reports 3.9
编辑推荐:
本研究针对人类肤色变异这一复杂遗传机制尚未完全阐明的难题,通过结合转录组学与机器学习技术,系统分析了不同个体类型角(ITA)分级的皮肤样本。研究发现265个差异表达基因,不仅验证了黑色素生成相关基因(如TYRP1、PMEL)在深色皮肤中上调,还揭示了抗氧化应激(GSTM3、AKR1B10)、脂质代谢(HRASLS1/PLPP1)和干扰素-γ(IFN-γ)信号通路等新机制,并构建出25个基因的ITA预测模型。该研究为个性化护肤产品开发提供了重要靶点。
人类肤色的多样性是自然界最显著的表型特征之一,这种差异不仅影响着社会文化认知,更与皮肤对紫外线(UV)的敏感性、皮肤癌发病率、光老化速度以及色素性疾病的易感性密切相关。尽管已知黑色素含量和黑素小体的分布是决定肤色的关键因素,但驱动肤色变异的复杂遗传网络仍未被完全揭示。传统研究多基于种族或Fitzpatrick皮肤分型等主观分类标准,这些方法难以精确量化肤色差异,导致对特定遗传因素的解析存在局限。
为此,来自欧莱雅研发与创新中心等机构的研究团队在《Scientific Reports》上发表了最新研究成果。该研究创新性地采用个体类型角(ITA)这一客观的颜色测量参数对皮肤样本进行精确分级,结合转录组测序(RNA-seq)和机器学习算法,系统揭示了不同肤色背后的分子基础,发现了包括黑色素生成、脂质代谢、干扰素-γ(IFN-γ)信号和抗氧化应激在内的多条关键通路,并成功构建了一个能够精准预测肤色的小型基因标志物组合。
研究团队收集了21例人乳房缩小术后的离体皮肤样本,根据ITA值将其客观分为“浅色”、“中间色”和“深色”三组。从表皮中提取总RNA后进行RNA-seq测序。数据分析包括差异表达分析(使用DESeq2软件)、通路富集分析(如GO、KEGG和Ingenuity Pathway Analysis-IPA)以及基于BioDiscML软件的机器学习建模,旨在寻找与ITA值最相关的基因特征。关键发现通过qPCR和免疫组织化学染色进行了验证。
比较分析识别出265个显著差异表达基因(|Fold-change| ≥ 1.5, p < 0.05)。富集分析显示,这些基因主要富集于几大生物学过程:1)色素沉着/黑色素生成;2)抗氧化/解毒和应激反应;3)脂质代谢(包括花生四烯酸和甘油二酯通路);4)干扰素-γ(IFN-γ)信号通路。
研究确认了17个与色素沉着相关的基因在深色皮肤中表达上调,包括TYRP1、PMEL、EDNRB、GPR143等经典色素基因,以及TRPS1、DBNDD1等新近被发现与色素沉着相关的基因。IPA分析进一步指出,黑色素生成的关键转录因子MITF是活性最强的上游调控因子。qPCR和免疫染色结果支持了RNA-seq的发现。
深色皮肤中,一系列与抗氧化和解毒相关的基因表达更高,例如谷胱甘肽S-转移酶Mu 3(GSTM3)和醛酮还原酶家族1成员B10(AKR1B10)。这表明深色皮肤可能具有更强的内在能力以应对环境压力源(如紫外线)引起的氧化损伤。
研究发现深色皮肤中花生四烯酸(AA)和甘油二酯(DAG)代谢相关基因的表达发生改变。HRASLS1(促进AA释放)、PTGS2(前列腺素H2合酶)、AKR1C3(促进前列腺素F2α产生)等基因的上调,提示前列腺素F2α(PGF2α)水平可能升高,而已知PGF2α能刺激黑素细胞树突形成和酪氨酸酶活性。同时,PLPP1(可能增加DAG水平)的上调和DAGLA(降解DAG)的下调,暗示DAG信号通路可能参与调控色素沉着,这与既往研究中DAG可增加黑色素含量的结论一致。
富集分析表明,IFN-γ信号通路在深色皮肤中可能受到抑制(IPA抑制z得分 = -2.06)。IFN-γ的多个靶基因表达发生变化,其中包括一些具有抗菌活性的基因(如S100A7, S100A9, DEFA6)。已知IFN-γ能抑制黑色素生成和黑素小体成熟,因此其信号减弱可能与深色皮肤的表型相关,但这可能在抗菌防御方面带来潜在的权衡。
将本研究结果与已发表的关于不同种族皮肤和多种色素沉着条件的基因表达数据集进行比较,发现了一批共同差异表达的基因(如GSTM3、TYRP1、AKR1B10),这从不同角度验证了本研究结果的可靠性。
为了更有效地利用连续变量ITA数据,研究采用了机器学习方法。通过特征选择,最初得到一个包含21个基因的预测模型。为了优化模型并纳入可能被遗漏的相关基因,最终确定了一个包含25个基因的特征集。这个特征集不仅包含了TYRP1、PMEL、GPR143等已知的色素基因,还纳入了GSTM3、外周髓鞘蛋白22(PMP22)、内切-β-N-乙酰葡糖胺糖苷酶(ENGASE)、精子发生相关丝氨酸丰富2样蛋白(SPATS2L)等新的候选基因,它们与ITA值显示出良好的相关性,为理解肤色调控的复杂网络提供了新的线索。
这项研究通过客观的ITA肤色分级体系,深入描绘了不同肤色水平的全基因组表达图谱,不仅证实了黑色素生成通路的核心作用,还揭示了脂质代谢、IFN-γ信号和氧化应激防御等此前未被充分认识的生物学过程在肤色变异中的潜在贡献。特别是机器学习方法识别出的25个基因特征,包含了已知基因和全新候选基因,极大地扩展了对肤色这一复杂性状遗传基础的认识。研究发现GSTM3等基因可能通过调节氧化应激状态影响黑色素水平和紫外线反应,这为后续的功能研究(如基因敲除/过表达实验)指明了方向。总之,该研究为开发针对不同肤色类型的个性化护肤策略及化妆品活性成分的发现提供了宝贵的分子层面的见解和潜在靶点。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号