《Microchemical Journal》:Identification diagnostic biomarkers for idiopathic pulmonary fibrosis by using electrochemical sensors and integrative transcriptomic analysis
编辑推荐:
本研究通过整合转录组分析与机器学习算法筛选出41个候选生物标志物,其中reelin基因被所有算法共同识别。基于这些标志物的逻辑回归模型展现出优异的诊断性能(AUC=0.959,特异性100%),结合电化学传感器技术为IPF早期无创诊断提供了高效解决方案。
作者:Ban Suping | Huang Hong | Chen Zhaoguang | Huang Guangchun | Wei Shixi | Wei Wujun | Liang Gencheng
单位:中国广西壮族自治区百色市右江民族医学院附属医院呼吸与重症医学科,邮编533000
摘要
特发性肺纤维化(IPF)是一种进行性的间质性肺疾病。目前,可用的诊断生物标志物非常有限,这使得早期检测变得困难。电化学传感器在检测蛋白质、核酸和代谢物等生物标志物方面表现优异,为IPF等复杂疾病的早期诊断提供了新的可能性。本研究旨在通过结合电化学传感器技术和转录组分析来筛选和鉴定IPF的诊断生物标志物,并探索其在IPF早期诊断中的应用潜力。我们从Gene Expression Omnibus数据库中获取了两个基因表达数据集(GSE209929和GSE195770),分别包含6个和8个样本。通过差异表达分析筛选出差异基因,并结合三种机器学习算法(LASSO回归、随机森林和支持向量机递归特征消除(SVM-RFE)进行生物标志物筛选。在GSE209929中鉴定出102个差异表达基因(37个上调基因和65个下调基因),在GSE195770中鉴定出1218个差异表达基因(660个上调基因和558个下调基因)。机器学习分析共筛选出41个候选生物标志物,其中reelin基因被所有三种算法共同选中。基于这些生物标志物构建的逻辑回归模型在诊断性能评估中表现优异,曲线下面积(AUC)达到0.959,准确率为85.7%,特异性为100%。电化学传感器的引入为这些生物标志物的检测提供了一种高效快速的方法,进一步提高了检测的灵敏度和特异性。
引言
特发性肺纤维化是最具破坏性的间质性肺疾病之一,其特征是肺组织逐渐纤维化以及呼吸功能不可逆地下降[1]。该疾病全球约有300万患者,美国和欧洲的年发病率估计为每10万人中有3至9例[2]。尽管对疾病病理生理学的理解有所进展,但IPF患者的诊断后中位生存期仅为3至5年,与许多恶性疾病相当。IPF的病理特征包括异常的伤口愈合反应、过量的细胞外基质沉积和成纤维细胞增殖,最终导致肺实质结构扭曲[3]。目前的诊断方法主要依赖于高分辨率计算机断层扫描成像,必要时还需进行手术肺活检以确定典型的间质性肺炎模式[4]。然而,这些方法存在侵入性、样本变异性以及无法在疾病早期阶段检测到病变的局限性,而早期干预可能最为有效。
IPF发病机制的分子机制尚未完全明了,但现有证据表明涉及多种生物通路的失调,包括上皮-间充质转化、异常的成纤维细胞激活和细胞外基质周转失衡[5]。最近的基因组和转录组研究开始揭示与纤维化重塑相关的复杂基因表达变化,揭示了潜在的治疗靶点和生物标志物。虽然提出了几种候选分子,如基质金属蛋白酶、生长因子和细胞外基质成分,但尚未有任何一种被临床应用于诊断生物标志物[6],[7],[8],[9],[10],[11]。IPF在临床表现和分子特征上的异质性要求采用综合分析方法,整合多种数据来源以识别可靠的分子特征[12]。机器学习方法已成为发现生物标志物的强大工具,能够处理高维数据、识别复杂模式并选择具有最佳区分能力的特征[13]。将差异基因表达分析与多种机器学习算法相结合,为鉴定具有高重复性和临床实用性的候选生物标志物提供了严谨的框架。
本研究旨在解决寻找能够促进IPF早期诊断和监测其进展的分子生物标志物的迫切需求。我们采用了一种整合生物信息学方法,结合两个独立基因表达数据集的差异表达分析和三种互补的机器学习算法进行特征选择。我们的目标有三个:首先,识别在IPF肺组织中一致改变的差异表达基因;其次,利用基于机器学习的特征选择方法来优先考虑具有最佳诊断潜力的候选生物标志物;第三,开发和验证能够高精度区分IPF和健康对照样本的分类模型。通过这种系统方法,我们希望建立一个分子特征,作为开发微创诊断工具和通过早期发现疾病来改善患者预后的基础。
作为高度敏感和特异的检测工具,电化学传感器在医学检测领域具有广泛的应用前景。近年来,随着纳米技术、微电子技术和生物化学的快速发展,电化学传感器在疾病早期诊断、生物标志物检测和药物开发方面展现出巨大潜力。通过将生化反应转化为可测量的电信号,它可以快速准确地检测生物样本中的目标分子,为疾病的早期干预和精准医疗提供有力支持。在特发性肺纤维化(IPF)的诊断中,电化学传感器有望成为一种无创且高通量的检测方法。通过检测血液、呼出气体冷凝液或肺泡灌洗液中的生物标志物,可以精确识别疾病的早期阶段。这项技术的引入不仅提高了诊断效率,还减少了传统诊断方法(如高分辨率计算机断层扫描(HRCT)和手术肺活检)的侵入性和成本。因此,电化学传感器与转录组分析的结合有望为IPF的早期诊断提供全新的策略,并推动该领域的发展。
数据获取与预处理
基因表达数据集来自美国国家生物技术信息中心维护的Gene Expression Omnibus(GEO)数据库。根据组织类型相关性和样本可用性,选择了两个数据集:GSE209929包含6个样本(3个纤维化/IPF样本和3个对照样本),GSE195770包含8个样本(4个IPF样本和4个供体/对照样本)。表达数据经过对数2变换,以确保分布正常并稳定动态范围内的方差。
数据质量评估与探索性分析
全面的质量控制分析表明,两个数据集均符合下游分析的可接受标准(图1)。图A显示了GSE209929和GSE195770的样本分布模式,样本间的表达范围一致,中位表达值处于相似水平。根据数据质量报告(表1),两个数据集中均未检测到缺失值。异常值分析显示每个样本的异常值数量有所不同。
讨论
作为高度敏感和特异的检测工具,电化学传感器在医学检测领域具有巨大应用潜力。通过将生化反应转化为可测量的电信号,它可以快速准确地检测生物样本中的目标分子,为疾病的早期诊断、生物标志物检测和药物开发提供有力支持。近年来,随着纳米技术、微电子技术的快速发展...
结论
电化学传感器在医学检测中的应用前景广阔。其高灵敏度、高特异性和快速响应使其成为疾病早期诊断和生物标志物检测的重要工具。在本研究中,通过转录组分析和机器学习方法筛选出的潜在生物标志物为电化学传感器的应用提供了明确的目标。这些生物标志物的检测可以通过电化学方法实现...
作者贡献声明
Ban Suping:撰写——原始草稿,资源整理。
Huang Hong:验证,项目管理。
Chen Zhaoguang:撰写——审稿与编辑,监督。
Huang Guangchun:可视化,验证。
Wei Shixi:监督,正式分析。
Wei Wujun:验证,概念构思。
Liang Gencheng:撰写——审稿与编辑,资源整理。
资助
本研究得到了“2022年中医药自筹研究课题”(GXZYL20220304)的支持。
利益冲突声明
作者声明没有已知的可能会影响本文研究的财务利益或个人关系。