
-
生物通官微
陪你抓住生命科技
跳动的脉搏
利用科学文献中的光谱数据提取技术,通过机器学习实现薄膜光学性质的预测
《ACS Applied Optical Materials》:Machine Learning-Enabled Optical Property Prediction of Thin Films Using Spectral Data Extraction from Scientific Literature
【字体: 大 中 小 】 时间:2025年10月24日 来源:ACS Applied Optical Materials 3.8
编辑推荐:
机器学习在材料科学中的应用研究,提出数据驱动方法提取科学文献图表中的折射率光谱数据,使用ChartOCR和Plot2Spectra工具处理1770个样本,通过预处理和特征工程构建高质量数据集,XGBoost模型实现0.149%的MAPE误差,验证ML方法对光学性质预测和自动化数据提取的有效性。

将机器学习(ML)融入材料科学领域,在准确高效地预测材料性质方面展现出了巨大潜力。本研究提出了一种数据驱动的方法,用于从科学文献中的线图中提取折射率光谱,将之前未被充分利用的图形数据转化为结构化数据集,以用于预测建模。研究采用了先进的 数据提取工具(如 ChartOCR 和 Plot2Spectra),并结合严谨的特征工程,最终构建了一个包含 1,770 个样本的高质量数据集。预处理流程包括光谱数据提取、数据标准化以及关键特征的整合(如元素组成、合成参数和波长依赖性质)。训练并评估了一个 XGBoost 模型,其平均绝对百分比误差(MAPE)为 0.149,这证明了该方法的有效性。这些发现凸显了基于机器学习的方法在提升光学性质预测能力及自动化数据提取方面的潜力,从而为材料研究的广泛应用奠定了基础。
生物通微信公众号
知名企业招聘