基于人工智能优化的硬木木质素-碳水化合物复合体(SP-LCC)数据集:结构解析与性能表征

【字体: 时间:2025年06月14日 来源:Scientific Data 5.8

编辑推荐:

  本研究针对木质素-碳水化合物复合体(LCCs)结构复杂、高产提取工艺缺乏的难题,通过AI引导优化AquaSolv Omni(AqSO)生物精炼流程,建立了包含95个样本的SP-LCC数据库。该数据集整合了核磁共振(NMR)结构解析与摩尔质量分布、抗氧化活性等五项性能参数,为LCCs在生物医药、乳化剂等领域的价值开发提供了首个系统性数据支持,同时为机器学习模型训练建立了基准。

  

在追求可持续发展的全球背景下,如何将丰富的木质纤维素资源转化为高附加值产品成为科学界关注的焦点。作为植物细胞壁的主要成分,木质素是最丰富的芳香族生物聚合物,但其复杂的非规则结构和与碳水化合物的紧密连接,使得传统生物精炼过程中往往将其作为低价值副产品焚烧处理。这种"烧钱又污染"的做法不仅造成资源浪费,更阻碍了生物基材料对石化产品的替代进程。木质素-碳水化合物复合体(LCCs)因其独特的双亲特性和生物相容性,在生物医药、乳化稳定剂等领域展现出巨大潜力,但现有提取方法存在产率低、工艺复杂等瓶颈,严重制约了其实际应用。

为突破这一技术壁垒,由芬兰奥博学术大学、德国慕尼黑工业大学等机构组成的国际研究团队,在《Scientific Data》发表了题为"SP-LCC-a dataset on the structure and properties of lignin-carbohydrate complexes from hardwood"的重要研究成果。该研究创新性地将人工智能技术与绿色化学工艺相结合,通过贝叶斯优化(BO)指导的AquaSolv Omni(AqSO)生物精炼流程优化,成功建立了目前最全面的硬木LCCs结构-性能数据库。这项工作不仅为理解LCCs的构效关系提供了关键数据支撑,更为生物精炼过程的智能化升级树立了新范式。

研究团队采用多学科交叉的研究方法,主要技术路线包含四个关键环节:(1)以桦木锯屑为原料,通过丙酮脱脂和不同参数的 hydrothermal treatment (HTT)处理制备样本;(2)运用二维异核单量子相干核磁共振(2D HSQC NMR)解析LCCs的化学结构;(3)采用尺寸排阻色谱-多角度激光散射(SEC-MALS)测定摩尔质量分布;(4)系统表征抗氧化活性(nRSI)、玻璃化转变温度(Tg
)、热降解性能和表面张力等关键物化参数。特别值得注意的是,研究通过设置4组工艺条件完全相同的重复样本,对所有测试方法进行了严格的技术验证,确保数据可靠性。

【背景与目标】研究首先阐明了LCCs的结构特征与应用价值。这些天然杂化材料通过苯基糖苷键、葡萄糖醛酸酯键和苄基醚键等共价连接形成,其双亲特性源自 lignin 的芳香环与 carbohydrate 的羟基共同作用。传统观点将LCCs视为木质素高值化利用的障碍,但本研究团队突破性发现,这些复合体在免疫调节、抗病毒和抗氧化等方面具有独特生物活性,还能作为 Pickering 乳液的稳定剂。然而现有提取方法如球磨法、酸性溶剂法等普遍存在产率低(<5%)、结构破坏严重等问题。为此,团队开发了基于水热处理的AqSO绿色工艺,并通过机器学习优化关键参数,最终获得产率高达19.8%的LCCs。

【数据内容】SP-LCC数据库包含95个样本的完整表征数据,其中88个样本通过2D HSQC NMR解析了23种结构单元的相对含量。研究创新性地采用"每100个芳香环(Ar)中结构单元数量"的标准化计量方法,解决了传统半定量分析的误差问题。如图2所示,核磁谱图清晰显示了β-O-4、苯基香豆满(β-5)等关键连接键的特征峰,以及葡萄糖醛酸(GlcU)等碳水化合物信号。技术验证表明,不同批次样本的结构参数相对标准偏差(RSD)仅为4.6%,证实了工艺的稳定性。

【性能表征】在物化性能方面,研究揭示了LCCs的多功能特性:(1)抗氧化活性nRSI值介于3.64-8.59 mmol g-1
,与商业抗氧化剂相当;(2)玻璃化转变温度Tg
在87.73-133.82℃可调,满足不同加工需求;(3)热降解起始温度Tonset
达148-197℃,热稳定性优异;(4)表面张力在51-70 mN m-1
范围可控,证实其表面活性。特别值得注意的是,摩尔质量分布分析发现部分样本存在聚集现象,这解释了Mw(4.6-117 kDa)测定值显著高于Mn(3.6-11.5 kDa)的原因。

【技术突破】研究的核心创新在于将贝叶斯优化引入生物精炼过程。如图1所示,通过建立P因子(P-factor)、液固比(L:S)和温度的三维参数空间,采用Kriging-believer算法进行批量采样,仅用54个实验点就实现了工艺优化,较传统正交实验效率提升80%。这种数据驱动的方法不仅将LCCs产率提高近4倍,还成功实现了性能的定向调控。

【结论与展望】该研究创建的SP-LCC数据集首次系统揭示了LCCs的结构-性能关系,为后续机器学习研究提供了高质量基准数据。作者特别指出,虽然数据来源于桦木,但建立的构效关系可推广到其他生物精炼工艺。研究的意义不仅在于开发了高产LCCs的绿色工艺,更重要的是展示了人工智能在生物质转化领域的巨大潜力。随着更多植物来源数据的补充,这种数据驱动的研究范式有望加速生物基材料的设计与应用,推动传统林业向高值化、智能化方向转型。正如研究者强调的,这项工作为"从烧木质素到用木质素"的产业变革提供了关键科学基础。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号