SAXS Assistant:生物大分子与聚合物纳米颗粒结构解析的自动化高通量分析工具

【字体: 时间:2025年09月25日 来源:Biophysical Journal 3.1

编辑推荐:

  来自多机构的研究团队开发了SAXS Assistant这一Python脚本工具,致力于解决SAXS数据解析耗时且主观性强的问题。该研究通过集成机器学习方法,实现了Guinier Rg与PDDF Rg的自动验证、Dmax的智能预测及结构分类,显著提升了SAXS数据分析的可靠性与效率,为生物大分子和合成聚合物研究提供了强有力的开源分析平台。

  

小角X射线散射(SAXS)作为解析大分子结构的强大技术,其高通量应用长期受限于数据处理过程中耗时而主观的分析流程。为此研究人员开发了基于Python的自动化工具SAXS Assistant,能够高效提取机器学习(ML)所需特征及关键结构参数,包括吉尼尔回转半径(Rg)、配对距离分布函数(PDDF)推导的Rg、最大颗粒尺寸(Dmax)以及Kratky图谱。该工具基于BioXTAS RAW构建,并通过Rg的Guinier与PDDF计算结果一致性验证数据质量——这是评估数据集可靠性的重要指标。

针对Dmax估算难题,研究团队采用来自小角散射生物数据库(SASBDB)的1,940组数据文件训练多层感知器(MLP)回归模型,最终测试集性能达到R2 = 0.90,平均绝对误差(MAE)为11.7埃。通过完全使用实验数据训练,该模型有效融合领域专家的分析经验,辅助研究人员评估PDDF得出的Dmax结果。

此外,工具引入高斯混合模型(GMM)聚类算法,依据SASBDB中的结构类别对样本进行自动分类。用户可借此比对实验样本与已知生物分子形状的相似度,该概率聚类方法同时支持从Kratky图谱中量化信息并生成形状描述特征。SAXS Assistant通过严格的质量控制、机器学习友好型输出及低置信度结果标记,极大加速了SAXS数据分析流程。其高通量处理能力和跨领域适用性,使其在生物大分子与合成聚合物研究中均具有重要应用价值。

相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号