
-
生物通官微
陪你抓住生命科技
跳动的脉搏
SAXS Assistant:生物大分子与聚合物纳米颗粒结构解析的自动化高通量分析工具
【字体: 大 中 小 】 时间:2025年09月25日 来源:Biophysical Journal 3.1
编辑推荐:
来自多机构的研究团队开发了SAXS Assistant这一Python脚本工具,致力于解决SAXS数据解析耗时且主观性强的问题。该研究通过集成机器学习方法,实现了Guinier Rg与PDDF Rg的自动验证、Dmax的智能预测及结构分类,显著提升了SAXS数据分析的可靠性与效率,为生物大分子和合成聚合物研究提供了强有力的开源分析平台。
小角X射线散射(SAXS)作为解析大分子结构的强大技术,其高通量应用长期受限于数据处理过程中耗时而主观的分析流程。为此研究人员开发了基于Python的自动化工具SAXS Assistant,能够高效提取机器学习(ML)所需特征及关键结构参数,包括吉尼尔回转半径(Rg)、配对距离分布函数(PDDF)推导的Rg、最大颗粒尺寸(Dmax)以及Kratky图谱。该工具基于BioXTAS RAW构建,并通过Rg的Guinier与PDDF计算结果一致性验证数据质量——这是评估数据集可靠性的重要指标。
针对Dmax估算难题,研究团队采用来自小角散射生物数据库(SASBDB)的1,940组数据文件训练多层感知器(MLP)回归模型,最终测试集性能达到R2 = 0.90,平均绝对误差(MAE)为11.7埃。通过完全使用实验数据训练,该模型有效融合领域专家的分析经验,辅助研究人员评估PDDF得出的Dmax结果。
此外,工具引入高斯混合模型(GMM)聚类算法,依据SASBDB中的结构类别对样本进行自动分类。用户可借此比对实验样本与已知生物分子形状的相似度,该概率聚类方法同时支持从Kratky图谱中量化信息并生成形状描述特征。SAXS Assistant通过严格的质量控制、机器学习友好型输出及低置信度结果标记,极大加速了SAXS数据分析流程。其高通量处理能力和跨领域适用性,使其在生物大分子与合成聚合物研究中均具有重要应用价值。
生物通微信公众号
知名企业招聘