基于机器学习模型评估精子运动性在公猪生育力分类中的初步研究

【字体: 时间:2025年09月14日 来源:Translational Animal Science 1.8

编辑推荐:

  为解决公猪生育力预测难题,研究人员开展精子运动性( sperm mobility) 结合计算机辅助精子分析(CASA) 和机器学习(如随机森林) 的研究,发现5分钟精子运动性可区分高、低受孕率(CR) 公猪,并与运动学参数(如ALH、LIN) 相关,为精液质量评估和生育力筛查提供新工具,具有重要应用潜力。

  

在生猪养殖行业中,公猪的生育力直接影响繁殖效率和经济效益,但长期以来,准确预测公猪生育力一直是一个重大挑战。传统的精液质量指标,如精子活力(motility) 和形态学(morphology),在实际生产条件下无法可靠预测受孕率(conception rate, CR),导致部分低生育力公猪进入育种程序,造成资源浪费和生产力下降。尽管计算机辅助精子分析(computer-assisted sperm analysis, CASA) 技术提供了一种客观量化精子运动的方法,但其对生育力变异的解释力仍有限,仅能解释约9-10%的差异。近年来,高通量组学技术(如脂质组学、蛋白质组学) 和功能基因组学研究揭示了精子功能背后的分子机制,但这些方法因成本高、操作复杂且缺乏标准化,难以在商业化猪场广泛应用。因此,开发一种简单、快速且易于部署的精液质量评估工具,以补充现有检测手段并提高生育力预测准确性,成为产业界的迫切需求。

在此背景下,本研究聚焦于精子运动性(sperm mobility) 测定方法,该方法最初在家禽生育力选择中开发并验证有效,通过测量精子在密度梯度介质(Accudenz?) 中的穿透能力来评估精子功能。2006年,Vizcarra和 Ford 首次将该方法适配于公猪,但未评估其与生育力结果的关系。随着遗传进展和生产实践的演变,公猪精液处理流程(如稀释至最终授精剂量浓度、运输和储存) 可能影响精子活力和功能,因此需要重新优化测定参数以适应现代产业条件。本研究旨在:(1) 优化精子运动性测定方法,使其适用于商业化稀释后的公猪精液样品;(2) 在一个试点队列中,评估该方法结合机器学习技术对公猪进行高、低受孕率分类的预测潜力。研究成果发表在《Translational Animal Science》期刊上,为精液质量评估和生育力预测提供了新的思路和工具。

研究人员采用了几项关键实验技术来开展这项工作。首先,精子运动性测定基于 Vizcarra和 Ford (2006) 的协议,使用Accudenz?制备密度梯度溶液,并通过分光光度计(530 nm) 测量精子在溶液中的吸光度值,以反映精子穿透能力。其次,计算机辅助精子分析(CASA) 用于量化精子的运动学参数,如曲线速度(curvilinear velocity, VCL)、平均路径速度(average path velocity, VAP)、线性度(linearity, LIN) 和头部侧向位移幅度(amplitude of lateral head displacement, ALH) 等。第三,机器学习方法中的随机森林(random forest) 算法被用于整合CASA参数和运动性数据,构建生育力分类模型。此外,研究还采用了统计学方法,如线性混合模型(REML) 和相关性分析(Pearson相关系数),以评估参数间的关联和模型性能。样本来源于两个商业化公猪站(Stud A和Stud B) 的21头杜洛克公猪(Duroc boars),根据已知受孕率(CR) 分为高受孕率组(HCR, CR>80%, n=11) 和低受孕率组(LCR, CR<75%, n=10),每头公猪每周采集一次精液,连续三周以捕获个体内变异。

精子运动性测定方法的优化(Experiment 1)

研究人员首先对精子运动性测定参数进行了优化测试,比较了不同Accudenz?浓度(3%和6%)和体积(1.5 mL和3 mL) 的组合。结果显示,使用1.5 mL的3% Accudenz?溶液时,吸光度值最高,且与Vizcarra和 Ford (2006) 使用新鲜样品测得的值最为接近。这表明该方法适用于稀释后的精液样品(最终浓度为5×107 cells/mL或3.3×107 cells/mL),并能敏感地反映精子活力变化。优化后的参数被用于后续生育力评估实验。

运动性与受孕率的关联分析(Experiment 2)

通过分析21头公猪的精液样品,研究发现5分钟运动性吸光度值与受孕率(CR) 呈正相关(r=0.47; P=0.03),表明运动性较高的公猪倾向于具有更高的生育力。运动性值在HCR和LCR组间存在显著差异,HCR组在10分钟达到吸光度峰值,而LCR组峰值延迟至20分钟,提示运动性可能反映精子功能的时间动态。此外,运动性与多个CASA运动学参数相关,例如与ALH均值呈负相关(r=-0.57),与LIN均值呈正相关(r=0.53),表明运动性捕捉了精子运动的协调性和模式,这些参数与精子膜生理和功能状态相关。

运动性作为生育力分类工具的评估

使用二项逻辑回归(binomial logistic regression) 模型,仅基于5分钟运动性值即可部分区分HCR和LCR公猪,曲线下面积(AUC) 为0.77(P<0.01)。当引入公猪站(stud) 作为交互因素时,分类性能略有提升(AUC=0.83),但模型改进不显著。为进一步提高预测准确性,研究人员应用随机森林算法整合CASA参数和运动性数据。结果显示,加入运动性后,模型的分类错误率从28.6%(仅CASA) 降低至22.4%,且HCR组的错误率显著下降(9.1% vs 18.2%)。然而,AUC值达到1.00表明模型存在过拟合,提示需要更大样本量来验证其泛化能力。

运动性与精液质量参数的深入关联

运动性不仅与生育力相关,还反映了精液质量的其他方面。例如,运动性与弯曲尾部精子比例呈正相关(r=0.47; P=0.03),而与远端液滴(distal droplets) 的关联在 assay 后期(40分钟) 增强(r=0.71)。这些发现表明,运动性可能作为一个综合指标,捕获精子形态和膜完整性信息,从而提供比传统 motility 评估更全面的质量评估。

公猪站间差异的影响

研究还发现,不同公猪站(Stud A和Stud B) 的运动性模式存在差异,可能与 extender 类型(AndroStar? Plus vs Preserv? Xtreme) 或管理实践有关。在Stud B中,运动性与CR的关联更强,且LCR公猪显示更高的运动学参数变异性(如VCL标准差)。这突出了在实际应用中,需考虑站特异性因素来优化测定阈值和 interpretation。

本研究通过优化精子运动性测定方法,首次证实其在公猪生育力分类中的潜力。5分钟运动性值与受孕率显著相关,并能部分区分高、低生育力公猪,其机制可能通过反映精子运动学模式和 viability 实现。结合机器学习方法,运动性数据可增强CASA的预测性能,但当前模型需在更大、更多样化群体中验证以避免过拟合。运动性测定具有操作简单、快速(5分钟出结果) 和低成本的优势,易于整合到商业化精液质量评估流程中,为即时决策提供支持。此外,它可能作为精液质量的广义指标,捕获运输、储存或细菌污染等因素的影响,从而在种猪站和农场层面提升质量控制。未来研究应扩大样本量、涵盖更多品种和 extender 类型,并探索运动性与精子功能标志物(如 capacitation 状态) 的关联,以进一步推动该技术的应用。总之,这项试点研究为开发实用生育力预测工具迈出了重要一步,填补了当前技术与高通量方法之间的空白。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号