
-
生物通官微
陪你抓住生命科技
跳动的脉搏
关于人类偏好学习在大型语言模型对齐中的应用的研究
《ACM Computing Surveys》:A Survey on Human Preference Learning for Aligning Large Language Models
【字体: 大 中 小 】 时间:2025年11月07日 来源:ACM Computing Surveys
编辑推荐:
大语言模型(LLMs)的成功源于人类偏好学习在模型对齐中的关键作用,本文系统梳理了人类偏好反馈的数据源与格式分类、建模与应用技术、评估协议,并探讨了通用性、迁移性和可控性等挑战与未来方向。
生物通微信公众号
知名企业招聘