
-
生物通官微
陪你抓住生命科技
跳动的脉搏
UQuAD+:乌尔都语机器阅读理解的基准数据集
《ACM Transactions on Asian and Low-Resource Language Information Processing》:UQuAD+: Benchmark Dataset for Urdu Machine Reading Comprehension
【字体: 大 中 小 】 时间:2025年11月08日 来源:ACM Transactions on Asian and Low-Resource Language Information Processing
编辑推荐:
乌尔都语MRC数据集构建与新型评估方法研究,包含20,000个多领域问答对,采用众包+专家标注确保质量,涵盖可/不可回答问题及多种答案形式,提出衡量语义等效的Semantic Match指标,实验显示现有模型表现极低(0.82%),为低资源语言研究提供新框架。
生物通微信公众号
知名企业招聘