
-
生物通官微
陪你抓住生命科技
跳动的脉搏
利用大型语言模型提升场景知识相关表达式的理解能力
《IEEE MultiMedia》:Improving Scene Knowledge Referring Expression Comprehension with Large Language Models
【字体: 大 中 小 】 时间:2025年11月25日 来源:IEEE MultiMedia 3.3
编辑推荐:
针对场景知识推理中的复杂性和冗余信息干扰问题,提出数据简化方案和SKRN网络,通过大语言模型过滤无关描述,结合多模态特征和注意力机制提升目标定位准确率,实验验证有效性。
生物通微信公众号
知名企业招聘