大语言模型跨学科思维的外部信息环境需求研究——基于交叉学科科普摘要生成的分析
《Scientific Reports》:External information environment required for cross disciplinary thinking in large language models based on interdisciplinary lay summary writing
【字体:
大
中
小
】
时间:2025年11月08日
来源:Scientific Reports 3.9
编辑推荐:
本研究探讨外部信息环境如何影响大语言模型(LLMs)的跨学科思维能力。研究人员通过设计交叉学科科普摘要生成任务,构建深度知识(科学摘要)与广度知识(科普摘要)的信息环境,系统分析ChatGPT-4.0和Claude3在不同信息输入组合下生成的交叉解读(convergent thinking)和交叉启发(divergent thinking)。研究发现:深度与广度知识的协同可显著增强LLMs的聚合思维;交叉解读范例对发散思维具有关键促进作用;外部信息环境与发散思维存在适度相关性。该研究为优化LLMs在交叉学科研究中的应用提供了重要方法论启示。
在人工智能迅猛发展的今天,大语言模型(LLMs)如ChatGPT已在各类学术任务中展现出惊人能力,甚至在某些创造性思维任务上超越人类。然而,当我们将目光投向需要深度融合不同学科知识的交叉学科研究时,一个关键问题浮现:这些模型是否具备真正的跨学科思维能力?正如人类科学家需要外部信息刺激来激发创新灵感(如乔治·德·梅斯特拉尔从苍耳粘附狗毛的现象中获得灵感发明魔术贴),LLMs的跨学科思维是否也依赖于特定的外部信息环境?
传统观点认为,提示工程(prompt engineering)是引导LLMs产出的关键手段。但交叉学科思维的形成往往需要在遥远的知识领域间建立联系,这对信息环境的知识内容构成提出了更高要求。目前,尚不清楚什么样的外部信息环境能够有效激活LLMs的跨学科思维潜力。正是为了回答这一核心问题,中央民族大学的研究团队在《Scientific Reports》上发表了这项开创性研究。
研究人员巧妙设计了"交叉学科科普摘要生成"作为研究切入点。这种新型摘要不仅包含传统科普摘要的通俗解释,还创新性地增加了两个核心组件:交叉解读(详细阐述学科间的逻辑关系,代表聚合思维)和交叉启发(激发读者创造力的额外案例,代表发散思维)。通过系统比较LLMs在不同信息输入组合下生成这两个组件的质量,研究团队得以深入剖析外部信息环境对跨学科思维的影响机制。
研究方法上,本研究采用基于BioNLP会议相关材料构建的101个生物与信息科学交叉研究数据集,利用GPT-4.0 Turbo作为生成模型、Claude3-opus作为校正模型,通过"生成-校正"协作框架确保输出质量。评价体系涵盖相关性(ROUGE-L、BERTScore)和可读性(FKGL、CLI、DCRS)指标,交叉解读和交叉启发则从交叉学科性、创新性和可行性三个维度进行LLM评估。
研究团队开发了一种新颖的自学习提示生成方法。结果显示,LLM自学习提示在相关性上略优于人工专家设计的提示,在可读性上表现相当。特别是在少样本(few-shot)条件下生成的科普摘要显示出最佳相关性,因此被选用于后续实验。
| 模型 | 调优 | ROUGE-L↑ | BERTScore↑ | FKGL↓ | CLI↓ | DCRS↓ |
| 人工专家撰写的科普摘要 | / | / | / | 15.44 | 16.12 | 10.76 |
| 表1. LLMs自学习提示与人工专家设计提示的比较结果 |
交叉解读评估显示,当同时输入科学摘要和科普摘要时,生成的交叉解读在交叉学科性和可读性上达到最高水平。虽然相关性略有下降,但整体质量最优,表明深度与广度知识的协同效应能显著提升LLMs的聚合思维能力。
交叉启发评估发现,七种不同输入生成的启发可清晰分为三类:基于交叉解读的启发在交叉学科性和创新性上表现最佳但可行性最差;基于各类摘要的启发处于中间水平;而摘要与交叉解读组合的启发在可行性上最优但创新性最差。这一现象揭示了创新性与交叉学科性高度相关,但创新性增加往往伴随实施难度的提升。
对基于交叉解读激发的交叉启发进行学科广度分析发现,79%的启发能够突破原交叉解读的学科限制,表明LLMs具备强大的学科发散能力。嵌入分析显示,交叉启发与对应交叉解读之间存在适度相关性——既共享关键特征又保持显著差异。
本研究通过分析LLMs在不同输入下生成的交叉学科科普摘要,揭示了外部信息环境与LLMs跨学科思维过程间的显著关联。主要发现包括:深度与广度知识的协同效应能显著增强LLMs的聚合思维;交叉解读范例对发散思维具有关键促进作用;外部信息环境与发散思维存在适度相关性。
这些发现为优化LLMs在交叉学科研究中的应用提供了重要方法论启示。通过构建提供多样化思维刺激的外部信息环境,有望将人类创造力与LLMs的广博知识相结合,产生更丰富、更广阔的创新思维成果。这不仅缓解了LLMs可能抑制人类创造力的担忧,更为人机协作开辟了无限可能。
尽管本研究中的交叉学科科普摘要生成主要作为评估LLMs跨学科思维能力的探针,但它同时为交叉学科研究的科普传播提供了有效方法,既能生成传统科普摘要,又能产出高质量的交叉解读和跨学科启发,对促进交叉学科研究的传播与发展具有重要贡献。
研究也指出了一些局限性,如发现尚未在更广泛的模型架构上验证普适性,评估方法仍需进一步完善等。未来研究将关注偏差缓解和更稳健的跨领域评估框架开发。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号