用于构建建筑领域通用大型语言模型数据集的框架

《ADVANCED ENGINEERING INFORMATICS》:A framework for constructing datasets for construction-domain-general large language models

【字体: 时间:2026年06月08日 来源:ADVANCED ENGINEERING INFORMATICS 9.9

编辑推荐:

  马志良|周俊宇|刘刚|宋银浩|邓秀芝|李江摘要提供领域知识的数据集对于开发大型语言模型(LLMs)以解决知识密集型问题至关重要,而建筑领域通用(CDG)LLMs则是建筑领域应用型LLMs的基础。本文提出了一个用于构建CDG LLMs数据集的框架(称为“CDG数据集”)。本文探讨了

  
马志良|周俊宇|刘刚|宋银浩|邓秀芝|李江

摘要

提供领域知识的数据集对于开发大型语言模型(LLMs)以解决知识密集型问题至关重要,而建筑领域通用(CDG)LLMs则是建筑领域应用型LLMs的基础。本文提出了一个用于构建CDG LLMs数据集的框架(称为“CDG数据集”)。本文探讨了如何系统且高效地构建CDG数据集的研究问题。首先,通过回顾建筑领域及其他领域LLMs数据集的相关研究来确定研究方法;接着分析CDG数据集的应用需求和技术要求;最后,基于需求分析提出了构建CDG数据集的框架,并通过案例研究和专家研讨会进行了验证。所提出的框架为建筑领域的CDG数据集构建提供了逐步指导,直接支持CDG LMMs的开发,并可适用于其他应用型LLMs,从而填补了建筑领域LLMs应用方面的空白。
相关新闻
生物通微信公众号
微信
新浪微博

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号