大型语言模型驱动的人本视角AutoML在数据与模型管理中的效能评估

【字体: 时间:2025年08月06日 来源:Frontiers in Artificial Intelligence 4.7

编辑推荐:

  这篇综述创新性地探讨了LLM(大型语言模型)如何通过人本化AutoML(自动机器学习)框架降低ML(机器学习)技术门槛。研究通过15位多背景专业人员的对照实验证明,LLM界面使93.34%用户获得10%-25%准确率提升,开发时间缩短50%,错误解决效率提高73%,为AI民主化提供了实证方案。

  

大型语言模型驱动的AutoML革命

1 引言

机器学习(ML)技术虽在医疗和科研领域广泛应用,但复杂的实现流程仍阻碍其普及。传统AutoML工具如Auto-Sklearn和AutoGluon虽简化了特征工程和超参数优化,但仍需用户具备编程基础。本研究提出LLM(大型语言模型)驱动的AutoML框架,通过自然语言交互彻底降低使用门槛。

2 方法

系统架构包含五大模块:

  • 模态推断(MI-LLM)自动识别数据类型

  • 特征工程(AFE-LLM)处理数据预处理

  • 模型选择(MS-LLM)基于概率框架(公式1)优化模型匹配

  • 管道组装(PA-LLM)生成可执行代码

  • 超参数优化(HPO-LLM)自动调参

15名参与者(含26.67%编程新手)在LLM与传统AutoML条件下完成图像分类(ImageNet子集)和文本情感分析(SST-2)任务。

3 实验结果

性能突破:

  • 93.34%用户实现更高准确率,其中46.67%提升>25%

  • 图像分类任务完成率从73.33%提升至93.33%

  • 平均耗时降低50%(7.85分钟 vs 16.55分钟)

用户行为分析显示,LLM界面消除78%的语法错误,使新手用户6分钟即可完成传统需18分钟的任务。统计检验证实所有指标p<0.001,效应量d>2.0。

4 创新价值

研究首次实证自然语言作为技术接口的可行性:

  • 缩短学习曲线:新手适应时间从45分钟降至12分钟

  • 跨领域应用:医疗影像分类准确率提升23%

  • 资源优化:自动匹配ResNet-50和DistilBERT等模型

5 局限与展望

当前系统在定制化需求(如focal loss实现)和实时交互存在不足。未来将探索多模态LLM与边缘计算的结合,进一步推动ML技术在基层医疗等场景的落地。

这项研究为人工智能民主化提供了可复用的技术范式,其模块化设计尤其适合缺乏AI专家的垂直领域应用。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号