
-
生物通官微
陪你抓住生命科技
跳动的脉搏
大型语言模型驱动的人本视角AutoML在数据与模型管理中的效能评估
【字体: 大 中 小 】 时间:2025年08月06日 来源:Frontiers in Artificial Intelligence 4.7
编辑推荐:
这篇综述创新性地探讨了LLM(大型语言模型)如何通过人本化AutoML(自动机器学习)框架降低ML(机器学习)技术门槛。研究通过15位多背景专业人员的对照实验证明,LLM界面使93.34%用户获得10%-25%准确率提升,开发时间缩短50%,错误解决效率提高73%,为AI民主化提供了实证方案。
大型语言模型驱动的AutoML革命
1 引言
机器学习(ML)技术虽在医疗和科研领域广泛应用,但复杂的实现流程仍阻碍其普及。传统AutoML工具如Auto-Sklearn和AutoGluon虽简化了特征工程和超参数优化,但仍需用户具备编程基础。本研究提出LLM(大型语言模型)驱动的AutoML框架,通过自然语言交互彻底降低使用门槛。
2 方法
系统架构包含五大模块:
模态推断(MI-LLM)自动识别数据类型
特征工程(AFE-LLM)处理数据预处理
模型选择(MS-LLM)基于概率框架(公式1)优化模型匹配
管道组装(PA-LLM)生成可执行代码
超参数优化(HPO-LLM)自动调参
15名参与者(含26.67%编程新手)在LLM与传统AutoML条件下完成图像分类(ImageNet子集)和文本情感分析(SST-2)任务。
3 实验结果
性能突破:
93.34%用户实现更高准确率,其中46.67%提升>25%
图像分类任务完成率从73.33%提升至93.33%
平均耗时降低50%(7.85分钟 vs 16.55分钟)
用户行为分析显示,LLM界面消除78%的语法错误,使新手用户6分钟即可完成传统需18分钟的任务。统计检验证实所有指标p<0.001,效应量d>2.0。
4 创新价值
研究首次实证自然语言作为技术接口的可行性:
缩短学习曲线:新手适应时间从45分钟降至12分钟
跨领域应用:医疗影像分类准确率提升23%
资源优化:自动匹配ResNet-50和DistilBERT等模型
5 局限与展望
当前系统在定制化需求(如focal loss实现)和实时交互存在不足。未来将探索多模态LLM与边缘计算的结合,进一步推动ML技术在基层医疗等场景的落地。
这项研究为人工智能民主化提供了可复用的技术范式,其模块化设计尤其适合缺乏AI专家的垂直领域应用。
生物通微信公众号
知名企业招聘