编辑推荐:
随着生成式人工智能(GAI)广泛应用,其能源消耗和环境影响引发关注。研究人员分析 369 个 GAI 模型数据,发现中美是碳排放主要贡献者,预计 2035 年全球 GAI 碳排放达 18.21 - 245.94 百万吨。该研究为理解 GAI 在低碳转型中的作用提供依据。
近年来,生成式人工智能(GAI)可谓风光无限,它能在文本、图像、视频等领域创造出新颖且有意义的内容 。OpenAI 的 ChatGPT 一经推出便火爆全球,引得众多科技公司纷纷投身于高性能模型的研发浪潮,将 GAI 融入自家产品之中。像 OpenAI 的文本转视频模型 Sora、Anthropic 的新大语言模型 Claude 3,以及 DeepSeek V3/R1 的发布,都在不断推动着这一领域的发展。GAI 正逐步渗透到商业、金融、法律、医疗等关键行业,开启了人工智能技术的新纪元。
然而,GAI 的蓬勃发展也带来了隐忧。在达沃斯世界经济论坛上,OpenAI 首席执行官 Sam Altman 就指出,GAI 的发展给能源系统带来了挑战。NVIDIA 的 Jensen Huang 和特斯拉的 Elon Musk 也强调,到 2025 年可能会面临能源短缺风险,全面的能源管理至关重要。有研究表明,大型人工智能系统的能耗可能与一些国家相当,这与全球设定的本世纪中叶碳中和目标相悖。尽管人们已经意识到人工智能能耗巨大,但对于全球 GAI 所引发的能源消耗和碳排放,却缺乏量化分析与深入预测,不同行业垂直 GAI 模型的能耗和环境影响也尚不明确。而搞清楚这些问题,对理解 GAI 在全球低碳转型和气候减缓中的作用至关重要。
为了解开这些谜团,华北电力大学(State Key Lab of Alternate Electrical Power System with Renewable Energy Sources)、北京大学(National Engineering Laboratory for Big Data Analysis and Applications;Department of Industrial Engineering and Management, College of Engineering)等机构的研究人员开展了一项研究。他们收集了 2018 - 2024 年全球发布的 369 个 GAI 模型的数据,对其能源消耗和整个生命周期的碳排放水平进行了研究分析1。
研究人员通过分析模型的能耗和碳排放数据,发现当前 GAI 模型主要部署在碳密集型地区。例如,英国和瑞典等碳强度较低的国家,其实更适合部署计算资源。从行业应用来看,GAI 模型目前主要用于服务行业,在劳动密集型和碳密集型行业还有更广阔的应用空间,有望提升这些行业的能源效率1。
在区域分布方面,研究人员评估了每个模型在完整推理和 4 - 6 个训练周期的能耗,发现这 369 个模型共消耗 24.97 - 41.104 太瓦时(TWh)的能源,产生 10.67 - 18.61 百万吨的碳排放,这一数据大致相当于中国三峡大坝年发电量的五分之二 。其中,美国和中国是全球 GAI 碳排放的主要贡献者,两国排放量占全球总量的 99% 以上。中国碳排放为 6.76 - 8.98 百万吨,美国为 3.66 - 8.72 百万吨,而欧洲仅为 0.02 - 0.09 百万吨。虽然中国发布的 GAI 模型数量超过美国,计算负载和能耗却低于美国,但由于中国碳强度相对较高,所以碳排放占全球的 54.4% 。研究还发现,计算需求大的 GAI 模型大多位于碳强度高的地区,如美国和中国,而瑞典、英国等碳强度较低的国家,计算需求明显较低。这表明,如果将训练和推理过程转移到碳强度较低的地区,能大幅减少 GAI 对环境的影响234。
针对特定领域模型(domain - specific models),研究人员也进行了分析。特定领域模型利用行业特定数据集,能高精度解决特定行业的问题。在 369 个大语言模型中,271 个是通用模型,98 个是特定领域模型。研究发现,金融和医疗行业的特定领域模型能耗较高,分别消耗 192.88 吉瓦时(GWh)和 155.90 GWh。尽管医疗行业的经济规模(1.40 万亿美元)远低于金融行业(21 万亿美元),但由于数据开放性较好,其能耗依然较高。金融行业因涉及隐私敏感的个人信息,数据时效性要求高,开发特定大模型难度大。法律行业经济规模为 7400 亿美元,能耗为 99.26 GWh,远高于经济规模相近(7200 亿美元)的教育行业(14.56 GWh)。这是因为法律行业的问答、文档生成、案例分析等任务适合大模型处理,而教育行业数据多样分散,增加了模型开发难度,使得法律模型能耗是教育模型的 7 倍 。由此可见,特定行业大模型的开发不仅受行业经济规模影响,还与行业自身的属性,如数据时效性、隐私保护和应用场景等有关56。
研究人员还对 GAI 未来的发展影响进行了预测。自 2017 年 Transformer 架构出现后,模型数量呈指数级增长。受 OpenAI 缩放定律启发,公司开发的模型越来越大。以 GPT - 3 为例,2020 年 5 月发布时,其参数从数亿飙升至超 1000 亿。同时,DeepSeek - V3 模型的训练成本不到 OpenAI 同类模型 GPT - 4 的十分之一,推理成本仅为其三十分之一。基于这些趋势,研究人员设计了多种场景来预测未来十年 GAI 的碳足迹 。在预测过程中,考虑了模型是否开源、参数数量、训练令牌(tokens)、每日请求量和碳密度等因素。在开源场景下,模型可继承现有模型参数,跳过训练阶段,相比闭源场景,碳排放和能耗更低。在低碳密度场景(使用更清洁能源)下,GAI 的碳排放显著减少。预计到 2035 年,GAI 的平均碳排放量将在 18.21 - 245.94 百万吨之间,平均能耗在 404.77 - 447.16 TWh 之间 。此外,开源数据共享、低碳能源转型以及两者结合,到 2035 年分别可减少 23.32、225.83 和 227.73 百万吨的碳排放78。
研究人员通过分析 GAI 的能源消耗、碳排放及其预测数据,量化了 GAI 的碳足迹。研究表明,GAI 作为碳密集型地区的耗能大户,对全球碳排放贡献巨大。这一研究强调了在劳动密集型行业高效部署 GAI、发展可再生能源以及采用开源实践以减少环境影响的重要性。虽然短期内,对计算能力的需求可能会掩盖能源消耗问题,但从长远来看,降低训练成本、提高效率是保持竞争力的关键 。同时,政府和行业也应注重可持续发展,优化数据中心、推进可再生能源发展、提高硬件效率,从而降低 GAI 对环境的影响。该研究成果发表在《The Innovation》上,为全球 GAI 的可持续发展提供了重要参考。
本研究主要采用了数据收集与分析技术,收集 2018 - 2024 年全球 369 个 GAI 模型数据,分析其能耗和碳排放相关指标;通过建立预测模型,考虑多种影响因素,设计不同场景预测未来十年 GAI 的碳足迹。
研究结论显示,GAI 在能源消耗和碳排放方面问题显著,区域分布不均衡,行业应用有局限,未来排放量呈上升趋势。讨论部分指出,应从多方面入手降低 GAI 的环境影响,如优化部署、发展清洁能源、开源共享等。这一研究对推动 GAI 与环境可持续发展协同共进意义重大,为后续研究和政策制定提供了重要依据。