SMART BUILDING

新鲜出炉丨斯坦福大学AI指数发展报告2025看点精选

发表时间:2025-04-09 11:29

斯坦福大学以人为本人工智能研究所(HAI)最新发布了2025 AI Index,追踪了2024年全球AI行业的发展趋势。至今,HAI已发布了8份(含本次)AI年度报告,今年的报告是迄今为止最全面的版本,显示人工智能对社会的影响从未如此明显。

1. 中美模型之间的差距正在缩小2023年,领先的美国模型显著优于其中国同行——这一趋势已不再持续。截至2023年底,在MMLU、MMMU、MATH和HumanEval等基准测试中,性能差距分别为17.5、13.5、24.3和31.6个百分点。到2024年底,这些差距大幅收窄至0.3、8.1、1.6和3.7个百分点。

2. AI模型性能趋于前沿。根据去年的人工智能指数,聊天机器人竞技场排行榜上排名前1和第10的模型之间的Elo分数差距为11.9%。到2025年初,这一差距缩小至5.4%。同样,排名前两名的模型之间的差距从2023年的4.9%减少到2024年的0.7%。人工智能领域正变得越来越竞争激烈,越来越多的开发者提供了高质量的模型。

3. 更具挑战性的基准测试正在不断地被提出MMLU、GSM8K和HumanEval等传统人工智能基准的饱和,加上MMMU和GPQA等更新、更具挑战性的基准的性能提高,促使研究人员为领先的人工智能系统探索其他评估方法。其中值得注意的是人类的最后一次考试,这是一个严格的学术测试,最高系统得分只有8.80%;前沿数学基准,人工智能系统只能解决2%的问题;还有BigCodeBench,一个编码基准,人工智能系统达到35.5%的成功率,远低于人类97%的标准。

4. 更小的模型推动更强的表现2022年,MMLU得分超过60%的最小模型是PaLM,拥有5400亿参数。到2024年,微软的Phi-3-mini仅拥有38亿参数,却达到了相同的门槛——相当于两年内减少了142倍。

5. AI代理展现出早期潜力。2024年推出的RE-Bench为评估AI代理处理复杂任务提供了严格的基准。在短期时间预算(两小时)内,顶级AI系统的表现是人类专家的四倍,但随着时间预算的增加,人类表现超越了AI——在32小时内以二比一的优势胜出。AI代理已经在某些特定任务上与人类专家相匹敌,例如编写Triton内核,同时更快地交付结果并降低成本。

6. AI开始在业务职能中产生财务影响,但大多数公司仍处于起步阶段。大多数报告使用人工智能在业务职能中产生财务影响的公司估计收益水平较低。49%的受访者表示其组织在服务运营中使用人工智能后实现了成本节约,其次是供应链管理(43%)和软件工程(41%),但大多数公司的成本节约低于10%。关于收入方面,71%使用人工智能进行营销和销售的受访者报告了收入增长,63%在供应链管理中,57%在服务运营中,但最常见的收入增长水平不到5%。

7. AI的使用在不同地区显示出显著变化,大中华区逐渐领先。尽管北美在组织使用人工智能方面保持领先地位,大中华区展示了最显著的同比增长率,组织使用人工智能的比例增加了27个百分点。欧洲紧随其后,增加了23个百分点,这表明全球人工智能格局正在迅速演变,国际竞争也在加剧。

8. AI提升生产力并弥合技能差距。去年的人工智能指数是首批强调研究显示人工智能对生产力有积极影响的报告之一。今年,更多的研究进一步证实了这些发现,确认人工智能不仅提升了生产力,在大多数情况下还帮助缩小了低技能和高技能工人之间的差距。

9. FDA批准的人工智能医疗设备的数量飙升1995年,FDA批准了其第一款人工智能医疗设备。到2015年,只有6款这样的设备获得批准,但到2023年,这一数字飙升至223台。合成数据在医学上显示出了巨大的前景。2024年发布的研究表明,人工智能生成的合成数据可以帮助模型更好地识别健康的社会决定因素,增强保护隐私的临床风险预测,并促进新的药物化合物的发现。

10. 世界对AI产品和服务的态度逐渐变得谨慎乐观。根据益普索在2022年和2024年的调查,在26个受访国家中,有18个国家认为人工智能产品和服务带来的好处多于弊端的比例有所增加。全球范围内,认为人工智能产品和服务更有益而非有害的人口比例从2022年的52%上升到2024年的55%。

11. 对AI影响日常生活的预期和认可度正在上升。世界各地,三分之二的人现在相信,在未来三到五年内,人工智能产品和服务将显著影响日常生活——这一比例自2022年以来增加了6个百分点。除马来西亚、波兰和印度外,所有国家自2022年以来都看到了这种看法的增加,其中加拿大(17%)和德国(15%)的增长幅度最大。在此前表现出最多怀疑态度的国家中,人工智能乐观情绪显著增加。全球范围内,对人工智能产品和服务的乐观态度有所提升,其中以前最持怀疑态度的国家增幅最大。2022年,英国(38%)、德国(37%)、美国(35%)、加拿大(32%)和法国(31%)是最不认为人工智能利大于弊的国家之一。自那以后,这些国家的乐观情绪分别增长了8%、10%、4%、8%和10%。

12. 工人预计AI将重塑工作,但替代恐惧仍较低。全球范围内,60%的受访者同意人工智能将在未来五年内改变个人的工作方式。然而,较小比例的受访者,即36%,认为人工智能将在未来五年内取代他们的工作。

13. AI被视为节省时间和娱乐提升工具,但对其经济影响仍存疑虑。全球对人工智能影响的看法各异。虽然55%的人认为它会节省时间,51%的人预计它会提供更好的娱乐选择,但对其健康或经济效益的信心较少。只有38%的人认为人工智能会改善健康,36%的人认为它会促进国家经济发展,31%的人看到对就业市场的积极影响,37%的人相信它会提升自己的工作。

14. AI培训产生的碳排放量正在稳步增加。训练早期的人工智能模型,如AlexNet(2012),有适度的碳排放量为0.01吨。最近的模型在训练方面的排放量显著更高: GPT-3(2020)为588吨,GPT-4(2023)为5184吨,Llama 3.1 405B(2024)为8930吨。

15.AI正在推动能源领域的重大变革,吸引了对核能的兴趣。微软宣布了一项16亿美元的协议,旨在重启三里岛核电站以支持人工智能发展,而谷歌和亚马逊也已签署核能合作协议,以支持人工智能运营。

斯坦福大学以人为本人工智能研究所(HAI) 2019 年成立,由著名 AI 科学家李飞飞与哲学教授约翰・埃切曼迪联合担任院长。AI Index 是 HAI 的一项独立倡议,由人工智能指数指导委员会领导,该委员会是一个由来自学术界和工业界的专家组成的跨学科小组。报告的参与机构众多,AI 指数与许多不同的组织合作以跟踪人工智能的进展,包括乔治敦大学的安全与新兴技术中心、LinkedIn、NetBase Quid、Lightcast 和麦肯锡等。此外,报告的撰写邀请了斯坦福大学多个学院的不同学科专家,也得到了谷歌、OpenAI 等业界巨头的支持,以及埃森哲、GitHub、麦肯锡等机构在研究和分析上的协助


2025年2月20日,值此AI技术深刻重塑全球产业格局之际,Smart Future联合建筑领域权威机构正式发布《智慧建筑发展报告2024——AI in AEC》。报告系统梳理了AI技术下的建筑产业变革,包含建筑设计、施工管理、运维服务等全链条的创新应用,为行业数字化转型提供战略蓝图。
点击阅读通知丨《建筑工程领域AI应用现状与趋势》报告发布会
文章分类: 研究报告
分享到:
联系人:王新雨       联系电话:010-58933142          手机:18801349110           联系地址:北京市海淀区三里河路9号中国城市科学研究会