声明:本文来自微信公众号 机器之心(ID:Almosthuman2014),编辑:蛋酱,陈萍,授权站长之家转载发布。
今年大模型技术爆发怎么复盘?除了直观的感受,你还需要一个系统的总结。
今天,斯坦福 HAI 该研究所发布了第七年 AI Index 这是关于人工智能行业现状的最全面的报告之一。
访问地址:https://hai.stanford.edu/news/ai-index-state-ai-13-charts
报告指出,人工智能的发展正在以惊人的速度前进,开发人员每月都在创造越来越强大和复杂的模型。然而,尽管发展速度加快,但人工智能行业在解决人们对人工智能可解释性的担忧和对人们生活日益紧张的影响方面几乎没有进展。
在今年的报告中,斯坦福 HAI 研究所增加了负责任人工智能的扩展章节、科学和医学领域人工智能的新章节,以及研发、技术性能、经济、教育、政策治理、多样性和公众舆论的综述。
以下是报告的关键内容:
2023年的进展速度比以往任何一年都快得多,GPT-4、Gemini 和 Claude3等最先系统显示出令人印象深刻的多模态功能,可以生成流畅的文本、处理音频和图像,并解释网络梗图。
2023年新发布的支持生成型 AI 大型语言模型的数量比前一年翻了一番,其中三分之二是开源模型,例如 Meta 的 Llama2,但性能最佳以闭源模型为例 Google 的 Gemini Ultra。
2023年,工业界继续引领人工智能前沿研究。工业界产生了51个值得关注的机器学习模型,而学术界只贡献了15个模型。2023年,产学界合作产生了21个值得关注的模型,再创新高。
美国领先中国、欧盟和英国顶级人工智能模型的主要来源。2023年,61个着名来自美国机构的人工智能模型远远超过21个欧盟和15个中国。
Gemini Ultra 是第一在大规模多任务语言理解关键基准测试中达到人类水平的表现 LLM。OpenAI 的 GPT-也不甘示弱,在 Holistic Evaluation of Language Models 该基准将获得0.96的平均胜率 MMLU 与其它评估相结合。
然而,人工智能性能的提高是有代价的。报告发现,前沿人工智能模型的开发成本越来越高。据说 Gemini Ultra 消耗价值1.91亿美元的计算资源, GPT-开发成本估计为7800万美元。
生成型企业 AI 投资猛增
图4.3.1展示了2013年至2023年全球企业人工智能投资的趋势,包括并购、少数股权、私募股权投资和公开发行。全球企业对人工智能的投资连续第二年下降。
2023年,总投资下降至1892亿美元,比2022年下降约20%。然而,在过去的十年里,企业对人工智能的投资增加了13倍。
图4.3.3表明,AI 该行业吸引了252亿美元的投资,几乎是2022年的9倍,大约是2019年的30倍。此外,生成人工智能占2023年所有人工智能私人投资的四分之一以上。
如果按地区比较,美国在人工智能私人投资总额上再次领先世界。2023年,美国投资672亿美元,约8.7倍于第二高国家中国投资(78亿美元),17.8倍于英国投资(38亿美元)(图4.3.8)。
谷歌在基础模型竞赛中占据主导地位
报告显示,谷歌在2023年发布的基本模型最多,图1.3.16总结了2023年各机构发布的各种基本模型。Google 发布最多的模型(18),其次是 Meta(11个)和 Microsoft(9)。2023年发布基础模型最多的学术机构是加州大学伯克利分校 (3个)。
自2019年以来,Google 发布的基本模型数量最多,共40个,其次是 OpenAI,有20个(图1.3.17)。清华大学也脱颖而出,发布了七个基本模型,而斯坦福大学是美国领先的学术机构,发布了五个模型。
闭源模型优于开源模型优于开源模型优于开源模型
图2.11.4和2.11.5在选定的基准上对比闭源模型和开源模型。在所有选定的基准上,闭源模型优于开源模型。
训练成本
至于基本模型,一个不可避免的话题是推理成本。虽然人工智能公司很少透露培训模型的成本,但人们普遍认为这些成本已经达到了数百万美元,并且仍在上升。例如,OpenAI 首席执行官 Sam Altman 曾提到,GPT-4.训练费用超过1亿美元。
图1.3.21根据云计算租赁价格直观地显示和选择 AI 与模型相关的培训成本。下图显示了近年来模型训练成本的显著增加。例如,2017年 Transformer 模型训练的成本约为900美元。2019年发布 RoBERTa Large 训练费用约为1.6万美元。2023年,OpenAI 的 GPT-4和 Google 的 Gemini Ultra 预计训练费用将分别为7800万美元和1.91亿美元。
图1.3.22显示了 AI Index 估计的所有 AI 模型的训练成本。如图所示,随着时间的推移,模型训练的成本急剧增加。
如图1.3.如23所示,计算训练需求较大的模型需要更多的训练成本。
碳足迹
图2.13.1显示选定 LLM 对训练期间释放的碳(以吨为单位)进行比较。例如,Meta 发布的 Llama270B 该模型释放了约291.2吨碳,比从纽约到旧金山的往返航班释放的碳排放量高出近291倍,约为普通美国人每年碳排放量的16倍。然而,Llama2的排放量仍然低于 OpenAI GPT-训练期间报告的502吨排放量。
美国在基本模型方面处于领先地位
2023年,世界上大多数基本模型来自美国(109),其次是中国(20)和英国(图1.3.18)。自2019年以来,美国在研发大多数基础模型方面一直处于领先地位(图1.3.19)。
CS 博士毕业生
在过去的十年里,美国和加拿大计算机科学博士毕业生数量是十年来的首次显著增加。2022年,计算机科学博士毕业生人数达到2105人,为2010年以来最高(图6.1.5)。
越来越多的 AI 博士毕业生在工业界寻求职业生涯(图6.1.7和图6.1.8)。2011年,工业(40.9%)和学术(41.6%)的就业比例大致相同。然而,到2022年,与进入学术界的人相比 (20.0%) 相比之下,毕业后进入行业的比例 (70.7%) 显然更高。在过去的五年里,进入政府职位的人明显更高。 AI 医生比例一直保持在相对较低的水平,稳定在0.7% 左右。
考生类别增加
下图所示 AP CS 考生的种族多样性正在增加。虽然白人学生仍然是最大但随着时间的推移,亚洲人和西班牙人 / 拉美人和其他学生参加 AP CS 考试人数不断增加(图8.3.3)。2022年,白人学生占考生比例最大(38.2%),亚洲学生(27.8%)(图8.3%).3和图8.3.4)。
电话会议财务报告
去年,财富500强公司财务报告电话会议中提到的人工智能数量显著增加。2023年,394次财务报告电话会议提到人工智能(占财富500强公司的近80%),高于2022年的266场(图4.4.25)。自2018年以来,财富500强电话会议中提到的人工智能数量几乎翻了一番。
涉及的主题非常广泛,最常被提及的主题是生成人工智能,占所有财务报告电话会议的19.7%(图4.4.4.26)。
成本下降,收入上升
人工智能不仅仅是企业的流行语:麦肯锡的同一项调查显示,人工智能的整合降低了企业的成本和收入。总的来说,42% 受访者表示,他们的成本降低了59% 受访者说他们的收入增加了。
2023年,不同领域的许多研究表明,人工智能使工人能够更快地完成任务,提高工作质量。其中一项研究被调查和使用 C o p il o t 编程人员,其他研究调查了顾问、呼叫中心代理人和法律专业的学生。研究还表明,虽然每个工人都能从中受益,但人工智能对低技能工人的帮助大于对高技能工人的帮助。
企业确实感知到了风险
该报告对收入至少5亿美元的1000家公司进行了全球调查,以了解公司如何看待负责任的人工智能。
结果表明,隐私和数据管理被认为是全球性的最大公平性(通常以算法偏见的形式讨论)仍然没有被大多数公司重视。
一张图表显示,企业正在采取行动来感知风险:各地区的大多数企业至少对相关风险采取了负责任的人工智能措施。
人工智能不能在一切上击败人类...
近年来,人工智能系统在阅读理解和视觉推理等一系列任务上的表现优于人类,如2015年的图像分类、2017年的基础阅读理解、2020年的视觉推理和2021年的自然语言推理。
但在一些复杂的认知任务中,人类的表现仍然优于人工智能系统,如视觉常识推理和高级解决数学问题(竞赛级数学问题),明年再来看看情况。
制定人工智能责任规范
当一家人工智能公司准备发布一个大型模型时,标准实践是根据该领域的流行基准进行测试,以便社区能够了解该模型在技术性能上是如何叠加的。然而,根据负责任的人工智能基准测试模型的做法并不多见。这些基准主要评估有毒语言输出(RealToxicityPrompts 和 ToxiGen)、反应中的有害偏差(BOLD 和 BBQ)以及模型的真实性(TruthfulQA)。这种情况正在改变,因为人们越来越意识到按照这些基准检查自己的模型是一件负责任的事情。
然而,报告中的一张图表显示,一致性仍然缺乏:OpenAI、Google 和 Anthropic 领先的开发人员主要负责不同的责任 AI 基准测试他们的模型。这种做法使系统地比较顶级人工智能模型的风险和局限性变得更加复杂。
法律对人工智能的促进和限制
报告指出,从2016年到2023年,至少有33个国家通过了一项与人工智能相关的法律,其中大部分发生在美国和欧洲;在此期间,共通过了148项与人工智能相关的法案。研究人员还将该法案分为扩展法和限制人工智能应用和使用的扩展法。
尽管许多法案继续促进人工智能的发展,但限制性立法已成为全球趋势。
AI 让人紧张
报告第九章是关于的「公众观点」多伦多大学的一项国际调查显示,63% 受访者知道 ChatGPT。在那些知道的人中,大约一半的人每周至少使用它 ChatGPT 一次。
但公众对人工智能的经济影响持悲观态度。在 lpsos 在一项调查中,只有37% 受访者认为人工智能将改善他们的工作。只有34% 人们认为人工智能将促进经济,32% 人们认为它将促进就业市场。
该指数的公众舆论数据来自于对人工智能态度的全球调查。来自31个国家的22816名成年人(16至74岁)参与了调查。
超过一半的受访者表示,人工智能让他们感到紧张,而前一年的比例是39%。三分之二的人现在预计人工智能将在未来几年改变他们的日常生活。
该指数的其他图表显示,不同群体的观点存在显著差异,年轻人更喜欢乐观地看待人工智能将如何改变他们的生活。
参考链接:https://spectrum.ieee.org/ai-index-2024
Copyright © 2013-2025 bacaiyun.com. All Rights Reserved. 八彩云 版权所有 八彩云(北京)网络科技有限公司 京ICP备2023023517号
本站文章全部采集于互联网,如涉及版权问题请联系我们删除.联系QQ:888798,本站域名代理为阿里云