2024 年生成式人工智能的决定性时刻
Posted: Sun Feb 16, 2025 3:59 am
2024 年是人工智能堆栈各个层面都出现创新的一年,从革命性的硬件进步到突破性的应用。这些进步使人工智能开发比以往任何时候都更容易获得、更强大。让我们来看看过去一年改变该领域的发展。
GenAI Visual 中的决定性时刻(徽标)
基础设施层:构建更好的基础
2024 年,人工智能硬件经历了巨大的变革,其突破性进展使得人工智能比以往任何时候都更加强大、更加容易使用。
英伟达
布莱克威尔建筑
NVIDIA 于 3 月发布的 Blackwell 架构为 GenAI 工作负载带来了显著的性能提升。该平台使组织能够运行万亿参数大型语言模型 (LLM),同时与前几代相比,成本和能耗降低了 25 倍。
杰森纳米超级
12 月,NVIDIA 发布了迄今为止最实惠的 AI 计算平台:Jetson Orin Nano Super。这款紧凑型设备的 GenAI 性能提高了 1.7 倍,内存带宽提高了 50%,同时价格降至 249 美元。这使得开发人员、学生和业余爱好者能够轻松实现复杂的 AI 处理。
基础模型层:竞争加剧
2024 年最引人注目的人工智能进步出现在模型层,竞争推动了多个方面的快速创新。
OpenAI
GPT-4o(五月)
今年 5 月,OpenAI 推出了 GPT-4o 模型,该模型无缝集成了文本、视觉和音频处理,彻底改变了 AI 功能。该模型在多语言、音频和视觉功能方面树立了新的行业标杆,提供了前所未有的效率——运行速度是以前版本的两倍,成本只有以前版本的一半。GPT-4o 拥有 128,000 个 token 上下文窗口,证明了单个模型可以有效地处理跨模态的复杂任务。
GPT-4o Mini(7 月)
7 月,OpenAI 推出了 GPT-4o Mini,让开发者和企业更容易获得先进的 AI。该模型的价格为 0.15 美元/百万代币,比 GPT-3.5 Turbo 便宜 60%,在保持高性能的同时,大大降低了企业 AI 部署的门槛。它成为未登录用户和达到 GPT-4o 使用限制的用户的默认模型。
o1 模型(九月)
9 月推出了 o1,OpenAI 的模型专注于深度推理。该模型旨在花更多 菲律宾电话号码数据 时间处理问题,类似于人类处理复杂任务的方式。这种有条不紊的方法获得了回报——o1 在物理、化学和生物学方面取得了博士级成绩,同时解决了 83% 的国际数学奥林匹克资格赛问题。该模型表明,让人工智能系统有更多时间“思考”可以显著提高结果。
o3 模型(十二月)
12 月,OpenAI 发布了 o3,引入了“深思熟虑的调整”和可调节的计算能力——模型思考的时间越长,性能就越好。在用于衡量通用智能能力的 ARC-AGI 基准测试中,o3 在获得最大计算资源的情况下取得了前所未有的 87.5% 的得分。该模型还显著提高了数学推理和编码能力,表明未来人工智能系统可以根据任务复杂性动态调整其处理能力。
SORA(十二月)
12 月还发布了 SORA,这是 OpenAI 在视频生成方面的突破。该模型可以创建分辨率高达 1080p 的宽屏、垂直或方形视频,并可以对长度和样式进行精细控制。SORA 在其生成的内容中展示了前所未有的物理理解能力,标志着人工智能朝着真正理解和模拟现实世界运动和交互迈出了重要一步。
GenAI Visual 中的决定性时刻(徽标)
基础设施层:构建更好的基础
2024 年,人工智能硬件经历了巨大的变革,其突破性进展使得人工智能比以往任何时候都更加强大、更加容易使用。
英伟达
布莱克威尔建筑
NVIDIA 于 3 月发布的 Blackwell 架构为 GenAI 工作负载带来了显著的性能提升。该平台使组织能够运行万亿参数大型语言模型 (LLM),同时与前几代相比,成本和能耗降低了 25 倍。
杰森纳米超级
12 月,NVIDIA 发布了迄今为止最实惠的 AI 计算平台:Jetson Orin Nano Super。这款紧凑型设备的 GenAI 性能提高了 1.7 倍,内存带宽提高了 50%,同时价格降至 249 美元。这使得开发人员、学生和业余爱好者能够轻松实现复杂的 AI 处理。
基础模型层:竞争加剧
2024 年最引人注目的人工智能进步出现在模型层,竞争推动了多个方面的快速创新。
OpenAI
GPT-4o(五月)
今年 5 月,OpenAI 推出了 GPT-4o 模型,该模型无缝集成了文本、视觉和音频处理,彻底改变了 AI 功能。该模型在多语言、音频和视觉功能方面树立了新的行业标杆,提供了前所未有的效率——运行速度是以前版本的两倍,成本只有以前版本的一半。GPT-4o 拥有 128,000 个 token 上下文窗口,证明了单个模型可以有效地处理跨模态的复杂任务。
GPT-4o Mini(7 月)
7 月,OpenAI 推出了 GPT-4o Mini,让开发者和企业更容易获得先进的 AI。该模型的价格为 0.15 美元/百万代币,比 GPT-3.5 Turbo 便宜 60%,在保持高性能的同时,大大降低了企业 AI 部署的门槛。它成为未登录用户和达到 GPT-4o 使用限制的用户的默认模型。
o1 模型(九月)
9 月推出了 o1,OpenAI 的模型专注于深度推理。该模型旨在花更多 菲律宾电话号码数据 时间处理问题,类似于人类处理复杂任务的方式。这种有条不紊的方法获得了回报——o1 在物理、化学和生物学方面取得了博士级成绩,同时解决了 83% 的国际数学奥林匹克资格赛问题。该模型表明,让人工智能系统有更多时间“思考”可以显著提高结果。
o3 模型(十二月)
12 月,OpenAI 发布了 o3,引入了“深思熟虑的调整”和可调节的计算能力——模型思考的时间越长,性能就越好。在用于衡量通用智能能力的 ARC-AGI 基准测试中,o3 在获得最大计算资源的情况下取得了前所未有的 87.5% 的得分。该模型还显著提高了数学推理和编码能力,表明未来人工智能系统可以根据任务复杂性动态调整其处理能力。
SORA(十二月)
12 月还发布了 SORA,这是 OpenAI 在视频生成方面的突破。该模型可以创建分辨率高达 1080p 的宽屏、垂直或方形视频,并可以对长度和样式进行精细控制。SORA 在其生成的内容中展示了前所未有的物理理解能力,标志着人工智能朝着真正理解和模拟现实世界运动和交互迈出了重要一步。