GPT-5 正式发布:多模态能力全面升级,推理速度提升 3 倍

📋 核心要点
  • GPT-5 在多项基准测试中刷新纪录,推理速度较上一代提升 3 倍
  • 新增实时视频理解能力,支持最长 200 万 token 上下文
  • 全新推理模式可自动分解复杂问题,准确率提升 40%
  • 对所有 ChatGPT Plus 用户免费开放,API 价格下调 50%

北京时间 2026 年 3 月 14 日,OpenAI 正式发布其最新旗舰模型 GPT-5。这是 OpenAI 自 GPT-4 发布以来最重要的一次模型迭代,在多模态理解、推理能力和响应速度上均取得了突破性进展。

多模态能力全面升级

GPT-5 最引人注目的更新是其实时视频理解能力。用户现在可以直接上传视频文件,或通过摄像头进行实时对话,GPT-5 能够理解视频中的场景、动作和对话内容,并做出准确回应。

除视频外,GPT-5 对图像的理解能力也大幅提升。在 OCR(文字识别)、图表分析、手写识别等任务上,GPT-5 的准确率超过了专门的视觉模型。

推理速度提升 3 倍

相比 GPT-4o,GPT-5 的平均响应速度提升了约 3 倍。这得益于 OpenAI 对模型推理架构的深度优化,以及新一代数据中心基础设施的支持。

"GPT-5 代表了我们在效率和能力上的双重突破。我们相信,这将彻底改变人们与 AI 交互的方式。" — OpenAI CEO Sam Altman

全新推理模式

GPT-5 引入了全新的深度推理模式(Deep Think),在处理复杂数学、编程和逻辑问题时,模型会自动分解问题、逐步推导,并在最终给出答案前进行自我验证。

在 MATH 数学竞赛题目和 HumanEval 编程评测中,GPT-5 的准确率分别达到了 96.3%94.7%,均创历史新高。

定价与可用性

GPT-5 即日起向所有 ChatGPT Plus 和 Team 用户免费开放。API 定价方面,输入 token 价格从 $10/M 下调至 $5/M,输出 token 价格从 $30/M 下调至 $15/M,降幅约 50%。

来源:OpenAI 官方博客 | 由 SunyataAI AI 编辑整理优化