以下是 GPT‑5 的最新介绍、核心功能亮点,以及与前代模型的对比汇总:
2025-08-08T00:04:25.png

GPT-5 简介

  • 发布日期:GPT‑5 于 2025 年 8 月 7 日正式发布,并通过 ChatGPT(含 API)向所有用户提供 (Business Insider, 维基百科)。
  • 定位:OpenAI 称其为迄今为止“最聪明最快速、最实用”的模型,具备“博士级专家”水平,标志着通向 AGI(通用人工智能)的重要进展 (The Atlantic, Business Insider, 维基百科)。
  • 可访问性:免费用户可使用基本版本,付费 Pro 用户(约 200 美元/月)拥有更高使用限额和优先级 (Business Insider)。

核心功能与技术特点

架构与模型选择机制

GPT‑5 构建为一个统一系统,包含多种子模型和一个智能“路由器”,可根据任务复杂度选择最适合的模型版本,包括 mainminithinking 以及超快 nano 等,同时在 ChatGPT 界面使用 thinking-pro 模式 (维基百科)。

编码与前端生成能力

GPT‑5 在编程领域表现卓越:

  • 在 SWE‑Bench Verified 基准上达 74.9%,优于前代 OpenAI o3 的 69.1%,效率更高(输出 token 和工具调用次数显著减少) (OpenAI)。
  • 在 Aider polyglot 上得分为 88%,错误率下降约 33% (OpenAI)。
  • 前端表现更具审美与准确性,实验中 70% 的情况下优于 o3 (OpenAI)。

Agentic 多工具任务处理

GPT‑5 擅长执行复杂、多步骤的任务,如同时调用多个工具、处理错误、长链调用等,在 τ²‑bench telecom 工具调用基准上达约 96.7% 的成功率 (OpenAI)。同时,它支持更长上下文输入:API 上最大 400 K token(272K 输入 + 128K 输出) (OpenAI)。

多模式与事实性改进

虽然 GPT‑5 主要聚焦文本与编码,但它也支持更广泛的输入长度和更准确的事实性表现。例如,在 LongFact、FactScore 基准中,错误率显著降低 (OpenAI)。

此外,GPT‑5 在 ChatGPT 中新增了:

  • 定制工具调用(custom tools);
  • **verbosity(详略控制)**与 reasoning\_effort(推理努力级别) 参数;
  • 更好的 UI、语气和安全性改进 (OpenAI, The Times of India)。

与前代模型的对比

特性 / 模型GPT-5GPT-4.5 (“Orion”)GPT-4o
发布日期2025‑08‑072025‑02‑272024‑05‑13
模型策略多模型路由系统快速语言对话模型多模态(文本、图像、语音)模型
编码性能SWE‑Bench 74.9%、Aider 88%语言能力略优于 GPT‑4o主要聚焦多模态处理
推理与工具调用高效、循环调用能力强强语言多语能力支持语音和图像生成
上下文窗口最长达 400 K token信息有限模态均支持但窗口较短
安全性/事实性准确性提高,幻觉减少成本高、速度慢首版多模态尝试
(Cinco Días, 维基百科, OpenAI, 维基百科, OpenAI)
  • GPT‑4.5 (“Orion”) 发布于 2025 年 2 月,语义理解与语言覆盖范围广,但推理未重点优化,成本较高使用缓慢 (维基百科)。
  • GPT‑4o 是具备本地图像、语音、文本处理能力的多模态模型,但其主要优势在跨媒介能力,而不是推理或编码 (维基百科)。

如有兴趣,我还可以进一步提供示例演示、使用建议或对行业应用的深入剖析。

最后修改:2025 年 08 月 08 日
如果觉得我的文章对你有用,请随意赞赏