OpenAI 大模型

GPT-5.5 系列（旗舰）：
- GPT-5.5：OpenAI 目前最强模型，专为复杂真实世界任务设计，擅长代码编写与调试、在线研究、数据分析、文档与表格创建，以及跨工具的多步骤任务执行。API 定价：输入 $5.00 / 1M tokens，输出 $30.00 / 1M tokens。
- GPT-5.5 Pro：GPT-5.5 的增强版，面向对性能要求最高的专业场景。
GPT-5.4 系列（均衡）：
- GPT-5.4：融合了推理、编码与智能体工作流的前沿能力，在效果与成本之间取得良好平衡。API 定价：输入 $2.50 / 1M tokens，输出 $15.00 / 1M tokens。
- GPT-5.4 mini：目前最强的 mini 级模型，在编码、计算机使用和子智能体场景中表现突出，速度比 GPT-5 mini 快 2 倍以上。API 定价：输入 $0.75 / 1M tokens，输出 $4.50 / 1M tokens。
- GPT-5.4 nano：超低成本轻量模型，适合高并发、低延迟的简单任务，是成本最优的选择之一。
图片生成：
- GPT-Image-2（即 GPT Image 1.5）：新一代图片生成与编辑模型，支持精准局部编辑、风格迁移，生成速度比上一代提升 4 倍，文字渲染与版面布局能力显著增强。
实时语音系列（2026 年 5 月最新发布）：
- GPT-Realtime-2：具备 GPT-5 级推理能力的实时语音模型，可处理复杂请求并自然推进对话。
- GPT-Realtime-Translate：实时语音翻译模型，支持 70+ 种输入语言翻译为 13 种输出语言，与说话者保持同步。
- GPT-Realtime-Whisper：流式语音转文字模型，支持说话时实时转录，适合字幕生成与会议记录。
嵌入向量：text-embedding-3 系列，适合语义搜索、RAG 检索增强生成等场景。

适用场景

对话式产品与智能客服：多轮对话、意图识别、知识库问答，推荐使用 GPT-5.4 或 GPT-5.4 mini。
代码开发辅助：代码补全、代码审查、技术文档生成，GPT-5.5 和 GPT-5.4 在编码基准上表现领先。
内容创作：文案撰写、翻译润色、营销素材生成，推荐 GPT-5.4 兼顾效果与成本。
图片生成与编辑：营销海报、产品图、应用内图片创作，使用 GPT-Image-2 获得更精准的编辑效果。
实时语音应用：语音交互界面、实时字幕、多语言同声传译，使用 GPT-Realtime-2 / Translate / Whisper 系列。
智能体与自动化工作流：多步骤任务执行、跨工具调用，GPT-5.5 具备强大的工具使用与长时序规划能力。
RAG 与语义搜索：结合 text-embedding-3 系列构建企业知识库检索系统。
低成本高频调用：使用 GPT-5.4 nano 处理简单分类、摘要、关键词提取等高并发轻量任务，控制推理成本。