xAI Grok API 是马斯克旗下 xAI 推出的全模态 AI 接口平台,兼容 OpenAI 格式。Grok 4.3 是目前唯一的推荐文本模型,同时平台提供独立的 Voice API 和 Imagine API 覆盖语音和视觉生成能力。新用户注册可获得 $25 免费额度。
注意:多个旧版模型(grok-4-1-fast、grok-4-fast、grok-4、grok-code-fast-1 等)将于 2026 年 5 月 15 日退役,建议迁移至 Grok 4.3。
Grok 4.3(旗舰文本模型)
- 目前 xAI 最智能、最快速的模型,官方推荐用于所有文本场景(对话、编码、推理)。
- 1M tokens 超长上下文,支持可配置推理模式(reasoning_effort 参数)。
- 极低幻觉率,强大的智能体工具调用能力,适合复杂多步骤任务。
- 支持 Web Search(实时网络搜索)和 X Search(X 平台实时内容搜索),无需额外配置即可获取最新信息。
- 支持代码执行、Collections RAG 检索、Remote MCP 工具调用。
- API 定价:输入 $1.25 / 1M tokens,输出 $2.50 / 1M tokens。
Voice API(实时语音)
- 实时语音对话(Voice Agent):亚秒级延迟,$3.00 / 小时,适合语音交互产品和实时客服。
- TTS 语音合成:$15.00 / 1M 字符,支持自定义声音。
- STT 语音识别:$0.10 / 小时,适合会议记录和字幕生成。
- 支持 WebSocket 模式和 Ephemeral Token 安全认证。
Imagine API(图片与视频生成)
- 图片生成与编辑:支持文生图、图片编辑、多图编辑,$0.02 / 张,支持 1K 和 2K 分辨率。
- 视频生成:支持文生视频、图生视频、视频编辑、参考视频、视频延伸,$0.05 / 秒。
内置工具
- Web Search:实时网络搜索,为模型提供最新信息(Grok 默认无实时知识,需启用搜索工具)。
- X Search:独家 X(Twitter)平台内容实时搜索,适合社交媒体监控和舆情分析。
- Code Execution:代码执行沙箱,适合数据分析和自动化任务。
- Collections Search(RAG):基于文件集合的语义检索,适合企业知识库问答。
- Remote MCP:支持远程 MCP 工具接入,扩展智能体能力边界。
适用场景
- 智能体与复杂工具调用:Grok 4.3 的强工具调用能力和低幻觉率,适合构建需要精确执行多步骤任务的 AI 智能体。
- 实时信息增强应用:X Search 独家接入 X 平台实时内容,适合新闻聚合、社交媒体分析、实时舆情监控。
- 超长上下文处理:1M 上下文支持整个代码库或大型文档集合的一次性分析。
- 实时语音交互:Voice API 亚秒级延迟,适合语音助手、实时客服和会议助手。
- 视觉内容创作:Imagine API 覆盖图片生成、编辑到视频生成的完整视觉创作链路。
- 代码开发辅助:Grok 4.3 在编码基准上表现领先,支持代码执行沙箱,适合 AI 编程助手集成。