DeepSeek API 提供开箱即用的大模型推理服务,同时兼容 OpenAI 和 Anthropic API 格式,迁移成本极低。两款模型均支持思考模式与非思考模式自由切换,1M 超长上下文,最大输出 384K tokens。
DeepSeek 大模型
-
DeepSeek-V4-Pro(旗舰):
- 综合能力最强的旗舰模型,适合复杂推理、深度分析和高质量内容生成。
- 支持思考模式(默认开启)与非思考模式切换,可通过
reasoning_effort参数控制推理深度(high / medium / low)。 - 上下文长度 1M tokens,最大输出 384K tokens。
- 支持 JSON Output、Tool Calls、对话前缀续写(Beta)、FIM 补全(非思考模式,Beta)。
- API 定价:输入 ¥3 / 1M tokens(缓存命中 ¥0.025),输出 ¥6 / 1M tokens(优惠期 2.5 折,延长至 2026/05/31)。
-
DeepSeek-V4-Flash(均衡):
- 速度与成本的最佳平衡,适合高并发、对延迟敏感的生产场景。
- 同样支持思考模式与非思考模式,原
deepseek-chat(非思考)和deepseek-reasoner(思考)模型名将于 2026/07/24 弃用,统一迁移至此。 - 上下文长度 1M tokens,最大输出 384K tokens。
- API 定价:输入 ¥1 / 1M tokens(缓存命中 ¥0.02),输出 ¥2 / 1M tokens。
-
双格式兼容:API 同时支持 OpenAI 格式(
https://api.deepseek.com)和 Anthropic 格式(https://api.deepseek.com/anthropic),可直接替换 base_url 无缝接入。 -
Agent 工具集成:已接入 Claude Code、GitHub Copilot、OpenCode 等主流 AI Agent 与编程助手,可直接将 DeepSeek 作为后端模型使用。
适用场景
- 复杂推理与深度分析:开启思考模式,使用 DeepSeek-V4-Pro 处理数学推导、代码调试、逻辑分析等多步骤推理任务。
- 代码生成与开发辅助:代码补全、重构、解释,支持 FIM(Fill-in-the-Middle)补全,适合集成到 IDE 插件或 AI 编程助手。
- 长文档理解与处理:1M 超长上下文支持整本书、完整代码库的一次性输入,适合文档摘要、合同分析、知识库问答。
- 高性价比生产替换:从 OpenAI 或 Anthropic 迁移只需修改 base_url,DeepSeek-V4-Flash 在成本上具有显著优势。
- 智能体与工具调用:支持 Tool Calls 和 JSON Output,适合构建需要结构化输出和外部工具调用的 AI 智能体。
- 低成本高频调用:使用 DeepSeek-V4-Flash 处理简单分类、摘要、关键词提取等高并发轻量任务,缓存命中后成本极低。