字节跳动火山方舟平台提供开箱即用的全模态 AI 模型服务,无需自行部署,即可调用豆包(Doubao)全系列自研模型,以及 DeepSeek、GLM 等第三方大模型。平台日均 tokens 使用量达 63 万亿,初始限流全网最高 500 万 TPM。
豆包大模型(文本与推理)
-
Doubao-Seed-2.0-Pro(旗舰):
- 最强通用推理模型,支持深度思考模式,适合复杂多步骤任务、代码生成与智能体工作流。
- 支持最长 256k 上下文,提供免费额度 50 万 tokens(深度思考)。
- API 定价:输入 ¥3.2 / 1M tokens(≤32k),输出 ¥16 / 1M tokens。
-
Doubao-Seed-2.0-Lite(均衡):
- 效果与成本均衡,支持音频理解,适合大多数生产场景。
- API 定价:输入 ¥0.6 / 1M tokens(≤32k),输出 ¥3.6 / 1M tokens。
-
Doubao-Seed-2.0-Mini(轻量):
- 超高速度、超低成本,适合高并发轻量任务。
- API 定价:输入 ¥0.2 / 1M tokens(≤32k),输出 ¥2.0 / 1M tokens。
-
Doubao-Seed-2.0-Code(代码专项):
- 专为 Agentic Coding 深度优化的代码模型,适合自主完成多步骤编程任务的 AI 智能体。
-
Doubao-Seed-Character(角色扮演):
- 支持故事剧情模式与多人剧情互动,长期记忆用户偏好,适合社交娱乐与沉浸式互动场景。
-
Doubao-Seed-Translation(翻译专项):
- 高质量、低延迟的专业翻译模型,支持多语言互译。
视频生成(Seedance)
-
Doubao-Seedance-2.0:最新旗舰视频生成模型,支持文本、图像、视频、音频四模态输入,内置”通用参考”系统,支持 480p / 720p / 1080p 输出,原生音画同步。720p 5 秒视频约 ¥4.97 / 个。
-
Doubao-Seedance-2.0-Fast:高效版,速度更快、成本更低,720p 5 秒视频约 ¥4.00 / 个。
-
Doubao-Seedance-1.5-Pro:稳定版,音画同生,支持样片模式快速验证效果,720p 5 秒有声视频约 ¥1.73 / 个。
图片生成(Seedream)
- Doubao-Seedream-5.0-Lite:高性价比图片生成,¥0.22 / 张。
- Doubao-Seedream-4.5:更高质量图片生成,¥0.25 / 张。
- 支持多图融合创作,适合营销素材、产品图、创意插画等场景。
语音与音频
- Doubao-Seed-TTS-2.0(语音合成):生成自然、高保真、个性化语音,支持多种音色风格。
- Doubao-Seed-ICL-2.0(声音复刻):快速定制专属 AI 音色,适合品牌语音、有声内容制作。
- Doubao-Seed-RealtimeVoice(实时语音):端到端超拟人感对话体验,适合语音交互产品。
- Doubao-Seed-LiveInterpret(同声传译):高质量、低延迟的端到端同声翻译,支持多语言。
- Doubao-Seed-ASR-2.0(语音识别):听得清、看得懂,支持流式与录音文件识别。
音乐生成
- Doubao-Seed-Music:让每个人都能成为音乐创作大师,支持 API 调用生成原创音乐。
其他专项模型
- Doubao-Seed-Embedding(向量模型):支持文本、图片、视频等多模态向量检索,适合 RAG 和语义搜索。文本输入 ¥0.70 / 1M tokens,图片输入 ¥1.80 / 1M tokens。
- Doubao-Seed3D-2.0(3D 生成):生成带纹理和 PBR 材质的 3D 模型文件,¥2.40 / 次。
- 第三方模型:平台同时托管 DeepSeek-V3.2、DeepSeek-R1、GLM-4.7 等主流模型,统一 API 调用。
适用场景
- 复杂推理与智能体编码:使用 Doubao-Seed-2.0-Pro 或 Seed-2.0-Code 处理多步骤推理、代码生成与 Agentic Coding 任务。
- 社交娱乐与角色扮演:Doubao-Seed-Character 支持多人剧情互动与长期记忆,适合游戏、陪伴类应用。
- 视频内容创作:Seedance 2.0 支持四模态输入与原生音画同步,适合短视频、广告、影视预告片生成。
- 图片素材生成:Seedream 系列适合营销海报、产品图、应用内图片创作,按张计费成本可控。
- 语音交互与播客:TTS 2.0 + 声音复刻 + 实时语音,覆盖从内容制作到实时对话的完整语音链路。
- 多语言翻译与同传:Seed-Translation 和 Seed-LiveInterpret 适合跨语言内容平台和国际会议场景。
- RAG 与知识库:Seed-Embedding 多模态向量模型 + 平台知识库服务,快速构建企业级检索系统。
- 低成本高频调用:使用 Doubao-Seed-2.0-Mini 处理简单分类、摘要、关键词提取等高并发轻量任务,¥0.2 / 1M tokens 起。