Stability AI API 以 credits 计费(购买后不过期),提供图片生成、图片编辑、图像控制、超分辨率放大、音频生成和 3D 资产生成六大能力。API 限速 150 次 / 10 秒,失败的生成不扣 credits。
图片生成模型
-
Stable Image Ultra(旗舰):
- 基于 SD 3.5 的最高质量文生图服务,擅长排版文字、复杂构图、动态光影、鲜艳色彩,输出 1MP(默认 1024×1024)。
- 支持图生图(
image+strength参数),16 种风格预设(电影、动漫、像素艺术等)。 - 计费:8 credits / 张。
-
Stable Image Core(高速均衡):
- 主力文生图服务,无需提示词工程,速度快、质量高,输出 1.5MP。
- 计费:3 credits / 张。
-
Stable Diffusion 3.5 系列(开源基础模型):
- SD 3.5 Large:8B 参数,最高质量,1MP 输出。6.5 credits / 张。
- SD 3.5 Large Turbo:Large 的蒸馏版,4 步生成,速度显著更快。4 credits / 张。
- SD 3.5 Medium:2.5B 参数,速度与质量均衡。3.5 credits / 张。
- SD 3.5 Flash:Medium 的蒸馏版,4 步生成,最快最便宜。2.5 credits / 张。
- 注:SD 3.0 系列已于 2025 年 4 月 17 日弃用,自动路由至 SD 3.5 等价版本。
图片编辑工具
- Erase(擦除):使用遮罩移除图片中的不需要元素(如人像瑕疵、桌面杂物)。5 credits / 张。
- Inpaint(局部重绘):基于遮罩填充或替换指定区域,输出 4MP。5 credits / 张。
- Outpaint(外扩):向任意方向扩展图片内容,最多扩展 2000 像素。4 credits / 张。
- Search and Replace(搜索替换):无需遮罩,用文字描述自动定位并替换对象。5 credits / 张。
- Search and Recolor(搜索重新着色):自动定位对象并按提示词重新着色。5 credits / 张。
- Remove Background(移除背景):精准分割前景,移除背景,输出透明 PNG。5 credits / 张。
- Replace Background and Relight(替换背景并重新打光):替换背景同时调整光照方向和强度,适合电商和摄影场景。8 credits / 张。
图像控制工具
- Sketch(草图转图):将手绘草图或线稿升级为精细输出,适合设计迭代。5 credits / 张。
- Structure(结构控制):保持输入图像的结构生成新图,适合场景重建和角色渲染。5 credits / 张。
- Style Guide(风格引导):从参考图提取风格元素,引导新图生成。5 credits / 张。
- Style Transfer(风格迁移):将参考风格图的视觉特征应用到目标图像,保留原始构图。8 credits / 张。
超分辨率放大
- Fast Upscaler:4 倍放大,约 1 秒处理,适合社交媒体图片快速增强。2 credits / 张。
- Conservative Upscaler:20-40 倍放大至 4MP,最小化改动,保留原始细节。40 credits / 张。
- Creative Upscaler:对低质量图片进行创意性放大,添加细节,适合高度降质的图片。60 credits / 张。
音频生成(Stable Audio 2.5)
- 最先进的音频生成模型,支持文生音频、音频转音频、音频局部重绘(Inpaint)三种模式。
- 生成最长 3 分钟、44.1kHz 立体声音频,适合音乐制作、电影音效设计和混音。
- 训练数据来自 AudioSparx 和 Freesound 授权音乐库,尊重版权。
- 计费:20 credits / 次(Stable Audio 2.5 和 2.0 均为 20 credits)。
3D 资产生成
- Stable Fast 3D:从单张 2D 图片生成高质量 3D 资产(GLB 格式),支持 512/1024/2048 纹理分辨率。10 credits / 次。
- Stable Point Aware 3D(SPAR3D):结合点云扩散和网格回归,改善背面细节预测,支持实时编辑。4 credits / 次。
适用场景
- 电商产品图处理:Replace Background + Relight 一键替换背景并调整光照,适合大规模产品图标准化。
- 创意内容生产:Stable Image Ultra 的高质量输出适合专业印刷媒体和大幅面应用。
- 设计原型迭代:Sketch 控制 + Stable Image Core 快速将草图转化为精细概念图。
- 图片后期处理:Erase、Inpaint、Remove Background 等编辑工具覆盖常见后期需求。
- 游戏与影视资产:Stable Fast 3D 从参考图快速生成 3D 模型,Stable Audio 2.5 生成场景音效和配乐。
- 高分辨率输出:Conservative Upscaler 将小图放大至 4MP,适合印刷和大屏展示。