Runway API 以 credits 计费($0.01 / credit),提供视频生成、图片生成、音频合成和实时数字人四大能力,并集成了 Google Veo 3.1、GPT Image 2 等第三方顶级模型,开发者通过单一 API 即可访问业界最全面的生成式媒体模型矩阵。
视频生成模型
-
Gen-4.5(旗舰):
- Runway 最新旗舰视频模型,支持文本或图像输入,电影级运动质量,强提示词遵循度,适合专业广告和叙事内容。
- 计费:12 credits / 秒(约 $0.12 / 秒)。
-
Gen-4 Turbo(高效):
- 图生视频,速度更快、成本更低,适合高并发生产场景。
- 计费:5 credits / 秒(约 $0.05 / 秒)。
-
Gen-4 Aleph(视频续写):
- 视频 + 文本/图像输入,支持视频续写和风格迁移,适合长视频创作工作流。
- 计费:15 credits / 秒(约 $0.15 / 秒)。
-
Act Two(动作捕捉驱动):
- 图像或视频输入,将参考动作迁移到目标角色,适合角色动画和虚拟形象驱动。
- 计费:5 credits / 秒。
-
Veo 3 / Veo 3.1(Google 集成):
- 通过 Runway API 直接调用 Google Veo 3.1,支持带音频和不带音频两种模式。
- 计费:Veo 3.1 带音频 40 credits / 秒,不带音频 20 credits / 秒;Fast 版带音频 15 credits / 秒。
图片生成模型
- Gen-4 Image:Runway 自研图片生成,支持文本/图像参考输入。720p 5 credits / 张,1080p 8 credits / 张。
- Gen-4 Image Turbo:快速版,任意分辨率 2 credits / 张,适合批量生成。
- Gemini Image 3 Pro(Google 集成):1K/2K 20 credits / 张,4K 40 credits / 张。
- GPT Image 2(OpenAI 集成):按质量和分辨率计费,高质量 1080p 20 credits / 张,4K 41 credits / 张。
- Gemini 2.5 Flash(Google 集成):任意分辨率 5 credits / 张,高性价比选择。
音频生成模型(ElevenLabs 集成)
- eleven_multilingual_v2:多语言语音合成,1 credit / 50 字符。
- eleven_text_to_sound_v2:文本生成音效,1 credit / 秒。
- eleven_voice_dubbing:语音配音,1 credit / 2 秒。
- eleven_voice_isolation:人声分离,1 credit / 6 秒。
实时数字人
- gwm1_avatars:实时对话数字人,支持文本对话驱动视频+音频输出,2 credits 启动 + 2 credits / 6 秒,适合虚拟客服、直播助手等场景。
适用场景
- 专业广告与影视内容:Gen-4.5 的电影级运动真实感和时序一致性,是专业广告和叙事内容的首选。
- 多模型统一接入:单一 API 同时访问 Runway、Google Veo 3.1、GPT Image 2、ElevenLabs,简化多供应商集成。
- 角色动画与虚拟形象:Act Two 动作迁移 + gwm1_avatars 实时数字人,覆盖从预制到实时的完整角色动画链路。
- 内容平台视频能力接入:Gen-4 Turbo 成本低、速度快,适合需要批量生成的内容平台。
- 多语言视频本地化:结合 ElevenLabs 配音模型,快速为视频生成多语言配音版本。
- 创意工具与设计平台:Gen-4 Image 系列支持图像参考输入,适合设计工具中的 AI 辅助创作功能。