Moonshot AI Kimi API 提供开箱即用的大模型推理服务,完全兼容 OpenAI Chat Completions API 格式,只需将 base_url 指向 https://api.moonshot.ai/v1 即可无缝迁移。平台已被 Cursor、Windsurf、Vercel、小红书、华为等数百万开发者和企业采用。
Kimi K2 系列(最新)
-
Kimi K2.6(旗舰,2026 年 4 月发布):
- 最新最强模型,原生多模态架构,支持文本、图像、视频输入,具备更强更稳定的长时序代码编写能力,显著提升指令遵循与自我纠错能力。
- 1T 总参数 MoE 架构,32B 激活参数,支持最多 300 个子智能体、4000 步协调执行的群体任务编排。
- 上下文长度 256k tokens,支持长思考与深度推理(思考/非思考模式可切换)。
- 支持自动上下文缓存、ToolCalls、JSON Mode、Partial Mode 和联网搜索。
- API 定价:缓存命中 $0.16 / 1M tokens,输入 $0.95 / 1M tokens,输出 $4.00 / 1M tokens。
-
Kimi K2.5(均衡,开源):
- 原生多模态智能体模型,基于约 15 万亿混合视觉与文本 token 持续预训练,支持文本、图像、视频输入。
- 同样支持思考/非思考模式、256k 上下文、ToolCalls、JSON Mode、联网搜索。
- 在化学文献理解等科学领域基准上排名前列,被 XtalPi 等 AI for Science 企业采用。
- API 定价:缓存命中 $0.10 / 1M tokens,输入 $0.60 / 1M tokens,输出 $3.00 / 1M tokens。
-
Kimi K2(基础,即将停用):
- MoE 架构基础模型,1T 总参数,32B 激活参数,代码与智能体能力突出。
- 注意:Kimi K2 系列将于 2026 年 5 月 25 日正式停用,建议迁移至 K2.6。
- API 定价:缓存命中 $0.15 / 1M tokens,输入 $0.60 / 1M tokens,输出 $2.50 / 1M tokens。
Moonshot V1 系列(稳定长上下文)
- moonshot-v1-128k:128k 上下文,适合超长文档处理。输入 $2.00 / 1M tokens,输出 $5.00 / 1M tokens。
- moonshot-v1-32k:32k 上下文,均衡选择。输入 $1.00 / 1M tokens,输出 $3.00 / 1M tokens。
- moonshot-v1-8k:8k 上下文,低成本轻量场景。输入 $0.20 / 1M tokens,输出 $2.00 / 1M tokens。
- 以上均有对应 Vision 预览版,支持图像输入,定价相同。
官方内置工具(即插即用)
平台提供一套开箱即用的生产级工具,无需额外集成:
- Web Search:联网搜索,获取最新信息并引用权威来源
- Code Runner:Python 代码执行工具
- Quick JS:安全执行 JavaScript 代码
- Memory:对话历史与用户偏好持久化存储
- Excel:Excel / CSV 文件分析
- Fetch:URL 内容提取与 Markdown 格式化
- Rethink / Date / Convert / Base64 等通用工具
适用场景
- 智能体编码与自动化开发:Kimi K2.6 支持 300 子智能体群体编排,适合构建自主完成调试、重构、多步骤开发工作流的 AI 编程智能体,已被 Cursor、Windsurf、Kilo Code 等工具集成。
- 深度研究与复杂推理:K2 Thinking 模式支持最多 300 步工具调用,适合战略研究、竞品分析、金融报告、学术文献综述等长时序推理任务。
- 多模态内容理解:K2.6 / K2.5 原生支持图像与视频输入,适合化学公式识别、图表解析、科学文献理解等多模态场景。
- 长文档分析:moonshot-v1-128k 支持整本书、完整合同、大型代码库的一次性输入,适合法律文档审查、专利分析、代码库理解。
- 法律与知识产权:模型对细节高度关注,适合合同审查、专利分析与起草,严格遵循术语和逻辑结构。
- 对话智能分析:擅长高保真对话分析,适合心理咨询质量评估、舆情监控、客户意图检测等场景。
- 低成本 OpenAI 替代:完全兼容 OpenAI SDK,仅需修改 base_url,K2.5 输入仅 $0.60 / 1M tokens,成本远低于同级别闭源模型。