智站集市 logo 智站集市

官方 API

Moonshot AI

Moonshot AI 官方 Kimi API 平台,提供 Kimi K2.6 / K2.5 旗舰多模态智能体模型,支持文本、图像、视频输入,256k 超长上下文,思考与非思考模式自由切换,以 1T 参数 MoE 架构实现顶级代码生成与智能体编排能力,兼容 OpenAI 格式。

试用 文本 API 全球 ⭐ 4.6 更新 2026/05/12
文本生成 多模态 代码生成 智能体 长上下文 推理模型 OpenAI 兼容

Moonshot AI Kimi API 提供开箱即用的大模型推理服务,完全兼容 OpenAI Chat Completions API 格式,只需将 base_url 指向 https://api.moonshot.ai/v1 即可无缝迁移。平台已被 Cursor、Windsurf、Vercel、小红书、华为等数百万开发者和企业采用。

Kimi K2 系列(最新)

  • Kimi K2.6(旗舰,2026 年 4 月发布):

    • 最新最强模型,原生多模态架构,支持文本、图像、视频输入,具备更强更稳定的长时序代码编写能力,显著提升指令遵循与自我纠错能力。
    • 1T 总参数 MoE 架构,32B 激活参数,支持最多 300 个子智能体、4000 步协调执行的群体任务编排。
    • 上下文长度 256k tokens,支持长思考与深度推理(思考/非思考模式可切换)。
    • 支持自动上下文缓存、ToolCalls、JSON Mode、Partial Mode 和联网搜索。
    • API 定价:缓存命中 $0.16 / 1M tokens,输入 $0.95 / 1M tokens,输出 $4.00 / 1M tokens。
  • Kimi K2.5(均衡,开源):

    • 原生多模态智能体模型,基于约 15 万亿混合视觉与文本 token 持续预训练,支持文本、图像、视频输入。
    • 同样支持思考/非思考模式、256k 上下文、ToolCalls、JSON Mode、联网搜索。
    • 在化学文献理解等科学领域基准上排名前列,被 XtalPi 等 AI for Science 企业采用。
    • API 定价:缓存命中 $0.10 / 1M tokens,输入 $0.60 / 1M tokens,输出 $3.00 / 1M tokens。
  • Kimi K2(基础,即将停用):

    • MoE 架构基础模型,1T 总参数,32B 激活参数,代码与智能体能力突出。
    • 注意:Kimi K2 系列将于 2026 年 5 月 25 日正式停用,建议迁移至 K2.6。
    • API 定价:缓存命中 $0.15 / 1M tokens,输入 $0.60 / 1M tokens,输出 $2.50 / 1M tokens。

Moonshot V1 系列(稳定长上下文)

  • moonshot-v1-128k:128k 上下文,适合超长文档处理。输入 $2.00 / 1M tokens,输出 $5.00 / 1M tokens。
  • moonshot-v1-32k:32k 上下文,均衡选择。输入 $1.00 / 1M tokens,输出 $3.00 / 1M tokens。
  • moonshot-v1-8k:8k 上下文,低成本轻量场景。输入 $0.20 / 1M tokens,输出 $2.00 / 1M tokens。
  • 以上均有对应 Vision 预览版,支持图像输入,定价相同。

官方内置工具(即插即用)

平台提供一套开箱即用的生产级工具,无需额外集成:

  • Web Search:联网搜索,获取最新信息并引用权威来源
  • Code Runner:Python 代码执行工具
  • Quick JS:安全执行 JavaScript 代码
  • Memory:对话历史与用户偏好持久化存储
  • Excel:Excel / CSV 文件分析
  • Fetch:URL 内容提取与 Markdown 格式化
  • Rethink / Date / Convert / Base64 等通用工具

适用场景

  • 智能体编码与自动化开发:Kimi K2.6 支持 300 子智能体群体编排,适合构建自主完成调试、重构、多步骤开发工作流的 AI 编程智能体,已被 Cursor、Windsurf、Kilo Code 等工具集成。
  • 深度研究与复杂推理:K2 Thinking 模式支持最多 300 步工具调用,适合战略研究、竞品分析、金融报告、学术文献综述等长时序推理任务。
  • 多模态内容理解:K2.6 / K2.5 原生支持图像与视频输入,适合化学公式识别、图表解析、科学文献理解等多模态场景。
  • 长文档分析:moonshot-v1-128k 支持整本书、完整合同、大型代码库的一次性输入,适合法律文档审查、专利分析、代码库理解。
  • 法律与知识产权:模型对细节高度关注,适合合同审查、专利分析与起草,严格遵循术语和逻辑结构。
  • 对话智能分析:擅长高保真对话分析,适合心理咨询质量评估、舆情监控、客户意图检测等场景。
  • 低成本 OpenAI 替代:完全兼容 OpenAI SDK,仅需修改 base_url,K2.5 输入仅 $0.60 / 1M tokens,成本远低于同级别闭源模型。