Name: Moonshot AI
Rating: 4.6 (1 reviews)

Moonshot AI Kimi API 提供开箱即用的大模型推理服务，完全兼容 OpenAI Chat Completions API 格式，只需将 base_url 指向 https://api.moonshot.ai/v1 即可无缝迁移。平台已被 Cursor、Windsurf、Vercel、小红书、华为等数百万开发者和企业采用。

Kimi K2 系列（最新）

Kimi K2.6（旗舰，2026 年 4 月发布）：
- 最新最强模型，原生多模态架构，支持文本、图像、视频输入，具备更强更稳定的长时序代码编写能力，显著提升指令遵循与自我纠错能力。
- 1T 总参数 MoE 架构，32B 激活参数，支持最多 300 个子智能体、4000 步协调执行的群体任务编排。
- 上下文长度 256k tokens，支持长思考与深度推理（思考/非思考模式可切换）。
- 支持自动上下文缓存、ToolCalls、JSON Mode、Partial Mode 和联网搜索。
- API 定价：缓存命中 $0.16 / 1M tokens，输入 $0.95 / 1M tokens，输出 $4.00 / 1M tokens。
Kimi K2.5（均衡，开源）：
- 原生多模态智能体模型，基于约 15 万亿混合视觉与文本 token 持续预训练，支持文本、图像、视频输入。
- 同样支持思考/非思考模式、256k 上下文、ToolCalls、JSON Mode、联网搜索。
- 在化学文献理解等科学领域基准上排名前列，被 XtalPi 等 AI for Science 企业采用。
- API 定价：缓存命中 $0.10 / 1M tokens，输入 $0.60 / 1M tokens，输出 $3.00 / 1M tokens。
Kimi K2（基础，即将停用）：
- MoE 架构基础模型，1T 总参数，32B 激活参数，代码与智能体能力突出。
- 注意：Kimi K2 系列将于 2026 年 5 月 25 日正式停用，建议迁移至 K2.6。
- API 定价：缓存命中 $0.15 / 1M tokens，输入 $0.60 / 1M tokens，输出 $2.50 / 1M tokens。

Moonshot V1 系列（稳定长上下文）

moonshot-v1-128k：128k 上下文，适合超长文档处理。输入 $2.00 / 1M tokens，输出 $5.00 / 1M tokens。
moonshot-v1-32k：32k 上下文，均衡选择。输入 $1.00 / 1M tokens，输出 $3.00 / 1M tokens。
moonshot-v1-8k：8k 上下文，低成本轻量场景。输入 $0.20 / 1M tokens，输出 $2.00 / 1M tokens。
以上均有对应 Vision 预览版，支持图像输入，定价相同。

官方内置工具（即插即用）

平台提供一套开箱即用的生产级工具，无需额外集成：

Web Search：联网搜索，获取最新信息并引用权威来源
Code Runner：Python 代码执行工具
Quick JS：安全执行 JavaScript 代码
Memory：对话历史与用户偏好持久化存储
Excel：Excel / CSV 文件分析
Fetch：URL 内容提取与 Markdown 格式化
Rethink / Date / Convert / Base64 等通用工具

适用场景

智能体编码与自动化开发：Kimi K2.6 支持 300 子智能体群体编排，适合构建自主完成调试、重构、多步骤开发工作流的 AI 编程智能体，已被 Cursor、Windsurf、Kilo Code 等工具集成。
深度研究与复杂推理：K2 Thinking 模式支持最多 300 步工具调用，适合战略研究、竞品分析、金融报告、学术文献综述等长时序推理任务。
多模态内容理解：K2.6 / K2.5 原生支持图像与视频输入，适合化学公式识别、图表解析、科学文献理解等多模态场景。
长文档分析：moonshot-v1-128k 支持整本书、完整合同、大型代码库的一次性输入，适合法律文档审查、专利分析、代码库理解。
法律与知识产权：模型对细节高度关注，适合合同审查、专利分析与起草，严格遵循术语和逻辑结构。
对话智能分析：擅长高保真对话分析，适合心理咨询质量评估、舆情监控、客户意图检测等场景。
低成本 OpenAI 替代：完全兼容 OpenAI SDK，仅需修改 base_url，K2.5 输入仅 $0.60 / 1M tokens，成本远低于同级别闭源模型。