官方 API

Cohere

Cohere 官方 API 平台，提供 Command A / Command R+ 企业级对话模型、Embed v3 多语言嵌入向量模型和 Rerank 重排序模型，专为企业 RAG 知识库检索、多语言应用和工具调用场景优化，是企业级 AI 基础设施的重要选择。

试用文本 API 全球 ⭐ 4.3 更新 2026/05/12

文本生成 RAG 嵌入向量重排序多语言工具调用企业级

Cohere 专注于企业级 AI 基础设施，其模型在 RAG（检索增强生成）、多语言处理和工具调用场景中表现突出。与通用对话模型不同，Cohere 的产品线专为企业搜索、知识库问答和数据分析工作流设计。

对话生成模型（Command 系列）

Command A（最新旗舰）：
- 最新旗舰模型，专为企业智能体和工具调用优化，支持复杂 RAG 工作流和多步骤任务执行。
- 128k 上下文，支持 100+ 语言。
Command R+（企业旗舰）：
- 104B 参数，专为复杂 RAG 和多步骤工具调用（智能体）场景设计，开源权重可用。
- API 定价：输入 $2.50 / 1M tokens，输出 $10.00 / 1M tokens。
Command R（均衡）：
- 高精度 RAG 和单步骤工具调用，128k 上下文，支持 10 种核心语言，低延迟高吞吐。
- API 定价：输入 $0.15 / 1M tokens，输出 $0.60 / 1M tokens。
Command R7B（轻量）：
- 7B 参数轻量模型，适合对成本敏感的简单 RAG 和对话场景。
- API 定价：输入 $0.0375 / 1M tokens，输出 $0.15 / 1M tokens。

嵌入向量模型（Embed v3）

Embed v3 Multilingual：多语言嵌入模型，支持 100+ 语言，适合跨语言语义搜索和 RAG 系统。
Embed v3 English：英文专用嵌入模型，更高精度，适合英文知识库检索。
支持多种嵌入类型（search_document、search_query、classification、clustering），针对不同任务优化。

重排序模型（Rerank 3.5）

对检索结果进行精准重排序，显著提升 RAG 系统的检索准确率。
支持多语言，适合在向量检索后进行二次精排，提升最终答案质量。

适用场景

企业知识库 RAG：Command R+ 的高精度 RAG 能力 + Embed v3 + Rerank 3.5，构建完整的企业知识库检索问答系统。
多语言企业应用：Embed v3 Multilingual 支持 100+ 语言，适合跨国企业的多语言内容处理。
智能体与工具调用：Command A / R+ 专为多步骤工具调用优化，适合构建企业级 AI 智能体。
低成本高频检索：Command R7B 在简单 RAG 场景下成本极低，适合高并发轻量查询。
搜索质量提升：Rerank 3.5 作为现有搜索系统的增强层，无需重建索引即可提升搜索相关性。