智站集市 logo 智站集市

官方 API

Cohere

Cohere 官方 API 平台,提供 Command A / Command R+ 企业级对话模型、Embed v3 多语言嵌入向量模型和 Rerank 重排序模型,专为企业 RAG 知识库检索、多语言应用和工具调用场景优化,是企业级 AI 基础设施的重要选择。

试用 文本 API 全球 ⭐ 4.3 更新 2026/05/12
文本生成 RAG 嵌入向量 重排序 多语言 工具调用 企业级

Cohere 专注于企业级 AI 基础设施,其模型在 RAG(检索增强生成)、多语言处理和工具调用场景中表现突出。与通用对话模型不同,Cohere 的产品线专为企业搜索、知识库问答和数据分析工作流设计。

对话生成模型(Command 系列)

  • Command A(最新旗舰):

    • 最新旗舰模型,专为企业智能体和工具调用优化,支持复杂 RAG 工作流和多步骤任务执行。
    • 128k 上下文,支持 100+ 语言。
  • Command R+(企业旗舰):

    • 104B 参数,专为复杂 RAG 和多步骤工具调用(智能体)场景设计,开源权重可用。
    • API 定价:输入 $2.50 / 1M tokens,输出 $10.00 / 1M tokens。
  • Command R(均衡):

    • 高精度 RAG 和单步骤工具调用,128k 上下文,支持 10 种核心语言,低延迟高吞吐。
    • API 定价:输入 $0.15 / 1M tokens,输出 $0.60 / 1M tokens。
  • Command R7B(轻量):

    • 7B 参数轻量模型,适合对成本敏感的简单 RAG 和对话场景。
    • API 定价:输入 $0.0375 / 1M tokens,输出 $0.15 / 1M tokens。

嵌入向量模型(Embed v3)

  • Embed v3 Multilingual:多语言嵌入模型,支持 100+ 语言,适合跨语言语义搜索和 RAG 系统。
  • Embed v3 English:英文专用嵌入模型,更高精度,适合英文知识库检索。
  • 支持多种嵌入类型(search_document、search_query、classification、clustering),针对不同任务优化。

重排序模型(Rerank 3.5)

  • 对检索结果进行精准重排序,显著提升 RAG 系统的检索准确率。
  • 支持多语言,适合在向量检索后进行二次精排,提升最终答案质量。

适用场景

  • 企业知识库 RAG:Command R+ 的高精度 RAG 能力 + Embed v3 + Rerank 3.5,构建完整的企业知识库检索问答系统。
  • 多语言企业应用:Embed v3 Multilingual 支持 100+ 语言,适合跨国企业的多语言内容处理。
  • 智能体与工具调用:Command A / R+ 专为多步骤工具调用优化,适合构建企业级 AI 智能体。
  • 低成本高频检索:Command R7B 在简单 RAG 场景下成本极低,适合高并发轻量查询。
  • 搜索质量提升:Rerank 3.5 作为现有搜索系统的增强层,无需重建索引即可提升搜索相关性。