智谱 AI Z.AI 平台提供开箱即用的全模态 AI 模型服务,GLM 系列覆盖文本推理、视觉理解、图片生成、视频生成、语音识别等全链路能力。多个模型提供限时免费额度,Flash 系列完全免费。
GLM 文本与推理系列
-
GLM-5.1(旗舰代码智能体,2026 年 3 月发布):
- 下一代旗舰模型,专为智能体工程设计,代码能力显著强于 GLM-5,在 SWE-Bench Pro 和 Terminal-Bench 2 上达到业界领先水平。
- 支持 200k 上下文,适合复杂代码库理解与多步骤智能体任务。
- API 定价:输入 $1.4 / 1M tokens,输出 $4.4 / 1M tokens,限时免费缓存命中 $0.26。
-
GLM-5(旗舰推理):
- 744B 总参数(40B 激活),预训练数据 28.5T tokens,集成 DeepSeek Sparse Attention 降低部署成本。
- 适合复杂系统工程和长时序智能体任务。
- API 定价:输入 $1.0 / 1M tokens,输出 $3.2 / 1M tokens。
-
GLM-5-Turbo(均衡推理):
- 深度推理模型,200k 上下文,在推理速度与效果之间取得平衡。
- API 定价:输入 $1.2 / 1M tokens,输出 $4.0 / 1M tokens。
-
GLM-4.7(高性价比):
- 效果与成本均衡,适合大多数生产场景。API 定价:输入 $0.6 / 1M tokens,输出 $2.2 / 1M tokens。
-
GLM-4.7-Flash / GLM-4.5-Flash(完全免费):
- 轻量快速模型,完全免费,适合高并发简单任务。
视觉理解系列
- GLM-5V-Turbo:旗舰视觉语言模型,支持图文混合输入,适合图片描述、文档解析、票据识别。输入 $1.2 / 1M tokens,输出 $4.0 / 1M tokens。
- GLM-OCR:文档智能专用模型,$0.03 / 1M tokens,适合高精度 OCR 和文档理解。
- GLM-4.6V-Flash:视觉理解免费模型。
图片生成
- GLM-Image:$0.015 / 张,高质量文生图。
- CogView-4:$0.01 / 张,高性价比图片生成,适合批量素材创作。
视频生成
- CogVideoX-3:$0.2 / 视频,文生视频,适合内容创作平台。
- Vidu Q1(文生视频 / 图生视频 / 首尾帧):$0.4 / 视频,支持多种输入模式,画质更高。
- Vidu 2(图生视频 / 首尾帧 / 参考视频):$0.2 ~ 0.4 / 视频,灵活的视频生成选项。
语音与其他
- GLM-ASR-2512(语音识别):$0.03 / 1M tokens(约 $0.0024 / 分钟),适合会议记录、字幕生成。
- GLM Slide/Poster Agent:PPT 和海报智能生成智能体,$0.7 / 1M tokens。
- 联网搜索工具:$0.01 / 次,可与文本模型组合使用。
适用场景
- 智能体编码与代码库理解:GLM-5.1 在 SWE-Bench Pro 上表现领先,适合构建自主完成多步骤编程任务的 AI 智能体。
- 复杂推理与分析:GLM-5 / GLM-5-Turbo 适合数学推导、法律分析、科研文献综述等高难度任务。
- 多模态内容理解:GLM-5V-Turbo 处理图文混合输入,GLM-OCR 专攻文档智能。
- 内容生成全链路:图片(CogView-4)+ 视频(Vidu Q1)+ 语音(GLM-ASR),一站式多媒体内容生产。
- 国内合规场景:数据不出境,满足金融、医疗、政务等行业合规需求。
- 低成本高频调用:GLM-4.7-Flash / GLM-4.5-Flash 完全免费,适合简单分类、摘要等高并发轻量任务。