ZAi

了解如何配置和使用 Z AI 的 GLM-4.5 模型与 Cline。体验高级混合推理、代理能力和区域优化的开源卓越表现。

Z AI(前身为智谱 AI)提供开创性的 GLM-4.5 系列,具有混合推理能力和代理 AI 设计。这些模型于 2025 年 7 月发布,在统一推理、编码和智能代理应用方面表现卓越,同时在 MIT 许可下保持开源可访问性。

网站: https://z.ai/model-apiarrow-up-right(国际) | https://open.bigmodel.cn/arrow-up-right(中国)

获取 API 密钥

国际用户

  1. 注册/登录: 前往 https://z.ai/model-apiarrow-up-right。创建账户或登录。

  2. 导航到 API 密钥: 访问您的账户仪表板并找到 API 密钥部分。

  3. 创建密钥: 为您的应用程序生成新的 API 密钥。

  4. 复制密钥: 立即复制 API 密钥并安全存储。

中国大陆用户

  1. 注册/登录: 前往 https://open.bigmodel.cn/arrow-up-right。创建账户或登录。

  2. 导航到 API 密钥: 访问您的账户仪表板并找到 API 密钥部分。

  3. 创建密钥: 为您的应用程序生成新的 API 密钥。

  4. 复制密钥: 立即复制 API 密钥并安全存储。

支持的模型

Z AI 根据您选择的区域提供不同的模型目录:

GLM-4.5 系列

  • GLM-4.5 - 旗舰模型,具有 355B 总参数、32B 活跃参数

  • GLM-4.5-Air - 紧凑型模型,具有 106B 总参数、12B 活跃参数

GLM-4.5 混合推理模型

  • GLM-4.5(思考模式) - 具有逐步分析的高级推理

  • GLM-4.5-Air(思考模式) - 针对主流硬件的高效推理

所有模型具有以下特性:

  • 128,000 token 上下文窗口用于广泛的文档处理

  • 混合专家(MoE)架构以获得最佳性能

  • 代理原生设计集成推理、编码和工具使用

  • MIT 许可下的开源可用性

在 Cline 中配置

  1. 打开 Cline 设置: 点击 Cline 面板中的设置图标(⚙️)。

  2. 选择提供商: 从"API 提供商"下拉菜单中选择"Z AI"。

  3. 选择区域: 选择您的区域:

    • "International"用于全球访问

    • "China"用于中国大陆访问

  4. 输入 API 密钥: 将您的 Z AI API 密钥粘贴到"Z AI API 密钥"字段中。

  5. 选择模型: 从"模型"下拉菜单中选择所需的模型。

GLM 编码计划

Z AI 提供专为编码应用设计的订阅计划。这些计划通过基于提示词的结构而不是传统的 API 使用计费,为 GLM-4.5 模型提供经济高效的访问。

计划选项

GLM Coding Lite - $3/月

  • 每个 5 小时周期 120 次提示词

  • 访问 GLM-4.5 模型

  • 专门通过 Cline 等编码工具使用

GLM Coding Pro - $15/月

  • 每个 5 小时周期 600 次提示词

  • 访问 GLM-4.5 模型

  • 专门通过 Cline 等编码工具使用

两个计划都提供首月促销定价:Lite 从 $6 降至 $3,Pro 从 $30 降至 $15。

zAI 订阅页面,显示 GLM Coding Lite 和 Pro 计划及其定价

设置 GLM 编码计划

要使用 Cline 的 GLM 编码计划:

  1. 订阅: 前往 https://z.ai/subscribearrow-up-right并选择您的计划。

  2. 创建 API 密钥: 订阅后,登录您的 zAI 仪表板并为您的编码计划创建 API 密钥。

  3. 在 Cline 中配置: 打开 Cline 设置,选择"Z AI"作为您的提供商,并将您的 API 密钥粘贴到"Z AI API 密钥"字段中。

Cline 设置,已选择 zAI 提供商并突出显示 API 密钥字段

此设置将您的订阅直接连接到 Cline,让您能够访问针对编码工作流优化的 GLM-4.5 工具调用能力。

Z AI 的混合智能

Z AI 的 GLM-4.5 系列引入了使其区别于传统语言模型的革命性功能:

混合推理架构

GLM-4.5 以两种不同模式运行:

  • 思考模式: 专为复杂推理任务和工具使用而设计,参与更深入的分析过程

  • 非思考模式: 为简单查询提供即时响应,优化效率

这种双模式架构代表"代理原生"设计理念,根据查询复杂度调整处理强度。

卓越性能

GLM-4.5 在跨越代理任务、推理和编码挑战的 12 个基准测试中获得了63.2 的综合得分,在所有专有和开源模型中位列第 3 名。GLM-4.5-Air 在提供卓越效率的同时保持了59.8 的竞争性性能。

混合专家卓越

复杂的 MoE 架构在保持计算效率的同时优化性能:

  • GLM-4.5: 355B 总参数,32B 活跃参数

  • GLM-4.5-Air: 106B 总参数,12B 活跃参数

扩展上下文能力

128,000-token 上下文窗口能够全面理解长文档和代码库,实际测试确认在保持卓越性能的同时能够有效处理近 2,000 行的代码库。

开源领导地位

在 MIT 许可下发布,GLM-4.5 为研究人员和开发者提供访问最先进能力的权限,没有专有限制,包括基础模型、混合推理版本和优化的 FP8 变体。

区域优化

API 端点

  • 国际: 使用 https://api.z.ai/api/paas/v4

  • 中国: 使用 https://open.bigmodel.cn/api/paas/v4

模型可用性

区域设置决定了 API 端点和可用模型,自动过滤以确保与您选择的区域兼容。

特殊功能

代理能力

GLM-4.5 的统一架构使其特别适合需要集成推理、编码和工具利用能力的复杂智能代理应用。

综合基准测试

性能评估包括:

  • 3 个代理任务基准测试

  • 7 个推理基准测试

  • 2 个编码基准测试

这种综合评估展示了在多样化 AI 应用中的多功能性。

开发者集成

模型支持通过多个框架进行集成:

  • transformers

  • vLLM

  • SGLang

提供完整的模型代码、工具解析器和推理解析器实现。

性能比较

对比 Claude 4 Sonnet

GLM-4.5 在代理编码和推理任务中表现出竞争性性能,尽管 Claude Sonnet 4 在编码成功率和自主多功能应用开发方面保持优势。

对比 GPT-4.5

GLM-4.5 在推理和代理基准测试中排名竞争性,而 GPT-4.5 通常在 MMLU 和 AIME 等专业基准测试的原始任务准确性方面领先。

提示和说明

  • 区域选择: 选择适当的区域以获得最佳性能并符合当地法规。

  • 模型选择: GLM-4.5 用于最大性能,GLM-4.5-Air 用于效率和主流硬件兼容性。

  • 上下文优势: 大型 128K 上下文窗口能够处理大量代码库和文档。

  • 开源优势: MIT 许可既支持商业使用,也支持二次开发。

  • 代理应用: 对于需要推理、编码和工具使用集成的应用特别强大。

  • 混合推理: 对复杂问题使用思考模式,对简单查询使用非思考模式。

  • API 兼容性: OpenAI 兼容的 API 提供流式响应和使用报告。

  • 框架支持: 为不同的部署场景提供多个集成选项。

Last updated