# ZAi

Z AI（前身为智谱 AI）提供开创性的 GLM-4.5 系列，具有混合推理能力和代理 AI 设计。这些模型于 2025 年 7 月发布，在统一推理、编码和智能代理应用方面表现卓越，同时在 MIT 许可下保持开源可访问性。

**网站：** <https://z.ai/model-api>（国际） | <https://open.bigmodel.cn/>（中国）

#### 获取 API 密钥

**国际用户**

1. **注册/登录：** 前往 <https://z.ai/model-api>。创建账户或登录。
2. **导航到 API 密钥：** 访问您的账户仪表板并找到 API 密钥部分。
3. **创建密钥：** 为您的应用程序生成新的 API 密钥。
4. **复制密钥：** 立即复制 API 密钥并安全存储。

**中国大陆用户**

1. **注册/登录：** 前往 <https://open.bigmodel.cn/>。创建账户或登录。
2. **导航到 API 密钥：** 访问您的账户仪表板并找到 API 密钥部分。
3. **创建密钥：** 为您的应用程序生成新的 API 密钥。
4. **复制密钥：** 立即复制 API 密钥并安全存储。

#### 支持的模型

Z AI 根据您选择的区域提供不同的模型目录：

**GLM-4.5 系列**

* **GLM-4.5** - 旗舰模型，具有 355B 总参数、32B 活跃参数
* **GLM-4.5-Air** - 紧凑型模型，具有 106B 总参数、12B 活跃参数

**GLM-4.5 混合推理模型**

* **GLM-4.5（思考模式）** - 具有逐步分析的高级推理
* **GLM-4.5-Air（思考模式）** - 针对主流硬件的高效推理

所有模型具有以下特性：

* **128,000 token 上下文窗口**用于广泛的文档处理
* **混合专家（MoE）架构**以获得最佳性能
* **代理原生设计**集成推理、编码和工具使用
* **MIT 许可下的开源可用性**

#### 在 Cline 中配置

1. **打开 Cline 设置：** 点击 Cline 面板中的设置图标（⚙️）。
2. **选择提供商：** 从"API 提供商"下拉菜单中选择"Z AI"。
3. **选择区域：** 选择您的区域：
   * "International"用于全球访问
   * "China"用于中国大陆访问
4. **输入 API 密钥：** 将您的 Z AI API 密钥粘贴到"Z AI API 密钥"字段中。
5. **选择模型：** 从"模型"下拉菜单中选择所需的模型。

#### GLM 编码计划

Z AI 提供专为编码应用设计的订阅计划。这些计划通过基于提示词的结构而不是传统的 API 使用计费，为 GLM-4.5 模型提供经济高效的访问。

**计划选项**

**GLM Coding Lite** - $3/月

* 每个 5 小时周期 120 次提示词
* 访问 GLM-4.5 模型
* 专门通过 Cline 等编码工具使用

**GLM Coding Pro** - $15/月

* 每个 5 小时周期 600 次提示词
* 访问 GLM-4.5 模型
* 专门通过 Cline 等编码工具使用

两个计划都提供首月促销定价：Lite 从 $6 降至 $3，Pro 从 $30 降至 $15。

![zAI 订阅页面，显示 GLM Coding Lite 和 Pro 计划及其定价](https://storage.googleapis.com/cline_public_images/docs/assets/zAI-coding-plan.png)

**设置 GLM 编码计划**

要使用 Cline 的 GLM 编码计划：

1. **订阅：** 前往 <https://z.ai/subscribe>并选择您的计划。
2. **创建 API 密钥：** 订阅后，登录您的 zAI 仪表板并为您的编码计划创建 API 密钥。
3. **在 Cline 中配置：** 打开 Cline 设置，选择"Z AI"作为您的提供商，并将您的 API 密钥粘贴到"Z AI API 密钥"字段中。

![Cline 设置，已选择 zAI 提供商并突出显示 API 密钥字段](https://storage.googleapis.com/cline_public_images/docs/assets/zAI-provider.png)

此设置将您的订阅直接连接到 Cline，让您能够访问针对编码工作流优化的 GLM-4.5 工具调用能力。

#### Z AI 的混合智能

Z AI 的 GLM-4.5 系列引入了使其区别于传统语言模型的革命性功能：

**混合推理架构**

GLM-4.5 以两种不同模式运行：

* **思考模式：** 专为复杂推理任务和工具使用而设计，参与更深入的分析过程
* **非思考模式：** 为简单查询提供即时响应，优化效率

这种双模式架构代表"代理原生"设计理念，根据查询复杂度调整处理强度。

**卓越性能**

GLM-4.5 在跨越代理任务、推理和编码挑战的 12 个基准测试中获得了**63.2** 的综合得分，在所有专有和开源模型中位列**第 3 名**。GLM-4.5-Air 在提供卓越效率的同时保持了**59.8** 的竞争性性能。

**混合专家卓越**

复杂的 MoE 架构在保持计算效率的同时优化性能：

* **GLM-4.5：** 355B 总参数，32B 活跃参数
* **GLM-4.5-Air：** 106B 总参数，12B 活跃参数

**扩展上下文能力**

128,000-token 上下文窗口能够全面理解长文档和代码库，实际测试确认在保持卓越性能的同时能够有效处理近 2,000 行的代码库。

**开源领导地位**

在 MIT 许可下发布，GLM-4.5 为研究人员和开发者提供访问最先进能力的权限，没有专有限制，包括基础模型、混合推理版本和优化的 FP8 变体。

#### 区域优化

**API 端点**

* **国际：** 使用 `https://api.z.ai/api/paas/v4`
* **中国：** 使用 `https://open.bigmodel.cn/api/paas/v4`

**模型可用性**

区域设置决定了 API 端点和可用模型，自动过滤以确保与您选择的区域兼容。

#### 特殊功能

**代理能力**

GLM-4.5 的统一架构使其特别适合需要集成推理、编码和工具利用能力的复杂智能代理应用。

**综合基准测试**

性能评估包括：

* **3 个代理任务基准测试**
* **7 个推理基准测试**
* **2 个编码基准测试**

这种综合评估展示了在多样化 AI 应用中的多功能性。

**开发者集成**

模型支持通过多个框架进行集成：

* **transformers**
* **vLLM**
* **SGLang**

提供完整的模型代码、工具解析器和推理解析器实现。

#### 性能比较

**对比 Claude 4 Sonnet**

GLM-4.5 在代理编码和推理任务中表现出竞争性性能，尽管 Claude Sonnet 4 在编码成功率和自主多功能应用开发方面保持优势。

**对比 GPT-4.5**

GLM-4.5 在推理和代理基准测试中排名竞争性，而 GPT-4.5 通常在 MMLU 和 AIME 等专业基准测试的原始任务准确性方面领先。

#### 提示和说明

* **区域选择：** 选择适当的区域以获得最佳性能并符合当地法规。
* **模型选择：** GLM-4.5 用于最大性能，GLM-4.5-Air 用于效率和主流硬件兼容性。
* **上下文优势：** 大型 128K 上下文窗口能够处理大量代码库和文档。
* **开源优势：** MIT 许可既支持商业使用，也支持二次开发。
* **代理应用：** 对于需要推理、编码和工具使用集成的应用特别强大。
* **混合推理：** 对复杂问题使用思考模式，对简单查询使用非思考模式。
* **API 兼容性：** OpenAI 兼容的 API 提供流式响应和使用报告。
* **框架支持：** 为不同的部署场景提供多个集成选项。


---

# Agent Instructions: Querying This Documentation

If you need additional information that is not directly available in this page, you can query the documentation dynamically by asking a question.

Perform an HTTP GET request on the current page URL with the `ask` query parameter:

```
GET https://hybridtalentcomputing.gitbook.io/cline-chinese-doc/zai.md?ask=<question>
```

The question should be specific, self-contained, and written in natural language.
The response will contain a direct answer to the question and relevant excerpts and sources from the documentation.

Use this mechanism when the answer is not explicitly present in the current page, you need clarification or additional context, or you want to retrieve related documentation sections.