# 智谱 GLM-4.5-Air

为了让每一位开发者和用户都能轻松体验前沿大模型的能力，**智谱向免费为 Cherry Studio 的用户开放了 GLM-4.5-Air 模型**。作为专为智能体（Agent）应用打造的高效基础模型，GLM-4.5-Air 在性能与成本之间实现了出色平衡，是构建智能应用的理想选择。

***

**🚀 什么是 GLM-4.5-Air？**

GLM-4.5-Air 是智谱最新推出的高性能语言模型，采用先进的**混合专家架构（Mixture-of-Experts, MoE）**，在保持卓越推理能力的同时，显著降低计算资源消耗。

* **总参数量：1060 亿**
* **激活参数量：120 亿**

通过精简设计，GLM-4.5-Air 实现了更高的推理效率，适合在资源受限环境下部署，同时仍能胜任复杂任务处理。

<figure><img src="/files/bqm8M8OhkwKDLFrcKuiX" alt=""><figcaption></figcaption></figure>

***

**📚 统一训练流程，夯实智能基础**

GLM-4.5-Air 与旗舰系列共享一致的训练流程，确保其具备扎实的通用能力基础：

1. **大规模预训练**：在高达 **15 万亿 token 的通用语料**上完成训练，构建广泛的知识理解能力；
2. **专项领域优化**：在代码生成、逻辑推理、智能体交互等关键任务上进行强化训练；
3. **长上下文支持**：上下文长度扩展至 **128K tokens**，可处理长文档、复杂对话或大型代码项目；
4. **强化学习增强**：通过 RL 优化模型在推理规划、工具调用等方面的决策能力。

这一训练体系为 GLM-4.5-Air 赋予了出色的泛化能力和任务适应性。

<figure><img src="/files/8iadvfK5aMWwGiBZPOzQ" alt=""><figcaption></figcaption></figure>

***

**⚙️ 专为智能体优化的核心能力**

GLM-4.5-Air 针对智能体应用场景进行了深度适配，具备以下实用能力：

✅ **工具调用支持**：可通过标准化接口调用外部工具，实现任务自动化\
✅ **网页浏览与信息提取**：可配合浏览器插件完成动态内容理解与交互\
✅ **软件工程辅助**：支持需求解析、代码生成、缺陷识别与修复\
✅ **前端开发支持**：对 HTML、CSS、JavaScript 等前端技术有良好理解与生成能力

该模型可灵活集成至 **Claude Code、Roo Code** 等代码智能体框架，也可作为任意自定义 Agent 的核心引擎使用。

<figure><img src="/files/tmbN17vpPgSfc92aJE9w" alt=""><figcaption></figcaption></figure>

***

**💡 智能“思考模式”，灵活响应各类请求**

GLM-4.5-Air 支持**混合推理模式**，用户可通过 `thinking.type` 参数控制是否启用深度思考：

* `enabled`：启用思考，适合需要分步推理或规划的复杂任务
* `disabled`：禁用思考，用于简单查询或即时响应
* 默认设置为 **动态思考模式**，模型自动判断是否需要深入分析

| 任务类型               | 示例                                              |
| ------------------ | ----------------------------------------------- |
| **简单任务**（建议关闭思考）   | <p>- 查询“智谱AI的成立时间”<br>- 翻译“I love you”为中文</p>   |
| **中等任务**（建议启用思考）   | <p>- 比较飞机与高铁从北京到上海的优劣<br>- 解释木星为何有较多卫星</p>      |
| **复杂任务**（强烈建议启用思考） | <p>- 说明 MoE 模型中专家如何协作<br>- 基于市场信息分析是否应买入ETF</p> |

***

**🌟 高效低成本，部署更轻松**

GLM-4.5-Air 在性能与成本之间实现了优秀平衡，特别适合实际业务部署：

* ⚡ **生成速度超 100 tokens/秒**，响应迅速，支持低延迟交互
* 💰 **API 成本极低**：输入仅 **0.8 元/百万 tokens**，输出 **2 元/百万 tokens**
* 🖥️ 激活参数少，算力需求低，易于在本地或云端高并发运行

真正实现“高性能、低门槛”的 AI 服务体验。

<figure><img src="/files/XEWLcSffwCImhpFQ5qaG" alt=""><figcaption></figcaption></figure>

***

**🧠 聚焦实用能力：智能代码生成**

GLM-4.5-Air 在代码生成方面表现稳定，支持：

* 覆盖 **Python、JavaScript、Java** 等主流语言
* 根据自然语言指令生成**结构清晰、可维护性强**的代码
* 减少模板化输出，贴近真实开发场景需求

适用于快速原型构建、自动化补全、Bug 修复等高频开发任务。

***

现在就免费体验 **GLM-4.5-Air**，开启你的智能体开发之旅！\
无论你是想打造自动化助手、编程伴侣，还是探索下一代 AI 应用，GLM-4.5-Air 都将是你高效可靠的 AI 引擎。

📘 立即接入，释放创造力！


---

# Agent Instructions: Querying This Documentation

If you need additional information that is not directly available in this page, you can query the documentation dynamically by asking a question.

Perform an HTTP GET request on the current page URL with the `ask` query parameter:

```
GET https://docs.cherry-ai.com/pre-basic/providers/cherryai/mian-fei-ti-yan-zhi-pu-glm4.5air-qing-liang-gao-xiao-xin-xuan-ze.md?ask=<question>
```

The question should be specific, self-contained, and written in natural language.
The response will contain a direct answer to the question and relevant excerpts and sources from the documentation.

Use this mechanism when the answer is not explicitly present in the current page, you need clarification or additional context, or you want to retrieve related documentation sections.
