智谱 GLM-4.5-Air

为了让每一位开发者和用户都能轻松体验前沿大模型的能力，智谱向免费为 Cherry Studio 的用户开放了 GLM-4.5-Air 模型。作为专为智能体（Agent）应用打造的高效基础模型，GLM-4.5-Air 在性能与成本之间实现了出色平衡，是构建智能应用的理想选择。

🚀 什么是 GLM-4.5-Air？

GLM-4.5-Air 是智谱最新推出的高性能语言模型，采用先进的混合专家架构（Mixture-of-Experts, MoE），在保持卓越推理能力的同时，显著降低计算资源消耗。

总参数量：1060 亿
激活参数量：120 亿

通过精简设计，GLM-4.5-Air 实现了更高的推理效率，适合在资源受限环境下部署，同时仍能胜任复杂任务处理。

📚 统一训练流程，夯实智能基础

GLM-4.5-Air 与旗舰系列共享一致的训练流程，确保其具备扎实的通用能力基础：

大规模预训练：在高达 15 万亿 token 的通用语料上完成训练，构建广泛的知识理解能力；
专项领域优化：在代码生成、逻辑推理、智能体交互等关键任务上进行强化训练；
长上下文支持：上下文长度扩展至 128K tokens，可处理长文档、复杂对话或大型代码项目；
强化学习增强：通过 RL 优化模型在推理规划、工具调用等方面的决策能力。

这一训练体系为 GLM-4.5-Air 赋予了出色的泛化能力和任务适应性。

⚙️ 专为智能体优化的核心能力

GLM-4.5-Air 针对智能体应用场景进行了深度适配，具备以下实用能力：

✅ 工具调用支持：可通过标准化接口调用外部工具，实现任务自动化 ✅ 网页浏览与信息提取：可配合浏览器插件完成动态内容理解与交互 ✅ 软件工程辅助：支持需求解析、代码生成、缺陷识别与修复 ✅ 前端开发支持：对 HTML、CSS、JavaScript 等前端技术有良好理解与生成能力

该模型可灵活集成至 Claude Code、Roo Code 等代码智能体框架，也可作为任意自定义 Agent 的核心引擎使用。

💡 智能“思考模式”，灵活响应各类请求

GLM-4.5-Air 支持混合推理模式，用户可通过 thinking.type 参数控制是否启用深度思考：

enabled：启用思考，适合需要分步推理或规划的复杂任务
disabled：禁用思考，用于简单查询或即时响应
默认设置为 动态思考模式，模型自动判断是否需要深入分析

任务类型

示例

简单任务（建议关闭思考）

- 查询“智谱AI的成立时间” - 翻译“I love you”为中文

中等任务（建议启用思考）

- 比较飞机与高铁从北京到上海的优劣 - 解释木星为何有较多卫星

复杂任务（强烈建议启用思考）

- 说明 MoE 模型中专家如何协作 - 基于市场信息分析是否应买入ETF

🌟 高效低成本，部署更轻松

GLM-4.5-Air 在性能与成本之间实现了优秀平衡，特别适合实际业务部署：

⚡ 生成速度超 100 tokens/秒，响应迅速，支持低延迟交互
💰 API 成本极低：输入仅 0.8 元/百万 tokens，输出 2 元/百万 tokens
🖥️ 激活参数少，算力需求低，易于在本地或云端高并发运行

真正实现“高性能、低门槛”的 AI 服务体验。

🧠 聚焦实用能力：智能代码生成

GLM-4.5-Air 在代码生成方面表现稳定，支持：

覆盖 Python、JavaScript、Java 等主流语言
根据自然语言指令生成结构清晰、可维护性强的代码
减少模板化输出，贴近真实开发场景需求

适用于快速原型构建、自动化补全、Bug 修复等高频开发任务。

现在就免费体验 GLM-4.5-Air，开启你的智能体开发之旅！无论你是想打造自动化助手、编程伴侣，还是探索下一代 AI 应用，GLM-4.5-Air 都将是你高效可靠的 AI 引擎。

📘 立即接入，释放创造力！

上一页CherryAI (免费)下一页Qwen3-8B

最后更新于1个月前

这有帮助吗？