免费体验 | 智谱 GLM-4.5-Air ,轻量高效新选择!
为了让每一位开发者和用户都能轻松体验前沿大模型的能力,智谱向免费为 Cherry Studio 的用户开放了 GLM-4.5-Air 模型。作为专为智能体(Agent)应用打造的高效基础模型,GLM-4.5-Air 在性能与成本之间实现了出色平衡,是构建智能应用的理想选择。
🚀 什么是 GLM-4.5-Air?
GLM-4.5-Air 是智谱最新推出的高性能语言模型,采用先进的混合专家架构(Mixture-of-Experts, MoE),在保持卓越推理能力的同时,显著降低计算资源消耗。
总参数量:1060 亿
激活参数量:120 亿
通过精简设计,GLM-4.5-Air 实现了更高的推理效率,适合在资源受限环境下部署,同时仍能胜任复杂任务处理。

📚 统一训练流程,夯实智能基础
GLM-4.5-Air 与旗舰系列共享一致的训练流程,确保其具备扎实的通用能力基础:
大规模预训练:在高达 15 万亿 token 的通用语料上完成训练,构建广泛的知识理解能力;
专项领域优化:在代码生成、逻辑推理、智能体交互等关键任务上进行强化训练;
长上下文支持:上下文长度扩展至 128K tokens,可处理长文档、复杂对话或大型代码项目;
强化学习增强:通过 RL 优化模型在推理规划、工具调用等方面的决策能力。
这一训练体系为 GLM-4.5-Air 赋予了出色的泛化能力和任务适应性。

⚙️ 专为智能体优化的核心能力
GLM-4.5-Air 针对智能体应用场景进行了深度适配,具备以下实用能力:
✅ 工具调用支持:可通过标准化接口调用外部工具,实现任务自动化 ✅ 网页浏览与信息提取:可配合浏览器插件完成动态内容理解与交互 ✅ 软件工程辅助:支持需求解析、代码生成、缺陷识别与修复 ✅ 前端开发支持:对 HTML、CSS、JavaScript 等前端技术有良好理解与生成能力
该模型可灵活集成至 Claude Code、Roo Code 等代码智能体框架,也可作为任意自定义 Agent 的核心引擎使用。

💡 智能“思考模式”,灵活响应各类请求
GLM-4.5-Air 支持混合推理模式,用户可通过 thinking.type
参数控制是否启用深度思考:
enabled
:启用思考,适合需要分步推理或规划的复杂任务disabled
:禁用思考,用于简单查询或即时响应默认设置为 动态思考模式,模型自动判断是否需要深入分析
简单任务(建议关闭思考)
- 查询“智谱AI的成立时间” - 翻译“I love you”为中文
中等任务(建议启用思考)
- 比较飞机与高铁从北京到上海的优劣 - 解释木星为何有较多卫星
复杂任务(强烈建议启用思考)
- 说明 MoE 模型中专家如何协作 - 基于市场信息分析是否应买入ETF
🌟 高效低成本,部署更轻松
GLM-4.5-Air 在性能与成本之间实现了优秀平衡,特别适合实际业务部署:
⚡ 生成速度超 100 tokens/秒,响应迅速,支持低延迟交互
💰 API 成本极低:输入仅 0.8 元/百万 tokens,输出 2 元/百万 tokens
🖥️ 激活参数少,算力需求低,易于在本地或云端高并发运行
真正实现“高性能、低门槛”的 AI 服务体验。

🧠 聚焦实用能力:智能代码生成
GLM-4.5-Air 在代码生成方面表现稳定,支持:
覆盖 Python、JavaScript、Java 等主流语言
根据自然语言指令生成结构清晰、可维护性强的代码
减少模板化输出,贴近真实开发场景需求
适用于快速原型构建、自动化补全、Bug 修复等高频开发任务。
现在就免费体验 GLM-4.5-Air,开启你的智能体开发之旅! 无论你是想打造自动化助手、编程伴侣,还是探索下一代 AI 应用,GLM-4.5-Air 都将是你高效可靠的 AI 引擎。
📘 立即接入,释放创造力!
最后更新于
这有帮助吗?