免费体验 | 智谱 GLM-4.5-Air ,轻量高效新选择!

为了让每一位开发者和用户都能轻松体验前沿大模型的能力,智谱向免费为 Cherry Studio 的用户开放了 GLM-4.5-Air 模型。作为专为智能体(Agent)应用打造的高效基础模型,GLM-4.5-Air 在性能与成本之间实现了出色平衡,是构建智能应用的理想选择。


🚀 什么是 GLM-4.5-Air?

GLM-4.5-Air 是智谱最新推出的高性能语言模型,采用先进的混合专家架构(Mixture-of-Experts, MoE),在保持卓越推理能力的同时,显著降低计算资源消耗。

  • 总参数量:1060 亿

  • 激活参数量:120 亿

通过精简设计,GLM-4.5-Air 实现了更高的推理效率,适合在资源受限环境下部署,同时仍能胜任复杂任务处理。


📚 统一训练流程,夯实智能基础

GLM-4.5-Air 与旗舰系列共享一致的训练流程,确保其具备扎实的通用能力基础:

  1. 大规模预训练:在高达 15 万亿 token 的通用语料上完成训练,构建广泛的知识理解能力;

  2. 专项领域优化:在代码生成、逻辑推理、智能体交互等关键任务上进行强化训练;

  3. 长上下文支持:上下文长度扩展至 128K tokens,可处理长文档、复杂对话或大型代码项目;

  4. 强化学习增强:通过 RL 优化模型在推理规划、工具调用等方面的决策能力。

这一训练体系为 GLM-4.5-Air 赋予了出色的泛化能力和任务适应性。


⚙️ 专为智能体优化的核心能力

GLM-4.5-Air 针对智能体应用场景进行了深度适配,具备以下实用能力:

工具调用支持:可通过标准化接口调用外部工具,实现任务自动化 ✅ 网页浏览与信息提取:可配合浏览器插件完成动态内容理解与交互 ✅ 软件工程辅助:支持需求解析、代码生成、缺陷识别与修复 ✅ 前端开发支持:对 HTML、CSS、JavaScript 等前端技术有良好理解与生成能力

该模型可灵活集成至 Claude Code、Roo Code 等代码智能体框架,也可作为任意自定义 Agent 的核心引擎使用。


💡 智能“思考模式”,灵活响应各类请求

GLM-4.5-Air 支持混合推理模式,用户可通过 thinking.type 参数控制是否启用深度思考:

  • enabled:启用思考,适合需要分步推理或规划的复杂任务

  • disabled:禁用思考,用于简单查询或即时响应

  • 默认设置为 动态思考模式,模型自动判断是否需要深入分析

任务类型
示例

简单任务(建议关闭思考)

- 查询“智谱AI的成立时间” - 翻译“I love you”为中文

中等任务(建议启用思考)

- 比较飞机与高铁从北京到上海的优劣 - 解释木星为何有较多卫星

复杂任务(强烈建议启用思考)

- 说明 MoE 模型中专家如何协作 - 基于市场信息分析是否应买入ETF


🌟 高效低成本,部署更轻松

GLM-4.5-Air 在性能与成本之间实现了优秀平衡,特别适合实际业务部署:

  • 生成速度超 100 tokens/秒,响应迅速,支持低延迟交互

  • 💰 API 成本极低:输入仅 0.8 元/百万 tokens,输出 2 元/百万 tokens

  • 🖥️ 激活参数少,算力需求低,易于在本地或云端高并发运行

真正实现“高性能、低门槛”的 AI 服务体验。


🧠 聚焦实用能力:智能代码生成

GLM-4.5-Air 在代码生成方面表现稳定,支持:

  • 覆盖 Python、JavaScript、Java 等主流语言

  • 根据自然语言指令生成结构清晰、可维护性强的代码

  • 减少模板化输出,贴近真实开发场景需求

适用于快速原型构建、自动化补全、Bug 修复等高频开发任务。


现在就免费体验 GLM-4.5-Air,开启你的智能体开发之旅! 无论你是想打造自动化助手、编程伴侣,还是探索下一代 AI 应用,GLM-4.5-Air 都将是你高效可靠的 AI 引擎。

📘 立即接入,释放创造力!

最后更新于

这有帮助吗?