1M token 上下文
该模型以 1M token 上下文亮相,旨在支撑长上下文工作流中复杂、庞大的编程智能体轨迹以及更长时间的工程任务。
GLM-5.2 是 Z.ai 面向长周期任务的最新旗舰模型。发布文章将其定位为相较于 GLM-5.1 的显著升级,具备稳固的 1M-token 上下文,目标是在长时间的编程智能体工作流中保持稳定表现,而不只是支持更大的提示词。
该产品面向大规模实现、自动化研究、性能优化和复杂调试等持续性工程工作。Z.ai 也将 GLM-5.2 定位为可通过其 API 平台和编程计划使用的模型,并支持智能体和 IDE 工作流。
除上下文长度外,这次发布还强调了架构与执行控制。它引入了用于降低 attention-indexer 开销的 IndexShare、用于 speculative decoding 的改进 MTP 层,以及可让用户在编程场景中平衡性能、延迟和计算成本的 effort-level 设置。
该模型以 1M token 上下文亮相,旨在支撑长上下文工作流中复杂、庞大的编程智能体轨迹以及更长时间的工程任务。
GLM-5.2 增加了明确的 effort-level 控制,使用户可以根据任务在能力、延迟和计算成本之间进行权衡。
发布文章称,IndexShare 会在每四层稀疏注意力层之间复用同一个索引器,从而在 1M 上下文长度下减少每 token 的 FLOPs。
GLM-5.2 改进了用于 speculative decoding 的 MTP 层,来源提到更高的接受长度以及减少训练与推理不一致的训练改动。
该模型被描述为 MIT 开源,没有地域限制,并提供无边界的技术访问。
当编程智能体需要在一个漫长的多步骤工程任务中保持上下文时使用 GLM-5.2,例如构建功能、编辑大型代码库或沿着持续的实现计划反复迭代。
用于涉及大量工件、长日志或长推理链的研究和调试工作流,其中更大的上下文窗口有助于保持连贯性。
当任务在快速响应和更难的问题求解之间切换时使用 effort 控制,以便根据具体情况调整延迟和计算资源。
在将 GLM-5.2 集成到智能体工具和基于 IDE 的开发流程时,使用 API 平台或编程计划,例如 Claude Code、Cline、OpenCode 或 Clawdbot/OpenClaw。
GLM-5.2 被定位为 Z.ai 面向长上下文任务的最新旗舰模型,具备 1M token 上下文以及更强的编程与智能体能力。
来源材料说明,GLM-5.2 可通过 GLM Coding Plan 和 API 平台在 Claude Code、Kilo Code、Cline、OpenCode 以及 Clawdbot/OpenClaw 等工具中用于 AI 编程。
发布文章强调了 1M token 上下文、多种思考 effort-level,以及 IndexShare 和改进的 MTP 层等架构变化,用于支持 speculative decoding。
定价和订阅页面显示,Z.ai 同时提供 API 访问和 GLM Coding Plan,其中包含起价为每月 $18 的付费订阅,以及 API 平台入口。
Ghost 是一款基于终端的 AI 助手,可在命令行中聊天、生成代码并运行任务。内置免费模型,支持 Linux、macOS 和 Windows,且为开源项目。
介绍全球最佳的编码、代理、计算机使用和企业工作流程模型。
AakarDev AI helps teams manage AI provider access, project-level setups, logs, and analytics from one dashboard. It supports BYOK workflows and lists providers including OpenAI, Google Gemini, Anthropic, Groq, Mistral AI, and Perplexity AI.
BookAI允许您通过简单提供书名和作者与您的书籍进行AI聊天。
Skills Janitor is a GitHub-hosted set of slash commands for auditing, tracking, and managing Claude Code and OpenAI Codex skills. It helps users find duplicates, broken links, and unused skills, then clean them up with self-contained commands.
FeelFish is a PC client for AI-assisted novel writing, designed to help fiction writers plan characters and settings, draft and revise long-form content, and manage story context. It includes a free tier and paid plans, with support for multiple large-model providers.