GLM-5.2 вышел: Zhipu открыла доступ к самой мощной открытой модели — 1M контекст, MIT-лицензия и открытый исходный код на следующей неделе
Основной чат
Чат для вайбкодеров: новости, гайды, поиск исполнителей, маркетплейс и разбор реальных кейсов.
13 июня 2026 года в 17:21 по пекинскому времени Zhipu AI (международный бренд Z.ai) открыла доступ к GLM-5.2 для всех пользователей GLM Coding Plan — тарифов Lite, Pro, Max и Team. По заявлению компании, это самая мощная открытая модель в их истории. API выйдет на следующей неделе, тогда же модель будет опубликована в open-source под лицензией MIT.
Релиз состоялся ровно через семь дней после появления первых сигналов внутреннего тестирования в сети — Z.ai придерживается этого ритма с точностью метронома: GLM-4.7, GLM-5.0, GLM-5.1 все вышли в публичный доступ через 7 дней после начала бета-тестирования.
Что известно о GLM-5.2
Официальная информация на момент публикации немногословна, но конкретна.
1M контекст — реально работающий. Zhipu характеризует GLM-5.2 как модель с «真正可用的 1M 上下文» — «реально используемым 1M контекстом». Это важная оговорка: многие модели заявляют большое контекстное окно, но на практике качество резко падает на дальних дистанциях. Zhipu явно позиционирует 1M как функциональную возможность, а не маркетинговый показатель.
Лидерство в длинных задачах. Компания заявляет, что GLM-5.2 «продолжает лидировать в длинных задачах» (long-range tasks). Это прямое продолжение вектора GLM-5.1, которая акцентировалась на длинных агентных сценариях.
MIT-лицензия, open-source на следующей неделе. Модель выйдет в открытый исходный код под MIT на следующей неделе — без ограничений на коммерческое использование, файн-тюнинг и самостоятельный хостинг.
API на следующей неделе. Разработчики, не использующие GLM Coding Plan, смогут подключиться через API со следующей недели.
Контекст: как Zhipu добралась до GLM-5.2 за 4 месяца
Чтобы понять значимость этого релиза, нужно понимать откуда он вырос.
GLM-5: февральский прорыв
11 февраля 2026 года, за несколько дней до китайского Нового года, Z.ai выпустила GLM-5 — и это был настоящий разрыв с предыдущим поколением. Модель выросла с 355 миллиардов параметров (32B активных) до 744 миллиардов (40B активных). Предобучающий датасет — с 23T до 28.5T токенов. Архитектура переключилась на DeepSeek Sparse Attention для эффективной работы с длинным контекстом, поддерживая окно в 200K токенов.
Стратегически важный факт: GLM-5 обучен целиком на чипах Huawei Ascend с использованием фреймворка MindSpore — без единого чипа NVIDIA. В условиях американских санкций на экспорт GPU это не просто техническое решение, а политическое заявление.
Акции Zhipu на Гонконгской бирже в течение трёх дней после релиза выросли на 60%. Одновременно с выпуском модели компания подняла цены на GLM Coding Plan на 30%.
GLM-5.1: апрельское ускорение
В марте GLM-5.1 был открыт подписчикам, 8 апреля — опубликован в open-source. Главный результат: прирост качества кодирования на 30% относительно GLM-5, вплотную приближаясь к Claude Opus 4.6 на бенчмарках SWE-bench Verified, HLE и BrowseComp.
Скорость вывода — 68 токенов в секунду. Стоимость — $3 за миллион токенов.
GLM-5.1 High-Speed: майский сюрприз
В мае Zhipu выпустила «высокоскоростную» версию GLM-5.1 — 400 токенов в секунду. Почти в 6 раз быстрее базовой. Для агентных сценариев с длинными цепочками действий это критическая характеристика.
GLM-5-Turbo: специализация на агентах
В марте параллельно вышел GLM-5-Turbo — модель, спроектированная с нуля под OpenClaw-сценарии (сложные автоматизированные агентные workflows). Стоимость: $1.2 за миллион входных токенов, $4 за миллион выходных. В пять раз дешевле Claude Opus 4.6.
Почему именно кодирование
Выбор Z.ai в пользу AI Coding как главного направления не случаен — это результат читаемой рыночной логики.
Anthropic достиг $30 млрд ARR во многом на разработчиках и Claude Code. Глобальный рынок AI Coding — не менее $100 млрд. Китайский рынок только входит в фазу ускорения.
Zhipu позиционирует переход от «Vibe Coding» (написание кода и исправление багов) к «Agentic Engineering» — завершению сложных системных инженерных задач и длинных агентных сценариев — как главный тезис всей серии GLM-5.
На это указывает и бизнес-динамика: облачная выручка компании в 2025 году выросла на 293% год к году. Бизнес-модель смещается от проектных контрактов к токен-биллингу — тому же пути, который прошёл Anthropic.
Философия открытости: не только бизнес
В официальном заявлении по поводу GLM-5.2 есть фраза, которую стоит процитировать целиком. Zhipu написала:
«В моменты, когда передовые модели внезапно становятся недоступными, Zhipu выбирает другой путь: передовой интеллект не должен принадлежать только немногим и не должен быть отозван в любой момент по решению немногих. Он должен быть открытым, доступным, пригодным для построения на его основе — и служить каждому разработчику».
Это косвенная, но вполне читаемая отсылка к ситуации с Fable 5 от Anthropic, доступ к которому ограничен для пользователей вне США. В гонке за умы разработчиков Z.ai делает ставку на открытость как дифференцирующий фактор.
## GLM-5.2 в контексте китайского AI-рынка
Zhipu — не единственный игрок на этом поле. По данным IDC, компания занимает третье место на китайском LLM-рынке после Alibaba (Qwen) и Baidu (ERNIE). Но по влиянию в developer-сообществе благодаря open-source стратегии фактически опережает рыночную долю.
На бенчмарках GLM-5 (744B / 40B активных) сопоставим с Qwen 3.5 (397B / 17B активных) и DeepSeek V4-Pro (1.6T / 49B активных). GLM лидирует на задачах с китайским языком, DeepSeek — на кодировании, Qwen — в мультимодальности. Три системы конкурентны на open-weight фронтире.
GLM-5.2 с заявленным реальным 1M контекстом и улучшенными длинными задачами потенциально меняет это соотношение — особенно для агентных применений, где длина контекста напрямую определяет сложность решаемых задач.
Что это значит для разработчиков
Прямо сейчас: если у вас есть GLM Coding Plan (Lite, Pro, Max или Team), GLM-5.2 уже доступен. Можно тестировать.
На следующей неделе: API откроется для всех разработчиков. Модель выйдет на HuggingFace под MIT-лицензией — можно будет скачать веса, файн-тюнить, запускать локально.
Для вайбкодинга: 1M контекст — это возможность передать всю кодовую базу среднего проекта в один сеанс. Улучшенные длинные задачи — более надёжные агентные сценарии с Claude Code или аналогами. Открытый исходный код — возможность запустить модель на собственном железе без зависимости от API.
По цене: исходя из прайсинга GLM-5 ($1.00 / $3.20 за млн токенов на OpenRouter) и GLM-5.1 ($3 за млн токенов) — GLM-5.2 ожидаемо в том же ценовом диапазоне. В 5-8 раз дешевле Claude Opus-уровня при сопоставимых возможностях.
Что неизвестно
Честности ради: официальный анонс GLM-5.2 минималистичен. Конкретные бенчмарки — SWE-bench Verified, AIME 2026, GPQA-Diamond — на момент публикации не раскрыты. Архитектурные изменения относительно GLM-5.1 не объявлены. Точная дата выхода API и open-source — «следующая неделя» без конкретного числа.
Детали появятся с выходом API и публикацией весов. Независимые тесты сообщества, как всегда, дадут более честную картину, чем внутренние бенчмарки.
Хронология серии GLM-5
| Версия | Дата | Ключевое |
|---|---|---|
| GLM-5 | 11 февраля 2026 | 744B параметров, 200K контекст, Huawei Ascend |
| GLM-5-Turbo | Март 2026 | Специализация на агентных задачах |
| GLM-5.1 | Апрель 2026 | +30% к кодированию, 68 tok/s, $3/M токенов |
| GLM-5.1 High-Speed | Май 2026 | 400 tok/s |
| GLM-5.2 | 13 июня 2026 | 1M контекст, лидерство в длинных задачах |
За четыре месяца — пять значимых обновлений. Быстрее, чем большинство западных лабораторий выпускают одно поколение.
Статья будет обновлена после публикации API и open-source весов. Следите за официальными каналами Z.ai и HuggingFace. Актуально на 13 июня 2026.