~/wiki / novosti / glm-5-2-zhipu-release-june-2026

GLM-5.2 вышел: Zhipu открыла доступ к самой мощной открытой модели — 1M контекст, MIT-лицензия и открытый исходный код на следующей неделе

◷ 8 мин чтения 13.06.2026

Основной чат

Чат для вайбкодеров: новости, гайды, поиск исполнителей, маркетплейс и разбор реальных кейсов.

GLM-5.2 вышел: Zhipu открыла доступ к самой мощной открытой модели — 1M контекст, MIT-лицензия и открытый исходный код на следующей неделе - обложка

13 июня 2026 года в 17:21 по пекинскому времени Zhipu AI (международный бренд Z.ai) открыла доступ к GLM-5.2 для всех пользователей GLM Coding Plan — тарифов Lite, Pro, Max и Team. По заявлению компании, это самая мощная открытая модель в их истории. API выйдет на следующей неделе, тогда же модель будет опубликована в open-source под лицензией MIT.

Релиз состоялся ровно через семь дней после появления первых сигналов внутреннего тестирования в сети — Z.ai придерживается этого ритма с точностью метронома: GLM-4.7, GLM-5.0, GLM-5.1 все вышли в публичный доступ через 7 дней после начала бета-тестирования.

Что известно о GLM-5.2

Официальная информация на момент публикации немногословна, но конкретна.

1M контекст — реально работающий. Zhipu характеризует GLM-5.2 как модель с «真正可用的 1M 上下文» — «реально используемым 1M контекстом». Это важная оговорка: многие модели заявляют большое контекстное окно, но на практике качество резко падает на дальних дистанциях. Zhipu явно позиционирует 1M как функциональную возможность, а не маркетинговый показатель.

Лидерство в длинных задачах. Компания заявляет, что GLM-5.2 «продолжает лидировать в длинных задачах» (long-range tasks). Это прямое продолжение вектора GLM-5.1, которая акцентировалась на длинных агентных сценариях.

MIT-лицензия, open-source на следующей неделе. Модель выйдет в открытый исходный код под MIT на следующей неделе — без ограничений на коммерческое использование, файн-тюнинг и самостоятельный хостинг.

API на следующей неделе. Разработчики, не использующие GLM Coding Plan, смогут подключиться через API со следующей недели.

Контекст: как Zhipu добралась до GLM-5.2 за 4 месяца

Чтобы понять значимость этого релиза, нужно понимать откуда он вырос.

GLM-5: февральский прорыв

11 февраля 2026 года, за несколько дней до китайского Нового года, Z.ai выпустила GLM-5 — и это был настоящий разрыв с предыдущим поколением. Модель выросла с 355 миллиардов параметров (32B активных) до 744 миллиардов (40B активных). Предобучающий датасет — с 23T до 28.5T токенов. Архитектура переключилась на DeepSeek Sparse Attention для эффективной работы с длинным контекстом, поддерживая окно в 200K токенов.

Стратегически важный факт: GLM-5 обучен целиком на чипах Huawei Ascend с использованием фреймворка MindSpore — без единого чипа NVIDIA. В условиях американских санкций на экспорт GPU это не просто техническое решение, а политическое заявление.

Акции Zhipu на Гонконгской бирже в течение трёх дней после релиза выросли на 60%. Одновременно с выпуском модели компания подняла цены на GLM Coding Plan на 30%.

GLM-5.1: апрельское ускорение

В марте GLM-5.1 был открыт подписчикам, 8 апреля — опубликован в open-source. Главный результат: прирост качества кодирования на 30% относительно GLM-5, вплотную приближаясь к Claude Opus 4.6 на бенчмарках SWE-bench Verified, HLE и BrowseComp.

Скорость вывода — 68 токенов в секунду. Стоимость — $3 за миллион токенов.

GLM-5.1 High-Speed: майский сюрприз

В мае Zhipu выпустила «высокоскоростную» версию GLM-5.1 — 400 токенов в секунду. Почти в 6 раз быстрее базовой. Для агентных сценариев с длинными цепочками действий это критическая характеристика.

GLM-5-Turbo: специализация на агентах

В марте параллельно вышел GLM-5-Turbo — модель, спроектированная с нуля под OpenClaw-сценарии (сложные автоматизированные агентные workflows). Стоимость: $1.2 за миллион входных токенов, $4 за миллион выходных. В пять раз дешевле Claude Opus 4.6.

Почему именно кодирование

Выбор Z.ai в пользу AI Coding как главного направления не случаен — это результат читаемой рыночной логики.

Anthropic достиг $30 млрд ARR во многом на разработчиках и Claude Code. Глобальный рынок AI Coding — не менее $100 млрд. Китайский рынок только входит в фазу ускорения.

Zhipu позиционирует переход от «Vibe Coding» (написание кода и исправление багов) к «Agentic Engineering» — завершению сложных системных инженерных задач и длинных агентных сценариев — как главный тезис всей серии GLM-5.

На это указывает и бизнес-динамика: облачная выручка компании в 2025 году выросла на 293% год к году. Бизнес-модель смещается от проектных контрактов к токен-биллингу — тому же пути, который прошёл Anthropic.

Философия открытости: не только бизнес

В официальном заявлении по поводу GLM-5.2 есть фраза, которую стоит процитировать целиком. Zhipu написала:

«В моменты, когда передовые модели внезапно становятся недоступными, Zhipu выбирает другой путь: передовой интеллект не должен принадлежать только немногим и не должен быть отозван в любой момент по решению немногих. Он должен быть открытым, доступным, пригодным для построения на его основе — и служить каждому разработчику».

Это косвенная, но вполне читаемая отсылка к ситуации с Fable 5 от Anthropic, доступ к которому ограничен для пользователей вне США. В гонке за умы разработчиков Z.ai делает ставку на открытость как дифференцирующий фактор.

## GLM-5.2 в контексте китайского AI-рынка

Zhipu — не единственный игрок на этом поле. По данным IDC, компания занимает третье место на китайском LLM-рынке после Alibaba (Qwen) и Baidu (ERNIE). Но по влиянию в developer-сообществе благодаря open-source стратегии фактически опережает рыночную долю.

На бенчмарках GLM-5 (744B / 40B активных) сопоставим с Qwen 3.5 (397B / 17B активных) и DeepSeek V4-Pro (1.6T / 49B активных). GLM лидирует на задачах с китайским языком, DeepSeek — на кодировании, Qwen — в мультимодальности. Три системы конкурентны на open-weight фронтире.

GLM-5.2 с заявленным реальным 1M контекстом и улучшенными длинными задачами потенциально меняет это соотношение — особенно для агентных применений, где длина контекста напрямую определяет сложность решаемых задач.

Что это значит для разработчиков

Прямо сейчас: если у вас есть GLM Coding Plan (Lite, Pro, Max или Team), GLM-5.2 уже доступен. Можно тестировать.

На следующей неделе: API откроется для всех разработчиков. Модель выйдет на HuggingFace под MIT-лицензией — можно будет скачать веса, файн-тюнить, запускать локально.

Для вайбкодинга: 1M контекст — это возможность передать всю кодовую базу среднего проекта в один сеанс. Улучшенные длинные задачи — более надёжные агентные сценарии с Claude Code или аналогами. Открытый исходный код — возможность запустить модель на собственном железе без зависимости от API.

По цене: исходя из прайсинга GLM-5 ($1.00 / $3.20 за млн токенов на OpenRouter) и GLM-5.1 ($3 за млн токенов) — GLM-5.2 ожидаемо в том же ценовом диапазоне. В 5-8 раз дешевле Claude Opus-уровня при сопоставимых возможностях.

Что неизвестно

Честности ради: официальный анонс GLM-5.2 минималистичен. Конкретные бенчмарки — SWE-bench Verified, AIME 2026, GPQA-Diamond — на момент публикации не раскрыты. Архитектурные изменения относительно GLM-5.1 не объявлены. Точная дата выхода API и open-source — «следующая неделя» без конкретного числа.

Детали появятся с выходом API и публикацией весов. Независимые тесты сообщества, как всегда, дадут более честную картину, чем внутренние бенчмарки.

Хронология серии GLM-5

Версия	Дата	Ключевое
GLM-5	11 февраля 2026	744B параметров, 200K контекст, Huawei Ascend
GLM-5-Turbo	Март 2026	Специализация на агентных задачах
GLM-5.1	Апрель 2026	+30% к кодированию, 68 tok/s, $3/M токенов
GLM-5.1 High-Speed	Май 2026	400 tok/s
GLM-5.2	13 июня 2026	1M контекст, лидерство в длинных задачах