~/wiki / novosti / kimi-k2-7-code-release

Kimi K2.7 Code: новая открытая модель Moonshot AI для агентного кодинга

◷ 12 мин чтения 13.06.2026

Основной чат

Чат для вайбкодеров: новости, гайды, поиск исполнителей, маркетплейс и разбор реальных кейсов.

Kimi K2.7 Code: новая открытая модель Moonshot AI для агентного кодинга - обложка

12 июня 2026 года, на той же неделе, когда Anthropic выпустила и почти сразу отозвала Claude Fable 5, китайская Moonshot AI выпустила Kimi K2.7 Code — открытую модель, специализированную на агентном программировании. Релиз заявляет снижение расхода reasoning-токенов на 30% по сравнению с предыдущей версией и улучшения на нескольких внутренних бенчмарках.

Разбираем, что это за модель, какие у неё реальные характеристики, и что говорят о ней независимые тесты — там есть нюансы.

Контекст: откуда взялся K2.7

Moonshot AI, основанная в 2023 году выпускником Tsinghua University Чжилинем Яном, строила компанию вокруг чат-бота Kimi. Переход к открытым весам начался с серии K2 в середине 2025 года, и с тех пор темп релизов остаётся высоким: базовая модель K2 вышла в июле 2025, K2 Thinking с улучшенным рассуждением — в ноябре 2025, K2.5 — в январе 2026, K2.6 — в апреле 2026. K2.7-Code, вышедший в июне 2026, становится пятым крупным релизом за неполный год.

Важная деталь про K2.6: когда модель вышла в апреле, она заняла первое место в еженедельном рейтинге OpenRouter — рейтинге, основанном на реальных решениях разработчиков о роутинге запросов через API, а не на самозаявленных бенчмарках. Это даёт K2.7 определённый кредит доверия на старте — предыдущая версия реально использовалась, а не просто красиво выглядела в пресс-релизе.

Технические характеристики

Kimi K2.7 Code — это модель Mixture-of-Experts с 1 триллионом общих параметров и 32 миллиардами активных параметров на токен. Архитектура использует 384 эксперта, из которых 8 выбираются на токен плюс 1 общий, 61 слой (включая 1 плотный слой), MLA для внимания и SwiGLU для feed-forward пути. Визуальный энкодер MoonViT добавляет 400 миллионов параметров для обработки изображений и видео.

Контекстное окно — 256 тысяч токенов. Это заметно меньше, чем 1 миллион у флагманов Claude — разница, которую стоит учитывать при выборе модели для задач с очень длинным контекстом.

Модель доступна под Modified MIT License — лицензия разрешает коммерческое использование с указанием авторства для крупномасштабных развёртываний. Веса размещены на Hugging Face, и Moonshot заявляет поддержку развёртывания через vLLM, SGLang и KTransformers.

Принципиальный момент: K2.7-Code не поддерживает режим без рассуждений (non-thinking mode). Forced thinking с включённым preserve_thinking — особенность, рассчитанная на многошаговые агентные workflow в кодинге, но это же означает, что для тривиальных запросов нельзя отключить «размышление» и сэкономить на токенах таким способом.

Что заявляет Moonshot: бенчмарки

Команда Moonshot опубликовала шесть строк бенчмарков, сравнивающих K2.7-Code с предшественником K2.6 и с конкурентами.

Улучшения относительно K2.6

По заявлению компании, K2.7-Code улучшает результаты по всем шести опубликованным показателям относительно K2.6, с наибольшими приростами именно в кодинг-специфичных тестах:

+21.8% на Kimi Code Bench v2
+11.0% на Program Bench
+31.5% на MLS Bench Lite
примерно −30% по использованию reasoning-токенов

Все три бенчмарка — Kimi Code Bench v2, Program Bench и MLS Bench Lite — это собственные (проприетарные) бенчмарки Moonshot AI.

Сравнение с фронтир-моделями

Здесь картина менее однозначная. По таблице, опубликованной Moonshot, GPT-5.5 остаётся впереди K2.7-Code по всем шести строкам таблицы. Claude Opus 4.8 лидирует над K2.7-Code по пяти из шести показателей.

Но есть исключения, которые Moonshot выделяет отдельно: K2.7-Code превосходит Opus 4.8 на MCP Mark Verified — 81.1 против 76.4. На MLS Bench Lite K2.7-Code близок к GPT-5.5 (35.1 против 35.5), хотя всё ещё позади Opus 4.8 с показателем 42.8.

MCP Mark Verified — это бенчмарк, проверяющий корректность вызова инструментов через Model Context Protocol: что-то на стыке CI-проверок, обновления тикетов и редактирования файлов в одном цикле. Превосходство именно здесь логично сочетается с позиционированием модели как агентной.

Методологическая оговорка от самого Moonshot

Важно: K2.7-Code и K2.6 тестировались с включённым режимом thinking, тогда как GPT-5.5 тестировался в Codex на уровне xhigh, а Claude Opus 4.8 — в Claude Code на уровне xhigh. Это первичные цифры от вендора, не из независимого лидерборда — то есть условия тестирования для разных моделей не идентичны, и сравнение нужно воспринимать с этой оговоркой.

Что говорят независимые наблюдатели

Здесь начинается самое интересное — и самое важное для тех, кто планирует использовать модель в продакшене.

Бенчмарки пока не проверены независимо

На момент релиза модель не была отправлена на DeepSWE — независимый бенчмарк для кодинга, который даёт разброс в 70 баллов между моделями (против разброса в 30 баллов у SWE-Bench Pro), что делает его более различающим сигналом для команд, настраивающих системы роутинга моделей. Иными словами, заявленные приросты пока подтверждены только самим Moonshot.

Реакция практиков на K2.6 — как ориентир

Поскольку независимых тестов K2.7 пока немного, полезно посмотреть, как сообщество отреагировало на K2.6 — модель с похожей архитектурой, вышедшую в апреле. Пользователь Hacker News описал её как «dirt cheap on OpenRouter for how good it is» (очень дёшево на OpenRouter за такое качество). Саймон Уиллисон проводил живую демонстрацию генерации анимированных SVG/HTML через OpenRouter и назвал модель практичной и быстрой. По неподтверждённым данным из обсуждений, K2.6 использовалась в качестве бэкенда для composer-2 в Cursor — интеграция, которую труднее сфабриковать, чем вендорский бенчмарк.

При этом был и скептический лагерь: один из комментаторов на Hacker News написал, что при реальном использовании впечатление было «так себе, несмотря на сильные бенчмарки» — повторяющаяся жалоба на недостаточную производительность в специфичных областях. По данным сравнения BenchLM, Claude Opus 4.7 получил оценку 94 против 68 у Kimi K2.5 в общем зачёте.

Это иллюстрирует общий паттерн с моделями серии Kimi K2: сильные собственные бенчмарки и реальная популярность по цене/throughput на OpenRouter — но смешанные впечатления при сравнении с топовыми закрытыми моделями на специфичных задачах.

Цены и доступ

Через Moonshot API

На официальном API Kimi K2.7-Code оценивается в $0.95 за миллион входных токенов, $4.00 за миллион выходных токенов, и $0.19 за миллион токенов из кэша (cache-hit).

Если применить заявленное снижение reasoning-токенов на 30% к выходной части счёта, для агентных workflow с большой долей вывода — это прямая экономия на инференсе, при условии что заявление подтвердится на практике.

Способы доступа

Moonshot API — первичный, OpenAI-совместимый API, base URL platform.moonshot.ai, model id kimi-k2.7-code
OpenRouter — маршрутизация как moonshotai/kimi-k2.7-code, удобно если у вас уже централизован биллинг и фоллбеки там
Cloudflare Workers AI — edge-инференс как @cf/moonshotai/kimi-k2.7-code
Vercel AI Gateway — для команд, стандартизировавшихся на роутинге через Vercel
Self-hosting — веса с Hugging Face, развёртывание через vLLM, SGLang или KTransformers

Kimi Code — отдельный продукт

Помимо API, Moonshot предлагает Kimi Code — терминальный coding-агент с подписочными планами от $19 в месяц. Это отдельный биллинг от использования API. Также объявлен «6x High-Speed Mode» как опция, которая появится позже — паттерн speed-tier, уже знакомый по closed-моделям: например, у Anthropic быстрый режим на Opus 4.8 работает в 2.5 раза быстрее за двойную цену.

Стратегически это читается так: Moonshot не просто публикует веса, а строит вокруг них подписочную платформу — тот же playbook «модель + план», который Anthropic использует с Claude Code.

Совместимость с существующими агентами

Документация Moonshot исторически поддерживала использование моделей Kimi внутри сторонних агентов — включая Claude Code, Cline и Roo Code — через совместимые API-эндпоинты. Это снижает порог для пробного использования до изменения переменной окружения, без переписывания инфраструктуры.

Сильные и слабые стороны: честная оценка

Сильные стороны

Открытые веса под коммерчески пригодной лицензией — можно self-host, инспектировать, не зависеть от одного closed-вендора.

Совместимость с существующими агентными инструментами через OpenAI-совместимый API — низкий порог пробного запуска.

Заметное превосходство в MCP-инструментах — конкретно полезно для агентных pipeline с CI, тикетами и многошаговыми правками.

Цена ощутимо ниже флагманских closed-моделей — $0.95/$4.00 против, например, $5/$30 у GPT-5.5.

Слабые стороны

Это специализированная Code-модель — на старте нет соответствующего general-purpose «Kimi K2.7» или Instruct-варианта, то есть модель заточена под инженерные задачи, а не под широкий чат.

Контекст 256K заметно меньше 1M у флагманов Claude.

Стандартные сторонние бенчмарки на момент релиза не опубликованы — заявления о производительности пока основаны только на цифрах Moonshot.

Тяжела для self-hosting — триллион параметров требует серьёзной инфраструктуры даже с учётом 32B активных.

Forced thinking без возможности отключения означает, что нельзя запустить модель в дешёвом режиме без рассуждений для тривиальных вызовов — это может оказаться неэффективным для простых задач в смешанном потоке запросов.

Как это вписывается в картину июня 2026

Релиз K2.7-Code примечателен ещё и по таймингу. Эта же неделя началась с релиза Claude Fable 5 — самой мощной публичной модели Anthropic, которую правительство США приказало отключить через три дня по соображениям национальной безопасности.

На этом фоне открытая модель с весами на Hugging Face, доступная для self-hosting без зависимости от облачного API одного вендора, получает дополнительный практический аргумент: для команд, которые не хотят рисковать внезапной недоступностью модели по решению третьей стороны, открытые веса — это форма инфраструктурной независимости, даже если по чистым бенчмаркам модель не лидирует.

Что делать прямо сейчас, если вы рассматриваете K2.7-Code

Если ваш стек уже использует Kimi K2.6 через OpenRouter или прямой API — переключение на K2.7-Code сводится к замене идентификатора модели, и стоит попробовать на части трафика, сравнив реальное потребление токенов на ваших задачах с заявленным снижением на 30%.

Если вы выбираете модель с нуля для агентного кодинга и важна цена за результат — K2.7-Code стоит включить в список кандидатов для A/B-тестирования, но не как единственный вариант, особенно до появления независимых бенчмарков типа DeepSWE.

Если ключевой критерий — глубокая работа с MCP-инструментами в длинных агентных циклах — преимущество K2.7-Code на MCP Mark Verified (81.1 против 76.4 у Opus 4.8 по данным Moonshot) делает модель достойной отдельного теста именно на этом сценарии.

Если нужен контекст больше 256K токенов или general-purpose модель без forced thinking — K2.7-Code не подходит по архитектуре, и стоит смотреть на K2.6 (если нужен Instruct-вариант) или на другие флагманы.

Итог

Kimi K2.7-Code — закономерный шаг в быстром цикле релизов Moonshot AI: специализация на агентном кодинге, заявленное снижение расхода reasoning-токенов на 30% и явный фокус на MCP tool-use, где модель по собственным данным Moonshot обгоняет даже Claude Opus 4.8.

При этом ключевые цифры на сегодня — это first-party данные вендора, не отправленные на независимые бенчмарки типа DeepSWE, с явной методологической оговоркой о неодинаковых условиях тестирования разных моделей. История с K2.6 показывает, что у предыдущих моделей серии была реальная популярность на OpenRouter при смешанных впечатлениях от прямого использования — разумно ожидать похожей картины и здесь, пока не появятся независимые данные.

Практический вывод: модель стоит тестировать, особенно если вы уже в экосистеме Kimi или цена за токен критична для вашего агентного pipeline — но не стоит принимать решение о миграции только на основе таблицы бенчмарков из пресс-релиза.