~/wiki / rabochee-mesto / claude-code-vs-codex-2026

Claude Code vs Codex: честное сравнение 2026 — цены, бенчмарки, реальные отзывы

◷ 20 мин чтения 06.06.2026

Основной чат

Чат для вайбкодеров: новости, гайды, поиск исполнителей, маркетплейс и разбор реальных кейсов.

$ cd раздел/ $ join vibe dev

В конце января 2026 года Андрей Карпатый написал в X, что за один месяц перешёл от 80% ручного кода к 80% агентного. Пост набрал 40 000 лайков. Комментарии разделились ровно пополам: одни рекомендовали Claude Code, другие — Codex.

С тех пор эта дискуссия не утихает. Оба инструмента прошли через несколько крупных обновлений, оба претендуют на звание лучшего агентного ИИ для разработчиков. Но их философии кардинально разные — и именно это определяет, кто что должен выбрать.

В этой статье — честный разбор без маркетинга: архитектура, бенчмарки, цены, реальные отзывы разработчиков и конкретные сценарии, где каждый инструмент выигрывает.


Что такое Claude Code и Codex

Claude Code

Claude Code — агентный инструмент от Anthropic. Запускается в терминале, читает вашу кодовую базу, редактирует файлы, запускает тесты, делает коммиты. Вышел в preview в феврале 2025, достиг GA в мае 2025.

Модели: Opus 4.8 (по умолчанию с 28 мая 2026), Opus 4.7, Sonnet 4.6, Haiku 4.5.

Доступен через: терминал, VS Code, JetBrains, веб (claude.ai/code, запущен октябрь 2025), мобильное приложение с push-уведомлениями.

Ключевая особенность: ваш код остаётся на вашей машине. Claude Code читает локальную файловую систему, выполняет команды в вашем реальном терминале, использует ваш локальный git. В Anthropic API уходит только обработка — не код.

Codex

Codex — агентный инструмент от OpenAI. Открытый исходный код (Apache-2.0), написан на Rust. С сентября 2025 объединён в единый продукт с ChatGPT-аккаунтом — можно переключаться между локальным и облачным режимами без потери контекста.

Модели: GPT-5.5 (локальные сессии), GPT-5.3-Codex (облако и code review).

Доступен через: CLI, IDE-расширение (VS Code, Cursor, Windsurf, JetBrains), Codex Cloud, боковую панель ChatGPT, мобильное приложение (GA май 2026), Chrome-расширение.

Ключевая особенность: единый продукт на шести поверхностях. Начали задачу на телефоне — продолжили в VS Code — посмотрели PR в Chrome. Модель и состояние не меняются.

По данным OpenAI (июнь 2026): Codex используют более 5 миллионов человек в неделю.


Ключевое различие: философия работы

Это самое важное, что нужно понять перед любым сравнением.

Claude Code = разработчик рядом с инструментом. Вы присутствуете. Агент показывает рассуждения, задаёт вопросы в ключевых точках, ждёт вашего подтверждения для деструктивных операций. Это интерактивная петля с человеком в контуре.

Codex = делегирование задачи. Вы передаёте чёткую задачу, Codex уходит работать в изолированной песочнице, возвращается с PR или diff-ом на проверку. «Fire and forget» архитектура.

«Если у вашей следующей задачи есть детали, которые вы хотите уточнять по ходу — используйте Claude Code. Если задача сформулирована достаточно чётко, чтобы отдать её и вернуться к ревью — используйте Codex» — практическое правило из сообщества (laozhang.ai, март 2026)

Именно эта разница объясняет почти все остальные отличия: в скорости, в стоимости токенов, в сценариях применения.

Не зря Codex написан на Rust (оптимизация под throughput и стабильность длинных автономных сессий), а Claude Code — на TypeScript (оптимизация под гибкость инструментов и изменения поведения на середине сессии).


Бенчмарки: кто объективно лучше

Важная оговорка перед таблицей: SWE-bench Verified и SWE-bench Pro — разные бенчмарки с разными задачами. Прямое сравнение цифр через эти два теста некорректно. Ниже — данные по каждому отдельно.

SWE-bench Pro (сложные инженерные задачи, май 2026)

Модель Результат
Claude Opus 4.7 64.3%
GPT-5.5 58.6%
GPT-5.4 57.7%
GPT-5.3-Codex 56.8%
Claude Opus 4.6 55.4%

Источник: публичный лидерборд SWE-bench Pro, май 2026

Победитель: Claude Code / Opus 4.7 с заметным отрывом (+5.7%)

SWE-bench Verified (стандартные инженерные задачи)

Модель Результат
GPT-5.5 88.7%
Claude Opus 4.7 87.6%

Победитель: Codex / GPT-5.5 с минимальным отрывом (+1.1%)

Terminal-Bench 2.0 (терминальные задачи: скрипты, DevOps, системное администрирование)

Модель Результат
GPT-5.5 82.7%
GPT-5.3-Codex 77.3%
GPT-5.4 75.1%
Claude Opus 4.7 69.4%
Claude Opus 4.6 65.4%

Источник: Terminal-Bench 2.0, май 2026

Победитель: Codex с существенным отрывом (+13.3%)

Blind-тест (человеческая оценка качества кода)

Исследователь Blake Crosley провёл 36 раундов слепого тестирования. Оценивались: корректность, полнота, простота, декомпозиция, практичность.

Результат Количество раундов Процент
Claude Code побеждает 8 67%
Codex побеждает 3 25%
Ничья 1 8%

В слепых оценках Claude Code выигрывает в 2.7 раза чаще.

CursorBench (работа в IDE-контексте)

Claude Code: 70%. Codex: данные не публиковались.

Производительность GitHub

По данным SemiAnalysis / GitHub Search API (май 2026): Claude Code генерирует 326 000+ коммитов в день — около 10% всех публичных коммитов на GitHub. В феврале 2026 было 4%. Рост кратный.

Итог по бенчмаркам

Нет однозначного победителя — есть разные сильные стороны:

  • Сложные инженерные задачи → Claude Code
  • Терминальные задачи, DevOps → Codex
  • Человеческая оценка качества кода → Claude Code убедительно
  • SWE-bench Verified → Codex с минимальным преимуществом

Цены и лимиты: полный разбор

Это место, где у большинства людей складывается неверная картина.

Claude Code — тарифы

Тариф Цена Что включено
Pro $20/мес Лимитированный доступ, быстро заканчивается
Max 5x $100/мес Реальный рабочий объём для активной разработки
Max 20x $200/мес Интенсивное использование, агентные пайплайны
API По токенам Opus 4.7: $15/M input, $75/M output

Важно: лимиты на $20 Pro и $100 Max делятся между claude.ai чатом и Claude Code. Если активно использовать оба — бюджет сжигается быстрее.

Реальность уровня $20: Anthropic сам описывает Pro как подходящий для лёгкого использования. Один сложный промт с большой кодовой базой — и 50-70% лимита за 5 часов сгорело.

Codex — тарифы

Тариф Цена Что включено
Free / Go $0–$14/мес Базовый доступ
Plus $20/мес 15–80 GPT-5.5 сообщений / 5 часов; 30–150 GPT-5.3-Codex; 10–60 облачных задач
Pro 5x $100/мес ~5x больше лимитов Plus
Pro 20x $200/мес ~20x больше лимитов Plus
API По токенам Отдельное ценообразование

Главная асимметрия

За одинаковые $20 Codex даёт значительно больше активного времени агента, чем Claude Code. Это не мнение — это консенсус из десятков сравнительных тредов.

Один из самых цитируемых комментариев на Reddit (388 upvotes): «Один сложный промт в Claude — и к концу я сжёг 50-70% лимита за 5 часов. Два промта — и неделя закончена».

Разработчики на стороне Codex говорят обратное: «Я кодил без остановки и ни разу не упёрся в лимиты на плане за $20». «Три дня на Ultra High — и использовал только 30% недельного лимита».

Но есть нюанс с Codex: один из самых обсуждаемых тредов на r/codex этой весной — о том, как пользователи обнаружили снижение лимитов в 4 раза без предупреждения. OpenAI менял условия несколько раз.

Реальный вывод по ценам

  • На $20: Codex даёт больший объём работы
  • На $100–$200: уровень сопоставим, выбор зависит от задач
  • При API-использовании (оплата по токенам): Claude Code дороже за задачу из-за большего расхода токенов, но часто результат требует меньше итераций

Токены и реальная стоимость задачи

Цена плана — видимая часть. Невидимая — сколько токенов каждый инструмент тратит на одну задачу.

Контролируемый тест (Composio, Opus 4.7 vs GPT-5.5, одинаковый MCP)

Две задачи: система триажа PR и UI для code review в реальном времени.

Инструмент Токены Стоимость
Claude Code (Opus 4.7) ~192 000 ~$2.50
Codex (GPT-5.5) ~136 000 ~$2.04

Разница: 1.4× по токенам, 23% по стоимости.

Это меньше, чем фольклорные «5-10×», но направление стабильное: Claude Code последовательно тратит больше. Причина — он читает больше файлов, строит план перед написанием кода, проверяет инструменты перед вызовом.

Что покупают эти лишние токены

В том же тесте Claude Code дал:

  • Более детальную декомпозицию (12 компонентов против 7 у Codex)
  • Непрошеный smoke-тест
  • Рабочий результат там, где Codex завис из-за неправильно настроенного MCP-пути

Независимый бенчмарк сообщества (февраль 2026) по трём типовым задачам (Figma-плагин, планировщик, API-интеграция): Claude Code использовал от 235K до 650K токенов, Codex — от 73K до 180K. Разрыв 3-4× при более тщательных выводах у Claude.

Где разрыв максимален

Tool-heavy MCP-работа. Если агент в одной сессии обращается к Linear, GitHub, Composio и базе данных — петля Claude Code «сначала проверь инструменты, потом план, потом код» разгоняет счёт значительно быстрее, чем подход Codex «прицелься точнее, напиши файл, отправь».

Для самостоятельного рефактора без вызовов инструментов разрыв почти исчезает.


Мультиагентность

Оба инструмента в 2026 году поддерживают параллельную работу нескольких агентов. Но реализации принципиально разные.

Codex: Subagents GA

Вышли в GA 14 марта 2026. Модель: менеджер + воркеры (explorer, worker, default). До 8 параллельных агентов. Изоляция через облачные контейнеры (microVM). Каждый сабагент работает в отдельной песочнице.

Подходит для: параллельной обработки независимых задач, когда нужна изоляция и автономность.

Claude Code: Agent Teams

Координированные суб-агенты с общими списками задач и прямым обменом сообщениями между агентами. Изоляция через git worktrees (локально). Есть зависимости задач — один агент может ждать результата другого.

Дополнительно: Agent View Dashboard для визуального управления сессиями (версия 2.1.139+).

Аспект Codex Claude Code
Модель Менеджер + воркеры Координированные агенты с обменом сообщениями
Изоляция Облачный контейнер / microVM Git worktree (локально)
Макс. параллельных агентов 8 Не ограничено явно
Межагентная коммуникация Нет Есть (прямые сообщения)
Зависимости задач Нет Есть
Видимость прогресса Статус задачи Agent View Dashboard

Вывод: Codex даёт более простую параллельность — независимые воркеры. Claude Code даёт более сложную оркестрацию — агенты могут координироваться и передавать данные.


Безопасность и песочница

Codex: защита на уровне ядра ОС

Codex использует kernel-level sandboxing: Seatbelt (macOS), Landlock (Linux), Windows sandbox. Это жёсткие границы, которые не обойти из userspace. Преимущество: надёжная изоляция, особенно при работе с ненадёжным внешним кодом. Недостаток: грубый контроль — либо да, либо нет.

Claude Code: защита на уровне приложения

26 программируемых hook-событий. До April 2026 добавлены: PostToolUseFailure, SubagentStart, TeammateIdle, TaskCompleted, PermissionRequest, PermissionDenied, FileChanged, CwdChanged, WorktreeCreate/WorktreeRemove и другие. Это тонкий контроль: можно разрешить конкретную команду в конкретном контексте и запретить в другом.

Codex даёт более жёсткие границы с грубым контролем. Claude Code даёт более гибкие границы с точным контролем. Правильный выбор зависит от вашей модели угроз.

Для ревью ненадёжного внешнего кода — kernel sandboxing Codex лучше. Для соблюдения корпоративных стандартов на доверенном коде — программируемые хуки Claude Code мощнее.


Экосистема: интеграции, плагины, конфигурация

Файлы конфигурации

Claude Code использует CLAUDE.md — проприетарный формат с иерархической структурой и поддержкой @path импортов. Файлы в корне проекта, во вложенных директориях, в домашней директории пользователя, на уровне enterprise.

Codex использует AGENTS.md — открытый стандарт, поддерживаемый десятками тысяч open-source проектов. Если ваша команда уже использует Cursor, Aider или другие агентные инструменты — Codex читает их конфигурацию напрямую.

Инструменты и MCP

Claude Code: полная поддержка MCP (Model Context Protocol). Это убийственная функция для сложных workflow — интеграция с любым MCP-сервером.

Codex: интеграции с Linear, GitHub, Slack есть нативно. MCP не поддерживается (по состоянию на июнь 2026). Это ограничение, на которое часто жалуются в сообществе.

GitHub

Возможность Claude Code Codex
Читать issues Да (WebFetch) Да (нативная интеграция)
Создавать PR автоматически Через API Нативно, из облачной задачи
GitHub Actions Routines (с апреля 2026) Нативная интеграция
Комментировать PR Через GitHub App Да

Открытость

Codex — Apache-2.0, исходный код открыт, 82 900 звёзд на GitHub (май 2026). Claude Code — проприетарный, 124 000 звёзд.


Реальные отзывы разработчиков

Данные: анализ 500+ комментариев на r/ClaudeCode, r/codex, r/ChatGPTCoding (QJC, март 2026).

Что говорят про Claude Code

«Claude Code чувствуется как хороший мидл-рефакторер. Ты знаешь, что он выполнит то, о чём ты просишь» — Thomas Ricouard (@Dimillian)

«Claude Code гораздо более хирургичен в выборе файлов, которые нужно трогать. Codex накрывает широкую сеть».

«У Claude Code намного больше функций, чем у Codex. Хуки, Rewind, Claude в Chrome, плагины, Plan mode».

«Я использовал его 8 часов в день. Постоянно упирался в лимиты, купил два аккаунта по $200/месяц. Отменил оба немедленно».

Что говорят про Codex

«Обычно делает правильно с первого раза. Недели использования Codex — и мне почти никогда не приходилось просить дважды».

«Кидаешь задачу, он уходит в свою VM, возвращается с PR».

«Дай CLI полную автономию — и он перепишет огромные куски кода. Тяжело отслеживать. Ощущение, что тебя вынуждают вайбкодить вместо управления».

«Предлагает слишком много лишних задач. Отправляешь один тикет — выполняет половину, потом спрашивает "сделать ещё X?" Нет! Сфокусируйся».

Главный консенсус Reddit

«Claude Code — качество выше, но использовать невозможно. Codex — чуть ниже качеством, но реально пригоден для работы» — общий консенсус Reddit, март 2026.

Парадокс обсуждений

В опросе 500+ комментариев: 65.3% предпочитают Codex, 34.7% — Claude Code. Но у Claude Code в 4 раза больший объём обсуждений, что означает в 4 раза больше активных пользователей. Оценивать победителя по sentiment-анализу здесь некорректно.


Провалы и слабые места каждого

Слабые места Claude Code

Лимиты. Это проблема номер один. Один сложный промт с большой кодовой базой — и значительная часть лимита за 5 часов сгорела. Для интенсивной ежедневной работы $20 Pro недостаточно.

Скорость. Claude Code медленнее на простых и средних задачах. Он планирует, проверяет инструменты, рассуждает вслух — это время.

Стоимость токенов. Расходует в 1.4-4× больше токенов на аналогичную задачу. При API-биллинге это ощутимо.

Зависимость от Anthropic. Закрытый исходный код, проприетарный формат конфигурации.

Слабые места Codex

Нет MCP. Это серьёзное ограничение для сложных workflow с внешними интеграциями.

Непредсказуемое изменение лимитов. OpenAI несколько раз менял квоты без предупреждения. Пользователи жалуются на снижение в 4× за одну ночь.

Непоследовательность. Один и тот же промт может дать разные результаты. Claude Code более детерминирован.

Слабая оркестрация. Subagents GA хорош для параллельных независимых задач, но для сложной координации с зависимостями Claude Code мощнее.

Избыточная автономность. При полной автономии может переписать код далеко за пределами нужного, без возможности остановить на полпути.

Нет поддержки длинного контекста. Максимум 200K токенов против 1M у Claude Code.


Сценарии: кому что выбрать

Выбирайте Claude Code, если:

Вы работаете с большими кодовыми базами. 1M токенов контекста против 200K у Codex — это не маркетинг, а реальное преимущество при работе с монолитами или проектами с тысячами файлов.

Вам нужна высокая точность и детерминированность. В слепых тестах люди оценивают код Claude Code как более чистый, идиоматичный и структурированный в 67% случаев.

Вы строите сложные мультиагентные пайплайны. Agent Teams с зависимостями задач и межагентной коммуникацией — это другой уровень оркестрации.

Вам нужны MCP-интеграции. Подключение к любому MCP-серверу — уникальное преимущество Claude Code.

Вы хотите присутствовать в процессе. Интерактивный режим, одобрение решений на ходу, возможность скорректировать курс на середине задачи.

Вы работаете над кодом, который пройдёт code review. PR от Claude Code принимают быстрее — разработчики отмечают лучшую структуру и меньше замечаний на ревью.

Выбирайте Codex, если:

Вы хотите рабочий инструмент за $20. За эту сумму Codex даёт значительно больше агентного времени.

Вы работаете с DevOps и терминальными задачами. Terminal-Bench 2.0: 82.7% vs 69.4% — отрыв существенный.

Вы хотите делегировать и не следить. Fire-and-forget: отдали задачу, получили PR, сделали ревью.

Вам нужен один инструмент на всех платформах. CLI, IDE, облако, телефон, браузер — единый аккаунт, единый контекст.

Ваша команда использует AGENTS.md. Открытый стандарт, совместимый с Cursor, Aider и другими инструментами.

Вы работаете со скриптами, автоматизацией, системным администрированием. Codex в этой области объективно сильнее.

Выбирайте оба, если:

Вы в продакшене. Многие опытные команды используют гибридный подход: Claude Code для генерации сложных фич, Codex для ревью и автономных задач.


Гибридный подход: когда берут оба

Опытные разработчики всё чаще используют гибридный workflow: Claude Code генерирует фичи, Codex ревьюит код перед мержем.

Есть несколько устойчивых паттернов из сообщества:

Паттерн 1: Claude пишет, Codex ревьюит. Используйте Claude Code для сложной реализации — он мыслит глубже и декомпозирует лучше. Потом запустите Codex как ревьюера — он поймает паттерны, которые может пропустить Claude, и сделает это быстро.

Паттерн 2: Codex для параллельной автоматизации, Claude для ключевых решений. Запустите 8 Codex-агентов параллельно для рутинных задач (тесты, документация, мелкие фиксы). Claude Code оставьте для задач, где важна точность и нужно ваше участие.

Паттерн 3: Claude для сложного рефакторинга, Codex для DevOps. Claude Code лучше понимает архитектурный контекст больших рефакторов. Codex надёжнее в терминальных задачах и CI/CD скриптах.

В опросе Reddit Q1 2026 (r/programming + r/ChatGPTCoding): 65% разработчиков предпочитают Codex для ежедневной работы, но в слепых ревью код Claude Code оценивается как более чистый в 67% случаев. «Ежедневное предпочтение» и «качество кода» — это разные метрики.


Итоговая таблица и вердикт

Полная таблица сравнения

Критерий Claude Code Codex
Модели Opus 4.8, 4.7, Sonnet 4.6, Haiku 4.5 GPT-5.5, GPT-5.3-Codex
Стартовая цена $20 Pro (сильно ограничен), реально $100 $20 Plus (реально пригоден)
Максимальный контекст 1M токенов 200K токенов
SWE-bench Pro 64.3% 58.6%
SWE-bench Verified 87.6% 88.7%
Terminal-Bench 2.0 65.4% 82.7%
Слепой тест (люди) 67% побед 25% побед
Токены на задачу 1.4-4× больше Базовый уровень
MCP поддержка Да Нет
Параллельные агенты Agent Teams (без явного лимита) Subagents GA (до 8)
Межагентная коммуникация Есть Нет
Платформы CLI, VS Code, JetBrains, Web, Mobile CLI, IDE, Cloud, ChatGPT, Mobile, Chrome
Sandboxing 26 программируемых хуков Kernel-level (Seatbelt/Landlock)
Конфигурация CLAUDE.md (проприетарный) AGENTS.md (открытый стандарт)
Открытый код Нет Apache-2.0
GitHub коммиты/день 326K+ (~10% всех публичных) Не раскрывается
GitHub звёзды 124K 82.9K
Лимиты Бьются быстро, особенно на $20 Стабильнее, но были изменения без предупреждения

Финальный вердикт

Claude Code — это про качество и глубину. Лучший код в человеческой оценке. Больший контекст. Более точная работа с большими кодовыми базами. Мощная оркестрация агентов. Но дороже при активном использовании и медленнее.

Codex — это про практичность и масштаб. Больше агентного времени за те же деньги. Лучше в DevOps и терминале. Проще запустить и делегировать. Но менее детерминирован и без MCP.

«Оба инструмента пересекли порог состоятельности в конце 2025 года. Вопрос больше не в том, какая модель умнее. Вопрос в том, какой workflow вам нужен. Вам нужен терминал, который думает быстро, или рабочее пространство, которое думает долго?»

Практическое правило для выбора:

  • Задача требует вашего участия по ходу → Claude Code
  • Задача чёткая, можно делегировать → Codex
  • Нужен MCP, большой контекст, высокая точность → Claude Code
  • Нужен бюджет, DevOps, автономность → Codex
  • Серьёзная продакшен-команда → оба, с роутингом по типу задачи

Часто задаваемые вопросы

Что лучше для вайбкодинга без опыта в программировании? Для новичков Codex проще в старте: понятный интерфейс в ChatGPT, меньше настройки, доступнее по цене. Claude Code мощнее, но требует базового понимания терминала и git.

Можно ли использовать оба одновременно? Да. Это то, что делают многие профессиональные команды. Подписка на ChatGPT Plus ($20) + Claude Max ($100) = $120/мес для полного покрытия обоих инструментов.

Какой инструмент лучше для Telegram-ботов? Оба справятся. Claude Code даёт более чистый код. Codex быстрее итерирует. Для простых ботов разница несущественна.

Что с безопасностью данных? Claude Code: ваш код не покидает машину, в API идёт только обработка. Codex Cloud: код исполняется в облачной песочнице OpenAI. Для чувствительных проектов Claude Code предпочтительнее.

Будет ли один из них закрыт? Нет предпосылок. Оба активно развиваются, оба получают обновления несколько раз в неделю.


Данные актуальны на июнь 2026. Инструменты обновляются быстро — проверяйте официальную документацию для актуальных лимитов и цен.

$ cd ../ ← назад к Рабочее место