Запуск OpenAI Codex локально бесплатно через Ollama
Основной чат
Чат для вайбкодеров: новости, гайды, поиск исполнителей, маркетплейс и разбор реальных кейсов.
Вчера в сообществе AI взорвалась новость: благодаря обновлению Ollama v0.24+ теперь можно запустить полноценный OpenAI Codex (как desktop-приложение, так и CLI) полностью локально, бесплатно, без API-ключей, rate limits и отправки кода на сервера OpenAI.
Это настоящий прорыв для разработчиков, которые хотят privacy, unlimited usage и топовый coding agent experience на своих машинах.
Что такое Codex и почему это важно
Codex от OpenAI долгое время считался одним из самых мощных coding agents: он отлично работал с code review, browser-based editing, review mode и long-running задачами. Но всё это было привязано к платному API с ограничениями.
Теперь ситуация изменилась. Ollama добавил native-поддержку Codex App и Codex CLI, позволяя запускать их с открытыми моделями (Gemma 4, Qwen 3.6, DeepSeek V4 и другими), которые по многим аспектам rival или даже превосходят оригинальный опыт.
Ключевые преимущества локальной версии:
- Полная приватность — код никогда не покидает вашу машину.
- Zero cost после начальной настройки.
- Неограниченное использование — никаких rate limits.
- Мультимодальность и tool-calling на уровне frontier-моделей.
- Полная поддержка встроенного браузера и review mode в desktop-приложении.
Пошаговая настройка
1. Codex App (Desktop) — самый удобный вариант
- Обновите Ollama до версии 0.24 или новее.
- Запустите соответствующую команду для интеграции (точная команда указана в оригинальном посте).
- Выберите модель при первом запуске:
gemma4:31b— отличный all-rounder с сильным reasoning.qwen3.6— топ по coding performance.deepseek-v4— для сложных задач.kimi-k2.6:cloud— если нужна сильная vision-поддержка.
Функции, которые работают локально:
- Встроенный браузер (визуальное редактирование сайтов путём аннотаций прямо на странице).
- Review mode (оставляйте комментарии, итеративно улучшайте код).
- Полноценный чат-интерфейс внутри приложения.
2. Codex CLI — для любителей терминала
# Запуск с open-source флагом
codex --oss
# С конкретной моделью
codex --oss -m gemma4
codex --oss -m qwen3.6
codex --oss -m deepseek-v4
Рекомендации по моделям и hardware
Перед скачиванием больших моделей проверьте совместимость на whatmodelscanirun.com — сервис мгновенно покажет, что потянет ваша видеокарта и VRAM.
Текущие топ-рекомендации (май 2026):
- Gemma 4 31B — баланс качества и скорости.
- Qwen 3.6 — лучший выбор для большинства coding-задач.
- DeepSeek V4 — когда нужны максимальные возможности на сложных проектах.
Практические возможности
Встроенный браузер Codex App позволяет открывать локальные серверы и живые сайты, аннотировать элементы прямо на странице и просить модель внести изменения. Это радикально упрощает frontend-разработку и prototyping.
Review mode даёт возможность инспектировать предложенные изменения кода, оставлять комментарии и итеративно дорабатывать без выхода из приложения — настоящий workflow как у senior-разработчика.
Сравнение с облачными альтернативами (Claude Opus 4.8, GPT-5.5 и др.)
Пока Anthropic выпускает Opus 4.8 с акцентом на honesty, dynamic workflows и agentic reliability, локальный Codex даёт другое преимущество — полную независимость.
Когда выбирать локальный Codex:
- Чувствительные проекты (корпоративный код, личные разработки).
- Постоянная работа без лимитов.
- Тестирование гипотез без затрат.
- Машины с мощным GPU (RTX 4090 и выше рекомендуется для больших моделей).
Когда лучше облако (Claude Opus 4.8 / GPT-5.5):
- Максимально сложные multi-agent задачи.
- Очень большие контексты и свежие знания.
- Когда не хватает локального железа.
Многие разработчики теперь используют гибридный подход: Claude Opus 4.8 или GPT-5.5 для высокоуровневого планирования и исследования, а локальный Codex — для приватной реализации и итераций.
Edge cases и нюансы
- Производительность сильно зависит от hardware. 31B+ модели требуют минимум 24–40+ GB VRAM для комфортной работы.
- Качество открытой модели может немного уступать оригинальному Codex на самых сложных reasoning-задачах, но разница быстро сокращается.
- Обновления Ollama выходят часто — следите за релизами.
- Для Windows/macOS/Linux поддержка отличается — проверяйте документацию.
Заключение: Новая эра локального AI development
Ollama v0.24+ фактически демократизировал доступ к мощным coding agents. То, что раньше стоило десятки-сотни долларов в месяц на API, теперь работает бесплатно и приватно на вашем ПК.
Это особенно timely на фоне выхода Claude Opus 4.8 — разработчики получают выбор: мощь и reliability облачных frontier-моделей или свобода и приватность локальных решений.
Рекомендуем попробовать прямо сегодня. Для многих это станет основным рабочим инструментом в 2026 году.
Смотрите полный видео-гайд по настройке: YouTube
Источники: Пост @intheworldofai, официальная документация Ollama, отзывы сообщества на май 2026.