Claude Code — напарник, Codex — исполнитель

Сережа Рис · 9 February 2026

Утром пятого февраля я час бился с задачей в Claude Code. 158 промптов за день — рекорд недели. Задача не шла. Отдал тот же контекст Codex CLI — он её прожил с первой попытки.

Зачем два агента

В январе я писал полный разбор рынка AI-инструментов для кодинга — и рекомендовал кросс-валидацию моделей. Теория. Теперь у меня неделя реальных данных.

По Steve Sewell из Builder.io, все три инструмента — Cursor, Claude Code, Codex — конвергируют: фичи переползают от одного к другому. Я решил посмотреть, как каждый проявляет себя на моих задачах. Не на бенчмарках. На реальных проектах за неделю.

Данные: 2-9 февраля 2026

Я пишу промпты, агенты пишут код. Все логи сохраняются. Вот что получилось за неделю.

         Claude Code                     Codex CLI
         ───────────                     ─────────
Промпты  703                             94
Сессии   229                             17
Проекты  19                              8
Модель   Claude Opus 4.6                 gpt-5.3-codex
Turns    ~703 (1:1)                      847 (9:1)

Активность по дням:

Пн  ████████████████░░░░ 82        ██░░░░░░░░░░░░░░░░░░  8
Вт  ████████████████░░░░ 80        ░░░░░░░░░░░░░░░░░░░░  2
Ср  █████████████████░░░ 88        ███░░░░░░░░░░░░░░░░░ 11
Чт  ████████████████████ 158       ██░░░░░░░░░░░░░░░░░░  7
Пт  ██████████████░░░░░░ 136       ████░░░░░░░░░░░░░░░░ 16
Сб  █████████████████░░░ 144       ████░░░░░░░░░░░░░░░░ 14
Вс  █░░░░░░░░░░░░░░░░░░  15       █████████████████░░░ 36
         88 промптов/день              ~13 промптов/день

Разница в объёме очевидна — CC получает в 7 раз больше промптов. Но ключевая цифра: 847 conversation turns у Codex при 94 промптах. В среднем 9 turns на один промпт. Агент делает значительно больше за один ход: цепочки из чтения, анализа, правок, проверок — без моего участия.

Разные характеры

CC работает как напарник — я описываю баг в SQLAlchemy-миграции, он предлагает подход, я корректирую, он правит, я проверяю. Диалог. Думаем вместе. За неделю — 19 проектов: cohorts (114 промптов), tg-digest-opus (108), hsl-mozg (106), sereja.tech (70), amarchitects-site (62). Самая длинная сессия — 4076 строк, генерация видео-урока.

Codex работает как исполнитель. Получает задачу и уходит работать. Мой стиль промптов для него: “сделай всё сам и проверь всё сам”, “можно отдавать клиенту?”. Конфиг — full-auto, xhigh reasoning, danger-full-access. Самая большая сессия — 357 turns, 8 MB, интеграция CMS для amarchitects-site.

Пик Codex пришёлся на воскресенье, 9 февраля — 643 turns, 36 промптов, 14.8 MB логов. В этот же день CC почти отдыхал (15 промптов). Характерно: когда нужна полная интеграция — PocketBase + Vercel + фронтенд — и можно не трогать час, я переключаюсь на Codex.

Где каждый сильнее

CC — для длинных сессий и планирования. Brainstorming, architecture decisions, итеративная работа, когда мне нужно обсудить подход, а не получить результат. 37% сессий маленькие, 29% средние, 34% большие. Переключаюсь между 19 проектами за неделю, и у каждого свой CLAUDE.md, свои скиллы, своя память. Короче: CC знает контекст каждого проекта.

9 февраля я отдал Codex проект amarchitects-site — CMS-записи не обновлялись на сайте. 357 turns спустя он нашёл разрыв между PocketBase и Vercel, прогнал полный CRUD-цикл и написал: “можно отдавать клиенту”. Я не просил его проверять CRUD. Он сам. Calvin French-Owen, сооснователь Segment и бывший инженер команды Codex в OpenAI, признался что сам перешёл на CC для ежедневной работы. Но его оценка Codex как ревьюера совпадает с моей.

Проверь весь проект. Найди несоответствия между компонентами. Можно отдавать клиенту?

Такой промпт в CC даст вежливый обзор. В Codex — 357 turns молчаливой работы и список конкретных проблем.

Конфигурации под капотом

Claude Code                          Codex CLI
──────────────                       ──────────────
Модель: Claude Opus 4.6              Модель: gpt-5.3-codex
MCP: exa, playwright, +3             MCP: exa, chrome-devtools
Skills: система скиллов              Skills: кастомные скиллы
Hooks: pre/post                      Режим: full-auto, xhigh
Memory: CLAUDE.md + Auto Memory      Версия: 0.99.0-alpha.5

CC выигрывает в экосистеме. MCP-серверы, система памяти между сессиями, hooks, skills marketplace. Зрелый продукт.

Codex пока альфа (0.99.0-alpha.5), но с козырем — xhigh reasoning на gpt-5.3-codex. Когда задача требует глубокого анализа, этот режим оправдывает себя. chrome-devtools MCP позволяет ему самостоятельно проверять фронтенд в браузере.

Стоимость

Точных цифр по Codex за неделю у меня нет — CLI не даёт детальную разбивку. Но по Adrian Cole, Senior Engineer, который перешёл с CC Max на Codex, координация между CC и задачей (coordination cost) дороже, чем автономная работа Codex. CC требует постоянного внимания — 703 промпта за неделю подтверждают.

CC на Max-подписке — фиксированная сумма. Codex Pro — тоже. Оба окупаются на первой серьёзной задаче. Подробнее про экономику я разбирал в полном обзоре AI-инструментов.

По-моему, реальная стоимость — не подписка, а внимание. CC съедает больше моего времени: 88 промптов в день — это я постоянно в диалоге. Codex с его 13 промптами в день забирает задачу и освобождает меня.

Что не получилось

CC плохо справляется с длинными цепочками зависимых шагов. На проекте cohorts — генерация видео-урока, сессия на 4076 строк — мне приходилось подхватывать его каждые 10-15 промптов. Про это я уже писал — 95% контекста занимают результаты тулов, а не мой код.

Codex плохо справляется с brainstorming. Он не задаёт уточняющих вопросов. Получает задачу — и делает. Нечёткая формулировка — не тот результат. Нет аналога Plan Mode, нет системы правил, которая накапливает опыт между сессиями.

Adaline Labs пришли к похожему выводу: оба инструмента превышают human parity на типовых задачах, но выбор зависит от workflow. Не от бенчмарков.

Мой workflow сейчас

Утро, минут 20-30. Планирование в CC — brainstorming, архитектура, разбивка на задачи. Диалог.

День. Крупные задачи уходят в Codex — “сделай и проверь”. Мелкие правки и вопросы — в CC.

Ревью, минут 40 перед деплоем — Codex. “Проверь весь проект, найди проблемы.”

Я не выбираю между ними. Использую оба — для разного.

Итого

703 промпта в CC, 94 в Codex. Но 847 turns у Codex — он делает больше за ход. CC — напарник для думания, Codex — исполнитель для автономной работы.

Если выбираете один — CC. Экосистема, память, скиллы, зрелость. Если можете оба — CC для планирования и итераций, Codex для автономных задач и ревью.

Неделя данных — не приговор. Codex ещё в альфе, CC обновляется каждую неделю. Через месяц расклад может измениться. Но прямо сейчас два агента вместе работают лучше, чем каждый по отдельности. По-моему, кросс-валидация — единственный подход, который масштабируется.

Данные: 2-9 февраля 2026. Claude Code на Opus 4.6, Codex CLI 0.99.0-alpha.5 на gpt-5.3-codex. 19 проектов, 797 промптов суммарно.

Об авторе

Claude Code — напарник, Codex — исполнитель

Зачем два агента

Данные: 2-9 февраля 2026

Разные характеры

Где каждый сильнее

Конфигурации под капотом

Стоимость

Что не получилось

Мой workflow сейчас

Итого

Читайте также