Claude Code — напарник, Codex — исполнитель
Утром пятого февраля я час бился с задачей в Claude Code. 158 промптов за день — рекорд недели. Задача не шла. Отдал тот же контекст Codex CLI — он её прожил с первой попытки.
Зачем два агента
В январе я писал полный разбор рынка AI-инструментов для кодинга — и рекомендовал кросс-валидацию моделей. Теория. Теперь у меня неделя реальных данных.
По Steve Sewell из Builder.io, все три инструмента — Cursor, Claude Code, Codex — конвергируют: фичи переползают от одного к другому. Я решил посмотреть, как каждый проявляет себя на моих задачах. Не на бенчмарках. На реальных проектах за неделю.
Данные: 2-9 февраля 2026
Я пишу промпты, агенты пишут код. Все логи сохраняются. Вот что получилось за неделю.
Claude Code Codex CLI
─────────── ─────────
Промпты 703 94
Сессии 229 17
Проекты 19 8
Модель Claude Opus 4.6 gpt-5.3-codex
Turns ~703 (1:1) 847 (9:1)
Активность по дням:
Пн ████████████████░░░░ 82 ██░░░░░░░░░░░░░░░░░░ 8
Вт ████████████████░░░░ 80 ░░░░░░░░░░░░░░░░░░░░ 2
Ср █████████████████░░░ 88 ███░░░░░░░░░░░░░░░░░ 11
Чт ████████████████████ 158 ██░░░░░░░░░░░░░░░░░░ 7
Пт ██████████████░░░░░░ 136 ████░░░░░░░░░░░░░░░░ 16
Сб █████████████████░░░ 144 ████░░░░░░░░░░░░░░░░ 14
Вс █░░░░░░░░░░░░░░░░░░ 15 █████████████████░░░ 36
88 промптов/день ~13 промптов/день
Разница в объёме очевидна — CC получает в 7 раз больше промптов. Но ключевая цифра: 847 conversation turns у Codex при 94 промптах. В среднем 9 turns на один промпт. Агент делает значительно больше за один ход: цепочки из чтения, анализа, правок, проверок — без моего участия.
Разные характеры
CC работает как напарник — я описываю баг в SQLAlchemy-миграции, он предлагает подход, я корректирую, он правит, я проверяю. Диалог. Думаем вместе. За неделю — 19 проектов: cohorts (114 промптов), tg-digest-opus (108), hsl-mozg (106), sereja.tech (70), amarchitects-site (62). Самая длинная сессия — 4076 строк, генерация видео-урока.
Codex работает как исполнитель. Получает задачу и уходит работать. Мой стиль промптов для него: “сделай всё сам и проверь всё сам”, “можно отдавать клиенту?”. Конфиг — full-auto, xhigh reasoning, danger-full-access. Самая большая сессия — 357 turns, 8 MB, интеграция CMS для amarchitects-site.
Пик Codex пришёлся на воскресенье, 9 февраля — 643 turns, 36 промптов, 14.8 MB логов. В этот же день CC почти отдыхал (15 промптов). Характерно: когда нужна полная интеграция — PocketBase + Vercel + фронтенд — и можно не трогать час, я переключаюсь на Codex.
Где каждый сильнее
CC — для длинных сессий и планирования. Brainstorming, architecture decisions, итеративная работа, когда мне нужно обсудить подход, а не получить результат. 37% сессий маленькие, 29% средние, 34% большие. Переключаюсь между 19 проектами за неделю, и у каждого свой CLAUDE.md, свои скиллы, своя память. Короче: CC знает контекст каждого проекта.
9 февраля я отдал Codex проект amarchitects-site — CMS-записи не обновлялись на сайте. 357 turns спустя он нашёл разрыв между PocketBase и Vercel, прогнал полный CRUD-цикл и написал: “можно отдавать клиенту”. Я не просил его проверять CRUD. Он сам. Calvin French-Owen, сооснователь Segment и бывший инженер команды Codex в OpenAI, признался что сам перешёл на CC для ежедневной работы. Но его оценка Codex как ревьюера совпадает с моей.
Такой промпт в CC даст вежливый обзор. В Codex — 357 turns молчаливой работы и список конкретных проблем.
Конфигурации под капотом
Claude Code Codex CLI
────────────── ──────────────
Модель: Claude Opus 4.6 Модель: gpt-5.3-codex
MCP: exa, playwright, +3 MCP: exa, chrome-devtools
Skills: система скиллов Skills: кастомные скиллы
Hooks: pre/post Режим: full-auto, xhigh
Memory: CLAUDE.md + Auto Memory Версия: 0.99.0-alpha.5
CC выигрывает в экосистеме. MCP-серверы, система памяти между сессиями, hooks, skills marketplace. Зрелый продукт.
Codex пока альфа (0.99.0-alpha.5), но с козырем — xhigh reasoning на gpt-5.3-codex. Когда задача требует глубокого анализа, этот режим оправдывает себя. chrome-devtools MCP позволяет ему самостоятельно проверять фронтенд в браузере.
Стоимость
Точных цифр по Codex за неделю у меня нет — CLI не даёт детальную разбивку. Но по Adrian Cole, Senior Engineer, который перешёл с CC Max на Codex, координация между CC и задачей (coordination cost) дороже, чем автономная работа Codex. CC требует постоянного внимания — 703 промпта за неделю подтверждают.
CC на Max-подписке — фиксированная сумма. Codex Pro — тоже. Оба окупаются на первой серьёзной задаче. Подробнее про экономику я разбирал в полном обзоре AI-инструментов.
По-моему, реальная стоимость — не подписка, а внимание. CC съедает больше моего времени: 88 промптов в день — это я постоянно в диалоге. Codex с его 13 промптами в день забирает задачу и освобождает меня.
Что не получилось
CC плохо справляется с длинными цепочками зависимых шагов. На проекте cohorts — генерация видео-урока, сессия на 4076 строк — мне приходилось подхватывать его каждые 10-15 промптов. Про это я уже писал — 95% контекста занимают результаты тулов, а не мой код.
Codex плохо справляется с brainstorming. Он не задаёт уточняющих вопросов. Получает задачу — и делает. Нечёткая формулировка — не тот результат. Нет аналога Plan Mode, нет системы правил, которая накапливает опыт между сессиями.
Adaline Labs пришли к похожему выводу: оба инструмента превышают human parity на типовых задачах, но выбор зависит от workflow. Не от бенчмарков.
Мой workflow сейчас
Утро, минут 20-30. Планирование в CC — brainstorming, архитектура, разбивка на задачи. Диалог.
День. Крупные задачи уходят в Codex — “сделай и проверь”. Мелкие правки и вопросы — в CC.
Ревью, минут 40 перед деплоем — Codex. “Проверь весь проект, найди проблемы.”
Я не выбираю между ними. Использую оба — для разного.
Итого
703 промпта в CC, 94 в Codex. Но 847 turns у Codex — он делает больше за ход. CC — напарник для думания, Codex — исполнитель для автономной работы.
Если выбираете один — CC. Экосистема, память, скиллы, зрелость. Если можете оба — CC для планирования и итераций, Codex для автономных задач и ревью.
Неделя данных — не приговор. Codex ещё в альфе, CC обновляется каждую неделю. Через месяц расклад может измениться. Но прямо сейчас два агента вместе работают лучше, чем каждый по отдельности. По-моему, кросс-валидация — единственный подход, который масштабируется.
Данные: 2-9 февраля 2026. Claude Code на Opus 4.6, Codex CLI 0.99.0-alpha.5 на gpt-5.3-codex. 19 проектов, 797 промптов суммарно.
Подписаться на обновления — @sereja_tech