← Блог

Sonnet 5: скучный релиз с одним полезным навыком

Сережа Рис · 1 July 2026

claude-sonnet-5anthropicclaude-codeвайбкодингоркестрацияopus

Sonnet 5 вышел 30 июня. Мой вердикт по итогам стрима в день релиза короткий: по ощущениям это апдейт на уровне 4.8, до полноценной пятой генерации модель не дотягивает. Полезный навык всё же нашёлся: она прилично держит роль исполнителя, когда планирует и режет задачу Opus.

Тестировал Sonnet 5 вживую на стриме в день релиза: рой субагентов под её управлением строил мультиплеерную 3D-игру, клон Quake, а зрители потом играли в неё вживую в чате. Вот запись:

Дальше по пунктам: что скучно, что реально любопытно, и почему независимый разбор Theo (t3.gg) на следующий день звучит почти дословно как мой вывод со стрима.

Почему это скучный релиз

Ожидания перед релизом были большие: номер “5” в названии звучит как новое поколение. На практике работа с моделью ощущается как апдейт. Прыжка в возможностях я не почувствовал.

После плейтеста собранной игры я прогнал метрики отклика и сформулировал вывод прямо в эфире: стало сильно лучше, модель подтянулась к уровню прошлого топа, к опыту 4.8. Это и есть вся дистанция до заявленного скачка: подтягивание к уровню прошлого топа, и только. Sonnet 5 вполне могла называться Sonnet 4.x, и в повседневной работе я бы не заметил разницы в цифре. Плюс смешанное чувство по скорости: на тех же классах задач Composer у Cursor ощущается резвее. Ничего не сломалось, но и восторга релиз не вызвал.

Единственное, что реально интересно: оркестрация

Настоящий прогресс модели, который я увидел, в другом: в том, как она держит агентную работу. Раньше Sonnet требовал оркестратора почти на каждом шаге длинной задачи и часто застревал на многошаговых сценариях. Новая версия дольше действует автономно, сама решает, какой инструмент вызвать: терминал, браузер, поиск, и доводит сложные задачи до конца там, где предыдущие версии обычно спотыкались. По итогам стрима это самый агентный Sonnet за всю историю линейки.

Но там же, в роли главного агента, который сам ставит подзадачи рою субагентов и держит целостность сложного проекта, модель начала спотыкаться. Игра работала с заметными артефактами: лаги, провалы сквозь геометрию, одни и те же баги возвращались после починки. После лайв-плейтеста с чатом вывод сложился однозначный: как оркестратора я бы её не рекомендовал, вообще. Она путается на мелочах чаще, чем хотелось бы, и в этой роли Opus работает надёжнее.

Финальная формулировка родилась там же, в итоговом блоке эфира: Opus работает планировщиком и оркестратором, Sonnet реализует уже готовый план.

Формула простая: Opus планирует, Sonnet исполняет.

И не только я так думаю: разбор Theo

После дня своих тестов Theo (t3.gg) пришёл ровно к той же развилке, независимо от моего стрима. Его разбор жёстче в деталях, но выводы совпадают почти построчно.

Для общего кодинга Sonnet 5 плохо заменяет Opus: медленнее и прожорливее по токенам. На задачах Theo насчитал примерно вдвое больше токенов, чем у Opus, и до пяти раз больше, чем у GPT. Переписывание игры заняло у Sonnet около двух часов против 27 минут у Opus. Когда модель не может решить задачу, она ходит по кругу.

Реально интересный навык тот же, что заметил я: модель любит субагентов, режет работу и оркестрирует, поведение, которое раньше видели в основном у Fable 5. Но самой Sonnet 5 не хватает ума вести эту оркестрацию хорошо. Лучшая рамка от Theo: Sonnet 5 воркер среднего размера, которого зовут как инструмент более умные модели: Fable, Opus, GPT. Мозгом системы она не работает.

Цена вводная: 2 доллара за миллион токенов на входе и 10 на выходе, действует до 31 августа 2026 года, дальше вырастет. Но реальная стоимость задачи высокая: неэффективность по токенам съедает всю экономию на низкой цене.

Отдельная регрессия: модель чаще отказывается от безобидной работы. Успех на benign-задачах упал ниже 92%, при том что у Sonnet 4.6 было 97%. В реальной разработке это раздражает. Плюс утечка мыслей: модель разговаривает сама с собой о том, какие инструменты может использовать, Theo насчитал 21 “let me” на одной странице трейса. Это тоже часть причины, почему она жжёт токены.

Итог Theo: имя “5” щедрое. Оркестрация и субагенты интересны, но самой Sonnet 5 не хватает ума быть оркестратором. Полезна как инструмент для более умных моделей. Полный разбор на X.

Как пользоваться с умом

Зову Sonnet 5, когда:

Оставляю Opus, когда:

Вывод

Чувства смешанные. Sonnet 5 не тянет на громкое имя “пятёрка” и получился одним из самых скучных релизов Anthropic за последнее время. Узкая ниша у неё всё же нашлась: рабочая лошадка-исполнитель под оркестрацией Opus, и на эту роль модель пришла подготовленной куда лучше прошлой версии.

Дальше жду, поправит ли Anthropic регрессию отказов и утечку мыслей в следующем патче, и как ответит Cursor через Composer 2.5. Про предыдущий громкий релиз, Claude Fable 5, у меня был противоположный вердикт: там модель приятно удивила прямо с порога. Тут вышло ровно наоборот.

Развернуть таймкоды теста Sonnet 5

08:35, новости релиза и старт дизайна в Orca. Открываю релиз Sonnet 5 прямо в эфире и ставлю первую задачу: пять субагентов на новой модели рисуют варианты дизайна одной страницы.

1:09:36, старт постройки Sonnet Arena. Рой субагентов под управлением Sonnet 5 берётся за мультиплеерную 3D-игру, клон Quake, без Opus в роли оркестратора на этом этапе.

1:27:05, публикация игры. Sonnet Arena собрана и опубликована, разговор уходит в экономию токенов против GLM.

1:32:15, реакция Twitter на токеномику. Читаю вслух свежие твиты и разбор от Grok про то, как Sonnet 5 сравнивают с GLM и Composer по токенам и цене.

1:42:05, лайв-плейтест с чатом. Зрители заходят в собранную игру вживую, баги и лаги видны всем, отсюда и вердикт про Sonnet-оркестратора.

1:48:45, итог: Opus планирует, Sonnet исполняет. Подвожу итог дня и формулирую ролевое разделение моделей, прощание со зрителями.

Подписаться на обновления — @sereja_tech