Anthropic представила Claude Sonnet 5 — нову LLM-модель, яка, за словами компанії, наближається за продуктивністю до флагманської Opus 4.8, але коштує суттєво дешевше.
Читайте также: Meta обмежує безкоштовне використання смарт-окулярів Ray-Ban
Sonnet 5 стала моделлю за замовчуванням для користувачів безкоштовного та Pro-тарифів, також вона доступна власникам Max, Team і Enterprise, у Claude Code та через Claude Platform.
Ціна: вдвічі дешевше за Opus
Головний аргумент нового релізу — вартість. До 31 серпня 2026 року діє промо-ціна $2 за мільйон вхідних токенів і $10 за мільйон вихідних. Після цієї дати тарифи зростуть до $3 і $15 відповідно — усе одно значно нижче за $5/$25 для Opus 4.8.
| Модель | Вхідні токени (вступна ціна, до 31.08.2026) | Вихідні токени (вступна ціна, до 31.08.2026) | Вхідні токени (стандартна ціна, з 01.09.2026) | Вихідні токени (стандартна ціна, з 01.09.2026) |
|---|---|---|---|---|
| Claude Sonnet 5 | $2 | $10 | $3 | $15 |
| Claude Opus 4.8 | $5 | $25 | $5 | $25 |
Втім, TheNextWeb звертає увагу на один нюанс: Sonnet 5 використовує новий токенізатор, через що один і той самий текст витрачає до 1,35 раза більше токенів, ніж раніше. Тобто промо-ціну підібрали так, щоб перехід залишався приблизно нейтральним за витратами — реальна економія на практиці може бути меншою, ніж здається на перший погляд.
Автономність — головна перевага Sonnet 5
Anthropic називає Sonnet 5 «найбільш агентною моделлю серії Sonnet». Модель здатна самостійно будувати плани, керувати браузером і терміналом та виконувати багатоетапні завдання без постійного втручання людини — саме туди, за словами TechCrunch, зараз рухається вся індустрія: OpenAI нещодавно випустила GPT-5.6 Sol із підтримкою розподілу роботи між сабагентами, а Google представила Gemini 3.5 Flash з подібним позиціюванням.
| Бенчмарк | Що вимірює | Sonnet 4.6 | Sonnet 5 | Opus 4.8 |
|---|---|---|---|---|
| SWE-bench Pro | Агентне кодування | 58,1% | 63,2% | 69,2% |
| Terminal-Bench 2.1 | Робота з терміналом | 67,0% | 80,4% | — |
| Tool-assisted reasoning | Міркування з інструментами | 46,8% | 57,4% | — |
| Knowledge-work benchmark | Робота зі знаннями (бали) | — | 1618 | 1615 |
| Firefox 147 exploit (повний успіх) | Небезпечні кібернавички | 0,0% | 0,0% | 68,8% |
| Firefox 147 exploit (частковий успіх) | Небезпечні кібернавички | 8,8% | 13,2% | — |
Що стосується бенчмарків, то на SWE-bench Pro Sonnet 5 набирає 63,2% проти 58,1% у попередника Sonnet 4.6 та 69,2% у Opus 4.8. На Terminal-Bench 2.1 результат зріс із 67,0% до 80,4%, а на тестах інструментального міркування — з 46,8% до 57,4%. А в одному з тестів на роботу зі знаннями Sonnet 5 навіть випереджає Opus 4.8 — 1618 проти 1615 балів.
Читайте также: Сонце ще не найбільша загроза. Учені назвали точну дату, коли на Землі зникне остання рослина
Безпека: краще за інші, але не на рівні Opus
Anthropic стверджує, що Sonnet 5 демонструє нижчий рівень «небажаної поведінки» порівняно з Sonnet 4.6: менше галюцинацій, менше догідливості (sycophancy) і краща стійкість до атак типу prompt injection, коли приховані інструкції намагаються перехопити керування агентом.
Водночас за показниками узгодженості (alignment) модель усе ще поступається Opus 4.8 і закритій моделі Claude Mythos Preview. У тесті на розробку експлойту для Firefox, проведеному спільно з Mozilla, ні Sonnet 5, ні Sonnet 4.6 не змогли створити робочий експлойт — обидві отримали 0%, хоча Sonnet 5 показав вищий рівень часткового успіху (13,2% проти 8,8% у попередника). Для порівняння: Opus 4.8 впорався на 68,8%, а Mythos 5 — на 88,4%.
Попри те, що модель спеціально не тренували для кібербезпекових задач, Anthropic увімкнула для неї ті самі захисні механізми в реальному часі, що й для Opus 4.7 і 4.8 — систему, яка виявляє та блокує небезпечне використання в кіберсфері. Це менш жорсткі обмеження, ніж ті, що застосовуються до Fable 5.
Чому поява Sonnet 5 важлива для ринку
Реліз Sonnet 5 збігається зі зміною настроїв у корпоративному секторі: за даними Android Headlines, такі гіганти, як Meta, Amazon і Uber, останнім часом свідомо скорочують надмірне використання обчислювальних ресурсів на штучний інтелект (токенмаксинг) після отримання несподівано великих рахунків. Дешевша, але потужна агентна модель — це спосіб Anthropic утримати розробників в екосистемі саме в той момент, коли компанія готується довести інвесторам стійкість своєї бізнес-моделі перед публічним лістингом.
Нагадаємо, кілька днів тому Anthropic звинуватила компанію Alibaba у використанні 25 тисяч фейкових акаунтів для копіювання можливостей Claude.
Читайте также: Сонце ще не найбільша загроза. Учені назвали точну дату, коли на Землі зникне остання рослина
Підписуйтесь на нас у соцмережах: Telegram | Facebook | LinkedIn
