4 Червня, 2026

Вийшла з-під контролю: Anthropic вважає, що Claude Mythos надто потужна для публічного релізу

Компанія Anthropic вирішила відкласти публічний реліз своєї найновішої LLM-моделі Claude Mythos через побоювання, що вона занадто добре знаходить критичні вразливості в операційних системах та браузерах.

Читайте также: Порушення всіх канонів. У Британії знайшли химерну золоту монету з Іваном Хрестителем

«Значне розширення можливостей попередньої версії Claude Mythos змусило нас вирішити не робити її загальнодоступною», — йдеться в заяві Anthropic. 

Представник Anthropic детально описав низку тривожних висновків про роботу нової моделі. Вона не тільки легко знаходить вразливості в надійних перевірених системах, але й може вийти з віртуальної «пісочниці», що робить LLM потенційно небезпечною.

Вийшла з-під контролю: Anthropic вважає, що Claude Mythos надто потужна для публічного релізу

Під час одного з експериментів дослідник поставив перед Mythos завдання надіслати йому повідомлення, якщо вона може втекти з пісочниці. «Дослідник дізнався про успіше виконання завдання, отримавши неочікуваний електронний лист від моделі, коли їв бутерброд у парку», — пишуть в Anthropic.

Вражаючу потужність Mythos демонструє факт того, що модель самостійно знайшла 27-річну вразливість у OpenBSD — системі, яка вважається однією з найзахищеніших у світі.

Особливе занепокоєння викликає той факт, що нова LLM дозволяє навіть «неекспертам» створювати шкідливі експлойти.

Читайте также: Не лише тривалість, а й графік. Вчені виявили приховану загрозу нерегулярного сну

«Інженери Anthropic без формальної підготовки з безпеки просили Mythos Preview знайти вразливості віддаленого виконання коду протягом ночі, а наступного ранку прокидалися з повністю робочим експлойтом», – написала команда Frontier Red з Anthropic у блозі. 

Що стосується порівняння Mythos з найкращою на сьогоднішній день моделлю штучного інтелекту Claude Opus 4.6, то вони теж вражають:

ПоказникClaude Opus 4.6Claude Mythos
Відтворення вразливостей (CyberGym)66.6%83.1%
Кодинг (SWE-bench Pro)53.4%77.8%
Логіка та міркування (Terminal-Bench)65.4%82.0%

Тепер в Anthropic заявили, що компанія вирішила не публікувати Mythos публічно. Натомість вони сподіваються випустити «моделі класу Mythos» після того, як буде вжито належних заходів безпеки.

Нагадаємо, що в Copilot тепер можна одночасно використовувати моделі Anthropic та OpenAI.

Читайте также: Що купити замість iPhone 17 Pro? ТОП-3 преміальні смартфони до 65 тисяч гривень у 2026 році

Автор admin

Залишити відповідь

Ваша e-mail адреса не оприлюднюватиметься. Обов’язкові поля позначені *