16 Червня, 2026

Блокує безпечні промпти. Кіберфахівці оцінили роботу ШІ-моделі Fable від Anthropic

Про це повідомляє TechCrunch.

Як ми вже писали, Fable — це публічна версія кібербезпекової моделі Mythos, яку презентували у квітні в межах ініціативи Project Glasswing для захисту критичної інфраструктури.

Читайте также: Штрафи для юристів. Суд у США закрив справу через вигадані дані? створені ШІ

Реклама

Якщо система зчитує промпт користувача як порушення правил, Fable зупиняє чат та сповіщає про позначення повідомлення«як такого, що стосується кібербезпеки або біології». Це має запобігати використанню Fable для створення шкідливого ПЗ або біологічної зброї.

Втім, у кібергалузі знайшлися ті, хто не вподобали ці обмеження.

«[Fable] відхиляє будь-який запит, який може бути хоча б побічно пов’язаний з кібербезпекою. Навіть такі нешкідливі завдання, як читання допису в блозі», — написала в X дослідниця компанії IBM X-Force Валентина Пальміотті.

Cпівробітник стартапу Tolmo Метт Суйче зазначив, що Fable відмовляється робити навіть звичайну перевірку коду. Фільтри працюють за ключовими словами, а внаслідок обмежень модель автоматично перемикається на старішу модель Claude Opus 4.8, випущену минулого місяця.

Читайте также: Потужністю 168 мегаватів. Meta уклала першу угоду про ШІ-центр обробки даних в Індії

«Якщо ви просите її написати безпечний код, вона вважає, що це робота, пов’язана з кібербезпекою, замість найкращих практик програмної інженерії, і вас понижують у версії», — поділився спеціаліст.

Водночас Суйче вважає такий підхід виправданим на ранніх етапах розвитку технології. На його думку, під час подібних релізів компаніям краще запровадити максимально суворі рамки та поступово послаблювати їх з часом, ніж випадково пропустити небезпечні запити від зловмисників.

Представники Anthropic наразі не прокоментували критику від технологічної спільноти, пише TechCrunch.

Читайте также: Тайцзюань від гуманоїда. Робот Z01 опанував складні рухи традиційного китайського бойового мистецтва

Автор admin

Залишити відповідь

Ваша e-mail адреса не оприлюднюватиметься. Обов’язкові поля позначені *