Про це повідомляє TechCrunch.
Як ми вже писали, Fable — це публічна версія кібербезпекової моделі Mythos, яку презентували у квітні в межах ініціативи Project Glasswing для захисту критичної інфраструктури.
Читайте также: Штрафи для юристів. Суд у США закрив справу через вигадані дані? створені ШІ
Якщо система зчитує промпт користувача як порушення правил, Fable зупиняє чат та сповіщає про позначення повідомлення«як такого, що стосується кібербезпеки або біології». Це має запобігати використанню Fable для створення шкідливого ПЗ або біологічної зброї.
Втім, у кібергалузі знайшлися ті, хто не вподобали ці обмеження.
«[Fable] відхиляє будь-який запит, який може бути хоча б побічно пов’язаний з кібербезпекою. Навіть такі нешкідливі завдання, як читання допису в блозі», — написала в X дослідниця компанії IBM X-Force Валентина Пальміотті.
Cпівробітник стартапу Tolmo Метт Суйче зазначив, що Fable відмовляється робити навіть звичайну перевірку коду. Фільтри працюють за ключовими словами, а внаслідок обмежень модель автоматично перемикається на старішу модель Claude Opus 4.8, випущену минулого місяця.
Читайте также: Потужністю 168 мегаватів. Meta уклала першу угоду про ШІ-центр обробки даних в Індії
«Якщо ви просите її написати безпечний код, вона вважає, що це робота, пов’язана з кібербезпекою, замість найкращих практик програмної інженерії, і вас понижують у версії», — поділився спеціаліст.
Водночас Суйче вважає такий підхід виправданим на ранніх етапах розвитку технології. На його думку, під час подібних релізів компаніям краще запровадити максимально суворі рамки та поступово послаблювати їх з часом, ніж випадково пропустити небезпечні запити від зловмисників.
Представники Anthropic наразі не прокоментували критику від технологічної спільноти, пише TechCrunch.
Читайте также: Тайцзюань від гуманоїда. Робот Z01 опанував складні рухи традиційного китайського бойового мистецтва
