Блокує безпечні промпти. Кіберфахівці оцінили роботу ШІ-моделі Fable від Anthropic

Про це повідомляє TechCrunch.

Як ми вже писали, Fable — це публічна версія кібербезпекової моделі Mythos, яку презентували у квітні в межах ініціативи Project Glasswing для захисту критичної інфраструктури.

Якщо система зчитує промпт користувача як порушення правил, Fable зупиняє чат та сповіщає про позначення повідомлення«як такого, що стосується кібербезпеки або біології». Це має запобігати використанню Fable для створення шкідливого ПЗ або біологічної зброї.

Втім, у кібергалузі знайшлися ті, хто не вподобали ці обмеження.

«[Fable] відхиляє будь-який запит, який може бути хоча б побічно пов’язаний з кібербезпекою. Навіть такі нешкідливі завдання, як читання допису в блозі», — написала в X дослідниця компанії IBM X-Force Валентина Пальміотті.

Cпівробітник стартапу Tolmo Метт Суйче зазначив, що Fable відмовляється робити навіть звичайну перевірку коду. Фільтри працюють за ключовими словами, а внаслідок обмежень модель автоматично перемикається на старішу модель Claude Opus 4.8, випущену минулого місяця.

«Якщо ви просите її написати безпечний код, вона вважає, що це робота, пов’язана з кібербезпекою, замість найкращих практик програмної інженерії, і вас понижують у версії», — поділився спеціаліст.

Водночас Суйче вважає такий підхід виправданим на ранніх етапах розвитку технології. На його думку, під час подібних релізів компаніям краще запровадити максимально суворі рамки та поступово послаблювати їх з часом, ніж випадково пропустити небезпечні запити від зловмисників.

Представники Anthropic наразі не прокоментували критику від технологічної спільноти, пише TechCrunch.

Блокує безпечні промпти. Кіберфахівці оцінили роботу ШІ-моделі Fable від Anthropic

Автор admin

Залишити відповідь Скасувати коментар

Ви пропустили

Жертва насильства чи таємний ритуал? Археологи досліджують дивне неолітичне поховання

Милий плюшевий кролик. Іспанські вчені створили унікального робота-компаньйона для літніх людей

Унікальні мозаїки та мармурова статуя. Чорні археологи випадково вивели вчених на розкішну імператорську віллу поблизу Рима

Недовіра до нейромереж. 60% опитаних американців відштовхують згадки про ШІ у рекламі брендів

Блокує безпечні промпти. Кіберфахівці оцінили роботу ШІ-моделі Fable від Anthropic

Автор admin

Схожі публікації

Недовіра до нейромереж. 60% опитаних американців відштовхують згадки про ШІ у рекламі брендів

Баг чи розрахунок. AMD вимкнула функцію безпеки на бюджетних Ryzen — і досі не відповіла, навіщо

Кінець епохи uBlock Origin. Google остаточно відключає старі розширення в Chrome

Залишити відповідь Скасувати коментар

Ви пропустили

Жертва насильства чи таємний ритуал? Археологи досліджують дивне неолітичне поховання

Милий плюшевий кролик. Іспанські вчені створили унікального робота-компаньйона для літніх людей

Унікальні мозаїки та мармурова статуя. Чорні археологи випадково вивели вчених на розкішну імператорську віллу поблизу Рима

Недовіра до нейромереж. 60% опитаних американців відштовхують згадки про ШІ у рекламі брендів