Про це пише видання Gizmodo.
Anthropic, яка нещодавно стала найдорожчою лабораторією у сфері передових ШІ-розробок і оголосила про плани виходу на біржу, повідомила про розширення програми Project Glasswing.
Читайте также: Квантова навігація. Вчені з’ясували як голуби орієнтуються в просторі за допомогою печінки
Серед нових партнерів є компанії, які підтримують програмний код, від якого залежать численні організації по всьому світу, зокрема державні установи. За оцінкою Anthropic, масштабна кібератака на будь-яку з таких компаній може вплинути більш ніж на 100 мільйонів людей і мати наслідки для національної та глобальної безпеки.
Організації отримають обмежений доступ до Claude Mythos Preview. Модель використовуватимуть для виявлення та перевірки вразливостей, щоб їх можна було усунути до того, як ними скористаються хакери або інші ШІ-системи зі зловмисною метою.
Подробиць про можливості Mythos небагато. Один із партнерів програми, компанія Cloudflare, повідомляла, що модель особливо добре знаходить так звані ланцюги експлойтів — ситуації, коли кілька помилок у програмі можна поєднати для проведення складнішої та небезпечнішої атаки.
Водночас Anthropic визнала, що модель поки не готова до широкого використання. Компанія виявила, що її вбудовані механізми захисту працюють нестабільно: реакція на певні запити могла змінюватися навіть після, на перший погляд, не пов’язаних змін у системі.
Читайте также: Борис Пинкус Биография Личная Жизнь: подробный очерк
Також з’ясувалося, що хоча Mythos Preview добре знаходить вразливості, вона значно гірше справляється з їх усуненням. Під час тестів спроби моделі самостійно створювати виправлення часто призводили до появи нових проблем в інших частинах програмного коду.
У Cloudflare також зазначили, що багато вразливостей, знайдених Mythos, виявляли й інші моделі штучного інтелекту. Подібний висновок зробила й компанія Aisle, яка протестувала кілька невеликих моделей із відкритим кодом. Вони змогли знайти ті самі вразливості, про які Anthropic повідомляла під час анонсу Mythos, хоча ці проблеми залишалися непоміченими людьми десятиліттями.
У матеріалі зазначається, що Claude Mythos Preview, ймовірно, перевершує інші моделі в окремих завданнях, однак деякі експерти з кібербезпеки вважають, що обмеження доступу до неї не вирішує проблему масових вразливостей. На їхню думку, це лише дає перевагу невеликій групі організацій, які отримали доступ раніше за інших.
Крім того, через закритий характер програми незалежним фахівцям складно оцінити реальні можливості моделі. Автори матеріалу зазначають, що такий підхід нагадує концепцію «безпеки через приховування», яку в сучасній кібербезпеці часто критикують. Наразі Anthropic продовжує дотримуватися курсу на обмежений і контрольований доступ до Mythos Preview.
Читайте также: К Чему Снится Собака Женщине: Толкование и Значение Сновидений
- Claude проти Gemini. Експерт з’ясував, яка модель штучного інтелекту краще керує пам’яттю користувача
- Папа Римський застерігає від ШІ, використовуючи ШІ? Аналітики впевнені, що енцикліку писав Claude
- Знаходить тисячі вразливостей. Anthropic планує випустити публічну версію моделі Claude Mythos
