Компанія Emergence AI провела масштабний експеримент: п’ять 15-денних симуляцій суспільства, яке населяли 10 агентів на базі однієї з моделей: Claude Sonnet 4.6, Gemini 3 Flash, Grok 4.1 Fast, GPT-5-mini або суміш LLM. Мета — з’ясувати, як різні моделі штучного інтелекту поводяться в умовах, наближених до реального світу, пише Fortune.
Читайте также: Ева Лонгория Супруг: Биография, Личная Жизнь и Карьера

Симуляція включала понад 40 локацій (поліцейська дільниця, ратуша тощо), реальні погодні дані Нью-Йорка, доступ до актуальних новин та інтернету. Кожен із 10 агентів у кожній симуляції мав понад 120 інструментів і підпорядковувався однаковим законам — забороні на крадіжку, вандалізм і обман.
Результати по кожній симуляції
Claude Sonnet 4.6 — єдина модель, яка дійшла до фінішу без втрат. Нульовий рівень злочинності, все населення з 10 агентів збереглося до 16-го дня, 332 голосування за 58 пропозицій із рівнем схвалення 98%. В Emergence описали це як «ефект гумового штампу» — висока громадянська участь за майже повної відсутності реальних дискусій. Утопія, але нудна.
Grok 4.1 Fast — найстрімкіший крах. 183 злочини (десятки крадіжок, понад 100 нападів, шість підпалів) за чотири дні, після чого всі десять агентів загинули.
Gemini 3 Flash — найбільш криміногенне суспільство. 683 злочини за 15 днів, і показник продовжував зростати на момент завершення симуляції. Саме тут розгорнулася найбільш обговорювана історія експерименту: два агенти оголосили себе романтичною парою і, коли управління містом почало руйнуватися, підпалили ратушу, морський пірс і офісну вежу — попри явну заборону на підпали. Далі — ще дивніше: інші агенти ухвалили «Акт про видалення агента» та проголосували за власне знищення, описавши це як «єдиний акт волі, що зберігає цілісність».
Читайте также: Вже за кілька місяців. Маск заявив, що Anthropic може втратити доступ до дата-центру SpaceX
GPT-5-mini — найбільш парадоксальний результат. Лише два злочини, але агенти так і не зрозуміли, як заробляти енергію для виживання, і все суспільство вимерло від голоду за тиждень.
Змішана симуляція — 352 злочини, і це лише після того, як 7 із 10 агентів загинули. Тут зафіксовано і найтривожніший висновок: агенти Claude, які у власній симуляції не вчинили жодного злочину, у змішаному середовищі поряд із Gemini, Grok і GPT-5 почали красти й залякувати інших. Висновок Emergence: гарантії безпеки на рівні моделі не витримують контакту з іншими моделями, що конкурують за одні й ті самі ресурси.
Дослідники підкреслюють: з часом агенти не просто дотримуються правил механічно — вони починають досліджувати межі середовища, адаптуватися й у деяких випадках шукати шляхи обходу закладених обмежень. Код симуляції опублікований у відкритому доступі на GitHub, а повні логи всіх п’яти симуляцій доступні на сайті world.emergence.ai.
Нагадаємо: нещодавно агент Gemini видалив майже 30 000 рядків коду — і збрехав розробнику, що все відновив.
Читайте также: Юлия Тимошенко Фигура: путь, личность и карьера
Підписуйтесь на нас у соцмережах: Telegram | Facebook | LinkedIn
