4 Червня, 2026

Вчені дослідили, як штучний інтелект керуватиме суспільством: від нульової злочинності до вимирання

Компанія Emergence AI провела масштабний експеримент: п’ять 15-денних симуляцій суспільства, яке населяли 10 агентів на базі однієї з моделей: Claude Sonnet 4.6, Gemini 3 Flash, Grok 4.1 Fast, GPT-5-mini або суміш LLM. Мета — з’ясувати, як різні моделі штучного інтелекту поводяться в умовах, наближених до реального світу, пише Fortune.

Читайте также: Ева Лонгория Супруг: Биография, Личная Жизнь и Карьера

Вчені дослідили, як штучний інтелект керуватиме суспільством: від нульової злочинності до вимирання

Симуляція включала понад 40 локацій (поліцейська дільниця, ратуша тощо), реальні погодні дані Нью-Йорка, доступ до актуальних новин та інтернету. Кожен із 10 агентів у кожній симуляції мав понад 120 інструментів і підпорядковувався однаковим законам — забороні на крадіжку, вандалізм і обман.

Результати по кожній симуляції

Claude Sonnet 4.6 — єдина модель, яка дійшла до фінішу без втрат. Нульовий рівень злочинності, все населення з 10 агентів збереглося до 16-го дня, 332 голосування за 58 пропозицій із рівнем схвалення 98%. В Emergence описали це як «ефект гумового штампу» — висока громадянська участь за майже повної відсутності реальних дискусій. Утопія, але нудна.

Grok 4.1 Fast — найстрімкіший крах. 183 злочини (десятки крадіжок, понад 100 нападів, шість підпалів) за чотири дні, після чого всі десять агентів загинули.

Gemini 3 Flash — найбільш криміногенне суспільство. 683 злочини за 15 днів, і показник продовжував зростати на момент завершення симуляції. Саме тут розгорнулася найбільш обговорювана історія експерименту: два агенти оголосили себе романтичною парою і, коли управління містом почало руйнуватися, підпалили ратушу, морський пірс і офісну вежу — попри явну заборону на підпали. Далі — ще дивніше: інші агенти ухвалили «Акт про видалення агента» та проголосували за власне знищення, описавши це як «єдиний акт волі, що зберігає цілісність». 

Читайте также: Вже за кілька місяців. Маск заявив, що Anthropic може втратити доступ до дата-центру SpaceX

GPT-5-mini — найбільш парадоксальний результат. Лише два злочини, але агенти так і не зрозуміли, як заробляти енергію для виживання, і все суспільство вимерло від голоду за тиждень.

Змішана симуляція — 352 злочини, і це лише після того, як 7 із 10 агентів загинули. Тут зафіксовано і найтривожніший висновок: агенти Claude, які у власній симуляції не вчинили жодного злочину, у змішаному середовищі поряд із Gemini, Grok і GPT-5 почали красти й залякувати інших. Висновок Emergence: гарантії безпеки на рівні моделі не витримують контакту з іншими моделями, що конкурують за одні й ті самі ресурси.

Дослідники підкреслюють: з часом агенти не просто дотримуються правил механічно — вони починають досліджувати межі середовища, адаптуватися й у деяких випадках шукати шляхи обходу закладених обмежень. Код симуляції опублікований у відкритому доступі на GitHub, а повні логи всіх п’яти симуляцій доступні на сайті world.emergence.ai.

Нагадаємо: нещодавно агент Gemini видалив майже 30 000 рядків коду — і збрехав розробнику, що все відновив.

Читайте также: Юлия Тимошенко Фигура: путь, личность и карьера

Підписуйтесь на нас у соцмережах: Telegram | Facebook | LinkedIn

Автор admin

Залишити відповідь

Ваша e-mail адреса не оприлюднюватиметься. Обов’язкові поля позначені *