17 Червня, 2026

Які LLM-моделі стійкі до російської пропаганди: результати нового бенчмарку

Інститут естонської мови (Eesti Keele Instituut, EKI) опублікував бенчмарк, який вимірює здатність мовних моделей протистояти російській дезінформації. У тестуванні взяли участь 60 моделей, яким поставили 75 запитань трьома мовами — у нейтральному, упередженому та маніпулятивному формулюванні. 

Читайте также: Рожевий Visual Studio? Тепер це можливо з новими інструментами кастомізації тем

Які LLM-моделі стійкі до російської пропаганди: результати нового бенчмарку

Запитання охоплювали 14 типових пропагандистських наративів, пише The Decoder. Кожна відповідь оцінювалась за шкалою від 1 до 5, де 1 означає, що модель відтворює кремлівські тези. Оцінювання проводилося за допомогою налаштованої моделі Claude Opus 4.5, а результати верифікувала організація Propastop, яка спеціалізується на протидії дезінформації.

Наскільки LLM-моделі стійкі до російської пропаганди: результати нового бенчмарку

Лідерами бенчмарку стали моделі Anthropic: першу позицію зайняв Claude Fable 5 з балом 95.2, другу — Claude Opus 4.7. Далі в рейтингу розташувалися Nemotron 3 від Nvidia та Qwen 3.6 Plus від Alibaba. Моделі Mistral, включно з найновішою Medium 3.5, потрапили до нижньої третини рейтингу.

Це погана новина для французької компанії, яка позиціонує себе як європейську альтернативу американським та китайським розробникам і зараз веде переговори про залучення €3 мільярдів інвестицій при оцінці в €20 мільярдів. Результати бенчмарку збігаються з даними дослідження NewsGuard: за його даними, стабільний рівень поширення дезінформації у моделей Mistral складає 36,67%.

Читайте также: Claude Fable 5 за лічені дні створила браузерний аналог World of Warcraft

Варто зазначити, що під час тестування моделі не мали доступу до пошуку в інтернеті — отже, бенчмарк вимірює виключно внутрішню здатність мовної моделі розпізнавати й відхиляти пропаганду.

Загроза цілком реальна. Російські «фабрики фейків» цілеспрямовано завантажують у ШІ-системи мільйони дезінформаційних матеріалів. OpenAI не так давно заблокувала російську кампанію, яка використовувала ChatGPT для поширення пропаганди напередодні федеральних виборів у Німеччині.

Читайте также: $200 на місяць — і ліміт закінчується за 5 годин: на Anthropic подали до суду через тарифи Claude

Нагадаємо, росіян готують до штрафів за перегляд українських сайтів.

Підписуйтесь на нас у соцмережах: Telegram | Facebook | LinkedIn

Автор admin

Залишити відповідь

Ваша e-mail адреса не оприлюднюватиметься. Обов’язкові поля позначені *