15 Червня, 2026

MiMo Code від Xiaomi: open-source термінальний агент, який перемагає Claude Code у 65% складних завдань

Компанія Xiaomi відкрила вихідний код нового термінального агента для програмування — MiMo Code. Інструмент орієнтований на довгострокові задачі розробки, де конкурентам традиційно бракує пам’яті та контексту. За внутрішніми тестами компанії, на завданнях із понад 200 кроками виконання MiMo Code перемагає Claude Code у більш ніж 65% випадків.

Читайте также: Майже 2000 років. У Франції знайшли незвичайну римську мозаїку

MiMo Code від Xiaomi: open-source термінальний агент, який перемагає Claude Code у 65% складних завдань

Що таке MiMo Code і як він працює

MiMo Code — термінальний агент для програмування, розроблений командою MiMo на базі відкритого проєкту OpenCode і випущений під ліцензією MIT. Він спроєктований для довгострокових задач автоматизованого програмування з акцентом на збереження якості рішень і цілісності стану протягом десятків або навіть сотень кроків виконання.

На відміну від першої моделі MiMo-7B, MiMo Code — не просто LLM. Це повноцінний агент, який запускається з терміналу й призначений допомагати розробникам у великих програмних проєктах. Замість покрокового виконання команд користувач може сформулювати мету, а агент самостійно спланує весь процес — від проєктування і написання коду до тестування та перевірки результату.

MiMo Code доступний на GitHub за ліцензією MIT та встановлюється за допомогою однієї команди терміналу ( curl -fsSL https://mimo.xiaomi.com/install | bash) на macOS та Linux або через npm ( npm install -g @mimo-ai/cli) на Windows.

Порівняння вартості доступу до відкритих та закритих LLM

МодельInput ($/млн токенів)Output ($/млн токенів)Загальна вартістьДжерело
MiMo-V2.5 Flash$0.10$0.30$0.40Xiaomi MiMo
deepseek-v4-flash$0.14$0.28$0.42DeepSeek
deepseek-v4-pro$0.435$0.87$1.305DeepSeek
MiniMax-M3$0.30$1.20$1.50MiniMax
Gemini 3.1 Flash-Lite$0.25$1.50$1.75Google
Qwen3.7-Plus$0.40$1.60$2.00Alibaba Cloud
MiMo-V2.5$0.40$2.00$2.40Xiaomi MiMo
Grok 4.3 (low context)$1.25$2.50$3.75xAI
MiMo-V2.5 Pro (≤256K)$1.00$3.00$4.00Xiaomi MiMo
GLM-5$1.00$3.20$4.20Z.ai
Kimi-K2.6$0.95$4.00$4.95Moonshot/Kimi
GLM-5.1$1.40$4.40$5.80Z.ai
Grok 4.3 (high context)$2.50$5.00$7.50xAI
MiMo-V2.5 Pro (>256K)$2.00$6.00$8.00Xiaomi MiMo
Qwen3.7-Max$2.50$7.50$10.00Alibaba Cloud
Gemini 3.5 Flash$1.50$9.00$10.50Google
Gemini 3.1 Pro Preview (≤200K)$2.00$12.00$14.00Google
GPT-5.4$2.50$15.00$17.50OpenAI
Gemini 3.1 Pro Preview (>200K)$4.00$18.00$22.00Google
Claude Opus 4.8$5.00$25.00$30.00Anthropic
GPT-5.5$5.00$30.00$35.00OpenAI
Claude Fable 5 / Claude Mythos 5$10.00$50.00$60.00Anthropic

Три ключові проблеми — і три архітектурні відповіді

Архітектура MiMo Code будується навколо трьох часових масштабів роботи агента.

Обчислення (Computation) — якість окремого кроку. Режим Max Mode генерує паралельно п’ять кандидатів-рішень за кожний хід, після чого та сама модель виступає суддею і вибирає найкращий варіант для виконання. На SWE-Bench Pro Max Mode підвищує результат на 10–20% порівняно з одиночною вибіркою, але за рахунок приблизно 4–5-кратного збільшення витрат на токени.

Механізм Goal вирішує іншу проблему — передчасне «завершення» задачі агентом. Коли агент намагається зупинитися, система автоматично запускає незалежний модельний виклик, який перевіряє, чи справді умова виконана. Якщо ні — агент продовжує роботу з поясненням, що саме залишилось.

Пам’ять (Memory) — безперервність у межах сесії. Більшість ШІ-інструментів для програмування спираються на контекстне вікно моделі: коли воно заповнюється, асистент починає «забувати» попередні рішення та деталі проєкту. MiMo Code використовує фоновий субагент, який паралельно управляє контекстом: коли вікно наближається до ліміту, субагент автоматично стискає роботу в структурований конспект, і основний агент продовжує роботу без втрати важливого контексту з початку сесії.

Чекпоїнти спрацьовують заздалегідь — приблизно на 20%, 45% і 70% від налаштованого бюджету, а не тоді, коли вікно вже майже вичерпане. Це дозволяє виконувати вилучення стану в момент, коли модель ще зберігає повну здатність до роботи. Загальний обсяг ін’єктованого контексту при відновленні сесії не перевищує 65 тис. токенів.

Система пам’яті складається з чотирьох рівнів: пам’ять сесії (checkpoint.md), пам’ять проєкту (MEMORY.md), глобальна пам’ять користувача і повна SQLite-історія всіх повідомлень і викликів інструментів.

Еволюція (Evolution) — накопичення досвіду між сесіями. Функція /dream запускається автоматично кожні сім днів: окремий агент переглядає старі сесії та файли пам’яті, видаляє дублікати, перевіряє шляхи до файлів і стискає все у компактне довгострокове сховище. Механізм Distill, що спрацьовує раз на 30 днів, виявляє повторювані робочі шаблони і перетворює їх на готові скрипти, команди CLI та документи СОП.

Читайте также: Пошкодження чутливих клітин. Дзвін у вухах може бути ранньою ознакою втрати слуху

Бенчмарки проти Claude Code

За даними Xiaomi, MiMo Code набрав 62% на SWE-Bench Pro і 73% на Terminal Bench 2, перевершивши Claude Code приблизно на п’ять відсоткових пунктів при використанні однакової базової моделі.

Порівняння продуктивності MiMo Code та Claude Code

MiMo Code + MiMo-V2.5-ProMiMo Code + MiMo-V2.5Claude Code + MiMo-V2.5-ProClaude Code + Claude Sonnet 4.6
SWE-bench Verified82%79%76%79%
SWE-bench Pro62%61%57%55%
Terminal Bench 273%71%68%69%

Цікаво, що сам «harness» (тобто агентська обв’язка) забезпечує вимірювальну частину приросту. Якщо запустити ту саму модель MiMo-V2.5-Pro в обох середовищах, MiMo Code дає 62% на SWE-bench Pro проти 57% для Claude Code та 73% на Terminal Bench 2 проти 68% — близько п’яти пунктів різниці, яка пояснюється виключно агентською системою, а не самою моделлю.

Результати A/B-тестування на реальних проєктах ще промовистіші. Внутрішнє бета-тестування охопило 576 розробників і 474 приватних репозиторії, в результаті чого отримано 1 213 пар порівнянь із чіткими результатами перемоги/поразки. Коли кількість кроків виконання не перевищує 200, показники перемоги обох систем близькі до 50%. Коли ж кількість кроків перевищує 200 (включно з багатоходовою взаємодією), MiMo Code виграє в більш ніж 65% випадків.

При цьому варто зазначити: Xiaomi не публікувала порівнянь з Codex від OpenAI або Gemini CLI від Google — Claude Code залишається єдиним названим конкурентом у всіх матеріалах. На офіційному лідерборді Terminal-Bench 2.0 на tbench.ai Codex CLI від OpenAI на базі GPT-5.5 набирає 82,2% — приблизно на дев’ять пунктів вище за MiMo Code.

Модельний стек Mimo Code

MiMo-V2.5-Pro — це мультиекспертна модель (MoE) з 1,02 трлн параметрів, 42 млрд активних параметрів на токен, 384 маршрутизованими експертами та 8 активними на кожен токен. Навчена на 27 трлн токенів з контекстним вікном 1 млн токенів, ліцензована за MIT.

Крім вбудованої MiMo-V2.5, агент підтримує підключення до сторонніх сервісів — DeepSeek, Kimi, GLM. Інструмент також включає вбудоване голосове введення на базі MiMo-V2.5-ASR.

Застереження та ризики

«Безкоштовний на обмежений час» доступ до моделі маршрутизує код через сервери Xiaomi, що стане неприйнятним для організацій із суворими вимогами до розташування даних або захисту інтелектуальної власності. Перевага над Claude Code підтверджена лише власними бенчмарками, а номер релізу V0.1.0 красномовно свідчить про незрілість продукту.

Нагадаємо, співробітники Xiaomi скаржаться на 15-годинний робочий день і штрафи за вихідні.

Читайте также: Telegram знову доступний на smart-годинниках Android

Підписуйтесь на нас у соцмережах: Telegram | Facebook | LinkedIn

Автор

Залишити відповідь

Ваша e-mail адреса не оприлюднюватиметься. Обов’язкові поля позначені *