MiMo Code від Xiaomi: open-source термінальний агент, який перемагає Claude Code у 65% складних завдань

Компанія Xiaomi відкрила вихідний код нового термінального агента для програмування — MiMo Code. Інструмент орієнтований на довгострокові задачі розробки, де конкурентам традиційно бракує пам’яті та контексту. За внутрішніми тестами компанії, на завданнях із понад 200 кроками виконання MiMo Code перемагає Claude Code у більш ніж 65% випадків.

Що таке MiMo Code і як він працює

MiMo Code — термінальний агент для програмування, розроблений командою MiMo на базі відкритого проєкту OpenCode і випущений під ліцензією MIT. Він спроєктований для довгострокових задач автоматизованого програмування з акцентом на збереження якості рішень і цілісності стану протягом десятків або навіть сотень кроків виконання.

На відміну від першої моделі MiMo-7B, MiMo Code — не просто LLM. Це повноцінний агент, який запускається з терміналу й призначений допомагати розробникам у великих програмних проєктах. Замість покрокового виконання команд користувач може сформулювати мету, а агент самостійно спланує весь процес — від проєктування і написання коду до тестування та перевірки результату.

MiMo Code доступний на GitHub за ліцензією MIT та встановлюється за допомогою однієї команди терміналу ( curl -fsSL https://mimo.xiaomi.com/install | bash) на macOS та Linux або через npm ( npm install -g @mimo-ai/cli) на Windows.

Порівняння вартості доступу до відкритих та закритих LLM

Модель	Input ($/млн токенів)	Output ($/млн токенів)	Загальна вартість	Джерело
MiMo-V2.5 Flash	$0.10	$0.30	$0.40	Xiaomi MiMo
deepseek-v4-flash	$0.14	$0.28	$0.42	DeepSeek
deepseek-v4-pro	$0.435	$0.87	$1.305	DeepSeek
MiniMax-M3	$0.30	$1.20	$1.50	MiniMax
Gemini 3.1 Flash-Lite	$0.25	$1.50	$1.75	Google
Qwen3.7-Plus	$0.40	$1.60	$2.00	Alibaba Cloud
MiMo-V2.5	$0.40	$2.00	$2.40	Xiaomi MiMo
Grok 4.3 (low context)	$1.25	$2.50	$3.75	xAI
MiMo-V2.5 Pro (≤256K)	$1.00	$3.00	$4.00	Xiaomi MiMo
GLM-5	$1.00	$3.20	$4.20	Z.ai
Kimi-K2.6	$0.95	$4.00	$4.95	Moonshot/Kimi
GLM-5.1	$1.40	$4.40	$5.80	Z.ai
Grok 4.3 (high context)	$2.50	$5.00	$7.50	xAI
MiMo-V2.5 Pro (>256K)	$2.00	$6.00	$8.00	Xiaomi MiMo
Qwen3.7-Max	$2.50	$7.50	$10.00	Alibaba Cloud
Gemini 3.5 Flash	$1.50	$9.00	$10.50	Google
Gemini 3.1 Pro Preview (≤200K)	$2.00	$12.00	$14.00	Google
GPT-5.4	$2.50	$15.00	$17.50	OpenAI
Gemini 3.1 Pro Preview (>200K)	$4.00	$18.00	$22.00	Google
Claude Opus 4.8	$5.00	$25.00	$30.00	Anthropic
GPT-5.5	$5.00	$30.00	$35.00	OpenAI
Claude Fable 5 / Claude Mythos 5	$10.00	$50.00	$60.00	Anthropic

Три ключові проблеми — і три архітектурні відповіді

Архітектура MiMo Code будується навколо трьох часових масштабів роботи агента.

Обчислення (Computation) — якість окремого кроку. Режим Max Mode генерує паралельно п’ять кандидатів-рішень за кожний хід, після чого та сама модель виступає суддею і вибирає найкращий варіант для виконання. На SWE-Bench Pro Max Mode підвищує результат на 10–20% порівняно з одиночною вибіркою, але за рахунок приблизно 4–5-кратного збільшення витрат на токени.

Механізм Goal вирішує іншу проблему — передчасне «завершення» задачі агентом. Коли агент намагається зупинитися, система автоматично запускає незалежний модельний виклик, який перевіряє, чи справді умова виконана. Якщо ні — агент продовжує роботу з поясненням, що саме залишилось.

Пам’ять (Memory) — безперервність у межах сесії. Більшість ШІ-інструментів для програмування спираються на контекстне вікно моделі: коли воно заповнюється, асистент починає «забувати» попередні рішення та деталі проєкту. MiMo Code використовує фоновий субагент, який паралельно управляє контекстом: коли вікно наближається до ліміту, субагент автоматично стискає роботу в структурований конспект, і основний агент продовжує роботу без втрати важливого контексту з початку сесії.

Чекпоїнти спрацьовують заздалегідь — приблизно на 20%, 45% і 70% від налаштованого бюджету, а не тоді, коли вікно вже майже вичерпане. Це дозволяє виконувати вилучення стану в момент, коли модель ще зберігає повну здатність до роботи. Загальний обсяг ін’єктованого контексту при відновленні сесії не перевищує 65 тис. токенів.

Система пам’яті складається з чотирьох рівнів: пам’ять сесії (checkpoint.md), пам’ять проєкту (MEMORY.md), глобальна пам’ять користувача і повна SQLite-історія всіх повідомлень і викликів інструментів.

Еволюція (Evolution) — накопичення досвіду між сесіями. Функція /dream запускається автоматично кожні сім днів: окремий агент переглядає старі сесії та файли пам’яті, видаляє дублікати, перевіряє шляхи до файлів і стискає все у компактне довгострокове сховище. Механізм Distill, що спрацьовує раз на 30 днів, виявляє повторювані робочі шаблони і перетворює їх на готові скрипти, команди CLI та документи СОП.

Бенчмарки проти Claude Code

За даними Xiaomi, MiMo Code набрав 62% на SWE-Bench Pro і 73% на Terminal Bench 2, перевершивши Claude Code приблизно на п’ять відсоткових пунктів при використанні однакової базової моделі.

Порівняння продуктивності MiMo Code та Claude Code

MiMo Code + MiMo-V2.5-Pro	MiMo Code + MiMo-V2.5	Claude Code + MiMo-V2.5-Pro	Claude Code + Claude Sonnet 4.6
SWE-bench Verified	82%	79%	76%	79%
SWE-bench Pro	62%	61%	57%	55%
Terminal Bench 2	73%	71%	68%	69%

Цікаво, що сам «harness» (тобто агентська обв’язка) забезпечує вимірювальну частину приросту. Якщо запустити ту саму модель MiMo-V2.5-Pro в обох середовищах, MiMo Code дає 62% на SWE-bench Pro проти 57% для Claude Code та 73% на Terminal Bench 2 проти 68% — близько п’яти пунктів різниці, яка пояснюється виключно агентською системою, а не самою моделлю.

Результати A/B-тестування на реальних проєктах ще промовистіші. Внутрішнє бета-тестування охопило 576 розробників і 474 приватних репозиторії, в результаті чого отримано 1 213 пар порівнянь із чіткими результатами перемоги/поразки. Коли кількість кроків виконання не перевищує 200, показники перемоги обох систем близькі до 50%. Коли ж кількість кроків перевищує 200 (включно з багатоходовою взаємодією), MiMo Code виграє в більш ніж 65% випадків.

При цьому варто зазначити: Xiaomi не публікувала порівнянь з Codex від OpenAI або Gemini CLI від Google — Claude Code залишається єдиним названим конкурентом у всіх матеріалах. На офіційному лідерборді Terminal-Bench 2.0 на tbench.ai Codex CLI від OpenAI на базі GPT-5.5 набирає 82,2% — приблизно на дев’ять пунктів вище за MiMo Code.

Модельний стек Mimo Code

MiMo-V2.5-Pro — це мультиекспертна модель (MoE) з 1,02 трлн параметрів, 42 млрд активних параметрів на токен, 384 маршрутизованими експертами та 8 активними на кожен токен. Навчена на 27 трлн токенів з контекстним вікном 1 млн токенів, ліцензована за MIT.

Крім вбудованої MiMo-V2.5, агент підтримує підключення до сторонніх сервісів — DeepSeek, Kimi, GLM. Інструмент також включає вбудоване голосове введення на базі MiMo-V2.5-ASR.

Застереження та ризики

«Безкоштовний на обмежений час» доступ до моделі маршрутизує код через сервери Xiaomi, що стане неприйнятним для організацій із суворими вимогами до розташування даних або захисту інтелектуальної власності. Перевага над Claude Code підтверджена лише власними бенчмарками, а номер релізу V0.1.0 красномовно свідчить про незрілість продукту.

Нагадаємо, співробітники Xiaomi скаржаться на 15-годинний робочий день і штрафи за вихідні.

Підписуйтесь на нас у соцмережах: Telegram | Facebook | LinkedIn

MiMo Code від Xiaomi: open-source термінальний агент, який перемагає Claude Code у 65% складних завдань

Що таке MiMo Code і як він працює

Три ключові проблеми — і три архітектурні відповіді

Бенчмарки проти Claude Code

Модельний стек Mimo Code

Застереження та ризики

Автор

Залишити відповідь Скасувати коментар

Ви пропустили

Поштовхи з глибини 90 кілометрів. У США підтвердили рідкісний тип землетрусів усередині мантії Землі

Безпілотник на 55 метрів. У США готують перший морський запуск гіперзвукової зброї з дрона

Як у клітині. У США створили рідину, яка сама накопичує енергію

9000 фейкових сайтів. Google судиться з китайською кібермережею через зловживання Gemini

MiMo Code від Xiaomi: open-source термінальний агент, який перемагає Claude Code у 65% складних завдань

Що таке MiMo Code і як він працює

Три ключові проблеми — і три архітектурні відповіді

Бенчмарки проти Claude Code

Модельний стек Mimo Code

Застереження та ризики

Автор

Схожі публікації

Залишити відповідь Скасувати коментар

Ви пропустили

Поштовхи з глибини 90 кілометрів. У США підтвердили рідкісний тип землетрусів усередині мантії Землі

Безпілотник на 55 метрів. У США готують перший морський запуск гіперзвукової зброї з дрона

Як у клітині. У США створили рідину, яка сама накопичує енергію

9000 фейкових сайтів. Google судиться з китайською кібермережею через зловживання Gemini