Китайська компанія Z.ai (попередня назва Zhipu AI) випустила GLM-5.2 — LLM-модель з відкритими вагами на 753 мільярди параметрів, заточену під складні автономні задачі програмування та інженерії. Головна перевага нової моделі в ціні — працювати з нею в шість разів дешевше за GPT-5.5, при цьому якість роботи не гірша.
Читайте также: Пошуки позаземного розуму. Вчені назвали три причини, чому прибульці навряд чи відвідують Землю

GLM-5.2 вже доступна на Hugging Face, через API Z.ai та в понад 20 сторонніх середовищах для розробки. Новинка має контекстне вікно до 1 мільйона токенів — достатнє для роботи з великими проєктами та виконання повного циклу розробки від постановки задачі до мультиплатформного деплою в межах одного завдання.
- На профільному бенчмарку SWE-bench Pro, який перевіряє реальні задачі з програмування, GLM-5.2 набрала 62,1 бали — помітно більше за GPT-5.5 (58,6) і власну попередницю GLM-5.1 (58,4).
- На FrontierSWE, спеціально розробленому бенчмарку для оцінки виконання довгих автономних задач, модель показала 74,4%, обігнавши GPT-5.5 (72,6%) і майже зрівнявшись із Claude Opus 4.8 (75,1%).
- У тестах на використання інструментів MCP-Atlas GLM-5.2 набрала 77,0 проти 75,3 у GPT-5.5, лише трохи відставши від Claude Opus 4.8 (77,8). На Humanity’s Last Exam з активованими інструментами модель показала 54,7 проти 52,2 у GPT-5.5.
Водночас на Terminal-Bench 2.1 GLM-5.2 (81,0) дещо відстає і від Claude Opus 4.8 (85,0), і від GPT-5.5 (84,0), хоча суттєво переважає Gemini 3.1 Pro (74,0).

Найслабший результат модель показала на DeepSWE — найскладнішому бенчмарку для глибокого рефакторингу багатофайлових проєктів зі складною залежністю компонентів: тут GPT-5.5 виграє з великим відривом (70,0% проти 46,2%), що пов’язують з потужною інфраструктурою Codex CLI від OpenAI — хмарним sandbox-виконанням і можливістю автономної роботи понад 24 години. Натомість на конкурсному бенчмарку дизайну Design Arena GLM-5.2 зайняла першу позицію з ELO-рейтингом 1360, обігнавши навіть Claude Fable 5.
Окрема архітектурна особливість моделі — механізм IndexShare, який повторно використовує той самий індексатор для кожних чотирьох шарів розрідженої уваги. Z.ai також впровадила два регульовані рівні «зусиль мислення» — Max і High: у режимі Max модель досягає пікової якості, витрачаючи близько 85 тисяч вихідних токенів на задачу, тоді як High дозволяє практично вдвічі скоротити обсяг виведення, втрачаючи лише кілька пунктів продуктивності — корисний інструмент оптимізації для задач, чутливих до затримки.
Читайте также: Не відрізнити від звичайних. Snap представила окуляри доповненої реальності з електрохромними лінзами
Перевага GLM-5.2 — її ціна. API коштує $1,40 за мільйон вхідних токенів і $4,40 за мільйон вихідних — разом $5,80 за мільйон. Для порівняння, GPT-5.5 коштує $5 за вхідні та $30 за вихідні токени, тобто $35 за мільйон — приблизно в шість разів дорожче за порівнянну чи кращу продуктивність у кодингу. Модель випущена під ліцензією MIT, тож компанії можуть завантажувати ваги з Hugging Face, донавчати на власному коді та розгортати в ізольованому середовищі без залежності від API постачальника.
Для розробників Z.ai запустила тарифний план GLM Coding Plan: $12,60 на місяць за Lite, $50,40 за Pro і $112 за Max (при річній оплаті), з підтримкою сторонніх інструментів для кодингу, включно з Claude Code, OpenClaw, Cline Code та Kilo Code. GLM-5.2 стала вже третьою флагманською моделлю Z.ai під ліцензією MIT за останні шість місяців — після GLM-5 у лютому та GLM-5.1 у квітні.
Нагадаємо, що OpenAI і Anthropic зараз знаходяться під тиском: бізнес замінює дорогі LLM-моделі на китайські open-source і заощаджує мільйони.
Читайте также: Точність понад 90%. Модель штучного інтелекту навчили виявляти ранні захворювання серця на ЕКГ
Підписуйтесь на нас у соцмережах: Telegram | Facebook | LinkedIn
