GLM-5.1: відкрита модель, яка випереджає Claude Opus 4.6 та працює «повний день»

Китайський стартап Z.ai, також відомий як Zhipu AI, представив свою найновішу розробку — модель штучного інтелекту GLM-5.1. Головна сенсація: це не просто чергова LLM, а повноцінний автономний агент з відкритим кодом, здатний виконувати завдання протягом усього робочого дня, пише Venture Beat.

Що робить GLM-5.1 особливою?

Основний акцент у розробці зроблено на концепції “8-hour work day”. Якщо звичайні LLM відповідають на конкретний запит, то GLM-5.1 спроєктована для тривалих ітераційних процесів:

Агентивність (Agentic AI): Модель може самостійно планувати кроки, використовувати зовнішні інструменти (браузер, термінал, API) та виправляти власні помилки без підказок користувача.
Перемога над закритими моделями: Згідно з бенчмарками, GLM-5.1 обходить Claude 4.6 Opus у завданнях на логіку, програмування та складне міркування.
Відкритість: На відміну від пропрієтарних моделей від OpenAI чи Anthropic, GLM-5.1 поширюється з відкритими вагами (open-source), що дає розробникам можливість розгортати її на власних потужностях.

Модель GLM-5.1 має 754 мільярди параметрів та контекстне вікно до 202 752 токенів. У той час як інші сучасні моделі, таких як Claude Opus 4.6, досягли верхньої межі продуктивності в 3547 запитів за секунду, GLM-5.1 виконує 655 ітерацій та понад 6000 викликів інструментів на секунду.

Для тих, хто використовує API, Z.ai встановив ціну на GLM-5.1 в розмірі $1,40 за 1 мільйон вхідних токенів та $4,40 за 1 мільйон вихідних токенів. Також доступна знижка на кеш у розмірі $0,26 за мільйон вхідних токенів.

У бенчмарку SWE-Bench Pro, який оцінює здатність моделі вирішувати реальні проблеми GitHub за допомогою запиту інструкцій та контекстного вікна з 200 000 токенів, GLM-5.1 досяг балу 58,4. Щодо контексту, це перевершує GPT-5.4 з 57,7, Claude Opus 4.6 з 57,3 та Gemini 3.1 Pro з 54,2 .

Інші показники GLM-5.1 у порівнянні з конкурентами:

Категорія	Claude 4 Opus	GLM-5.1	GPT-5.4
Кодинг (HumanEval)	84.1%	88.4%	87.9%
Математика (GSM8K)	94.2%	96.5%	95.8%
Довгий контекст (Recall)	98.1%	99.9%	99.2%

Реліз GLM-5.1 підтверджує тренд на «агентизацію» ШІ. Ми переходимо від ери «запитай-отримай відповідь» до ери «постав задачу — отримай готовий проєкт увечері». Для розробників це означає доступ до інструменту рівня Opus 4 без прив’язки до хмарних сервісів та дорогих підписок.

Нагадаємо, що програмісти — перші в зоні ризику: в Anthropic вже порахували, як швидко вас замінить LLM.

Підписуйтесь на нас у соцмережах: Telegram | Facebook | LinkedIn

GLM-5.1: відкрита модель, яка випереджає Claude Opus 4.6 та працює «повний день»

Що робить GLM-5.1 особливою?

Автор admin

Залишити відповідь Скасувати коментар

Ви пропустили

Флагман фармацевтики. BMS та NVIDIA створюють ШІ-суперкомп’ютер для розробки ліків

2000 годин під напругою. У Гонконзі створили сонячні елементи, які не бояться затінення

Займав майже 8 гектарів. В Словаччині знайшли римський військовий табір часів Марка Аврелія

Холодне захоплення. У США навчилися добувати рідкісний гелій-3 для квантових комп’ютерів

GLM-5.1: відкрита модель, яка випереджає Claude Opus 4.6 та працює «повний день»

Що робить GLM-5.1 особливою?

Автор admin

Схожі публікації

США погрожують Китаю санкціями через дистиляцію моделей штучного інтелекту

OpenAI відключила модель для тривалих задач — вона неодноразово намагалась вибратись за межі «пісочниці»

Microsoft випадково розкрила: мінімальні системні вимоги Windows 11 давно втратили сенс

Залишити відповідь Скасувати коментар

Ви пропустили

Флагман фармацевтики. BMS та NVIDIA створюють ШІ-суперкомп’ютер для розробки ліків

2000 годин під напругою. У Гонконзі створили сонячні елементи, які не бояться затінення

Займав майже 8 гектарів. В Словаччині знайшли римський військовий табір часів Марка Аврелія

Холодне захоплення. У США навчилися добувати рідкісний гелій-3 для квантових комп’ютерів