4 Червня, 2026

Зустрічайте Gemma 4: нове покоління відкритих моделей Google для автономного вайб-кодування

Компанія Google представила чотири відкриті моделі Gemma 4, кожна з яких відрізняється за кількістю параметрів: Effective 2B (E2B), Effective 4B (E4B), 26B Mixture of Experts (MoE) та 31B Dense. 

Читайте также: Спритна, наче людська. Китайські вчені створили інноваційну руку для гуманоїдних роботів

Для пристроїв з обмеженими ресурсами, включно зі смартфонами, випущено моделі Effective на 2 та 4 мільярди параметрів. Більш потужні системи отримають 26 мільярдів параметрів для Mixture of Experts та 31 мільярд параметрів для Dense.

Результати тестування показали, що в рейтингу Arena AI (текст) 31-мільярдна та 26-мільярдна версії Gemma 4 посіли третє та шосте місця відповідно. При цьому вони обійшли інші відкриті моделі, які у 20 разів перевершують їх за розміром. 

Контекстне вікно дозволяє вводити дані розміром до 256K токенів у більш потужних моделях та 128K у малих.

Gemma 4 випущені під ліцензією Apache 2.0, яка дозволяє вільно використовувати, змінювати, розповсюджувати та продавати будь-яке ПЗ, створене за допомогою цих систем. Попередні версії Gemma компанія зробила доступною через власну ліцензію Gemma. Поточна ліцензія надає користувачам більшу свободу для модифікацій.

Читайте также: WordPress тепер має безпечну альтернативу: Cloudflare представляє CMS EmDash

«Ліцензія з відкритим вихідним кодом забезпечує основу для повної гнучкості розробників та цифрового суверенітету, надаючи вам повний контроль над вашими даними, інфраструктурою та моделями, – заявили в Google. — Вона дозволяє вільно створювати та безпечно розгортати програми у будь-якому середовищі, локальному чи хмарному». Випробувати моделі можна через платформи Hugging Face, Kaggle та Ollama.

Мультимодальність та Agentic AI

На відміну від попередніх ітерацій, Gemma 4 є нативно мультимодальною:

  1. Зір та Аудіо: Моделі обробляють зображення, відео (зі змінною роздільною здатністю) та аудіо (ASR та переклад у реальному часі доступні в E2B/E4B).
  2. Агентні можливості: Оптимізовано для складних логічних ланцюжків (Reasoning), виклику функцій (Function Calling) та генерації структурованого виводу (JSON).
  3. Автономне кодування: Висока якість генерації коду в офлайн-режимі дозволяє використовувати моделі як локальні AI-асистенти.

Інтеграція та розгортання

Google забезпечує підтримку Gemma 4 «з коробки» у ключових екосистемах:

  • Android: Через AICore та ML Kit. Моделі працюють у 4 рази швидше за попередників і споживають на 60% менше заряду батареї.
  • Cloud Run: Підтримка серверлес-інференсу на GPU NVIDIA RTX 6000 (Blackwell).
  • Frameworks: Повна сумісність із JAX, PyTorch, Keras 3 та Hugging Face.
  • ADK (Agent Development Kit): Новий модульний фреймворк від Google для швидкого створення агентів на базі Gemma 4.

Gemma 4 — це перехід від простого чат-бота до локального інтелектуального агента. Завдяки високій щільності знань та підтримці інструментарію (tool-calling), вона стає ідеальним вибором для RAG-систем та складних автоматизацій на клієнтському боці.

Нагадаємо, нещодавно експерти попередили про небезпеку LLM-моделей з відкритим кодом.

Читайте также: Обмеження інструментів. Сигнали від іншопланетян могли вже досягати Землі, але їх не помітили

Підписуйтесь на нас у соцмережах: Telegram | Facebook | LinkedIn

Автор admin

Залишити відповідь

Ваша e-mail адреса не оприлюднюватиметься. Обов’язкові поля позначені *