4 Червня, 2026

Нова модель. Google представила ШІ, який допомагає роботам орієнтуватися в реальному світі

Про це пише видання Interesting Engineering.

Модель Gemini Robotics-ER 1.6 створили, щоб подолати одну з головних проблем робототехніки — здатність мислити не лише за інструкціями. Вона використовує так зване«втілене мислення», що дає змогу роботам аналізувати зображення, планувати кроки і вирішувати, коли завдання виконано.

Читайте также: Група компаній FRACTAL запускає безоплатний застосунок для саморозвитку та професійного зростання

Реклама

Це означає перехід від простого виконання команд до систем, які можуть самостійно ухвалювати рішення залежно від ситуації.

Нова версія покращує просторове мислення і здатність працювати з кількома джерелами зображень одночасно. Роботи можуть об’єднувати дані з різних камер і краще орієнтуватися навіть у складних або змінних умовах.

Модель також навчилася розпізнавати прилади. Вона може зчитувати показники манометрів, індикаторів і цифрових дисплеїв, які часто використовують у промисловості.

Роботи тепер точніше визначають об’єкти, рахують їх і розуміють зв’язки між ними. Вони можуть«вказувати» на предмети під час аналізу, щоб розбити складні завдання на простіші кроки.

Це важливо для роботи в реальному середовищі, де потрібно взаємодіяти з об’єктами, рухатися серед перешкод і приймати рішення за неповної інформації.

Ще одне покращення — здатність перевіряти, чи правильно виконано завдання. Це допомагає вирішити, чи потрібно повторити дію, чи переходити далі.

Читайте также: Google Chrome запускає Skills: зберігайте промпти та додавайте їх одним кліком

Функцію зчитування приладів розробляли разом із Boston Dynamics. У компанії зазначили, що такі можливості дозволять роботам Spot самостійно бачити, розуміти і реагувати на виклики в реальному середовищі.

Модель поєднує аналіз зображень і виконання коду. Вона може збільшувати фрагменти, знаходити ключові елементи, як-от стрілки чи позначки, і точно обчислювати значення.

Точність зчитування приладів зросла з 23% у попередніх версіях до 93% у новій. Також система краще дотримується правил безпеки, наприклад уникає небезпечних дій з об’єктами.

У Google заявили, що це їхня найбезпечніша модель для роботів на цей момент, яка краще виявляє ризики і дотримується фізичних обмежень.

Реклама:

Gemini Robotics-ER 1.6 вже доступна розробникам через Gemini API і Google AI Studio разом з інструментами для тестування і створення застосунків.

Читайте также: Автоматизація процесів. NVIDIA представила ШІ-моделі для зменшення помилок у квантових комп’ютерах

Читайте також:
  • Конфіденційність під загрозою. Perplexity звинувачують у передачі даних Google та Meta
  • Нова лінійка. Google випустила відкриті моделі Gemma 4 на базі Gemini 3
  • Механізми безпеки. Google оновила захист Gemini для питань психічного здоров’я після скандалу

Автор admin

Залишити відповідь

Ваша e-mail адреса не оприлюднюватиметься. Обов’язкові поля позначені *