Нова модель. Google представила ШІ, який допомагає роботам орієнтуватися в реальному світі

Про це пише видання Interesting Engineering.

Модель Gemini Robotics-ER 1.6 створили, щоб подолати одну з головних проблем робототехніки — здатність мислити не лише за інструкціями. Вона використовує так зване«втілене мислення», що дає змогу роботам аналізувати зображення, планувати кроки і вирішувати, коли завдання виконано.

Це означає перехід від простого виконання команд до систем, які можуть самостійно ухвалювати рішення залежно від ситуації.

Нова версія покращує просторове мислення і здатність працювати з кількома джерелами зображень одночасно. Роботи можуть об’єднувати дані з різних камер і краще орієнтуватися навіть у складних або змінних умовах.

Модель також навчилася розпізнавати прилади. Вона може зчитувати показники манометрів, індикаторів і цифрових дисплеїв, які часто використовують у промисловості.

Роботи тепер точніше визначають об’єкти, рахують їх і розуміють зв’язки між ними. Вони можуть«вказувати» на предмети під час аналізу, щоб розбити складні завдання на простіші кроки.

Це важливо для роботи в реальному середовищі, де потрібно взаємодіяти з об’єктами, рухатися серед перешкод і приймати рішення за неповної інформації.

Ще одне покращення — здатність перевіряти, чи правильно виконано завдання. Це допомагає вирішити, чи потрібно повторити дію, чи переходити далі.

Функцію зчитування приладів розробляли разом із Boston Dynamics. У компанії зазначили, що такі можливості дозволять роботам Spot самостійно бачити, розуміти і реагувати на виклики в реальному середовищі.

Модель поєднує аналіз зображень і виконання коду. Вона може збільшувати фрагменти, знаходити ключові елементи, як-от стрілки чи позначки, і точно обчислювати значення.

Точність зчитування приладів зросла з 23% у попередніх версіях до 93% у новій. Також система краще дотримується правил безпеки, наприклад уникає небезпечних дій з об’єктами.

У Google заявили, що це їхня найбезпечніша модель для роботів на цей момент, яка краще виявляє ризики і дотримується фізичних обмежень.

Gemini Robotics-ER 1.6 вже доступна розробникам через Gemini API і Google AI Studio разом з інструментами для тестування і створення застосунків.

Читайте також:

Конфіденційність під загрозою. Perplexity звинувачують у передачі даних Google та Meta
Нова лінійка. Google випустила відкриті моделі Gemma 4 на базі Gemini 3
Механізми безпеки. Google оновила захист Gemini для питань психічного здоров’я після скандалу

Нова модель. Google представила ШІ, який допомагає роботам орієнтуватися в реальному світі

Автор admin

Залишити відповідь Скасувати коментар

Ви пропустили

Флагман фармацевтики. BMS та NVIDIA створюють ШІ-суперкомп’ютер для розробки ліків

2000 годин під напругою. У Гонконзі створили сонячні елементи, які не бояться затінення

Займав майже 8 гектарів. В Словаччині знайшли римський військовий табір часів Марка Аврелія

Холодне захоплення. У США навчилися добувати рідкісний гелій-3 для квантових комп’ютерів

Нова модель. Google представила ШІ, який допомагає роботам орієнтуватися в реальному світі

Автор admin

Схожі публікації

2000 годин під напругою. У Гонконзі створили сонячні елементи, які не бояться затінення

Холодне захоплення. У США навчилися добувати рідкісний гелій-3 для квантових комп’ютерів

Футуристична зброя. В США показали безпілотний ударний конвертоплан Thunder

Залишити відповідь Скасувати коментар

Ви пропустили

Флагман фармацевтики. BMS та NVIDIA створюють ШІ-суперкомп’ютер для розробки ліків

2000 годин під напругою. У Гонконзі створили сонячні елементи, які не бояться затінення

Займав майже 8 гектарів. В Словаччині знайшли римський військовий табір часів Марка Аврелія

Холодне захоплення. У США навчилися добувати рідкісний гелій-3 для квантових комп’ютерів