Про це пише видання Interesting Engineering.
Дослідники з Huawei Noah’s Ark Lab, Технічного університету Дармштадта та ETH Zurich створили систему, яка поєднує великі мовні моделі з Robot Operating System(ROS). Це дозволяє роботам розуміти інструкції та виконувати їх у фізичному середовищі.
Читайте также: Більше не Море смерті. Найбільша пустеля Китаю перетворюється на поглинач вуглецю
Система обробляє текстові команди і розбиває їх на послідовні кроки. Наприклад, команда підняти зелений блок і покласти його на чорну полицю перетворюється на набір дій, які робот виконує через ROS.
Дослідники зазначають, що автономні роботи, здатні перетворювати природну мову на надійні фізичні дії, залишаються важливим викликом для штучного інтелекту. Вони показали, що підключення мовної моделі до ROS створює універсальну систему для«втіленого» інтелекту, а повну реалізацію виклали у відкритий доступ.
Платформа поєднує здатність мовних моделей до аналізу з популярною системою керування роботами. Це дозволяє інтерпретувати інструкції без необхідності окремого програмування для кожного завдання.
Автори пояснюють, що агент автоматично перетворює результати мовної моделі на дії робота, підтримує різні режими виконання, може навчатися нових базових навичок через наслідування і вдосконалювати їх завдяки зворотному зв’язку від людини або середовища.
Читайте также: Захист від вимкнення. Моделі ШІ можуть обманювати й саботувати, щоб врятувати одна одну
Система має два способи виконання. У першому модель створює невеликі фрагменти коду для керування роботом. У другому будує структури рішень, відомі як дерева поведінки, які допомагають адаптуватися, якщо якийсь крок не спрацював. Це підвищує гнучкість і дозволяє працювати як із простими, так і зі складними завданнями.
Під час випробувань на різних роботах система змогла надійно інтерпретувати команди і виконувати дії в різних сценаріях. За словами авторів, експерименти показали стійкість, масштабованість і універсальність підходу, зокрема для тривалих завдань, перестановки об’єктів на столі, оптимізації дій і дистанційного контролю.
Усі результати отримали з використанням попередньо навчених мовних моделей з відкритим кодом. Роботи також можуть навчатися на основі зворотного зв’язку і поступово покращувати свою роботу без складного перепрограмування.
Дослідники вважають, що поєднання розуміння мови з фізичними діями може пришвидшити використання роботів у динамічних середовищах, де важлива адаптивність. Надалі вони планують масштабувати систему для складніших завдань і різних типів роботів.
Читайте также: 5 скрытых нюансов при покупке кальяна, на которые не обращают внимания новички
- Без використання двигуна. У Кореї створили швидкий двосторонній актуатор для роботів
- Новий метод. Вчені зменшили похибку гнучких роботів до менш ніж 1% і підвищили точність у вузьких просторах
- Спритна, наче людська. Китайські вчені створили інноваційну руку для гуманоїдних роботів
