Google DeepMind презентувала роботів нового покоління, здатних сортувати білизну та адаптуватися до складних завдань
Google DeepMind презентувала нові моделі Gemini Robotics 1.5 та Gemini Robotics-ER 1.5, що дозволяють роботам виконувати багатокрокові завдання. Роботи можуть сортувати білизну та переробляти сміття, а також адаптуватися до нових умов.
Google DeepMind зробила черговий крок у розвитку штучного інтелекту для робототехніки, представивши нові моделі Gemini Robotics 1.5 та Gemini Robotics-ER 1.5. Розробки дозволяють роботам краще «думати» перед виконанням дій і вперше дають змогу виконувати багатокрокові завдання, включно з такими побутовими процесами, як сортування білизни чи переробка сміття. Про це повідомляє Financial Times.
Деталі
Старший директор і керівник відділу робототехніки Google DeepMind Кароліна Парада підкреслила, що компанія переходить до якісно нового етапу.
Моделі, що використовувалися до цього часу, чудово справлялися з виконанням однієї інструкції за раз. Зараз ми переходимо від виконання однієї інструкції до справжнього розуміння та вирішення проблем фізичних завдань
У демонстраційних сценаріях робот зміг не лише упакувати речі в сумку за проханням дослідниці, але й самостійно додав парасольку, дізнавшись через онлайн-пошук, що у Лондоні в ці дні очікується дощ. В іншому випадку машина спершу з’ясувала онлайн правила сортування сміття в Сан-Франциско, а тоді розклала відходи у відповідні контейнери.
Професор прикладного штучного інтелекту Оксфордського університету Інгмар Познер зазначив, що масштабне інтернет-навчання відкриває нові горизонти. Водночас професор Анджело Канджелозі з Манчестерського центру ШІ попередив: «Це просто відкриття закономірностей між пікселями, між зображеннями, між словами, токенами тощо – тобто ще не справжнє мислення».
Окремим проривом стала технологія «передача руху», яка дозволяє переносити вивчені навички з одних типів роботів (наприклад, роботизованих рук) на інші – гуманоїдів. Це вирішує ключову проблему нестачі якісних даних для навчання.
На відміну від великих мовних моделей, які можна навчати на всьому величезному інтернеті даних, робототехніка була обмежена кропітким процесом збору реальних даних
Попри досягнення, компанія визнає, що попереду залишаються виклики: роботи мають стати спритнішими, безпечнішими й надійнішими, перш ніж їх можна буде повноцінно інтегрувати у середовище взаємодії з людьми.