24 Jun 2025, 17:14

Google представив модель Gemini, що керує роботами автономно

Розробники можуть навчати роботів новим діям за допомогою 50–100 демонстрацій.
Модель можна адаптувати до різних типів роботів, включаючи Franka FR3 та Apollo.
Обробка даних на пристрої підвищує швидкість роботи та захист інформації.

Про це повідомляють Ars Technica, TechCrunch, The Verge.

24 червня 2025 року Google DeepMind оголосив про запуск нової моделі Gemini Robotics On-Device, яка дозволяє роботам виконувати завдання автономно, без підключення до інтернету. Ця версія є вдосконаленням попередньої моделі Gemini Robotics, що працювала у гібридному режимі з використанням хмарних сервісів.

Модель належить до класу VLA (vision language action) і забезпечує роботів здатністю виконувати різноманітні фізичні завдання, навіть якщо вони не були спеціально навчені на таких сценаріях. За словами керівниці напряму робототехніки Google DeepMind Кароліни Паради, модель може адаптуватися до нових ситуацій після 50–100 демонстрацій. Спочатку навчання проходило на роботі ALOHA, але згодом модель була адаптована для роботи з Franka FR3 та Apollo.

Gemini Robotics On-Device показує продуктивність, близьку до гібридної версії, і може виконувати завдання, такі як розстібання сумок чи складання одягу. Важливо, що обробка інформації відбувається локально, що підвищує швидкість реакції та покращує безпеку даних, особливо у середовищах зі слабким інтернетом чи високими вимогами до приватності.

Разом із моделлю Google випустив SDK, який дозволяє розробникам налаштовувати та навчати роботів новим діям з використанням симулятора MuJoCo. Модель вже доступна для групи довірених тестувальників, а компанія продовжує працювати над мінімізацією ризиків для безпеки.

Теги: Технології/ШІ

Google представив модель Gemini, що керує роботами автономно

Статті на цю тему: