Час читання: 2 хв.
Google DeepMind запустив потужну версію своєї моделі штучного інтелекту Gemini Robotics для мобільних пристроїв. Gemini Robotics On-Device – це нова модель штучного інтелекту Google, яка дає змогу робити локальні висновки, узагальнювати завдання та керувати дрібною моторикою реальних роботів. Нова система може керувати фізичними роботами, не покладаючись на хмарне підключення. Як вказується, це стало важливим кроком у розгортанні швидкої, адаптивної робототехніки загального призначення в реальних умовах.
Згідно з опублікованими даними, модель Gemini Robotics On-Device втілює мультимодальне мислення Gemini 2.0 у роботах, які не потребують підключення до інтернету. Вона створена для роботи в умовах, критичних до затримок, а також у місцях із поганим або відсутнім підключенням. Завдяки високому ступеню узагальнення завдань, розумінню природної мови та управлінню дрібною моторикою, ця модель дає змогу роботам виконувати складні завдання безпосередньо на пристрої. Google також випускає повний комплект для розробки програмного забезпечення (SDK) для підтримки експериментів і налаштування.
Реклама
У повідомленні Google вказується, що, на відміну від свого попередника, підключеного до хмари, Gemini Robotics On-Device працює повністю на самому роботі. Це забезпечує швидшу реакцію і підвищує надійність, особливо в автономному режимі або в умовах обмеженого доступу. Він уже здатний виконувати стандартні завдання і може адаптуватися до нових з мінімальними витратами даних, провівши всього від 50 до 100 демонстрацій.
“Він досить малий і ефективний, щоб працювати безпосередньо на роботі”, – розповіла Кароліна Парада, голова відділу робототехніки в Google DeepMind. Вона додала: “Я б подумала про це як про стартову модель або як про модель для додатків, які просто погано підключаються”. У повідомленні підкреслюється, що флагманська гібридна модель залишається більш потужною. “Ми насправді дуже здивовані тим, наскільки ефективна ця модель із вбудованим пристроєм”, – сказав Парада.
Зазначається, що модель була розроблена на роботі Google ALOHA, але її було адаптовано і для інших пристроїв, зокрема Apollo humanoid від Apptronik і дворуку Franka FR3. Вона виконує докладні дії, як-от розстібання блискавок на сумках і складання одягу, з плавним виведенням із низькою затримкою. Це також перша версія робототехнічної моделі DeepMind, яку розробники можуть точно налаштувати. Тонке налаштування включає в себе дистанційне керування роботом для виконання завдання кілька разів. Це дає моделі достатній досвід для виконання цього завдання автономно. Розробники можуть протестувати модель у симуляторі Google MuJoCo або в реальних умовах.
Повідомляється, що система Gemini Robotics On-Device підходить для систем, які потребують забезпечення безпеки. Вона обробляє всі дані локально, допомагаючи захистити конфіденційність користувачів у таких випадках, як охорона здоров’я. Її автономні можливості забезпечують безперервну роботу навіть за нестабільного підключення. Парада зазначила, що традиційне навчання з підкріпленням робить навчання повільним і крихким. Генеративний ШІ, навпаки, дає змогу роботам робити узагальнення з мінімальними витратами. “Він використовує мультимодальне розуміння світу Gemini для вирішення абсолютно нового завдання”, – пояснила вона. “З повноцінною системою Gemini Robotics ви підключаєтеся до моделі, яка міркує про те, що робити безпечно, і крапка”, – сказав Парада.




