ПОСЛЕДНИЕ НОВОСТИ
ПОДОБРАНО ДЛЯ ВАС
Еженедельно
ОСТАВАЙТЕСЬ НА ВЕРШИНЕ

Лучшие аналитические материалы о криптовалютах прямо в вашу электронную почту.

Новая модель Google Gemini внедряет встроенный в устройство искусственный интеллект в робототехнику

Автор:Коллинз Дж. ОкотКоллинз Дж. Окот
3 минуты чтения,
Компания Gemini сократила объем IPO до 425 миллионов долларов на фоне осторожности рынка
  • Компания Google запустила новую языковую модель под названием Gemini Robotics On-Device.
  • Данная модель позволяет выполнять задачи локально на роботах без необходимости подключения к интернету.
  • Технологическая компания утверждает, что в тестах производительность модели приближается к уровню облачной модели Gemini Robotics.

Во вторник компания Google DeepMind представила новую языковую модель под названием Gemini Robotics On-Device. Фирма сообщила, что эта модель может выполнять задачи локально на роботах без подключения к интернету.

Новая модель, созданная на основе предыдущей модели искусственного интеллекта Gemini Robotics, выпущенной в марте, способна управлять движениями робота. Google также подтвердила, что модель «зрение-язык-действие» (VLA) достаточно мала и эффективна для работы непосредственно на роботе. По словам компании, разработчики могут управлять моделью и точно настраивать её в соответствии с различными потребностями, используя подсказки на естественном языке. 

Robotics On-Device превосходит другие модели Google

Глава подразделения робототехники Google DeepMind, Каролина Парада, заявила, что оригинальная модель Gemini Robotics использует гибридный подход, позволяющий ей работать как на устройстве, так и в облаке. Она отметила, что с новой моделью, работающей только на устройстве, пользователи могут получить доступ к функциям в автономном режиме практически так же хорошо, как и у флагманской модели.

Технологическая компания утверждает, что в тестах производительность этой модели приближается к уровню облачной модели Gemini Robotics. Google также заявила, что в общих тестах она превосходит другие модели, работающие непосредственно на устройстве, хотя и не назвала эти модели. 

«Гибридная модель Gemini Robotics по-прежнему мощнее, но мы действительно удивлены тем, насколькоtronэта встроенная модель. Я бы рассматривал её как модель начального уровня или как модель для приложений с плохим качеством связи»

— Каролина Парада, руководитель отдела робототехники в Google DeepMind.

В ходе демонстрации компания показала, как роботы, используя локальную модель, расстегивают сумки и складывают одежду. Google признала, что, хотя модель была обучена для роботов ALOHA, позже она была адаптирована для работы с двуруким роботом Franka FR3 и человекоподобным роботом Apollo отtronik.

Технологическая компания утверждает, что двурукий робот Franka FR3 успешно справлялся с задачами и объектами, с которыми раньше не сталкивался, например, со сборкой на промышленном конвейере. Компания отметила , что разработчики могут продемонстрировать роботам от 50 до 100 примеров задач, чтобы обучить их новым задачам, используя модели в физическом симуляторе MuJoCo. 

Компания Google DeepMind также упомянула о выпуске комплекта разработки программного обеспечения под названием Gemini Robotics SDK. Компания сообщила , что ее SDK для робототехники предоставляет полный набор инструментов, необходимых для использования моделей Gemini Robotics на протяжении всего жизненного цикла, включая доступ к контрольным точкам, запуск модели, оценку модели на роботе и в симуляторе, загрузку данных и ее тонкую настройку. Компания сообщила, что ее модель Gemini Robotics, работающая на устройстве, и ее SDK будут доступны группе доверенных тестировщиков, в то время как Google продолжает работать над минимизацией рисков для безопасности.

Технологические компании присоединяются к гонке робототехники

Другие компании, использующие модели ИИ, также проявляют интерес к робототехнике. Nvidia разрабатывает платформу для создания базовых моделей для человекоподобных роботов. Генеральный директор компании, Дженсен Хуанг, отметил, что создание базовых моделей для универсальных человекоподобных роботов — одна из самых интересных задач в области ИИ на сегодняшний день.

Хуанг утверждал, что человекоподобный фактор является одной из самых спорных тем в мире робототехники на данный момент. Он признал, что это привлекает огромные объемы венчурного капитала, но при этом порождает массовый скептицизм. 

Компания Nvidia также активно продвигает инновации в области робототехники с помощью таких инициатив, как Isaac и Jetson. В марте прошлого года на своей ежегодной конференции разработчиков GTC компания присоединилась к гонке человекоподобных роботов с проектом GROOT.

Компания Nvidia назвала новую платформу универсальной базовой моделью для человекоподобных роботов. Фирма заявила, что GROOT также будет поддерживать новое оборудование от Nvidia. 

Компания Hugging Face не только разрабатывает открытые модели и наборы данных для робототехники, но и работает над роботами. Ранее в этом месяце компания представила модель OpenAI для робототехники под названием SmolVLA. 

Компания утверждает, что модель обучена на общедоступных наборах данных и превосходит гораздо более крупные модели для робототехники как в виртуальной, так и в реальной среде. Hugging Face также сообщила, что SmolVLA стремится демократизировать доступ к моделям визуально-языково-действенного анализа (VLA) и ускорить исследования в области создания универсальных роботизированных агентов.

В прошлом году компания запустила LeRobot, набор моделей, наборов данных и инструментов, ориентированных на робототехнику. Совсем недавно Hugging Face приобрела Pollen Robotics, французский стартап в области робототехники, и представила несколько недорогих роботизированных систем, включая человекоподобных роботов, доступных для покупки.

Если вы это читаете, значит, вы уже впереди. Оставайтесь на шаг впереди, подписавшись на нашу рассылку.

Поделитесь этой статьей
ЕЩЕ… НОВОСТИ
ЭКСПРЕСС- ПО ГЛУБОКОЙ
КУРС