Исследователи из Университета Суррея совершили прорыв в области технологий искусственного интеллекта (ИИ), обучив систему прогнозировать трехмерную (3D) позу собак по двухмерным (2D) изображениям. Команда под руководством аспирантки Мойры Шутер использовала инновационный подход, открывающий двери для самых разных применений, от экологии до анимации dent
В рамках новаторского подхода исследователи обратились к виртуальному миру популярной видеоигры Grand Theft Auto, чтобы создать множество виртуальных собак. Модифицировав игру, они заменили главного героя восемью различными породами собак, создав таким образом богатый набор цифровых моделей поведения собак. Эта инициатива, получившая название DigiDogs, предоставила обширный набор данных, включающий 27 900 кадров, фиксирующих различные виды активности собак, включая сидение, ходьбу, лай и бег, в различных условиях окружающей среды.
Обучение ИИ на платформе DigiDogs: прорыв в возможностях прогнозирования
Традиционно обучение систем искусственного интеллекта восприятию трехмерной информации из двухмерных изображений предполагает предоставление им знаний о трехмерной «истинной картине», обычно получаемой с помощью костюмов для захвата движений у людей. Однако распространение этого подхода на собак представляло собой уникальную проблему. Не сдаваясь, исследователи использовали набор данных DigiDogs для обучения своей модели ИИ, преодолев отсутствие данных о захвате движений у собак.
Г-жа Шутер подчеркнула универсальность их решения, отметив возможности его применения от охраны дикой природы до разработки виртуальных миров. Первоначально обученная на компьютерной графике собак, модель ИИ демонстрирует потенциал для экстраполяции 3D-скелетных моделей из фотографий реальных животных. Эта возможность перспективна для различных областей, позволяя специалистам по охране природыdentраненых диких животных и давая художникам возможность создавать более реалистичные модели животных в виртуальной среде.
Перспективы на будущее
В дальнейшем исследовательская группа планирует усовершенствовать свою систему искусственного интеллекта, используя модель DINOv2 от Meta, чтобы обеспечить ее способность точно предсказывать 3D-позы на основе реальных изображений собак. Преодолевая разрыв между виртуальными и реальными данными, они стремятся повысить производительность модели и расширить ее применимость в различных сценариях. Г-жа Шутер подчеркнула богатство информации, заложенной в 3D-позах, отметив их превосходство над 2D-фотографиями.
Новаторская работа Университета Суррея демонстрирует преобразующий потенциал технологий искусственного интеллекта в сочетании с инновационными подходами и междисциплинарным сотрудничеством. По мере дальнейшего развития ИИ, подпитываемого достижениями в области сбора данных и совершенствования алгоритмов, возможности для расширения нашего понимания мира и использования его в практических приложениях кажутся безграничными.
Сочетание виртуального моделирования, искусственного интеллекта и данных из реального мира открывает перспективы для революционных изменений во многих областях, от охраны дикой природы до индустрии развлечений. Исследования Университета Суррея представляют собой значительный шаг вперед в раскрытии прогностических возможностей ИИ, знаменуя собой важную веху в стремлении использовать технологии для решения сложных задач и открытия новых возможностей. При дальнейшем внедрении инноваций и сотрудничестве будущее ИИ обладает огромным потенциалом для преобразования нашего мира к лучшему.

