Aria Gen 2: Открытие новых исследований в области машинного восприятия, контекстного искусственного интеллекта, робототехники и многого другого
С момента своего запуска в 2020 году проект Aria позволил исследователям по всему миру продвигать свое состояние машинного восприятия и искусственного интеллекта (ИИ) благодаря доступу к передовому исследовательскому оборудованию и наборам данных с открытым исходным кодом, моделям и инструментам. Мета объявила о следующем шаге: введение очков Aria Gen 2. Новое поколение оборудования расширяет возможности исследований, включая восприятие машин, эгоцентрический и контекстный ИИ, а также робототехнику.

Для исследователей, желающих изучить, как системы искусственного интеллекта могут лучше понять мир с человеческой точки зрения, очки Aria Gen 2 добавляют новый набор возможностей к платформе Aria. Они включают в себя ряд достижений, которых нет ни на одном другом устройстве, доступном сегодня, и доступ к этим прорывным технологиям позволит исследователям раздвинуть границы возможного.
По сравнению с Aria Gen 1, уникальное ценностное предложение Aria Gen 2 включает в себя:
- Современный набор датчиков: обновленный набор датчиков включает в себя RGB-камеру, камеры 6DOF SLAM, камеры отслеживания глаз, пространственные микрофоны, IMU, барометр, магнитометр и GNSS. По сравнению со своим предшественником, Aria Gen 1, новое поколение представляет два инновационных датчика, встроенных в носовые упоры: датчик PPG для измерения сердечного ритма и контактный микрофон, чтобы отличить голос носителя от голоса прохожих.
- Сверхнизкое энергопотребление и машинное восприятие на устройстве: SLAM, отслеживание глаз, отслеживание рук и распознавание речи обрабатываются на устройстве с использованием собственного чипа Meta.
- Удобство использования в течение всего дня: очки Aria Gen 2 способны работать течение шести-восеми часов непрерывного использования, весят около 75 граммов и имеют возможность складывания для удобной переноски.
- Взаимодействие через аудио: Пользователи получают аудиообратную связь через лучшие в своем классе динамики для открытых ушей, позволяющие создавать прототипы системы с открытыми ушами.
Десятилетний путь к созданию следующей вычислительной платформы привел к разработке этих критически важных технологий. В Meta команде Reality Labs Research и FAIR AI lab будут использовать их для продвижения долгосрочной исследовательской концепции. Их доступ к академическим и коммерческим исследовательским лабораториям в рамках проекта Aria еще больше продвигает открытые исследования и общественное понимание ключевого набора технологий, которые, по мнению Meta, помогут сформировать будущее вычислений и искусственного интеллекта.
Открытые исследования, проведенные проектом Aria с 2020 года, уже привели к важной работе, включая создание инструментов с открытым исходным кодом, широко используемых в академических и промышленных исследованиях. Набор данных Ego-Exo4D, собранный с использованием первого поколения очков Aria, стал основополагающим инструментом современного компьютерного зрения и для робототехники. Исследователи из Georgia Tech недавно показали, как Aria Research Kit может помочь гуманоидным роботам научиться помогать людям в доме, в то время как команды BMW использовали его для изучения того, как интегрировать системы дополненной и виртуальной реальности в интеллектуальные транспортные средства.
И Aria также позволяет разрабатывать новые технологии для обеспечения доступности. Очки Aria первого поколения были использованы Университетом Карнеги-Меллона в их проекте NavCog, который был направлен на создание технологий для оказания помощи слепым и слабовидящим людям в навигации в помещении. Опираясь на этот фундамент, очки Aria Gen 2 в настоящее время используются Envision, компанией, занимающейся созданием решений для слепых или слабовидящих людей. Envision изучает интеграцию своего помощника Ally AI и пространственного аудио с использованием новейших очков Aria Gen 2 для улучшения навигации в помещении и доступности.
Envision использовал возможности SLAM на устройстве Aria Gen 2 а также функции пространственного звука через встроенные динамики, чтобы помочь слепым и слабовидящим людям беспрепятственно ориентироваться в помещении. Это инновационное использование технологий, которое все еще находится на этапе исследований, является примером того, как исследователи могут использовать очки Aria Gen 2 для создания прототипов опыта искусственного интеллекта на основе эгоцентрических наблюдений. Усовершенствованные датчики и возможности машинного восприятия на устройстве, включая SLAM, отслеживание глаз, отслеживание рук и аудиовзаимодействие, также делают их идеальными для сбора данных для исследований и робототехники.
В ближайшие месяцы Meta планирует поделиться более подробной информацией о сроках доступности устройств с партнерами. Исследователи, заинтересованные в доступе к Aria Gen 2, могут зарегистрироваться, чтобы получать обновления. Мы с нетерпением ждем, как Aria Gen 2 поможет исследователям создавать инновации, которые сформируют будущее искусственного интеллекта и вычислительных технологий.