Facebook разработала модель компьютерного зрения SEER (SElf-supERvised), которая может самостоятельно обучаться распознавать объекты на фотографиях с минимальным участием человека.
Future AI systems will learn as people do — without relying on labeled data sets. Today we’re detailing SEER, a breakthrough in self-supervised #computervision, and open-sourcing VISSL, the library we used to build it. Learn more:https://t.co/CBg6ZkiqFU pic.twitter.com/zHHM3UHiUs
— Facebook AI (@facebookai) March 4, 2021
Модель SEER может обучиться на любой случайной группе изображений в интернете – без необходимости тщательного контроля и разметки, которые используются в создании большинства алгоритмов компьютерного зрения в наши дни.
После предварительного обучения на миллионе случайных, немаркированных и неотсортированных общедоступных изображений Instagram модель достигла точности в 84,2% на [simple_tooltip content=’Самый большой в мире набор визуальных данных, который используется разработчиками систем компьютерного зрения для проверки точности работы их алгоритмов.’]ImageNet[/simple_tooltip].
Главный научный сотрудник Facebook AI Янн ЛеКун называет подход самостоятельного обучения одним из самых многообещающих способов создания машин, обладающих базовыми знаниями для решения задач, выходящих далеко за рамки современных моделей ИИ.
«Самостоятельное обучение может иметь множество полезных применений, например, — научиться читать медицинские изображения без необходимости маркировать множество рентгеновских снимков» – говорит ЛеКун.
Он добавил, что аналогичный подход уже используется для автоматического создания хэштегов для изображений в Instagram. Также, по его словам, технологию SEER можно использовать в Facebook для сопоставления рекламы с сообщениями или для фильтрации нежелательного контента.
В Facebook заявили, что некоторые технологии в основе SEER будут доступны для разработчиков бесплатно. Но сам алгоритм останется закрытым, так как он был обучен с помощью данных пользователей Instagram.
Напомним, в январе 2021 года Facebook представила новую версию автоматического альтернативного текста (AAT) для фотографий, который с помощью машинного обучения описывает изображения для людей с нарушениями зрения.
Подписывайтесь на новости ForkLog в Telegram: ForkLog Feed — вся лента новостей, ForkLog — самые важные новости и опросы.
ForkLog
Автор: Богдан Каминский