26 февраля дочерняя компания Google DeepMind представила Genie — генеративную ИИ-модель, умеющую создавать игры. Нейросеть, обученная на более чем 200 000 часах геймплей-видео, способна превратить любое изображение или текст в 2D-платформер.
В названии Genie заложена игра слов. Оно представляет собой сокращение от Generative Interactive Environments и является отсылкой к имени Джина из мультфильма про Аладдина.
«Последнее время мы наблюдали появление генеративного ИИ, модели которого способны создавать разнообразный контент на основе текста, изображений и даже видео. Сегодня мы представляем новую парадигму — генеративные интерактивные среды: Genie», — сообщили представители DeepMind.
Rather than adding inductive biases, we focus on scale. We use a dataset of >200k hours of videos from 2D platformers and train an 11B world model. In an unsupervised way, Genie learns diverse latent actions that control characters in a consistent manner. pic.twitter.com/71a3iuAGZA
— Tim Rocktäschel (@_rockt) February 26, 2024
По словам создателей, Genie обучается на большом наборе общедоступных материалов из сети. Команда сосредоточились на видеороликах, посвященных 2D-платформерам и робототехнике. Отмечается, что ее алгоритм может работать в любой области, а также масштабироваться на другие массивы данных.
Изобретатели выразили мнение, что появление Genie также имеет большое значение для обучения ИИ-агентов. Их исследования показали, что игровая среда может быть эффективным испытательным полигоном. Благодаря новой нейросети они смогут обучаться в бесконечном количестве создаваемых каждый день миров.
Напомним, 21 февраля 2024 года Google представила открытую ИИ-модель Gemma, по результатам тестов превосходящую нейросети от Meta и Mistral.
Автор: Алекс Кондратюк