Nvidia разрабатывает нейросеть для генерации видео

Генеративные нейросети за последние полгода приобрели бешеную популярность. Мы привыкли к невероятным или реалистичным изображениям, которые способен создать искусственный интеллект. Но вскоре нас может ожидать волна генеративных нейросетей, которые способны создавать видео. Над таким проектом уже работают специалисты NVIDIA совместно с Корнелльским университетом. Судя по всему, эту модель искусственного интеллекта представят на Международной конференции по компьютерному зрению и распознаванию образов, которая пройдет в июне.

Нейросеть Nvidia Video LDM использует модель скрытой диффузии (LDM) для качественного синтеза изображений, включая наработки LDM Stable Diffusion. Сначала идет предварительное обучение LDM только на изображениях; затем генератор изображений преобразовывают в генератор видео, вводя временные параметры для последовательности изображений; потом идет выравнивание и согласование. Данная модель генеративного ИИ разрабатывается для двух целей — моделирование вождения в реальной среде и создание творческого контента. Проверка автомобильных видео проходит валидацию на реальных записях с разрешением 512 x 1024. Такая технология может быть использована для разработки будущих систем автономного вождения. И в целом у данного ИИ широкие перспективы в разных сферах деятельности.

ИИ сможет генерировать видеоролики по текстовому описанию, например, «коала играет на пианино».

Сейчас нейросеть умеет генерировать видео с разрешением до 1280 x 2048 при длительности до 5 секунд. Много забавных примеров представлено на официальной страничке проекта.

Источник:
Cornell University

Еще новости:

Arctic принимает заказы на мини-холодильник

Замечена GeForce RTX 5090 с большим количеством блоков ROP, чем указано в спецификациях

На подходе серия NVMe-накопителей Kingston Fury Renegade G5 с поддержкой PCIe 5.0

Последние обзоры:

Обзор и тестирование видеокарты ASUS TUF Gaming GeForce RTX 5090 32GB OC Edition. Сравнение с GeForce RTX 4090 и другими оппонентами

Обзор и тестирование процессора Intel Core Ultra 7 265K и платформы LGA 1851. Очередной «плиточный» представитель

Обзор 14″ хромбука-трансформера Acer Chromebook Plus Spin 514