Камера, мотор, начали! Сбер представил первую в России нейросеть для генерации полноценного видео

Поделиться:

Нейросеть Сбера умеет создавать 8-секундные видеоролики по самым разным темам запросов.

Сбер представил нейросеть Kandinsky Video —  первую в России генеративную модель для создания полноценных видеороликов по текстовому описанию, которая генерирует видеоряд продолжительностью до восьми секунд с частотой 30 кадров в секунду. Об этом в ходе международной конференции AI Journey рассказал первый заместитель Председателя Правления Сбербанка Александр Ведяхин.

Архитектура Kandinsky Video состоит из двух ключевых блоков: первый отвечает за создание ключевых кадров, из которых складывается структура сюжета видео, а второй — за генерацию интерполяционных кадров, которые позволяют достичь плавности движений в финальном видео. В основе двух блоков лежит новая модель синтеза изображений по текстовым описаниям Kandinsky 3.0.