NVIDIA представила ИИ, который генерирует видео с высоким разрешением по текстовому описанию

NVIDIA представила свою ИИ-модель для превращения текста в видео под названием VideoLDM, разработанную в сотрудничестве с исследователями из Корнельского университета. Модель способна генерировать видео в разрешении до 2048 × 1280 пикселей с частотой 24 кадра и длительностью до 4,7 секунд на основе текстового описания.

Источник изображений: NVIDIA

В основе модели лежат наработки нейросети Stable Diffusion. Решение NVIDIA имеет до 4,1 млрд параметров, но только 2,7 млрд из этих них использовали видео для тренировки. Это весьма скромно по меркам современных ИИ. Тем не менее, с помощью эффективного подхода к модели скрытой диффузии (LDM — Latent diffusion model) разработчики смогли создавать разнообразные и согласованные во времени видео высокого разрешения с весьма высоким качеством.

Исследователи выделяют следующие особенности данной модели: генерацию персонализированного видео и свёрточный синтез во времени. Временные слои, которые были обучены в VideoLDM для превращения текста в видео, вставляются в опорные сети LDM изображений, которые заранее точно настроены в наборе изображений DreamBooth. Временные слои обобщаются контрольными точками DreamBooth, что позволяет персонализировать преобразование текста в видео. Применяя изученные временные слои сверточно во времени, можно получить клипы чуть большей продолжительности с незначительным ухудшением качества.

Модель также способна генерировать видео сцен вождения. Видеоролики имеют разрешение 1024 × 512 точек и длительностью до 5 минут. Есть возможность моделирования конкретного сценария вождения, когда за основу берутся ограничивающие рамки для создания интересующей обстановки, синтезируется соответствующий начальный кадр, а затем создаются правдоподобные видеоролики. Помимо этого, модель может сделать мультимодальное прогнозирование сценариев движения, сгенерировав несколько правдоподобных развертываний на основе одного начального кадра.

Данная исследовательская работа является участником Конференции по машинному зрению и распознаванию образов, которая проходит в Ванкувере с 18 по 22 июня. Пока что представленная нейросеть является лишь исследовательским проектом и не ясно, когда что-то подобное NVIDIA выпустит в открытый доступ.

Источник:

Лента

«Государство — это нация» Как 50 лет назад революция свергла самую долгую фашистскую диктатуру Европы?

Толковый путь: как сервис видеосвязи Контур.Толк стал пространством для коммуникаций

Весь мир верит в пользу десяти тысяч шагов. Сколько на самом деле надо ходить, чтобы не толстеть и быть здоровым

Топ-20 психологических трюков

Мифы и правда про знакомства в интернете

Правила современного этикета

Как бы я взломал Рунет?

Электронная почта навсегда изменила мир. Кто ее придумал и почему люди не сразу поняли, что это революция?

Как защитить себя от интернет-травли? Простые советы для сохранения эмоционального равновесия

«Слова утратили авторство и смысл» За сто лет русская речь сильно изменилась. Как на это влияли власти СССР?

«Она жаждала заполучить гения» Русская жена свела с ума великого Сальвадора Дали. Как она навсегда изменила его жизнь?

Все говорят о финансовой грамотности. Как правильно управлять своими деньгами и не потерять их?

Великий гуманист. Как Николай Пирогов изменил медицину, спас жизни миллионам людей и прославился на весь мир?

«Мы не такие, как американцы» Какие операции проводят по всему миру иранские спецслужбы и как США охотятся на их лидеров?

Дуров дал интервью Такеру Карлсону. Он много лет не появлялся перед камерами. О чем рассказал загадочный миллиардер?

Завтрак — главный прием пищи за день. Как завтракать правильно, а что есть ни в коем случае нельзя?

Женщины больше не стремятся быть красивыми и сексуальными. Почему они это делают и как это стало модным трендом?

«Рад стараться, дорогой товарищ Сталин!» Как Хрущев заполучил власть в Москве и уничтожил столичную элиту?

NVIDIA представила ИИ, который генерирует видео с высоким разрешением по текстовому описанию

Понравилось это:

Добавить комментарий Отменить ответ

Лента

Поделиться ссылкой:

Понравилось это:

Добавить комментарий Отменить ответ