Разработчики из компании Meta* представили новую нейросеть под названием Make-A-Video. И она умеет генерировать видеоролики по текстовому описанию. Это похоже на работу других нейросетей, которые создают изображения аналогичным способом, но там всё ограничивается одним изображением, а не несколькими.
В техническом плане система работает так: при анализе текстового запроса Make-A-Video генерирует 16 кадров видео с разрешением 64 на 64 пикселя каждый. После этого их увеличивают с помощью другой ИИ-системы. Как утверждается, нейросеть обучали на миллионах видеороликов, в том числе стоковых.