Около трёх месяцев прошло с того времени как OpenAI представила генеративную нейросеть Sora, которая может создавать близкое к реальности видео по текстовому описанию. сейчас у Гугл есть чем ответить: в рамках конференции Гугл I/O была анонсирована нейросеть Veo. Метод может производить «качественные» видеоклипы с разрешением Полный HD длительностью больше минутки с применением различных зрительных и синематографических стилей.
В пресс-релизе Гугл сказано, что метод Veo обладает «продвинутым осознанием естественного языка», что позволяет ИИ-модели осознавать синематографические определения, такие как «таймлапс» либо «съёмка пейзажа с воздуха». Юзеры могут достигнуть хотимого результата при помощи не только лишь текстовых подсказок, но также «скормить» ИИ изображения либо видео, получая в конечном счёте «поочередные и целостные» ролики, в каких в протяжении всего времени движения людей, зверей и объектов смотрятся близко к реальности.
Главный начальник ИИ-подразделения Гугл DeppMind Демис Хассабис (Demis Hassabis) проговорил, что юзеры могут редактировать генерируемые ролики при помощи дополнительных подсказок. Также, Гугл изучает возможность интеграции дополнительных функций, которые позволят Veo создавать раскадровки и больше длительные видео.
Невзирая на нынешний анонс Veo, обыденным юзерам придётся какое-то время подождать, сначала чем метод станет общедоступным. На данном шаге Гугл приглашает к тестированию подготовительной версии нейросети ограниченно кол-во создателей контента. Компания желает поэкспериментировать с Veo, чтоб найти, каким образом следует производить поддержку создателей контента и развивать взаимодействие с ними, давая творческим людям право голоса в разработке ИИ-технологий Гугл. Некие функций Veo в наиблежайшие несколько недель станут доступны ограниченному числу юзеров сервиса VideoFX, которые подадут заявки на роль в тестировании подготовительной версии метода. В дальнейшем Гугл хочет также добавить некие функции Veo в YouTube Shorts.