ИИ научился создавать акустический фон по текстовым подсказкам

Технический стартап ElevenLabs запустил программку на базе искусственного ума (ИИ) для автоматического сотворения звуков окружения на базе текстовых подсказок. Об этом сообщается на официальной страничке компании в соцсети X (раньше — Twitter). Творцы новейшей нейросети показали ее способности на примере беззвучных видеороликов, сгенерированных при помощи генеративной модели Sora конторы OpenAI.

© globallookpress.com

"Мы использовали текстовые подсказки, такие как "шум волн", "гул металла", "чириканье птиц" и "мотор гоночного автомашины", для создания звука, который мы наложили на некоторые из наших любимых клипов из анонса OpenAI Sora", — отметили в ElevenLabs.

В демонстрационном видео показаны и другие примеры работы метода, включая шум улицы крупного города, механический шум бота и лай щенков. ElevenLabs известна как программист ИИ-системы по преобразованию текста в синтезированную речь и автоматического дубляжа видео с поддержкой больше чем 20 языков.