Технический стартап ElevenLabs запустил программку на базе искусственного ума (ИИ) для автоматического сотворения звуков окружения на базе текстовых подсказок. Об этом сообщается на официальной страничке компании в соцсети X (раньше — Twitter). Творцы новейшей нейросети показали ее способности на примере беззвучных видеороликов, сгенерированных при помощи генеративной модели Sora конторы OpenAI.
© globallookpress.com
"Мы использовали текстовые подсказки, такие как "шум волн", "гул металла", "чириканье птиц" и "мотор гоночного автомашины", для создания звука, который мы наложили на некоторые из наших любимых клипов из анонса OpenAI Sora", — отметили в ElevenLabs.
В демонстрационном видео показаны и другие примеры работы метода, включая шум улицы крупного города, механический шум бота и лай щенков. ElevenLabs известна как программист ИИ-системы по преобразованию текста в синтезированную речь и автоматического дубляжа видео с поддержкой больше чем 20 языков.