Новая модель генерации аудио: технологии будущего

Новая модель генерации аудио: технологии будущего

Создание аудио из различных файлов

На днях была представлена новая модель для озвучивания текста под названием Dialog 1.0. Эта система эмоциональна в три раза больше, чем ElevenLabs, обладает высокой скоростью работы и допускает менее 1% ошибок.

Данная технология открывает возможности для создания подкастов, голосовых агентов и аудиокниг. В ней реализована функция клонирования голоса, благодаря чему ИИ-персонажи звучат очень естественно. Поддерживается также русский язык.

Можно бесплатно сгенерировать до 30 минут аудио, воспользовавшись специальным сервисом.

Источник: @ffleshka

Похожие новости

Google разрабатывает инновационный подход к обучению нейросетей для преодоления ограничений памяти

Современные языковые модели, основанные на архитектуре трансформеров, сталкиваются с одной из главных проблем — ограниченной долговременной памятью. Эти системы способны запомнить лишь ограниченный объем информации, связанный с тренировочными данными и…

Microsoft создает ИИ-докторов для ранней диагностики болезней

Глава направления искусственного интеллекта в одной из ведущих технологических компаний заявил о запуске специально созданной команды, которая займется разработкой узкоспециализированных моделей ИИ. Основная цель — превзойти человека в определенных областях,…