Новая модель генерации аудио: технологии будущего

Новая модель генерации аудио: технологии будущего

Создание аудио из различных файлов

На днях была представлена новая модель для озвучивания текста под названием Dialog 1.0. Эта система эмоциональна в три раза больше, чем ElevenLabs, обладает высокой скоростью работы и допускает менее 1% ошибок.

Данная технология открывает возможности для создания подкастов, голосовых агентов и аудиокниг. В ней реализована функция клонирования голоса, благодаря чему ИИ-персонажи звучат очень естественно. Поддерживается также русский язык.

Можно бесплатно сгенерировать до 30 минут аудио, воспользовавшись специальным сервисом.

Источник: @ffleshka

Похожие новости

Нейросеть GigaChat расширяет возможности логического анализа

Разработчики GigaChat внедрили в систему режим «Рассуждать», который позволяет искусственному интеллекту работать с логическими цепочками. Теперь нейросеть способна строить последовательные рассуждения, проверять промежуточные шаги, обрабатывать данные и делать обоснованные выводы.…

Илон Маск анонсировал внедрение голосового ИИ Grok в автомобили Tesla

В результате подтвержденных заявлений, стало известно, что голосовой интеллектуальный ассистент Grok, разработанный стартапом xAI под руководством Илона Маска, уже скоро появится в моделях Tesla. Внедрение этой технологии станет важным шагом…