Новая модель генерации аудио: технологии будущего

Новая модель генерации аудио: технологии будущего

Создание аудио из различных файлов

На днях была представлена новая модель для озвучивания текста под названием Dialog 1.0. Эта система эмоциональна в три раза больше, чем ElevenLabs, обладает высокой скоростью работы и допускает менее 1% ошибок.

Данная технология открывает возможности для создания подкастов, голосовых агентов и аудиокниг. В ней реализована функция клонирования голоса, благодаря чему ИИ-персонажи звучат очень естественно. Поддерживается также русский язык.

Можно бесплатно сгенерировать до 30 минут аудио, воспользовавшись специальным сервисом.

Источник: @ffleshka

Похожие новости

Высокие зарплаты специалистов Microsoft: аналитика по годовым доходам

Издание Business Insider опубликовало данные о доходах сотрудников компании Microsoft, где особенно выделяются годовые оклады в различных подразделениях. Для работников техподдержки средний годовой заработок составляет 11,9 миллиона рублей, а для…

Нейросеть GigaChat расширяет возможности логического анализа

Разработчики GigaChat внедрили в систему режим «Рассуждать», который позволяет искусственному интеллекту работать с логическими цепочками. Теперь нейросеть способна строить последовательные рассуждения, проверять промежуточные шаги, обрабатывать данные и делать обоснованные выводы.…