GigaChat внедряет новую модель распознавания голоса с высоким качеством

GigaChat внедряет новую модель распознавания голоса с высоким качеством

Разработчики GigaChat представили обновленную систему обработки речи, которая кардинально отличается от традиционных методов. Вместо использования последовательных модулей для преобразования речи в текст и последующей обработки, новая модель основана на технологии end-to-end, которая позволяет сразу преобразовывать голосовые данные в текст без промежуточных шагов.

При сравнительном тестировании на 1200 диалогах новая подход оказалась вдвое точнее предыдущих решений. По качеству диалогов она достигла уровня GPT-4 и способна успешно обрабатывать аудио длительностью до 170 минут, работая как на русском, так и на английском языке.

Пользователи уже могут воспользоваться новой функцией как через веб-интерфейс, так и в мессенджере Telegram, что делает её доступной для широкой аудитории.

Источник: @techgptnews

Похожие новости

Илон Маск анонсировал внедрение голосового ИИ Grok в автомобили Tesla

В результате подтвержденных заявлений, стало известно, что голосовой интеллектуальный ассистент Grok, разработанный стартапом xAI под руководством Илона Маска, уже скоро появится в моделях Tesla. Внедрение этой технологии станет важным шагом…

Обновленные умные очки для плавания Smart Swim 2 с расширенными функциями

Компания Form презентовала обновлённую версию своих интеллектуальных очков для плавания — **Smart Swim 2**. Зарегистрировано почти шесть лет с момента выпуска первой модели, несколько инженеров усердно работали, внедряя новые функции.…