GigaChat внедряет новую модель распознавания голоса с высоким качеством

GigaChat внедряет новую модель распознавания голоса с высоким качеством

Разработчики GigaChat представили обновленную систему обработки речи, которая кардинально отличается от традиционных методов. Вместо использования последовательных модулей для преобразования речи в текст и последующей обработки, новая модель основана на технологии end-to-end, которая позволяет сразу преобразовывать голосовые данные в текст без промежуточных шагов.

При сравнительном тестировании на 1200 диалогах новая подход оказалась вдвое точнее предыдущих решений. По качеству диалогов она достигла уровня GPT-4 и способна успешно обрабатывать аудио длительностью до 170 минут, работая как на русском, так и на английском языке.

Пользователи уже могут воспользоваться новой функцией как через веб-интерфейс, так и в мессенджере Telegram, что делает её доступной для широкой аудитории.

Источник: @techgptnews

Похожие новости

В США могут запретить продажу некоторых моделей iPhone из-за нарушений с Samsung

В Соединённых Штатах рассматривается возможность запрещения продажи отдельных моделей iPhone вследствие использования компанией Apple технологий, украденных у компании Samsung. Причиной стало предварительное решение комиссии по международной торговле США в рамках…

Roblox станет платформой для виртуальных знакомств с ограничением по возрасту

Разработчики Roblox объявили о планах превратить платформу в сервис, поддерживающий виртуальные знакомства. Однако, по словам руководства, участие в таких взаимодействиях будет доступно только для пользователей в возрасте 21 года и…