Разработка Сбера улучшит распознавание русского языка

Сбербанк разработал технологию для улучшения распознавания русской речи ИИ. Новая методика сокращает затраты на обучение нейронных сетей, не требуя больших объемов подготовленных аудиоматериалов.

10.3k просмотров
2 мин
нейросеть глаз

Исследовательская группа Сбербанка разработала инновационную технологию, позволяющую значительно повысить точность распознавания русской речи искусственными системами обработки естественного языка. По заявлению представителей компании, новая методика устраняет необходимость использования больших объемов специально подготовленных и маркированных аудиоматериалов, снижая затраты на обучение нейронных сетей.

Метод основан на модификации популярной архитектуры трансформеров типа HuBERT, однако ключевым отличием стало использование семантического анализа данных вместо традиционных акустических признаков. Этот подход позволил создать высокоэффективный алгоритм предобучения, способный качественно обрабатывать большие объемы необработанного звукового материала.

Основатель проекта и руководитель технического направления GigaChat Сбербанк Фёдор Минькин отметил, что эта технология станет прорывом в области русскоязычных систем распознавания речи, особенно учитывая сложность адаптации технологий для языков с ограниченными ресурсами разметки данных.

Для демонстрации возможностей новой методики разработчики использовали набор из ста тысяч часов записанной разговорной речи на русском языке, обработав её предварительно обученной сетью Conformer. Результаты тестов показали значительное улучшение показателей точности распознавания: система допускает вдвое меньшее количество ошибок по сравнению с признанным лидером отрасли моделью Whisper Large v3 от OpenAI.

Применение данной технологии открывает новые перспективы для развития интеллектуальных голосовых ассистентов, автоматизации колл-центров и инструментов анализа телефонных переговоров. Метод позволяет эффективно интегрироваться в существующие мультимедийные решения, такие как диалоговые интерфейсы с поддержкой голосового ввода, повышая удобство взаимодействия пользователей с цифровыми сервисами.

Таким образом, благодаря новому решению от команды Сбербанка российский рынок технологий искусственного интеллекта получает мощный инструмент повышения эффективности систем распознавания естественной речи, обеспечивая качественные улучшения в повседневной жизни миллионов россиян.

Поделиться
1 комментарий
  • Это прям прорыв в области распознавания речи да и демонстрирует зрелость отечественных исследований. Отлично!

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *