Российскую технологию распознавания речи признали лучшей в мире

Технология сегментирования аудиопотока и распознавания речи, созданная группой компаний ЦРТ, признана лучшей на международном конкурсе CHiME Speech Separation and Recognition Challenge (CHiME-6). Об этом в четверг, 7 мая, сообщила пресс-служба разработчика.

«На CHiME-5 конкурсанты решали так называемую cocktail party problem — распознавание спонтанной речи нескольких дикторов в условиях частичного наложения речи и шума, то есть в типичной ситуации общения на вечеринке. Этот блок требовал работы с сегментированной (уже выделенной) речью. Новизна и особенность CHiME-6 заключалась в том, что впервые в истории конкурсантам было предложено решить аналогичную проблему, но работа с несегментированной речью, при этом — с перекрытием речи до 20%», — говорится в пресс-релизе.

Записи для конкурса были сделаны на 20 ужинах в настоящих домах, где люди свободно общались, шутили, смеялись, готовили, ели, мыли посуду.

Организаторы поставили перед участниками цель — создать систему распознавания, которая «прослушает» записи и выдаст полную расшифровку с наименьшим количеством ошибок. В итоге победителем стала технология, созданная специалистами ЦРТ.

«Качественное распознавание речи разных дикторов, при этом перебиваемой шумами, позволяет выводить сервисы из разряда инновационных в повседневное применение, совершенствуя бизнес и упрощая нашу жизнь», — отметил генеральный директор группы компаний ЦРТ Дмитрий Дырмовский.

В начале января президент России Владимир Путин в ходе обращения с ежегодным посланием к Федеральному собранию заявил, что страна способна достичь прорыва в сфере развития искусственного интеллекта.

В ноябре прошлого года Сбербанк создал самый мощный в России суперкомпьютер. Данная модель помогает ускорить разработку сервисов и процессов, основанных на искусственном интеллекте.

Источник: iz.ru

Похожие статьи

НАПИСАТЬ КОММЕНТАРИЙ

Ваш e-mail не будет опубликован. Обязательные поля помечены (обязательно)