Ученые из Санкт-Петербургского Федерального исследовательского центра РАН (СПб ФИЦ РАН) создали приложение, которое может распознавать речь по губам в шумных местах. Об этом пишет ТАСС со ссылкой на пресс-службу организации.
Выяснилось, что такое приложение можно использовать в широком спектре отраслей — от сферы услуг до тяжёлой промышленности.
— Разработка поможет повысить точность работы голосовых помощников в шумных условиях, например, в людных местах или при управлении тяжёлой техникой, — уточнили в пресс-службе.
Учёные предложили нейросеть, способную собирать два вида информации по аналогии с человеческим восприятием — звуковую форму речи и движение губ. Она распознаёт речь по аудиовизуальным сигналам и способна принимать решение о том, какие данные (видео, звук или оба) дадут максимальную точность.
Ранее 78.ru писал, что американский искусственный интеллект сотворил робота, который может самопроизводиться.