Лингвисты из Санкт-Петербургского государственного университета (СПбГУ) обучили нейросеть распознавать эмоциональную речь, сообщает ТАСС с ссылкой на пресс-службу учреждения.
В качестве базы учёные использовали интервью с жертвами Холокоста. В общей сложности специалисты обработали 26 часов разговоров. Теперь, если рассказать искусственному интеллекту о чём-то эмоционально, то технология буквально «почувствует» настроение человека. Однако в настоящий момент система неидеальна и допускает ошибки.
— Мы использовали предобученную на русском языке глубокую нейросеть Wav2Vec 2.0. Идея её работы заключается в том, чтобы выучить сопоставление каждого звука устной речи человека соответствующей букве алфавита. Конкретно данная архитектура нейросети также использует так называемый механизм внимания, для того чтобы научиться „обращать внимание“ на значимые для определения той или иной буквы по звуку признаки, что значительно повышает качество результата, — рассказал магистрант кафедры математической лингвистики СПбГУ Михаил Долгушин.
Отмечается, что распознавание речи — одна из важных задач для компьютерных систем, поскольку она позволяет формировать субтитры и генерировать пересказ теста.
Ранее 78.ru писал, что петербургские учёные разработали формат обучения с применением виртуальной реальности.