Нижегородские ученые разработали алгоритм для точного измерения частоты основного тона речи. Эта технология может быть полезной при распознавания эмоций, анализа речи и диагностирования заболеваний по голосу. Об этом сообщает пресс-служба НИУ ВШЭ.
Этот алгоритм отличает высокая частотность и быстрота измерения. При этом он способен работать даже при высоком уровне фонового шума и ограничении в вычислительных ресурсах.
За основу алгоритма взяли классические математические методы, в том числе преобразование Фурье, которое применяют при обработке аудиосигналов. Однако они все теряют эффективность и испытывают проблемы при работе с записями низкого качества и сигналами, которые содержат шум.
Нижегородские ученые устранили проблему с помощью нейросети. Она разделяет звуки речи и фоновый шум. В результате это позволяет повысить точность и эффективность алгоритма.
Этот метод может применяться в самых разных целях — от улучшения систем распознавания речи до мониторинга эмоционального состояния и диагностики речевых расстройств.
Напомним, нижегородские ученые смогли вывести мышей-мутантов. Такие лабораторные животные используются для исследований.