Исследование и разработка робастных методов распознавания речи
Исследование робастных методов распознавания речи проводится в направлении создания акустических моделей речевого
сигнала, которые более адекватно, по сравнению с традиционными статистическими моделями, отражают те
разнообразные условия, в которых осуществляется речевая коммуникация.
В основу методов моделирования речевого потока положены т.н. множественные статистические
модели аллофонов и морфем, методы построения которых были предложены и исследованы в нашем коллективе ранее.
Идея множественных моделей состоит в том, что для аллофона создаются несколько различных
специализированных акустических моделей, которые совместно используются в лексической сети при декодировании речевого
потока.
Выбор таких множественных моделей осуществляется автоматически, путем анализа речевого корпуса данных, с
последующей кластеризацией, например, по типу акустико-фоновой обстановки, канала связи или характеристик голоса диктора.
Работа выполнялась при поддержке РФФИ, проект 04-01-00588.