Project

Исследование и разработка робастных методов распознавания речи

Исследование робастных методов распознавания речи проводится в направлении создания акустических моделей речевого сигнала, которые более адекватно, по сравнению с традиционными статистическими моделями, отражают те разнообразные условия, в которых осуществляется речевая коммуникация. В основу методов моделирования речевого потока положены т.н. множественные статистические модели аллофонов и морфем, методы построения которых были предложены и исследованы в нашем коллективе ранее. Идея множественных моделей состоит в том, что для аллофона создаются несколько различных специализированных акустических моделей, которые совместно используются в лексической сети при декодировании речевого потока. Выбор таких множественных моделей осуществляется автоматически, путем анализа речевого корпуса данных, с последующей кластеризацией, например, по типу акустико-фоновой обстановки, канала связи или характеристик голоса диктора. Работа выполнялась при поддержке РФФИ, проект 04-01-00588.