Создание аннотированного корпуса речевых данных для распознавания ключевых слов

Аннотированный корпус речевых данных (речевая базы данных), предназначен для обучения (оценивания параметров), настройки и тестирования систем обнаружения ключевых слов в потоке слитной речи. Корпус включает речевой матерал, записанный в телефонном канале (городская телефонная сеть), с разными отношениями сигнал/шум. Обьем речевого материала обеспечивает возможность как обучения (оценивания и подгонки параметров моделей) марковский моделей звуов речи (для использования их в системе распознавания ключевых слов), так и последующего тестирования качества работы системы распознавания ключевых слов.