Создание аннотированного корпуса речевых данных для распознавания ключевых
слов
Аннотированный корпус речевых данных (речевая базы данных), предназначен
для обучения (оценивания параметров), настройки и тестирования систем обнаружения
ключевых слов в потоке слитной речи. Корпус включает речевой матерал, записанный
в телефонном канале (городская телефонная сеть), с разными отношениями
сигнал/шум. Обьем речевого материала обеспечивает возможность как обучения
(оценивания и подгонки параметров моделей) марковский моделей звуов речи
(для использования их в системе распознавания ключевых слов), так и последующего
тестирования качества работы системы распознавания ключевых слов.