Компанией "Центр речевых технологий" разработана технология поиска ключевых слов в фонограммах речи для русского языка – Voice Digger. Это первая в России коммерческая разработка в области audio data mining, сообщает 3DNews.
Voice Digger позволяет осуществлять автоматическое определение "ключевых" слов и словосочетаний в потоке слитной речи без предварительного прослушивания и, таким образом, становится хорошим помощником в работе с аудио архивами и мониторинге аудиоинформации. Voice Digger основан на непрерывном распознавании речи, реализуемом на акустических скрытых Марковских моделях (HMM).
Ключевые слова задаются в виде обычного набранного текста, по которому система строит НММ модель каждого слова. Кроме того в системе задается так называемая фоновая модель - модель общей речи. При построении моделей ключевых слов используется транскриптор русского языка и акустические модели фонов для русского языка. На выходе VoiceDigger предоставляет ссылку на звуковой документ и местоположение искомого слова или словосочетания. Метод является достаточно быстрым и не зависит от словаря. Уровень ошибки составляет 8%.
По мнению специалистов, новая технология будет пользоваться спросом в крупных системах обработки, хранения и анализа данных. Модули, созданные на базе Voice Digger, позволят оперативно обработать не только текстовые, но и мультимедиа-данные и получить на выходе систематизированные выборки по интересующей пользователя тематике.