14 февраля 2008, 17:48

Voice Digger - технология поиска ключевых слов для аудио на русском языке

Компанией "Центр речевых технологий" разработана технология поиска ключевых слов в фонограммах речи для русского языка – Voice Digger. Это первая в России коммерческая разработка в области audio data mining, сообщает 3DNews.

Voice Digger позволяет осуществлять автоматическое определение "ключевых" слов и словосочетаний в потоке слитной речи без предварительного прослушивания и, таким образом, становится хорошим помощником в работе с аудио архивами и мониторинге аудиоинформации. Voice Digger основан на непрерывном распознавании речи, реализуемом на акустических скрытых Марковских моделях (HMM).

Ключевые слова задаются в виде обычного набранного текста, по которому система строит НММ модель каждого слова. Кроме того в системе задается так называемая фоновая модель - модель общей речи. При построении моделей ключевых слов используется транскриптор русского языка и акустические модели фонов для русского языка. На выходе VoiceDigger предоставляет ссылку на звуковой документ и местоположение искомого слова или словосочетания. Метод является достаточно быстрым и не зависит от словаря. Уровень ошибки составляет 8%.

По мнению специалистов, новая технология будет пользоваться спросом в крупных системах обработки, хранения и анализа данных. Модули, созданные на базе Voice Digger, позволят оперативно обработать не только текстовые, но и мультимедиа-данные и получить на выходе систематизированные выборки по интересующей пользователя тематике.

Оцените новость:

5 оценок

Последние новости

Технологии | Вчера, 18:15
Российские спецслужбы отключали часть системы наблюдения за Путиным
Технологии | Вчера, 17:45
СМИ: Пентагон может отказаться от поставок ракет Tomahawk Германии
Технологии | Вчера, 17:15
ВВС Израиля атаковали военные цели в Иране
Железо | Вчера, 16:45
Так буде виглядати складний iPhone Ultra, — ЗМІ
Безопасность | Вчера, 16:15
"Шахед" поразил хаб "Укрпочты" в Харькове
Технологии | Вчера, 15:45
ВМФ РФ патентує безекіпажний катер-рятувальник
Технологии | Вчера, 15:15
Кім Чен Ин ставить завдання: виробництво ракет КНДР — ×2,5 за п'ять років
Технологии | Вчера, 14:45
МАГАТЭ проверит поврежденный российским дроном ядерный объект на ЧАЭС
Технологии | Вчера, 14:15
OpenAI планує масштабне оновлення ChatGPT

Еще новости

Последние материалы