7 мая 2003, 12:58

Intel учит компьютеры "читать по губам"

Исследователи корпорации Intel выпустили программное обеспечение, лицензируемое по принципу открытого исходного кода, позволяющее разработчикам создавать компьютеры, которые "читают по губам" отдаваемые им команды, что обеспечивает лучшее распознавание сказанного.

Современные мощные алгоритмы распознавания речи хорошо работают при отсутствии фонового шума или при использовании хорошо настроенной гарнитуры, однако точность этих алгоритмов значительно снижается, когда приложения на их основе оказываются в условиях естественных шумов, характерных, например, для общественных мест.

Программный пакет Audio Visual Speech Recognition (AVSR), объединенный с алгоритмами распознавания мимики лица из библиотеки компьютерного зрения Intel OpenCV, позволит компьютерам "наблюдать" за лицом человека и отслеживать движения его рта. Синхронизация видеоданных с результатами речевой идентификации в итоге обеспечит повышение точности распознавания речи и соответственно - эффективности широкого спектра речевых приложений в шумных средах.

Программное обеспечение AVSR является частью библиотеки Intel OpenCV и представляет собой инструментальный набор из более 500 используемых при обработке изображений функций, которые помогают исследователям разрабатывать новые приложения на основе технологий компьютерного зрения.

Оцените новость:
  • 0 оценок