20 апреля 2004, 10:33

В НАСА разрабатывают ПО для распознавания "беззвучной речи"

Ученые НАСА приступили к разработке компьютерной программы, способной распознавать беззвучную человеческую речь путем анализа посылаемых мозгом к горлу нервных сигналов, управляющих речью.

Во время предварительных экспериментов эти сигналы считывались при помощи специальных датчиков размеров с пуговицу, прикрепленных под подбородком с обеих сторон адамова яблока,  а затем после специальной обработки компьютерная программа "переводила" их в слова. По мнению ученых НАСА, в будущем такие системы распознавания "беззвучной речи" могут быть использованы для оснащения скафандров космонавтов, для осуществления связи в шумных местах, например, для приема команд диспетчеров аэропорта, а также для повышения точности традиционных программ распознавания речи.

По словам Чака Йоргенсена (Chuck Jorgensen) из калифорнийского Исследовательского центра НАСА имени Эймса в Силиконовой долине, возглавляющего группу разработчиков, предметом анализа является непроизнесенная вслух, беззвучная речь, когда человек читает про себя, или мысленно говорит сам с собой. Как отметил г-н Йоргенсен, при этом все равно возникают биологические сигналы, вне зависимости от того, шевелятся ли губы человека или его лицевые мышцы.

Г-н Йоргенсен также пояснил, что даже когда человек мысленно составляет предложения или проговаривает мысли про себя так тихо, что его не слышно, мозгом на язык и на голосовые связки все равно поступают речевые сигналы.

На первом этапе тестирования ученым удалось "обучить" специальную компьютерную программу распознавать беззвучно произносимые шесть слов ("стоп", "идти","налево", "направо", "альфа" и "омега") и 10 цифр (от нуля до 9). Точность начального распознавания составила 92%. Эксперимент заключался в следующем: беззвучно произнося эти слова, ученые проводили несложный поиск по Интернету, при этом для управления программой Web-браузера, использовалась цифровая таблица соответствия алфавиту.

Как пояснил г-н Йоргенсен, исследователи построили из букв алфавита матрицу, подобно обычному календарю, пронумеровав ее строки и столбцы числами от 0 до 9. Таким образом, каждая буква - элемент матрицы - обозначается в ней уникальной парой координат. С помощью такой матрицы исследователи беззвучно задали поиск слова "НАСА" на одном из известных поисковых серверов. Затем электронным способом пронумеровали Web-страницы, полученные в результате поиска и снова использовали цифры для выбора Web-страниц для анализа. Таким образом, была продемонстрирована возможность осуществления поиска по интернету без помощи клавиатуры.

В настоящее время ученые проводят испытания с новыми "бесконтактными" датчиками, которые способны считывать сигналы даже через слой одежды.

Следующим этапом разработки программы должна стать демонстрация возможности управления механическим устройством при помощи простого набора команд. Группа г-на Йоргенсена планирует проведение таких тестов по управлению  модели марсохода. "Модель марсохода будет передвигаться налево или направо, следуя нашим "беззвучно" выданным командам, - пояснил г-н Йоргенсен. По мнению ученых, такие системы могут использоваться в будущем для конфиденциального общения, например во время телефонных разговоров в автобусе или метро.

По мнению ученых, расширенная система управления мышцами может оказаться полезной для получивших травму космонавтов при работе с оборудованием. Г-н Йоргенсон привел следующий пример: в результате длительного космического полета у космонавтов возникает мышечная слабость, в этих случаях для осуществления посадки на Марс или приземления, экипаж сможет просто выдавать команды на компьютер с соответствующим программным обеспечением. Также логично, что такие системы найдут различное применение для инвалидов.

Для лучшего понимания того, как происходит процесс управления голосовыми связками, мышцами и положением языка под воздействием нервных сигналов, ученые центра НАСА имени Эймса изучают комплесные паттерны нервных импульсов. Как объянил г-н Йоргенсон, ученые используют амплификаторы для усиления электрических нервных импульсов. Затем импульсы обрабатываются для удаления шума и выявления составляющих полезного сигнала для формирования различных слов.

Затем при помощи компьютерной программы эти усиленные нервные импульсы "считываются" для распознавания отдельных слов и звуков. Ключевыми компонентами системы являются датчики, обработка сигналов и распознавание образов. В этом также заключается  суть научного исследования. Ученые под руководством г-на Йоргенсона продолжают расширять "словарный запас" системы" при помощи наборов звуков английского языка для возможности их использования в полноценной компьютерной программе распознавания речи.

Исследования в области распознавания беззвучной речи финансируются в рамках Программы изучения связи, информатики и компьютерных технологий Подразделения системных исследований НАСА. Вопрос о выдаче патента на новую технологию в настоящее время рассматривается.

Оцените новость:
  • 0 оценок