Toshiba разработала 3-язычную систему перевода с распознаванием речи, которая, тем не менее, является настолько «легкой» в плане мегабайтов, что ее можно установить даже в сотовый телефон. В отличие от других электронных переводчиков приложение от Toshiba не перекладывает задачу обработки на более мощный сервер в сети, а выполняет эту задачу самостоятельно. Поэтому сам процесс перевода происходит быстрее и будет обходиться владельцу телефона дешевле, поскольку не нужно подключаться к Интернету, а значит, и прибегать к услуге дорогого роуминга.
Мобильное приложение представляет собой сокращенную версию программы-переводчика для ПК, которую Toshiba уже продает в Японии. Программа осуществляет переводы с японского, английского и китайского языков.
Программа-переводчик использует технологию распознавания речи, для того чтобы определить, на каком языке разговаривает собеседник. Затем, собственно, начинается сам процесс перевода сказанного. Для этого могут быть задействованы два метода — статистический машинный перевод или система перевода, основанная на правилах, описывающих языковые структуры и их преобразования (rule-based machine translation). Далее движок синтеза речи выводит результат перевода.
При переводе по правилам выполняется анализ исходного текста: проводится морфологический анализ слов в предложении, затем синтаксический анализ и на заключительном этапе выполняется синтез переведенных предложений. Таким образом, система действует прямо как человек-переводчик: сначала анализирует текст, каждое слово, затем согласовывает между собой все члены предложения и синтезирует вариант перевода.
Статистический машинный перевод имеет другой принцип работы: здесь используются большие базы параллельных текстов, где попарно хранятся словосочетания (фразы из 2–3 слов) и их переводы. В процессе перевода применяется не лингвистический, а статистический анализ. Система подбирает вариант перевода, основываясь на частоте совпадений, то есть в конечном итоге будет подставлен вариант, имеющий наиболее высокий процент совпадений. При этом такая технология будет работать тем лучше, чем больше будет ее база параллельных текстов, а значит, в таком случае требуется мощный сервер, который будет вмещать эту базу. На сегодня практически единственным доступным статистическим переводчиком является бесплатный сервис онлайн-перевода компании Google.
Удивительно, но мобильный переводчик Toshiba использует оба метода машинного перевода, при этом ни о каком мощном сервере, который требуется для статистического перевода речь не идет. Статистический метод перевода применяется при переводе с английского на китайский и с китайского на английский и японский, в других случаях используется технология перевода по правилам.
Демонстрация работы мобильного переводчика происходила на смартфоне Toshiba TG01, который вообще-то отличается довольно мощным процессором — Qualcomm Snapdragon, 1 ГГц. Однако, он работает под управлением Windows Mobile, которая выделяет на исполнение каждого процесса не более 32 МБ оперативной памяти. Тем не менее, мобильный переводчик прекрасно себя проявил — даже с такими ограничениями. Правда, система распознавания речи иногда неправильно определяла отдельные слова, и нужно было повторить фразу еще раз, но в целом, мобильное приложение хорошо распознавало речь и вполне сносно осуществляло перевод.
В настоящий момент Toshiba завершает разработку этого приложения и вскоре намерена представить его коммерческую версию. Приложение, первоначально созданное для Windows Mobile, может быть адаптировано и под другие мобильные платформы, например, Android или iPhone OS, правда, пока это только планы.