Разработчики компании Xerox представили программное обеспечение, способное связывать текст и основные типы изображений.
Новое ПО призвано официально изменить привычные методы систематизации информации на электронных и бумажных носителях.
По мнению Марко Брессана (Marco Bressan), специалиста по компьютерным технологиям и руководителя группы исследователей Xerox Research Centre Europe (XRCE), существующие программы классифицируют или "маркируют" либо текст, либо изображение в отдельности, а затем приступают к их обработке; однако до сих пор никому не удавалось эффективно объединить оба процесса. Благодаря объединению визуального и текстового контента, новая технология существенно повышает эффективность решения основных задач по управлению документооборотом, например, извлечение информации из базы данных или автоматическая маршрутизация документов.
Марко Брессан считает, что новая технология также найдет применение в центрах обработки изображений (imaging centers) XEROX, выполняющих сканирование и оцифровку документов для создания надежных, доступных и удобных для поиска архивов электронной информации для своих клиентов. В настоящее время процесс сканирования, маркирования и индексирования документов частично контролируется оператором. Гибридный метод систематизации, используемый данной программой, позволяет оптимизировать управление документооборотом, повысить точность и полностью автоматизировать весь процесс.
Создание гибридной поисковой системы стало результатом последних достижений в области оптимизации работы оборудования, распознавания изображений, компьютерных технологий, а также благодаря появлению большого количества смешенного контента. XRCE, располагая большим опытом в области систематизации текста, продемонстрировал первый прототип систематизатора изображений (image categorizer) в 2005 году. Новая программа создана на базе более ранних разработок Компании в области систематизации отдельно текста и изображения.
По словам Марко Брессана, "гибридный систематизатор XEROX создает единое поле данных путем интеграции текста и изображений. При этом текстовая информация дополняет визуальную, а визуальная – текстовую. Таким образом, результаты работы системы в целом гораздо более высокие, чем при работе с каждым ее элементом по отдельности".