Компания «СофтИнформ», ведущий российский разработчик поисковых решений, представила SoftInform Search Server 4.6 - новую версию корпоративной системы полнотекстового поиска и поиска похожих по содержанию документов в больших объемах данных.
Новая версия несет в себе множество новых возможностей и усовершенствований, включая OCR (возможность распознавания текста на изображениях); поддержку операционных систем Windows 7 и Windows Server 2008 как для 32-битных, так и для 64-битных платформ; а также увеличившийся список форматов файлов, доступных для индексации.
Наиболее значительным усовершенствованием в SoftInform Search Server 4.6 является поддержка распознавания текста, содержащегося в графических файлах. Благодаря этому пользователи смогут эффективно искать нужную им информацию не только среди документов, изначально находившихся в электронном формате, но и среди отсканированных печатных документов. Благодаря высокому качеству распознавания текста пользователи могут быть уверены в том, что данные, находящиеся в виде отсканированных документов, будут представлены в результатах поиска в том же виде, что и на бумаге.
Поддержка современных программных платформ Windows 7 и Windows Server 2008, реализованная в SoftInform Search Server 4.6, даст корпоративным заказчикам возможность продолжать использовать уникальные поисковые возможности решения «СофтИнформ» при переходе на новейшие операционные системы.
Новая версия SoftInform Search Server также предлагает пользователям более широкий список поддерживаемых источников данных, включая индексацию базы IBM Lotus Mail и расширенный список поддерживаемых форматов файлов. Так, теперь SoftInform Search Server может индексировать документы, находящиеся внутри архивов продолжающего набирать популярность у пользователей формата 7z; реализована поддержка индексации почтовых вложений, закодированных с помощью алгоритма UUE, а также вложений форматов TNEF и MIME-типа text/enriched.
При этом SoftInform Search Server по-прежнему предлагает своим пользователям мощные средства полнотекстового поиска документов с учетом морфологии и синонимов, а также дает возможность искать похожие по смыслу документы с использованием уникального запатентованного алгоритма «поиска похожих». При этом решение обеспечивает высокую скорость индексации данных (от 15 до 30 Гб в час) и обеспечивает компактный размер индекса, составляющий 15 25% от размера проиндексированной текстовой информации.