Новая версия библиотеки это действительно большой прорыв в технологии конвертирования PDF-документов.
Разработчики компании SautinSoft создали систему искусственного интеллекта, которая воссоздает Word-документ из PDF как если бы он был набран вручную человеком. Word-документы, созданные с помощью PDF Focus .Net, теперь полностью редактируются и содержат параграфы, колонки, таблицы, разрывы страниц и это еще не все, что появилось в новой версии.
21 февраля 2013 года: SautinSoft, независимая интернет-компания, занимающаяся разработкой программного обеспечения, выпустила версию 3.0 библиотеки PDF Focus .NET. PDF Focus - это вспомогательный компонент для .NET разработчиков, который облегчает создание программ, конвертирующих PDF файлы. PDF Focus .NET заслуженно входит в список лучших PDF-библиотек, а новый функционал выделяет его среди конкурентов.
Изначально PDF документы проектировались как файлы для чтения. Сама структура PDF документа не имеет таких терминов, как параграф, строка, столбец или таблица. Весь текст в PDF-документах расположен по координатам (х, у), а таблицы являются набором прямоугольных линий. Однако ввод текста в редакторе MS Word полностью связан с использованием этих понятий: строки, абзацы и таблицы. В версии 3.0 была разработана система искусственного интеллекта для того, чтобы воссоздавать Word-документ заново.
Также одна из основных функций в новой версии - возможность воссоздавать таблицы из набора пересеченных линий и текста расположенного в табличном порядке. Еще добавлена поддержка подчеркнутого и зачеркнутого текста. Кроме того, PDF Focus .NET содержит функции, которые позволяют использовать плавающий или точный алгоритм форматирования при создании документа. Плавающий алгоритм собирает текст естественным образом, аналогично тому, как живой человек печатает документ. А точный алгоритм, напротив, создает в файле PDF отдельное поле для каждого текстового блока, сохраняя исходные координаты текста при конвертации из PDF в Word.