jPDFText - бібліотека Java для вилучення тексту з PDF-документів. З jPDFText документи PDF можуть бути оброблені для вилучення текстового вмісту для архівації, зберігання, пошуку або індексації. jPDFText побудовано на вершині технології PDF, розробленої компанією Qoppas, тому вам не потрібно встановлювати сторонні програми або драйвери. Оскільки це написано на Java, це дозволяє вашій програмі залишатися незалежною від платформи та працювати на Windows, Linux, Unix (Solaris, HP UX, IBM AIX), Mac OS X та будь-якій іншій платформі, яка підтримує середовище виконання Java.
Основні риси:
Завантажте документи PDF з файлів, мережевих дисків, URL-адрес або вхідних потоків.
Витяг тексту в логічному порядку читання.
Витяг слова як вектор рядків.
Працює на Windows, Linux, Unix і Mac OS X (100% Java).
Не потрібно встановлювати та настроювати додаткові драйвери або програмне забезпечення під час розгортання.
Перевірено JDK 1.4.2 та вище.
Коментар не знайдено