Дані програми:
Версія: 2.6.0
Дата завантаження: 20 Feb 15
Ліцензія: Shareware
Ціна: 1900.00 $
Популярність: 63
Проект PDFTextStream є текст у форматі PDF і метадані бібліотека видобуток доступні для Java, Python, і .NET.
Він підтримує всі версії специфікації PDF документа, (в тому числі v1.6, використовувані Acrobat 7), видобуток текст, закодований за допомогою двобайтових наборів символів (включаючи китайський, японський і корейський), розшифровки 40-бітних і 128- розрядним шифруванням документи і видобуток всіх метаданих документів, передбачених PDF документів (у тому числі даних форми, закладки та анотації).
Проста інтеграція з Джакарта Lucene входить
Що нового У цьому випуску :.
- Ця версія включає в себе безліч виправлень, досягнутий для забезпечення PDFTextStream здатний витягувати текст з PDF документів, невідповідних специфікації PDF.
- Це також включає в себе безліч поліпшень продуктивності.
Що нового у версії 2.3.0:
- Додана метод до COM .isStruckThrough (). snowtide.pdf.TextUnit, яке вказує, чи має характер закреслення, проведеної через нього.
- Покращена підтримка PDFTextStream для вбудованих відображень символів.
- Розрахунок пробілів між словами був зафіксований належним чином враховувати прогалини, які явно кодуються у вихідних документах PDF.
- Покращена обробка PDFTextStream в композитних кодувань контенту, який раніше міг не приводить у деяких діапазонах змісту PDF буття "ігнорується" під час вилучення.
- Виправлена помилка в VisualOutputTarget, де текст з одного рядка будуть розділені на кілька рядків
- покращене вертикальне вирівнювання тексту витягуються за допомогою VisualOutputTarget
- Покращена VisualOutputTarget виробництва екстрактів дозволяє усувати паразитні додаткову прогалини між близько-сусідніх слів
Що нового у версії 2.2.5:
- Цей реліз додає підтримку для вилучення XFA форм даних, як XML.
- Це значно підвищує продуктивність вилучення тексту з використанням VisualOutputTarget. Підтримка PDF документів розміром більше 2GB.
- Виправлення помилки, коли кодування з вбудованих шрифтів Type1 раніше не застосовуються належним чином в деяких обставинах.
- Виправлення помилки, коли нова зміст в оновлених документів PDF іноді ігнорується.
- Виправлення помилки, коли PDFDocEncoding кодуванні закладки і метадані були декодируется правильно.
- .getDestinationName () в com.snowtide.pdf.Bookmark.
Вимоги
- Apache Lucene
Коментар не знайдено