PDFTextStream

Скріншот програми:
PDFTextStream
Дані програми:
Версія: 2.6.0
Дата завантаження: 20 Feb 15
Ліцензія: Shareware
Ціна: 1900.00 $
Популярність: 63

Rating: 3.5/5 (Total Votes: 2)

Проект PDFTextStream є текст у форматі PDF і метадані бібліотека видобуток доступні для Java, Python, і .NET.
Він підтримує всі версії специфікації PDF документа, (в тому числі v1.6, використовувані Acrobat 7), видобуток текст, закодований за допомогою двобайтових наборів символів (включаючи китайський, японський і корейський), розшифровки 40-бітних і 128- розрядним шифруванням документи і видобуток всіх метаданих документів, передбачених PDF документів (у тому числі даних форми, закладки та анотації).
Проста інтеграція з Джакарта Lucene входить

Що нового У цьому випуску :.

  • Ця версія включає в себе безліч виправлень, досягнутий для забезпечення PDFTextStream здатний витягувати текст з PDF документів, невідповідних специфікації PDF.
  • Це також включає в себе безліч поліпшень продуктивності.

Що нового у версії 2.3.0:

  • Додана метод до COM .isStruckThrough (). snowtide.pdf.TextUnit, яке вказує, чи має характер закреслення, проведеної через нього.
  • Покращена підтримка PDFTextStream для вбудованих відображень символів.
  • Розрахунок пробілів між словами був зафіксований належним чином враховувати прогалини, які явно кодуються у вихідних документах PDF.
  • Покращена обробка PDFTextStream в композитних кодувань контенту, який раніше міг не приводить у деяких діапазонах змісту PDF буття "ігнорується" під час вилучення.
  • Виправлена ​​помилка в VisualOutputTarget, де текст з одного рядка будуть розділені на кілька рядків
  • покращене вертикальне вирівнювання тексту витягуються за допомогою VisualOutputTarget
  • Покращена VisualOutputTarget виробництва екстрактів дозволяє усувати паразитні додаткову прогалини між близько-сусідніх слів

Що нового у версії 2.2.5:

  • Цей реліз додає підтримку для вилучення XFA форм даних, як XML.
  • Це значно підвищує продуктивність вилучення тексту з використанням VisualOutputTarget. Підтримка PDF документів розміром більше 2GB.
  • Виправлення помилки, коли кодування з вбудованих шрифтів Type1 раніше не застосовуються належним чином в деяких обставинах.
  • Виправлення помилки, коли нова зміст в оновлених документів PDF іноді ігнорується.
  • Виправлення помилки, коли PDFDocEncoding кодуванні закладки і метадані були декодируется правильно.
  • .getDestinationName () в com.snowtide.pdf.Bookmark.

Вимоги

  • Apache Lucene

PDFTextStream

Коментар не знайдено
додати коментар
Включіть картинки!