Багато додатків, які працюють з неструктурованими даними потрібен доступ до текстовому змісту відформатованих або розміченими документами. Організації, які архівних документів часто потрібен доступ до текстового вмісту зробити документи для пошуку і дозволяють агрегацію контенту, звітності та видобуток архівах документів. Пошук і витяг додаток також необхідно витягти і розмітити текст з файлів різних форматів.
Один стандартний механізм для доступу і вилучення тексту з документів, який надається інтерфейсом плагіна IFilter використовується в пошукових системах Microsoft. Є кілька IFilter реалізації, розроблені Microsoft та інших виробників, які охоплюють різні формати файлів. Стандартний або витяг надійність і текст якість варіюється залежно від декількох розробників IFilter.
Opait текстові фільтри є невелика утиліта, програма з простим інтерфейсом для IFilters, які вже встановлені на комп'ютері, а також кілька спеціальних витяг тексту фільтрів, які працюють безпосередньо з форматами файлів і поліпшити реалізаціями за замовчуванням IFilter.
. Інтерфейс для вилучення тексту забезпечується бібліотеки невеликий клас під назвою Opait.Filters який включені і можуть бути використані для інтеграції текстових фільтрів у додатках .NET
Вимоги
.NET Framework 4.5
Коментар не знайдено