WordTabulator призначений для аналізу тексту. За допомогою wordTabulator ви можете створити індекс елементів слів, витягнутих з певного тексту набір. Елементи слово може бути слова, N-грам (з певним розміром) або фрази (syntagmes). Програма може обробляти тексти, як і в звичайних 2-байт, що кодують (ANSI), як і в багатобайтові кодування UTF-8. Вихідні тексти визначаються як набір плоских текстових файлів або HTML / XML документів / SGML. В останньому випадку програма може фільтрувати контент з розмітки. Крім того, ви можете обробляти тільки певний контент в окремих парних тегів. Або ви можете пропустити цей зміст з обробки. Вона включає в себе морфологічний модуль для російських, трьох різних форматах індексу виробництва, трьох різних типів елементів слів (слів, N-грам і фраз), браузер контексту, і істинної алфавітного порядку.
Дані програми:
Версія: 3.5
Дата завантаження: 15 Apr 15
Ліцензія: Безкоштовно
Популярність: 370
Розмір: 2708 Kb
Коментар не знайдено