Дані програми:
Версія: 4.0
Дата завантаження: 3 Jun 15
Ліцензія: Безкоштовно
Популярність: 31
Шерлок Холмс універсальний пошуковик, система для збору та індексування текстових даних (текстові файли, веб-сторінки, і т.д.), як локально, так і по мережі.
<Особливості / сильний> :.
- Збирає файли за допомогою HTTP-небудь з локальних файлів
- Аналізує текстові файли, HTML, PDF, а також кілька інших форматів, використовуючи зовнішні парсери (наприклад, MS Word і PostScript).
- вся система є модульною, тому додаючи свої власні джерела даних або аналізатори просто питання підключення в правий модуль (добре, як правило, також писати це).
- Добре працює в змішаному середовищі кодування.
- Вважає кілька входжень одного і того ж файлу (навіть з незначними змінами) в одному документі з декількома URL.
- Все настроюється. Ви можете написати правила фільтрації на спеціальній мові, який дозволяє настроїти змінні конфігурації залежно від оброблюваного документа.
- Пошук слів, фраз і логічних виразах. Пошук в іменах файлів і посилань текстів.
- Пошук близькість і близькість ваговій регулярних пошуків.
- Визнання мовах, легко інтегрувати парадигматичним і синонімічних словників.
- Перевірка орфографії на основі частот слів, які спостерігаються в індексованих даних, натякаючи користувачеві, що його запит може бути орфографічною помилкою.
- Результати пошуку включають контекст кожного документа.
- Ваги і десятки мільйонів документів на звичайній апаратної ПК.
- Інтерфейс (передній кінець) повністю відокремлена від іншої частини системи, що робить його легко змінити, а також вставляти пошуковик в існуючих додатках.
- Завантажені файли та індекси стискаються для економії місця.
Коментар не знайдено