DSTK - Toolkit 3 Data Science являє собою набір програм для видобування даних та тексту, керуючись моделлю CRISP DM. DSTK пропонує розуміння даних за допомогою статистичного та текстового аналізу, підготовки даних з використанням нормалізації та обробки текстів, моделювання та оцінки для машинного навчання та алгоритмів статистичного навчання.
DSTK 3 пропонує такі привабливі функції, як глибока нейронна мережа (глибоке навчання), аналіз текстових посилань з візуалізаціями, кластери KMeans. Деякі з цих функцій можуть бути представлені в старій версії, але оскільки алгоритми перезаписуються, щоб зменшити використання зовнішніх бібліотек, таких як Weka, для зменшення розміру файлу, нам потрібно більше часу для їх розробки. Двигун DSTK все ще знаходиться на стадії бета-тестування, отже, можуть бути деякі помилки та неточність.
DSTK 3 складається з DSTK Engine, DSTK ScriptWriter, DSTK Studio та DSTK Text Explorer. DSTK Engine спрощений, зосереджуючись на Data Mining. DSTK ScriptWriter пропонує користувальницький інтерфейс для написання скрипта для DSTK Engine. DSTK Studio пропонує статистику SPSS, як графічний інтерфейс для видобування даних, а DSTK Text Explorer пропонує графічний інтерфейс для текстового вишукування.
Вимоги :
Java Runtime Environment, Microsoft. Net Framework
Обмеження :
10-експериментальна версія
Коментар не знайдено