DKPro ядро програмного забезпечення з відкритим вихідним кодом, написаний на мові програмування Java і виконаний у вигляді збору заявок для обробки природної мови (НЛП).
Серед деяких функціональних можливостей, що надаються компонентами DKPro основних, ми можемо відзначити, лексемізацію, сегментація, з'єднання розщеплення, і які, лематизації, частеречного розмітка, морфологічного аналізу, синтаксичний розбір, розбір залежностей, дозвіл кореферентності, визначення мови, перевірка орфографії, та перевірки граматики.
Грунтуючись на рамках Apache UIMA, DKPro Основні Спочатку проект був розроблений всюдисущими обробки знань Лабораторії (УКП) в Технічному Universit & AUML; т Дармштадті, Німеччина.
DKPro Основні поширюється у вигляді окремих видань, DKPro Основний GPL і DKPro Основний над рівнем моря, що ліцензуються відповідно до GPLv3 і Apache Software License. Кожен випуск містить різний набір функцій
Що нового У цьому випуску :.
- Нові модулі API
- api.phonetics - види анотацій фонетичному рівні
- api.semantics - види анотацій семантичної інформації (семантичні поля і семантична роль маркування)
- Модулі New I / O
- io.conll - Читач і письменник для формату CONLL 2006
- io.tcf - Читач і письменник для формату Кларін TCF
- io.tgrep - Письменник для TGrep2 корпусних файлів
- io.tiger - Читач для формату Tiger XML
- Нові модулі аналізу
- commonscodec - фонетична транскрипція на основі бібліотеки Apache Commons Codec
- decompounding - гнучкий набір компонентів для decompounding, засновані на різній розщеплення і алгоритмів ранжирування
- зчленувань-інструменти - обгортка для ванної зчленувань-інструментів
- Морфа - обгортка для Морфа Стеммер / лемматізатор
- mstparser - обгортка для mstparser
- SFST - Новий модуль для SFST на основі морфологічних аналізаторів
- umlautnormalizer - нормалізатор для умляутом в німецьких текстах (ASL)
- Додаткові моменти в цій версії включають в себе:
- Додана підтримка для вирішення моделі з віддалених репозиторіїв під час виконання
- ДобавленаTypeCapabilities анотації оголошення, які анотації вони споживають і виробляють
- Додана автоматично генеруються XML дескриптори компонентів UIMA (через uimafit-Maven-плагін)
- Додана підтримка ClearNLP семантична роль маркування
- Додана підтримка GATE Хеппл POS Tagger
- Додана підтримка OpenNLP парсер і Пошук імен
- Оновлення до Apache uimaFIT 2.0.0
- Оновлення до Apache UIMA 2.4.2
- Оновлений ArkTweet НЛП 0.3.2
- Оновлення до ClearNLP 1.3.1
- Оновлення до CoreNLP 3.2.0
- Оновлення до воріт 7,1
- Оновлення до jweb1t 1.3.0
- Оновлення до LanguageTool 2,2
- Оновлення до Maltparser 1.7.2
- Оновлення Мате-Tools Анна 3,5
- Оновлення до OpenNLP 1.5.3
- При оновленні будь ласка, увагу, що ви не повинні змішувати різні версії DKPro основних компонентів у ваших проектах. - Вони можуть бути не сумісні один з одним
не «LI> Деякі модулі більше не підтримується і не були розглянуті у використанні для широкої публіки, наприклад, Модуль io.mmax2 і модуль io.wsdl. Вони були вилучені і не включені в цей випуск.
Вимоги
- Java 2 Standard Edition Runtime Environment
Коментар не знайдено