DataCleaner

Скріншот програми:
DataCleaner
Дані програми:
Версія: 4.0.9 оновлений
Дата завантаження: 27 Sep 15
Розробник: -
Ліцензія: Безкоштовно
Популярність: 33

Rating: 4.5/5 (Total Votes: 2)

DataCleaner є відкритим вихідним кодом і абсолютно безкоштовно рішення для організацій і підприємств, які бажають підвищити і виміряти якість даних.
З DataCleaner, користувачі зможуть в профіль, порівняння, валідації даних від бізнес-правил, а також контролювати прогресування цих вимірів з плином часу.
Серед його особливостей можна згадати моніторинг даних, профілювання та аналіз даних DQ, очищення і збагачення даних, виявлення і об'єднати дублікати, якість даних клієнтів, а також супер-швидкий ETLightweight (екстракт-Transform-Load).
Щоб дізнатися більше про функції і можливості DataCleaner років, а також про те, як з нею працювати, будь ласка, зверніться до http://eobjects.dk/docs

What новий У цьому випуску

  • Покращення і нові можливості:
  • Ми зробили це можливим створювати і видаляти таблиці за допомогою настільного користувальницького інтерфейсу в DataCleaner. Зверніть увагу, що термін і Quot; таблиці і Quot; тут насправді охоплює більше, ніж просто реляційних таблиць баз даних. Це також включає в себе листи в сховищах даних MS Excel, колекції в MongoDB, типи документів в CouchDB і ElasticSearch і так далі ... В принципі всі види сховища даних, що підтримують запис-операції, крім однієї таблиці сховищ даних, таких як CSV сховищ даних, підтримує цю функцію! Функціональність піддається через:
  • & Quot; Створити таблицю & Quot; включений в меню правою кнопкою миші схем в дереві на лівій стороні додатку.
  • & Quot; Створити таблицю & Quot; включено також за допомогою таблиці вибору входів у такі компоненти, як вставити в таблицю, таблиця пошуку та оновлення таблиці.
  • & Quot; Drop Table & Quot; включений в меню правою кнопкою миші таблиць в дереві на лівій стороні додатку.
  • Ми додали (опціонально) можливість задавати свій веб-сервіс Salesforce.com Кінцева точка URL. Це дозволяє використовувати DataCleaner для підключення до пісочниці середовищах Salesforce.com, а також для власних користувальницьких кінцевих точок.
  • Підтримка ElasticSearch була покращена, дозволяючи користувальницькі відображення, а також повторне використання визначення сховища даних ElasticSearch тепер також для пошуку та індексування.
  • Вибірка записів і підбору потенційних дублікатів в дублюванням функції виявлення була покращена, що призводить до більш швидкого конфігурації, тому що рішення, прийняті в ході тренування є більш представницьким.
  • Формат файл моделі дублікатів була оновлена, який зняв необхідність в окремому файлі '' довідкової щоб врятувати минулі рішення навчання. Сумісність з старому форматі була збережена, але з використанням нового формату додає багато переваг для користувачів.
  • Виправлення:
  • проблема нитка голодування було зафіксовано в DataCleaner монітора. Вплив цього питання було здорово, але це сталося тільки в рідкісних і дуже індивідуальних випадках. Якщо замовлення слухач об'єктів на моніторі DataCleaner б кинути помилку, це призведе до ресурсу ніколи не звільнившись і займаючи нитка з басейну Кварц-планування на сервері. Якщо це трапиться багато разів сервер може в кінцевому підсумку закінчилися потоків в цьому пулі.
  • Вертикальне меню на екрані результатів тепер робити належну роботу відображення позначки компонентів, які мають результати. Це робить його легше розпізнати, який елемент меню вказує на який результат пункту.

Що нового у версії 3.5.7:

  • The 'Синонім пошуку "трансформація в даний час варіант дивитися кожну фішку на вході. Це корисно, якщо ви робите заміну синонімів у межах значень довгого текстового поля.
  • Блокування виконання робіт DataCleaner допомогою веб-служби монітора для цього іноді може завершитися з помилкою, викликаної блокуючого потоку. Ця проблема була виправлена.
  • Поліпшення було зроблено в способі роботи і послідовність компонентів закриті / очищені після виконання.
  • The JNLP / Java WebStart версія DataCleaner піддавався помилкою в Java Runtime викликає певні файли JAR же не бути визнані WebStart пусковий, при певних обставинах. Ця проблема була вирішена шляхом невеликих змін у цих JAR-файлів.
  • Кілька мертві посилання в документації не зафіксовано.

Що нового у версії 3.5.4:

  • Це стало можливим, щоб приховати вихідні стовпці перетворень , Приховування не вплине на потік обробки на всіх, а просто приховати їх від користувальницького інтерфейсу, і, таким чином потенційно робить досвід більш чистий, при взаємодії з іншими компонентами.
  • Новий веб-сервіс був доданий в моніторинг веб-додатки, який забезпечує шлях до опитувати стан виконання певної роботи.
  • Виправлена ​​помилка, в результаті чого звіт HTML збій для деяких типів аналізу, якщо записи не були оброблені.
  • І 6 інші незначні помилка була адресована.

Що нового у версії 3.5.1:

  • Захват змінені записи:
  • Новий фільтр був доданий для того, щоб додаткової обробки записів, що не були оброблені перед, наприклад, тільки для профілювання або копіювання змінений запису. Ім'я нові фільтри є захоплення змінені записи, посилаючись на концепції відстеження змінених даних.
  • У черзі виконання робіт:
  • The DataCleaner монітор тепер черга виконання тієї ж роботи, якщо спрацьовує кілька разів. Це гарантує, що ви часом не запустити ту ж роботу одночасно, які можуть призвести до різного роду питань, в залежності від того, що робота робить.
  • Невеликі виправлення:
  • Кілька виправлень був реалізований.

Що нового у версії 3.5:

  • Кілька чарівників тепер доступні для реєстрації сховища даних; у тому числі файл-завантаження на сервері для CSV файлів, запис підключення до бази даних, керованої реєстрації Salesforce.com повноважень і більше.
  • Будівельні роботи майстра були розширені з декількома розширеними функціями; Вибір розподілу значень і малюнок знаходження поля в майстрові швидкого аналізу, абсолютно новий майстер створення EasyDQ основі чистки клієнтів робочих місць і новий майстер завдання для стрільби Pentaho інтеграції даних робочих місць (читайте про це нижче).
  • Тепер Ви можете одноранговой запит будь сховище даних безпосередньо у веб-інтерфейсі користувача. Це робить його легко отримати швидкі або спорадичні розуміння даних без створення робочих місць або інших керованих підходи обробки даних.
  • Після роботи або сховищами даних створюються, користувач керується вжити заходів з нещодавно збудованого об'єкта. Наприклад, ви можете дуже швидко запустити роботу відразу після він побудований, або зробити запит сховища даних після реєстрації.
  • Адміністратори тепер можуть безпосередньо завантажувати робочі місця в сховищі, яке особливо зручно, якщо ви хочете, щоб вручну редагувати вміст XML файлів роботи.
  • Багато технічного мотлоху тепер заховані на користь показуючи прості діалоги. Наприклад, коли робота спрацьовує великий показник завантаження показується, а коли закінчив Результат буде показаний. Передова екран реєстрації, який був раніше там ще може бути відображений на натисканні на посилання для отримання додаткової інформації.

Що нового у версії 3.1.2:

  • Ми додали веб-сервіс в моніторингу Додаток для отримання (список) метричних значень. Це робить моніторинг ще зручнішим в якості ключового компонента інфраструктури, як спосіб контролю даних (якість) і виставити результати в сторонніх додатків.
  • Компонент "Таблиця пошуку" була покращена шляхом додавання приєднатися семантику як конфігурується власності. Використання приєднатися семантику можна налаштувати, якщо ви хочете, пошук працювати семантично як LEFT JOIN або INNER JOIN.
  • Компоненти EasyDQ були модернізовані, додаючи додаткові параметри конфігурації і багатше результату інтерфейс дедуплікаціі.
  • Покращена продуктивність були Особливу увагу цього випуску. Поліпшення були зроблені в двигуні DataCleaner для подальшого використовувати підхід обробки потокового в деяких випадках кутових, які не покриті раніше був.

Що нового у версії 3.1.1:

    були розширені
  • Дата і час, пов'язані з опції аналізу , додавши, аналізатори розподілу для номера тижнів, місяців і років. Всі аналізатори, пов'язані з датою і часом тепер згруповані в підміню під назвою & Quot; Дата і час & Quot; під & Quot; Аналіз і Quot ;.
  • Додатковий & Quot; описова статистика і Quot; Опція була додана до аналізатора номер і аналізатора дати / часу. Ця опція додає додаткові показники з результатами цих аналізаторів, таких як медіана, асиметрія, ексцес процентилю і. Ці показники не є обов'язковими, так як їх обсяг пам'яті дещо більше, ніж існуючі метрики.
  • Лінії на часовій шкалі графіків веб-додатки моніторингу тепер маленькі точки в них. Це особливо корисно для діаграм з декількома (або навіть тільки один) спостережень у них -., Щоб вказати, де саме точки спостереження є
  • Парсер запитів при виклику запити однорангових також істотно поліпшена. Тепер запити можуть містити положення, DISTINCT * -wildcards, підзапити і відмовостійкої до питань Текст випадку.
  • Два нових трансформаторів, які були додані для генерації UUID, і для генерації тимчасових міток.

Що нового у версії 3.1:

  • Метрична формули - розроблені якості даних КПЕ:
  • Тепер можна побудувати набагато більш докладно Data Quality КПЕ в моніторингу веб-додатки DataCleaner в. Користувальницький інтерфейс дозволяє створювати складні формули в табличному вигляді формули стилю; за допомогою змінних, зібрані DataCleaner робочих місць.
  • Метрична формули можна об'єднати будь-яку кількість метрик, констант і операцій, так довго, як це може бути виражено в математичному рівнянні.
  • Наприклад - вимірюють швидкість повторюваних записів у відсотках від загальної кількості записів. Або виміряти кількість кодів продуктів, які відповідають набору декількох шаблонів рядків.
  • Спеціальна Запити - будь сховище
  • З DataCleaner 3.1 тепер ви можете виконувати незаплановані запити будь-якого сховища! Запити можуть бути виражені у вигляді звичайного SQL і буде застосовуватися до баз даних, а також файлів, баз даних NoSQL і більше, забезпечуючи по-справжньому корисну механізм запитів, щоб розширити ваш досвід у відкриття і дані профілювання.
  • Можливість запиту також доступні через веб-сервіс для моніторингу користувачів з роллю адміністратора. Запит надається як параметр HTTP POST або тіла, і результат надається як таблиці XHTML.
  • Значення збігів - варіант Новий аналіз:
  • Часто у вас є тверде уявлення, на якому значення повинно бути дозволено й очікувану для конкретної області. У DataCleaner там завжди був варіант аналіз Значення поширення, які допоможуть вам відстоювати свої припущення. У DataCleaner 3.1, хоча, у вас є більш точна пропозиція - значення Шукач. Ця опція аналіз дозволяє визначити набір очікуваних значень, а потім виконати розподіл значення, як аналіз, зокрема, для перевірки і виявлення несподівані значення.
  • Копіювання, видалення і управління робочих місць:
  • Управління робочих місць і результатів у застосуванні DataCleaner монітора була значно поліпшена. Тепер ви можете натиснути на роботу на сторінці Планування монітора, і знайти варіанти управління, доступні для таких операцій, як перейменування, копіювання, видалення і багато іншого. Кожна операція поважає зв'язків з іншими артефактами в моніторі, наприклад, результатів аналізу, графіків і багато іншого. Це означає, що управління моніторингу сховища стало набагато простіше і зрілим.
  • Управління історією якості даних:
  • Іноді ви зіткнулися з ситуаціями, коли ви насправді хочете, щоб зробити моніторинг з історичними даними! Це може бути, що у вас є історичні звалища або резервні копії баз даних, які ви хочете, щоб показати і розповісти історію. Тепер Ви можете зробити аналіз цього історичного даних, завантажити його на моніторі DataCleaner, і за допомогою нового веб-сервісу, встановити історичні дані конкретного результату аналізу. Це означає, що ваші терміни буде правильно побудувати результати за допомогою передбачуваної дати їх, але з результатами, які ви, можливо, зібраних на більш пізній момент часу.
  • підтримка кластерної планувальник (тільки ЕО):
  • Планувальник DataCleaner моніторі була зовні, так що він може бути замінений на кошти простої конфігурації. У Enterprise Edition (EE) в DataCleaner, ми надаємо кластерний планувальник, забезпечуючи можливість завантаження балансу і поширювати свої страт на кластері машин.
  • Single-входу в систему (SSO) за допомогою CAS (EE тільки):
  • У Enterprise Edition (EE) з DataCleaner ми в даний час забезпечують можливість одного SIGNON для застосування монітора. Тепер DataCleaner може бути невід'ємною частиною ІТ-інфраструктури, також з точки зору безпеки.
  • ... І багато іншого:
  • Вище тільки резюме. Більше тридцяти питання були вирішені в цьому випуску. Ми вирішили декілька запитів, що надходять від форумів і спільноти, і ми закликаємо всіх використовувати цю середу в якості засобу для зміни. Ми дуже раді, щоб зробити розвиток DataCleaner бути в значній мірі під впливом потоків в суспільстві.

Що нового у версії 3.0.3:

  • Додає сервіс для перейменування робочих місць в сховище моніторингу .
  • Ви можете отримати доступ до цього як RESTful веб-служби або в інтерактивному режимі в інтерфейсі.
  • Веб-служба була додана для зміни історичну дату результату аналізу в сховище моніторингу.
  • Веб-додаток було зроблено сумісним зі спадщиною JSF контейнери.
  • Кешування конфігурації у веб-додатки значно покращився, що призводить до швидкого завантаження сторінок і ініціалізації робота.

Що нового у версії 3.0.2:

  • При спрацьовуванні роботу в веб-додатки моніторингу, панель автоматично оновлюється кожну секунду, щоб отримати останню стан виконання.
  • на основі файлів сховища даних (наприклад, CSV або Excel таблиці) з абсолютними шляхами тепер правильно вирішена в моніторинг веб-додатки.
  • The & Quot; Виберіть з ключ / значення карті і Quot; Трансформатор тепер підтримує вкладені виберіть вирази, як і Quot; Address.Street & Quot; або & Quot; OrderLines [0] .product.name & Quot ;.
  • Механізм таблиця пошуку були оптимізовані для роботи з використанням підготовлених операторів при роботі з базами даних JDBC.
  • Адміністратори тепер можуть завантажити файл на основі сховища даних безпосередньо з & Quot; сховищ даних і Quot; сторінка.
  • Обробка виключень в моніторинг веб-додатки була покращена небагато, що робить повідомлення про помилки точніше і інтуїтивно зрозумілим.

Скріншоти

datacleaner-70932_1_70932.png
datacleaner-70932_2_70932.png
datacleaner-70932_3_70932.png

Схожі програми

Helmholtz
Helmholtz

15 Apr 15

SQLSoup
SQLSoup

15 Apr 15

SwingSet
SwingSet

20 Feb 15

mysqlWisp
mysqlWisp

3 Jun 15

Інші програми розробника -

bibtex2html
bibtex2html

20 Feb 15

Stellarium
Stellarium

10 May 15

Qps
Qps

2 Jun 15

Keypress
Keypress

3 Jun 15

DataCleaner

Коментар не знайдено
додати коментар
Включіть картинки!