DataFu був розроблений в LinkedIn і повністю написана на Java.
DataFu включає в себе функції / бібліотеки для роботи з:
- Статистика
- Оцінка
- відбір проб
- Сесії
- Link Analysis
- Встановити операції
- Сумки
DataFu ідеально підходить для інтелектуального аналізу даних і статистичних додатків, що працюють поверх баз даних Hadoop або свині.
Ці функції дозволяють розробникам в повній мірі скористатися всіма даними, що зберігаються всередині Hadoop або Свині бази даних без необхідності мати справу з величезними вимогами до системи для того, щоб зробити це.
Що нового в цьому випуску :.
- Пара UDF, для простої випадкової вибірки з заміною
- Додаткові залежності в даний час упаковані в DataFu необхідних залежностей так менше JAR.
<Літій> SetDifference ОДС для обчислення різницю множин (наприклад А-В або А-В-С).
Що нового у версії 1.2.0:
- Пара UDF, для простої випадкової вибірки з заміною.
- Додаткові залежності в даний час упаковані в DataFu необхідних залежностей так менше JAR.
<Літій> SetDifference ОДС для обчислення різницю множин (наприклад А-В або А-В-С).
Що нового у версії 1.1.0 :.
- Додана ША хеш UDF
- InUDF і AssertUDF додані для свиней 0,12 сумісності. Вони такі ж, як в і Assert.
- SimpleRandomSample, який реалізує масштабируемую простий алгоритм випадкової вибірки.
Коментар не знайдено