Apache Паркет є "стовпчастих" формат даних для зберігання, який був спеціально створений для Apache Hadoop сімейство проектів.
Паркет рекомендується використовувати з великими даними, в основному тому, що вона використовує складну систему стиснення даних, спираючись на ряд оптимізованих алгоритмів запису роздрібнення і повторного складання.
Це дозволяє отримувати дані з розбивкою, організований в вкладеному форматі, і знову кожного разу, коли запитується.
Формат Паркет може також використовуватися поза екосистеми Hadoop, будучи спеціально розроблений, щоб бути агностиком, наскільки це можливо, працювати з будь-яким типом структури обробки даних і моделі зберігання даних.
< сильний> Що нового в цьому випуску:
- Перейменувати пакети і Maven координати org.apache
- Додати статистику кодування в ColumnMetaData li>
- Streaming ощадливість API
- Нові логічні типи
Що нового у версії 2.3.0:
- Перейменувати пакети і Maven координати org.apache
- Додати статистику кодування в ColumnMetaData li>
- Streaming ощадливість API
- Нові логічні типи
Обмеження
- Проект все ще знаходиться в стадії розробки в сховище Apache Incubator і може істотно змінюватися від версії до версії.
Коментар не знайдено