Потоковые данные агрегируются и фильтруются, объединяются в сводные данные в реальном времени с помощью непрерывных SQL-запросов. Результаты сохраняются в Tantor PipelineDB.
Для аналитики потоковых данных часто требуется контекст. Интегрированный реляционный механизм хранения Tantor PipelineDB позволяет соединять потоковые данные с историческими для сопоставления в режиме реального времени.
Объединение потоков c таблицами
Можно запускать непрерывные запросы с заданными временными интервалами: секунда, минута, день, 30 дней и т. д. Такие запросы сохраняются в Tantor PipelineDB, а «сырые» данные вне заданных интервалов могут опускаться.
Запросы с заданными интервалами
В real-time аналитике допустимы компромиссы с точностью ради скорости. Tantor PipelineDB поддерживает структуры и алгоритмы для приближенных вычислений на потоках: фильтры Блума, count-min sketch, Filtered-Space-Saving top-k, HyperLogLog, and t-digest.
Вероятностные структуры данных