Что такое StarRocks?

StarRocks — СУБД нового поколения с поддержкой архитектуры Massively Parallel Processing (MPP), сверхбыстрая и масштабируемая, предназначенная для осуществления real-time аналитики на предприятиях. StarRocks позволяет обрабатывать запросы в больших масштабах с задержкой менее секунды.

Архитектура StarRocks включает богатый набор возможностей:

  • полностью векторизованный движок обработки данных,

  • выбор наиболее быстрого плана выполнения SQL-запроса по технологии Cost-based Optimizer (CBO),

  • поддержка материализованных представлений (Materialized View).

Благодаря этому StarRocks обеспечивает скорость выполнения запросов, значительно превосходящую аналогичные продукты, особенно на объединениях нескольких таблиц (multi-table joins).

StarRocks идеально подходит для real-time аналитики данных. Данные могут загружаться на высокой скорости, а также обновляться и удаляться в реальном времени. Пользователи могут создавать таблицы с различными схемами, такими как flat, star и snowflake.

Совместимая с протоколами MySQL и стандартным SQL, StarRocks «из коробки» поддерживает все основные BI-инструменты, такие как Tableau и Power BI. StarRocks не зависит от внешних компонентов. Это интегрированная аналитическая платформа с высокой масштабируемостью, высокой доступностью, простая в управлении и сопровождении.

Сценарии

StarRocks отвечает разнообразным требованиям корпоративной аналитики, включая многомерную OLAP (Online Analytical Processing) аналитику, real-time аналитику, аналитику при высокой конкуррентности, настраиваемую отчётность, ad-hoc запросы и унифицированную аналитику.

Многомерная OLAP-аналитика

Архитектура MPP и векторизованный движок выполнения позволяют выбирать различные схемы данных для построения многомерных аналитических отчётов. Примеры сценариев:

  • Аналитика пользовательского поведения

  • Профилирование пользователей, анализ меток, тегирование

  • Отчёты по высокоразмерным метрикам

  • Self-service дашборды

  • Обнаружение и анализ аномалий сервиса

  • Сквозной анализ по темам

  • Аналитика финансовых данных

  • Аналитика мониторинга системы

Real-time аналитика

StarRocks использует таблицы типа Primary Key для реализации обновлений в реальном времени. Изменения данных в Transaction Processing базе могут синхронизироваться в StarRocks за считанные секунды для построения real-time хранилища.

Сценарии:

  • Аналитика онлайн‑промо

  • Отслеживание и аналитика логистики

  • Аналитика производительности и расчёт метрик для финансового сектора

  • Аналитика качества для стриминга в реальном времени

  • Аналитика размещения рекламы

  • Удаленное администрирование серверов Linux через браузер (Cockpit management)

  • APM (Application Performance Management)

Аналитика при высокой конкуррентности

StarRocks использует эффективное распределение данных, гибкие индексы и интеллектуальные материализованные представления (Materialized View) для пользовательской аналитики при высокой конкуррентности:

  • Аналитика отчётов для рекламодателей

  • Канальная аналитика для ритейла

  • Пользовательская аналитика для SaaS

  • Аналитика для многовкладочных дашбордов

Унифицированная аналитика

StarRocks предоставляет унифицированный опыт аналитики данных.

  • Одна система покрывает различные аналитические сценарии, снижая сложность системы и совокупную стоимость владения (TCO).

  • StarRocks объединяет подходы Data Lakes и Data Warehouses. Данные в Lakehouse могут полностью управляться в StarRocks, также как и чувствительные к задержкам запросы с высокой конкурентностью могут выполняться в StarRocks. Данные в Data Lakes доступны через подключение внешних каталогов (external catalogs) или внешних таблиц (external tables), доступное в StarRocks.