Что такое StarRocks?¶
StarRocks — СУБД нового поколения с поддержкой архитектуры Massively Parallel Processing (MPP), сверхбыстрая и масштабируемая, предназначенная для осуществления real-time аналитики на предприятиях. StarRocks позволяет обрабатывать запросы в больших масштабах с задержкой менее секунды.
Архитектура StarRocks включает богатый набор возможностей:
полностью векторизованный движок обработки данных,
выбор наиболее быстрого плана выполнения SQL-запроса по технологии
Cost-based Optimizer(CBO),поддержка материализованных представлений (
Materialized View).
Благодаря этому StarRocks обеспечивает скорость выполнения запросов, значительно превосходящую аналогичные продукты, особенно на объединениях нескольких таблиц (multi-table joins).
StarRocks идеально подходит для real-time аналитики данных. Данные могут загружаться на высокой скорости, а также обновляться и удаляться в реальном времени. Пользователи могут создавать таблицы с различными схемами, такими как flat, star и snowflake.
Совместимая с протоколами MySQL и стандартным SQL, StarRocks «из коробки» поддерживает все основные BI-инструменты, такие как Tableau и Power BI. StarRocks не зависит от внешних компонентов. Это интегрированная аналитическая платформа с высокой масштабируемостью, высокой доступностью, простая в управлении и сопровождении.
Сценарии¶
StarRocks отвечает разнообразным требованиям корпоративной аналитики, включая многомерную OLAP (Online Analytical Processing) аналитику, real-time аналитику, аналитику при высокой конкуррентности, настраиваемую отчётность, ad-hoc запросы и унифицированную аналитику.
Многомерная OLAP-аналитика¶
Архитектура MPP и векторизованный движок выполнения позволяют выбирать различные схемы данных для построения многомерных аналитических отчётов. Примеры сценариев:
Аналитика пользовательского поведения
Профилирование пользователей, анализ меток, тегирование
Отчёты по высокоразмерным метрикам
Self-service дашборды
Обнаружение и анализ аномалий сервиса
Сквозной анализ по темам
Аналитика финансовых данных
Аналитика мониторинга системы
Real-time аналитика¶
StarRocks использует таблицы типа Primary Key для реализации обновлений в реальном времени. Изменения данных в Transaction Processing базе могут синхронизироваться в StarRocks за считанные секунды для построения real-time хранилища.
Сценарии:
Аналитика онлайн‑промо
Отслеживание и аналитика логистики
Аналитика производительности и расчёт метрик для финансового сектора
Аналитика качества для стриминга в реальном времени
Аналитика размещения рекламы
Удаленное администрирование серверов Linux через браузер (
Cockpit management)APM (Application Performance Management)
Аналитика при высокой конкуррентности¶
StarRocks использует эффективное распределение данных, гибкие индексы и интеллектуальные материализованные представления (Materialized View) для пользовательской аналитики при высокой конкуррентности:
Аналитика отчётов для рекламодателей
Канальная аналитика для ритейла
Пользовательская аналитика для SaaS
Аналитика для многовкладочных дашбордов
Унифицированная аналитика¶
StarRocks предоставляет унифицированный опыт аналитики данных.
Одна система покрывает различные аналитические сценарии, снижая сложность системы и совокупную стоимость владения (TCO).
StarRocks объединяет подходы Data Lakes и Data Warehouses. Данные в Lakehouse могут полностью управляться в StarRocks, также как и чувствительные к задержкам запросы с высокой конкурентностью могут выполняться в StarRocks. Данные в Data Lakes доступны через подключение внешних каталогов (
external catalogs) или внешних таблиц (external tables), доступное в StarRocks.