Dagster или Airflow: что выбрать для оркестрации в DWH-проектах?

В статье рассказываем, какие задачи решают оркестраторы в проектах внедрения корпоративных хранилищ данных. Выясняем, в чём разница между инструментами, и почему Dagster становится всё популярнее в DWH-проектах, чем Airflow.

Нравится

Send

Мнение автора может не совпадать с мнением редакции

Перед аналитикой данные из корпоративных систем необходимо превратить в информацию, пригодную для бизнес-анализа:

Извлечь из разрозненных источников
Трансформировать — фильтровать, группировать, структурировать, агрегировать в датасет
Загрузить в целевую систему — DWH, BI, Data Lake, СУБД, облако и т.д.

Вместе эти три процесса называются ETL (Extract, Transform, Load).