Habr<p>ELT процесс в архитектуре Data lakehouse на базе open-source (kafka, dagster, s3+iceberg, trino, clickhouse и DBT)</p><p>К нам обратился один из крупнейших строительных холдингов России (ГК компаний из 10+ юридических лиц) с потребностью в сборе всех данных с филиалом, анализе и визуализации на дашбордах. При входе на проект аналитической инфраструктуры у компании почти не было, только множество учетных систем без централизованного хранилища данных. Объем проекта был непонятен, «аппетит приходит во время еды». Важная особенность проекта — полностью закрытый контур с доступом через терминальные решения. Было решение выбрать архитектуру Data Lakehouse на open source стеке, основой которого стали — kafka, dagster, s3+iceberg, trino, clickhouse и DBT. В результате получилось более 1000 моделей DBT, 1 тб сжатых данных, и объем продолжает расти. Из потребителей данных — бизнес системы, Power BI отчеты, аналитики и дата‑инженеры, веб‑приложения, MDX‑кубы. Методология ведения проекта Scrum, команда DWH‑инженеров 11 человек и greenfield‑разработка.</p><p><a href="https://habr.com/ru/articles/931282/" rel="nofollow noopener" translate="no" target="_blank"><span class="invisible">https://</span><span class="">habr.com/ru/articles/931282/</span><span class="invisible"></span></a></p><p><a href="https://zhub.link/tags/dbt" class="mention hashtag" rel="nofollow noopener" target="_blank">#<span>dbt</span></a> <a href="https://zhub.link/tags/yml%D1%84%D0%B0%D0%B9%D0%BB" class="mention hashtag" rel="nofollow noopener" target="_blank">#<span>ymlфайл</span></a> <a href="https://zhub.link/tags/datalakehouse" class="mention hashtag" rel="nofollow noopener" target="_blank">#<span>datalakehouse</span></a> <a href="https://zhub.link/tags/data_engineering" class="mention hashtag" rel="nofollow noopener" target="_blank">#<span>data_engineering</span></a> <a href="https://zhub.link/tags/etl%D0%BF%D1%80%D0%BE%D1%86%D0%B5%D1%81%D1%81%D1%8B" class="mention hashtag" rel="nofollow noopener" target="_blank">#<span>etlпроцессы</span></a> <a href="https://zhub.link/tags/open_source" class="mention hashtag" rel="nofollow noopener" target="_blank">#<span>open_source</span></a> <a href="https://zhub.link/tags/trino" class="mention hashtag" rel="nofollow noopener" target="_blank">#<span>trino</span></a> <a href="https://zhub.link/tags/clickhouse" class="mention hashtag" rel="nofollow noopener" target="_blank">#<span>clickhouse</span></a> <a href="https://zhub.link/tags/dagster" class="mention hashtag" rel="nofollow noopener" target="_blank">#<span>dagster</span></a></p>