Starburst ETL to platforma do przetwarzania danych z Trino i Iceberg. W 2026 roku darmowa wersja Enterprise obsługuje petabajty danych. Przewodnik krok po kroku instalacji i użycia.
Krok 1: Instalacja Starburst Galaxy
1. Załóż konto free tier. 2.
Wybierz region EU. 3. Deploy cluster.
Krok 1: Instalacja Starburst Galaxy
1. Załóż konto free tier.
2. Wybierz region EU.
3. Deploy cluster.
- Free 30 dni
- Scalable do PB
- No credit card
Blend: combine practical steps with quick context.
Krok 2: Konfiguracja Connectorów
Hybrid note: mix concise bullets with short explanatory paragraphs.
Pros
1. Dodaj S3/Iceberg. 2. Ustaw catalog.
Trade-offs
3. Test query SQL.
1. Dodaj S3/Iceberg.
2. Ustaw catalog.
3. Test query SQL.
- Kafka connector
- Postgres source
- Delta Lake support
Krok 3: Budowa Pipeline ETL
Fact: 1. Extract z DB. 2. Transform
Key: Krok 3: Budowa Pipeline ETL
1. Extract z DB.
2. Transform w Trino.
3. Load do lakehouse.
- MERGE commands
- Partition pruning
- CDC pipelines
Editor note: keep language and intent consistent across this section.
Krok 4: Optymalizacja Query
Analysis panel
1. Użyj materialized views.
2. Index columns.
3. Monitor costs.
- Cost controls
- Query caching
- RBAC security
Krok 5: Integracje i Narzędzia
Pros
1. Połącz z Airflow. 2. Grafana
Trade-offs
dashboards. 3. Migrate z Hive.
1. Połącz z Airflow.
2. Grafana dashboards.
3. Migrate z Hive.
- dbt support
- Superset BI
- Terraform IaC
Krok 6: Best Practices 2026
1. Data mesh arch. 2. Zero-ETL
patterns. 3. ML feature stores.
Krok 6: Best Practices 2026
1. Data mesh arch.
2. Zero-ETL patterns.
3. ML feature stores.
- Galactic File System
- RAG workloads
- Cost 0,50$/TB
Bezpłatne Zasoby
Pros
Docs, tutorials i community.
Trade-offs
Docs, tutorials i community.
Docs, tutorials i community.
- Starburst Academy
- GitHub repos
- Slack channel