Autore: Elena Conti
risultati
-
DuckDB 2.0: l’analisi locale diventa il default
La nuova release porta query distribuite su file remoti senza un data warehouse. Abbiamo misurato i tempi su…
-
Costruire una pipeline ELT idempotente in 120 righe
Una guida passo-passo per ingestion incrementale, gestione dei tardi e backfill, con dbt e un orchestratore minimale.
-
Feature store senza framework: solo SQL e disciplina
Non serve adottare una piattaforma per avere feature consistenti tra training e serving. Ecco il pattern minimo.
-
Orchestrare 50 DAG con Airflow senza perdere il sonno
Pattern di organizzazione, testing locale e alerting che abbiamo imparato gestendo pipeline in produzione per tre anni.
-
Polars vs Pandas nel 2026: benchmark aggiornato
Abbiamo rieseguito i test su dataset reali da 1M a 500M di righe. Polars è maturato, ma ci…
-
Data quality con Great Expectations: oltre il check nullo
Scrivere aspettative significative che catturano la distribuzione, non solo la struttura. Con esempi su dati di e-commerce reali.
-
dbt Mesh in pratica: federare i progetti senza caos
La nuova architettura multi-progetto di dbt promette autonomia ai team. Abbiamo provato a implementarla in un’organizzazione con 8…