// data & ai · giornale tecnico MILANO ● LIVE 00:00:00
,

Liquid clustering anche sulle tabelle esistenti: la conversione è ora GA su Databricks

Da Databricks Runtime 18.1 si converte una tabella Delta partizionata in liquid clustering con un ALTER TABLE, senza ricrearla da zero. Ora è generally available.

Il liquid clustering ha semplificato la gestione del layout dei dati su Delta Lake, ma c’era un limite fastidioso: per applicarlo bisognava ripartire da una tabella nuova. Da oggi non più. La conversione di una tabella partizionata in liquid clustering è generally available.

Cosa cambia

A partire da Databricks Runtime 18.1 puoi convertire una Delta Lake table partizionata con un comando: ALTER TABLE ... REPLACE PARTITIONED BY WITH CLUSTER BY. Niente ricreazione da zero, niente downtime prolungato. La conversione è progettata per minimizzare l’impatto su reader e writer e funziona sia per tabelle managed che external.

Perché conta

Il partizionamento statico invecchia male: gli schemi scelti mesi fa raramente reggono i pattern di query di oggi. Il liquid clustering elimina questa rigidità e si adatta nel tempo. Poter migrare in modo incrementale ciò che è già in produzione, senza riscrivere le tabelle, è la differenza tra un’ottimizzazione teorica e una che si fa davvero.

In sintesi

Se gestisci tabelle Delta con partizionamenti che hanno cominciato a pesare più di quanto aiutino, questa è l’occasione per rivalutarle senza un progetto di migrazione dedicato. Un comando, impatto contenuto, layout che si adatta da solo.

Fonte: Converting a partitioned table to liquid clustering is generally available — Databricks Release Notes