La classificazione del testo è uno di quei compiti che quasi ogni team dati prima o poi affronta: smistare ticket, etichettare documenti, categorizzare feedback. Con ai_classify ora generally available, Databricks la rende un’operazione nativa del lakehouse.
Cosa cambia
ai_classify permette di classificare testo secondo label personalizzate, con supporto per descrizioni delle label, istruzioni globali e classificazione multi-label. Non è un wrapper improvvisato: è pensata per essere precisa, configurabile e scalabile direttamente nelle pipeline di data engineering, richiamabile in SQL o Python.
L’aggiunta più interessante è una UI no-code dedicata alla classificazione: si possono costruire, validare e iterare sugli agenti di classificazione senza scrivere una riga di codice. Abbassa la barriera per i team meno vicini al codice senza togliere nulla a chi preferisce lavorare in query.
Perché conta
Per chi gestisce grandi volumi di testo — supporto clienti, documenti contrattuali, contenuti — avere un sistema di classificazione versionabile e integrabile nel lakehouse evita di mantenere servizi esterni e di spostare i dati fuori dalla piattaforma governata. La logica vive accanto ai dati, con i vantaggi di tracciabilità e governance che ne derivano.
In sintesi
Insieme a ai_extract, ai_classify completa un set di funzioni AI native che spostano l’elaborazione del linguaggio dentro SQL. Meno integrazioni, meno codice di collante, più operazioni ripetibili sui dati.
Fonte: ai_classify is now generally available — Databricks Release Notes
