// data & ai · giornale tecnico MILANO ● LIVE 00:00:00
,

ai_classify è ora GA su Databricks: classificazione del testo nativa nel lakehouse

Databricks dichiara ai_classify generally available: classificazione del testo con label personalizzate, multi-label e una UI no-code, direttamente in SQL.

La classificazione del testo è uno di quei compiti che quasi ogni team dati prima o poi affronta: smistare ticket, etichettare documenti, categorizzare feedback. Con ai_classify ora generally available, Databricks la rende un’operazione nativa del lakehouse.

Cosa cambia

ai_classify permette di classificare testo secondo label personalizzate, con supporto per descrizioni delle label, istruzioni globali e classificazione multi-label. Non è un wrapper improvvisato: è pensata per essere precisa, configurabile e scalabile direttamente nelle pipeline di data engineering, richiamabile in SQL o Python.

L’aggiunta più interessante è una UI no-code dedicata alla classificazione: si possono costruire, validare e iterare sugli agenti di classificazione senza scrivere una riga di codice. Abbassa la barriera per i team meno vicini al codice senza togliere nulla a chi preferisce lavorare in query.

Perché conta

Per chi gestisce grandi volumi di testo — supporto clienti, documenti contrattuali, contenuti — avere un sistema di classificazione versionabile e integrabile nel lakehouse evita di mantenere servizi esterni e di spostare i dati fuori dalla piattaforma governata. La logica vive accanto ai dati, con i vantaggi di tracciabilità e governance che ne derivano.

In sintesi

Insieme a ai_extract, ai_classify completa un set di funzioni AI native che spostano l’elaborazione del linguaggio dentro SQL. Meno integrazioni, meno codice di collante, più operazioni ripetibili sui dati.

Fonte: ai_classify is now generally available — Databricks Release Notes