// data & ai · giornale tecnico MILANO ● LIVE 00:00:00

Flusso

Chip Huyen: cosa devi davvero sapere sull’AI engineering nel 2025· Ali Ghodsi (Databricks): la semantica è “esistenziale” per l’AI in azienda· Soumith Chintala (PyTorch): «Stiamo costruendo studenti obbedienti, non rivoluzionari»· Clem Delangue (Hugging Face): «Il vero bubble è negli LLM via API, non nell’open source»· Hannes Mühleisen (DuckDB): perché tutti odiano i database (e come cambiarlo)· Tristan Handy (dbt Labs) e il volto che cambia del data stack· Jay Kreps (Confluent): essere data-driven non basta più, ora si agisce sui dati in tempo reale· Andrew Ng e la data-centric AI: migliora i dati, non solo il modello· Chip Huyen: cosa devi davvero sapere sull’AI engineering nel 2025· Ali Ghodsi (Databricks): la semantica è “esistenziale” per l’AI in azienda· Soumith Chintala (PyTorch): «Stiamo costruendo studenti obbedienti, non rivoluzionari»· Clem Delangue (Hugging Face): «Il vero bubble è negli LLM via API, non nell’open source»· Hannes Mühleisen (DuckDB): perché tutti odiano i database (e come cambiarlo)· Tristan Handy (dbt Labs) e il volto che cambia del data stack· Jay Kreps (Confluent): essere data-driven non basta più, ora si agisce sui dati in tempo reale· Andrew Ng e la data-centric AI: migliora i dati, non solo il modello·

Databricks, News

ai_classify è ora GA su Databricks: classificazione del testo nativa nel lakehouse

Databricks dichiara ai_classify generally available: classificazione del testo con label personalizzate, multi-label e una UI no-code, direttamente in SQL.

Claudio

13 Giu 2026

La classificazione del testo è uno di quei compiti che quasi ogni team dati prima o poi affronta: smistare ticket, etichettare documenti, categorizzare feedback. Con ai_classify ora generally available, Databricks la rende un’operazione nativa del lakehouse.

Cosa cambia

ai_classify permette di classificare testo secondo label personalizzate, con supporto per descrizioni delle label, istruzioni globali e classificazione multi-label. Non è un wrapper improvvisato: è pensata per essere precisa, configurabile e scalabile direttamente nelle pipeline di data engineering, richiamabile in SQL o Python.

L’aggiunta più interessante è una UI no-code dedicata alla classificazione: si possono costruire, validare e iterare sugli agenti di classificazione senza scrivere una riga di codice. Abbassa la barriera per i team meno vicini al codice senza togliere nulla a chi preferisce lavorare in query.

Perché conta

Per chi gestisce grandi volumi di testo — supporto clienti, documenti contrattuali, contenuti — avere un sistema di classificazione versionabile e integrabile nel lakehouse evita di mantenere servizi esterni e di spostare i dati fuori dalla piattaforma governata. La logica vive accanto ai dati, con i vantaggi di tracciabilità e governance che ne derivano.

In sintesi

Insieme a ai_extract, ai_classify completa un set di funzioni AI native che spostano l’elaborazione del linguaggio dentro SQL. Meno integrazioni, meno codice di collante, più operazioni ripetibili sui dati.

Fonte: ai_classify is now generally available — Databricks Release Notes

data engineering, llm, ml, Unity Catalog

Correlati

continua a leggere

News

I modelli open-weight raggiungono i closed sui benchmark di ragionamento

Marco Ferri

11 Giu 2026
Interviste

Chip Huyen: cosa devi davvero sapere sull’AI engineering nel 2025

Claudio

13 Giu 2026
Interviste

Ali Ghodsi (Databricks): la semantica è “esistenziale” per l’AI in azienda

Claudio

13 Giu 2026
Interviste

Soumith Chintala (PyTorch): «Stiamo costruendo studenti obbedienti, non rivoluzionari»

Claudio

13 Giu 2026