Andrew Ng ha insegnato il machine learning a mezzo mondo. Da anni porta avanti un messaggio controcorrente rispetto alla corsa ai modelli sempre più grandi: la leva più efficace è la qualità dei dati. In una intervista dedicata alla data-centric AI lo ribadisce con la consueta chiarezza.
L’approccio data-centric
L’idea è semplice da enunciare e difficile da praticare: invece di accanirsi sul codice e sull’architettura del modello, conviene lavorare sistematicamente sui dati. Il workflow ideale, secondo Ng, parte dall’addestrare un modello, prosegue con l’analisi degli errori per capire dove sbaglia, poi migliora i dati — non il codice — e riaddestra. Un ciclo in cui il dato è la variabile su cui si interviene.
Oltre il training: gli agenti
Nelle sue uscite più recenti, Ng allarga lo sguardo all’AI agentica: il valore si sposta dall’addestramento del modello all’orchestrazione di agenti che svolgono task complessi. Per chi vuole lavorare nel campo, indica priorità concrete — padroneggiare il prompt engineering, il fine-tuning e soprattutto il deployment in produzione — e sottolinea la domanda crescente di competenze per integrare l’AI generativa in applicazioni reali, da sanità e finanza al customer service.
Perché ascoltarlo
Il messaggio di Ng è un antidoto all’hype: prima di cercare il modello più potente, sistema i dati. È un richiamo che chi fa data engineering condivide istintivamente, ma che vale la pena ripetere mentre l’attenzione collettiva resta tutta sui modelli.
Fonte: The Data-Centric AI Approach With Andrew Ng — Scale Exchange
