// data & ai · giornale tecnico MILANO ● LIVE 00:00:00

Il manutentore solitario dietro la libreria che usi ogni giorno

Quattro milioni di download a settimana, un solo sviluppatore. Una conversazione sulla sostenibilità dell’open source.

Quattro milioni di download a settimana, un solo sviluppatore. Una conversazione sulla sostenibilità dell'open source.

Ci siamo incontrati in una videocall di mercoledì mattina. L’intervistato ha scelto di parlare con la telecamera spenta — una preferenza che rispettiamo e che, forse, dice già qualcosa sulla cultura che cerca di costruire.

Come è iniziato tutto

«Non avevamo un piano. Avevamo un problema — i report settimanali richiedevano tre giorni di lavoro manuale — e l’ho risolto con uno script Python. Poi hanno voluto un secondo script. Poi un terzo. A un certo punto avevo una piattaforma, non uno script.»

La decisione che ha cambiato tutto

Il momento chiave è stato quando abbiamo deciso di cancellare il data lake e ricominciare con file Parquet su S3. Tutti pensavano fossi impazzito. Dopo tre mesi la spesa cloud era scesa del 60%.

— l’intervistato

La lezione, spiega, non è tecnica. È organizzativa. «Il costo maggiore non è il compute, è la complessità cognitiva. Ogni servizio in più è un manuale in più che qualcuno deve leggere.»

Cosa consiglia a chi inizia

  • Inizia con CSV. Sul serio.
  • Non adottare uno strumento perché lo usa Netflix. Tu non sei Netflix.
  • Misura il tempo che perdi, non i terabyte che processi.

L’intervista integrale, con i dettagli tecnici della migrazione, è disponibile nel podcast datastack (link in fondo alla pagina).

Correlati

continua a leggere