La VP of Data di una scale-up racconta come hanno ridotto la spesa cloud del 60% tornando a strumenti semplici.
Ci siamo incontrati in una videocall di mercoledì mattina. L’intervistato ha scelto di parlare con la telecamera spenta — una preferenza che rispettiamo e che, forse, dice già qualcosa sulla cultura che cerca di costruire.
Come è iniziato tutto
«Non avevamo un piano. Avevamo un problema — i report settimanali richiedevano tre giorni di lavoro manuale — e l’ho risolto con uno script Python. Poi hanno voluto un secondo script. Poi un terzo. A un certo punto avevo una piattaforma, non uno script.»
La decisione che ha cambiato tutto
Il momento chiave è stato quando abbiamo deciso di cancellare il data lake e ricominciare con file Parquet su S3. Tutti pensavano fossi impazzito. Dopo tre mesi la spesa cloud era scesa del 60%.
— l’intervistato
La lezione, spiega, non è tecnica. È organizzativa. «Il costo maggiore non è il compute, è la complessità cognitiva. Ogni servizio in più è un manuale in più che qualcuno deve leggere.»
Cosa consiglia a chi inizia
- Inizia con CSV. Sul serio.
- Non adottare uno strumento perché lo usa Netflix. Tu non sei Netflix.
- Misura il tempo che perdi, non i terabyte che processi.
L’intervista integrale, con i dettagli tecnici della migrazione, è disponibile nel podcast datastack (link in fondo alla pagina).
