En enkelt forespørgsel i Google cloud-tjenesten blev katastrofal for en udvikler, der troede, han brugte et gratis dataset. Nu advares andre mod at begå samme fejl.
Mange udviklere anvender Google Cloud til analyse og datahåndtering – ofte med den opfattelse, at adgang til offentlige datasæt også betyder gratis brug. Men det er en farlig antagelse, som en uheldig udvikler nu har fået at mærke på den hårde måde.
Udvikleren, kaldet Tim, ville hente information fra det offentligt tilgængelige HTTP Archive – et kendt dataset med information om internettets teknologier. Han valgte at bruge Google Cloud og kørte sit script via BigQuery, et analyseværktøj udviklet af Google.
Kort efter modtog han en uventet regning: Over 14.000 dollars, svarende til ca. 150.000 norske kroner. Det skriver det norske medie Kode24.
Offentlige data – men ikke gratis at bruge
Det viste sig, at Tims forespørgsel havde behandlet omkring 2,5 petabyte data. Og selvom datasættet i sig selv er frit tilgængeligt, koster det penge at behandle det via Google Cloud – og især med så stor datamængde.
Google advarede ham ikke undervejs. Hverken i brugerfladen eller gennem det Python-bibliotek, han benyttede, fik han en forudgående advarsel om de potentielle omkostninger.
Stor kritik af gennemsigtighed hos Google
Efter hændelsen blev dokumentationen for HTTP Archive opdateret med en tydelig advarsel. Nu fremgår det klart, at brug via Google BigQuery kan medføre høje udgifter, hvis man ikke er forsigtig.
Men ifølge Tim burde techgiganten have gjort mere for at forhindre situationen. Han påpeger, at de fleste udviklere antager, at de bliver varslet, inden de løber ind i store omkostninger. Det skete ikke her.
Det skræmmende er, at Tims situation ikke er enestående. Mange tror, at fordi Google tilbyder adgang til offentlige data, er det også gratis at arbejde med. Men i cloud-tjenester beregnes der ofte gebyrer på baggrund af datamængde, forespørgsler og regnekraft.
Et enkelt script med dårlig optimering eller forkert forståelse kan derfor koste dyrt.
Sådan undgår du samme fejl
Hvis du bruger Google Cloud:
- Tjek altid estimater for omkostninger, før du kører en forespørgsel
- Brug prøveversioner og gratis kvoter med omtanke
- Sæt budgetgrænser og alarmer via Clouds kontrolpanel
- Gennemgå dokumentation og begræns forespørgsler til det nødvendige
Google Cloud er et effektivt værktøj, men det er ikke gratis, bare fordi dataene er offentlige. Hvis du ikke følger med i, hvordan dine scripts behandler data, kan du ende med en regning, der overgår selv den dyreste udviklingsfejl.
Disse 5 apps bør du slette med det samme: Overvåger alt du gør