Trend DK
Forside AI Google smider billigere AI-model ud efter klager: Token-regningen var løbet...

Google smider billigere AI-model ud efter klager: Token-regningen var løbet løbsk

Google smider billigere AI-model ud efter klager: Token-regningen var løbet løbsk
Leveret af Trend

Gemini 3.5 Flash (Low) bruger omkring 45 procent færre tokens end standardmodellen.

Google har lanceret en sparsommeligere variant af sin AI-model Gemini 3.5 Flash, efter at udviklere klagede over, at simple kodeopgaver åd deres ugentlige token-grænser i kodeplatformen Antigravity. Den nye variant, Gemini 3.5 Flash (Low), blev præsenteret 25. maj 2026 af Varun Mohan, direktør i Google DeepMind med ansvar for Antigravity.

Ifølge Googles interne målinger genererer Low-varianten cirka 45 procent færre tokens end den almindelige Flash-model. Til gengæld for det lavere forbrug skal den ifølge Mohan stadig slå den ældre Gemini 3 Flash på softwareudviklingsopgaver.

Token-forbruget er den enhed, brugerne betaler for, hver gang en AI-model læser et input eller skriver et svar. Jo flere tokens, jo dyrere bliver opgaven, og i Antigravity er forbruget koblet sammen med en ugentlig grænse, som mange udviklere ramte langt hurtigere end ventet.

Klagerne kom hurtigt

Da Google tidligere på året skiftede Antigravity over til Gemini 3.5 Flash som standardmodel og samtidig strammede grænserne i AI Pro-abonnementet, reagerede brugerne kontant. På Googles egen udviklerfora beskriver flere, hvordan kvoten brændte af på dage i stedet for at række en hel uge.

En bruger forklarer, at 3.5 Flash spiser sig gennem de ugentlige grænser “utroligt hurtigt”, mens en anden påpeger, at den tidligere Gemini 3 Flash gav rigeligt med plads til debugging, refaktorering og rutinekode uden bekymring for kvoten. Google forsøgte først at lukke utilfredsheden ved at hæve Antigravity-grænserne med en faktor ni fordelt over to runder, men det fjernede ikke selve problemet.

Mohan har bekræftet, at Google havde et blindt punkt, da man målte token-forbruget. Holdet fokuserede på at gøre Gemini 3.5 Flash hurtig og dygtig til komplekse opgaver og overså, hvor dyrt simple opgaver kunne blive med samme model.

Tre niveauer at vælge mellem

Med lanceringen af Low-varianten har Antigravity reelt fået tre Flash-niveauer at navigere imellem. Low er det nye standardvalg til lette opgaver som boilerplate-kode, simple rettelser og kommentarer. Medium er den oprindelige Gemini 3.5 Flash, der nu er omdøbt og rykket et trin op, og bruges når opgaven kræver mere ræsonnement. High dækker over den ældre Gemini 3 Flash, der stadig er tilgængelig til de tungeste kodeopgaver, indtil Flash Low overhaler den helt.

Mohan forklarer, at Low-modellen justerer modellens “indsatsniveau”, men ikke skærer ned på systemprompten eller den kontekst, modellen får med, hvilket skal sikre, at kvaliteten ikke kollapser ved at spare tokens.

Hvornår Pro er svaret

Til opgaver, der falder uden for Flash-familien, peger Google på Gemini 3 Pro. Pro-modellen er Googles tungere ræsonnementsmodel og bruges i Antigravity, når en agent skal planlægge flere skridt, holde styr på en stor kodebase eller udføre opgaver, hvor præcision tæller mere end hastighed. Flash bruges som det hurtige “arbejdslag”, hvor agenter skal handle hurtigt og generere kode i mange små trin, mens Pro træder til, når der skal lægges en plan eller koordineres mellem flere agenter.

I praksis betyder valget, at en udvikler, der beder Antigravity om at omdøbe en variabel eller skrive en getter-metode, fremover kan blive på Low uden at brænde kvote af. En forespørgsel om at debugge en fejl på tværs af flere filer er typisk Medium-territorium, og når agenten skal bygge en ny feature fra ende til anden og selv beslutte rækkefølgen, er det Pro, der trækkes ind.

Google har samtidig nulstillet kvoten på både gratis og betalte abonnementer i forbindelse med opdateringen, så brugerne får et frisk udgangspunkt med den nye model.

Ads by MGDK