Tokenmaxxing voorbij: bedrijven kiezen goedkopere AI

Binnen veel techbedrijven gold lange tijd één vuistregel: gebruik zoveel mogelijk AI. Dat tijdperk loopt ten einde. CNBC beschreef op 26 juni hoe organisaties afstappen van wat in de sector ’tokenmaxxing’ heet, het maximaal verstoken van AI-tokens, en terugschakelen naar nuchtere kostenbeheersing. De cijfers achter die omslag zijn fors.

Van zoveel mogelijk naar zo nuttig mogelijk

Tokenmaxxing ontstond toen werkgevers hun mensen aanmoedigden om AI overal voor in te zetten, vaak met interne ranglijsten die het verbruik beloonden. Volgens CNBC draaien Amazon en Microsoft die aanpak nu terug en schrappen ze tools die dat gebruik bijhielden. De aanleiding is simpel: de uitgaven leveren te weinig op. Dataplatform Entelligence.AI rekende voor dat van elke dollar aan AI-tokens slechts 0,18 dollar daadwerkelijk waarde bij de eindgebruiker terechtkomt.

Een rekening zonder plafond

Het probleem zit in het verdienmodel. Bij facturatie per token stijgt de rekening met alles wat een AI-agent doet, en een nuttiger agent kost dus meer. Zonder afgesproken limiet loopt dat snel op. Uber verbruikte volgens CNBC zijn AI-budget voor heel 2026 al in de eerste vier maanden. Het bedrijf voerde daarna verbruikstiers in, met een basisniveau van 1.500 dollar per maand per tool. De baas van AI-startup Lindy verwacht dat zijn ploeg van ongeveer 25 mensen dit jaar meer aan AI uitgeeft dan aan salarissen.

Vlucht naar goedkopere modellen

Diezelfde Lindy-topman trok de consequentie en verlegde honderd procent van zijn verkeer van Claude naar DeepSeek, het Chinese bedrijf achter goedkopere open-weight modellen. DeepSeek verlaagde zijn API-prijzen met 90 procent, meldt SDxCentral, en dat zet een bredere prijzenslag in gang. Ook elders duiken voordelige alternatieven op, zoals GLM-5.2, dat de prestaties van Opus 4.8 benadert voor een fractie van de prijs. Tegelijk waarschuwt CNBC dat de omslag pas begint: zo’n 95 procent van het zakelijke AI-gebruik draait nog op dure frontier-modellen. Model-routing, waarbij elke taak naar het goedkoopst passende model gaat, wint aan terrein. Die kostendruk speelt tegen de achtergrond van oplopende spanningen tussen Anthropic en Alibaba en grote Chinese investeringen in eigen AI-datacenters.

Wat betekent dit

Voor Nederlandse bedrijven die met AI experimenteren is de les concreet. Meten wat een model echt oplevert weegt nu zwaarder dan ruw verbruik, en een limiet per team voorkomt verrassingen op de factuur. Goedkopere en open modellen maken het haalbaar om eenvoudige taken weg te halen bij de duurste systemen, terwijl het topsegment bewaard blijft voor werk dat die kosten rechtvaardigt. De vraag verschuift van hoeveel AI een organisatie gebruikt naar hoeveel waarde ze eruit haalt.