Anthropic past pricing aan: web search, code execution en “active runtime” maken Claude-agents voorspelbaarder (maar niet gratis)

Anthropic heeft stilletjes een belangrijke stap gezet voor iedereen die Claude niet alleen als chat, maar als agent inzet. Op de officiële pricingpagina staan nu expliciete tarieven voor drie “agent-achtige” bouwblokken: web search, code execution en active runtime. Daarmee wordt het makkelijker om agent-workflows te begroten—maar het maakt ook duidelijk waar de kosten gaan zitten zodra je agents écht laat werken. (Bron: Claude pricing)

Wat is er nieuw aan de pricing?

Op de pagina noemt Anthropic onder “Additional usage rates” onder andere:

Active runtime: $0,08 per session-hour.
Web search: $10 per 1.000 searches.
Code execution: $0,05 per hour per container (met een vermelding van 50 free hours per day).

Dat zijn geen kleine details: ze vormen precies de kostenposten die bij agents vaak “onzichtbaar” worden—omdat je niet één modelcall doet, maar een reeks tool-calls met een runtime die doorloopt. (Bron: Claude pricing)

De wijziging werd de afgelopen uren ook gesignaleerd in pricing-change trackers, wat suggereert dat dit een recente update is. (Bron: ModelsWar pricing changes)

Waarom dit belangrijk is voor developers en teams

Agents verschuiven AI van “antwoord geven” naar “werk uitvoeren”: browsen, iets controleren, code draaien, en terugkoppelen met onderbouwing. Dat zie je ook in de bredere trend naar developer tooling en autonome workflows—bijvoorbeeld bij xAI’s Grok Build als CLI-agent en de opkomst van “unified API”-lagen die modelrouting en observability centraliseren (zoals in WaveSpeed’s Any LLM-API).

Het praktische gevolg: je kostenmodel gaat niet alleen over tokens. Je rekent nu ook met tijd (runtime), tool-actie (searches) en uitvoeromgeving (containers). Door die posten expliciet te prijzen, wordt het ineens haalbaar om agent-KPI’s te koppelen aan euro’s/dollars: “wat kost één complete agent-run?” in plaats van “wat kost één prompt?”

Dat kostenbewustzijn begint volgens Leon Tindemans, die de AI-trainingen van TTM Communicatie verzorgt, al bij het team zelf.

“Mensen die snappen hoe een agent werkt, laten hem niet eindeloos doorzoeken. Begrip van de techniek is uiteindelijk de goedkoopste rem op je rekening.” Leon Tindemans, AI-expert en Copilot- & ChatGPT-trainer

Wat betekent dit voor je kostenrails?

Met deze pricing wordt het nog belangrijker om guardrails in te bouwen:

Budgetlimieten per taak: max runtime + max searches + max tool-calls.
Snelle stops: als de agent te lang zoekt of blijft itereren, moet je workflow kunnen afbreken.
Veiligheid en privacy: zodra je meer tooling koppelt, wil je prompts en output standaard checken op gevoelige info (PII). Zie bijvoorbeeld onze uitleg over GLiGuard/PII-detectie.

Conclusie: volwassen pricing voor volwassen agents

De kern: Anthropic maakt de “agent-laag” concreter door er duidelijke prijskaartjes aan te hangen. Dat is goed nieuws voor teams die Claude-agents in productie willen zetten, omdat het begroten en sturen simpeler wordt. Tegelijk is het een wake-up call: zodra je agents laat browsen en code laat uitvoeren, zijn de variabelen (en dus je kosten) breder dan tokens.

Mijn take: dit soort transparante tool-pricing is precies wat je nodig hebt om agents op te schalen—maar alleen als je het combineert met strakke monitoring, duidelijke limieten en een reviewmoment voordat een agent iets “definitiefs” doet. Dat sluit ook aan op Anthropic’s eerdere bewegingen rond agent-ecosystemen, zoals de veranderingen in toegang en kostenstructuur bij de Agent SDK (zie: Agent SDK-credits stoppen) en de focus op inzetbaarheid in het MKB (zie: Claude voor small business).