Grok 4.3 van xAI nu beschikbaar op Amazon Bedrock
2 mins read

Grok 4.3 van xAI nu beschikbaar op Amazon Bedrock

xAI heeft zijn nieuwste taalmodel Grok 4.3 vanaf deze week beschikbaar gemaakt in Amazon Bedrock. Volgens de aankondiging van AWS van 15 juni is dit de eerste keer dat een model van xAI als reguliere optie binnen Bedrock landt, naast aanbieders als Anthropic, Meta en Mistral.

Wat Grok 4.3 binnen Bedrock biedt

Grok 4.3 is een redeneermodel waarbij ontwikkelaars de rekendiepte zelf instellen, van geen tot hoog. Wie snelle, goedkope antwoorden wil, kiest een laag niveau, terwijl complexe vraagstukken meer rekenstappen krijgen. AWS noemt sterke tool-aanroepen en het opvolgen van instructies als kernpunten, wat het model geschikt maakt voor het bouwen van agents die zelfstandig taken afhandelen.

xAI claimt in zijn eigen toelichting een contextvenster van een miljoen tokens en de laagste hallucinatiegraad onder de huidige topmodellen. Die cijfers komen van xAI zelf en zijn nog niet onafhankelijk geverifieerd, dus enige terughoudendheid is op zijn plaats. AWS noemt als voorbeeldtoepassingen klantenservice, webontwikkeling, jurisprudentieonderzoek en het doorzoeken van financiële documenten.

Mantle als nieuwe inferentiemotor

Opvallend is dat Grok 4.3 draait op Mantle, een nieuwe inferentiemotor die Amazon binnen Bedrock heeft gebouwd met prijs-prestatie als doel. Mantle ondersteunt tool calling, gestructureerde uitvoer en streaming van antwoorden. Voor bedrijven die veel verzoeken verwerken telt vooral de tokenefficiëntie, omdat de kosten bij grote volumes snel oplopen.

De stap past in een bredere beweging waarin Amazon zijn eigen infrastructuur verstevigt. Het bedrijf wil zijn Trainium-chips ook aan derden verkopen en bouwde eerder al een directe route voor modellen als Claude Opus 4.8 via AWS. Met Grok erbij groeit het aanbod aan frontier-modellen op één platform.

De concurrentie om lange context

Het venster van een miljoen tokens plaatst Grok 4.3 in een groep modellen die mikken op zeer lange invoer. Google werkt aan Gemini 3.5 Pro met twee miljoen tokens, en partijen als MiniMax versnellen de verwerking van lange context. Tegelijk zetten open modellen zoals GLM-5.2 druk op de prijs. De keuze voor ontwikkelaars gaat steeds minder over één beste model en steeds meer over de juiste combinatie van prijs, snelheid en betrouwbaarheid.

Wat betekent dit

Voor Nederlandse bedrijven die al op AWS draaien wordt het simpeler om Grok te proberen zonder een apart contract met xAI. Ze kunnen het model naast Claude of Llama zetten en per taak kiezen wat past. De claims over hallucinatie en contextlengte verdienen een eigen test voordat ze in productie gaan, maar de toegevoegde keuze is reëel. Wie agents bouwt, krijgt er een instelbaar redeneermodel bij dat draait op infrastructuur die Amazon op kosten heeft afgestemd.