Anthropic wil Claude draaien op Microsoft Maia 200

Anthropic praat met Microsoft over het draaien van Claude op Microsofts eigen AI-chip, de Maia 200. Volgens CNBC gaat het om vroege gesprekken waarbij Anthropic Azure-servers met de accelerator zou huren voor inferentie, het uitvoeren van een al getraind model. Zou de deal doorgaan, dan wordt Claude het eerste topmodel dat de chip buiten Microsoft zelf op grote schaal test.

Wat de Maia 200 kan

De Maia 200 is Microsofts tweede generatie zelfontworpen AI-versneller, in januari 2026 gepresenteerd en gebouwd op het 3-nanometerproces van TSMC. De chip is uitsluitend bedoeld voor inferentie. Microsoft claimt op basis van interne benchmarks tot 40 procent betere prestaties per watt voor het draaien van grote taalmodellen vergeleken met de vorige generatie, en een derde lagere totale eigendomskosten. TechTimes meldt dat de chip sinds begin dit jaar draait in datacenters in Arizona en Iowa, waar hij al inferentie verwerkt voor OpenAI’s GPT-5.2 via Microsoft Foundry en Microsoft 365 Copilot.

Toch is de Maia 200 medio 2026 nog niet algemeen beschikbaar voor Azure-klanten. Er loopt een beperkte preview. Dat maakt Anthropic een vroege externe testklant, precies op het moment dat Microsoft wil bewijzen dat zijn silicium kan concurreren met dat van NVIDIA. Eerder schreven we al over hoe Qualcomm met de Dragonfly-datacenterchip diezelfde markt opzoekt, en hoe OpenAI samen met Broadcom een eigen chip ontwierp.

Anthropic spreidt zijn rekenkracht

Voor Anthropic past de stap in een bredere koers. Het bedrijf is sinds een deal van 5 miljard dollar eind 2024 een van de grootste Azure-klanten van Microsoft, met de afspraak om Azure als primaire cloud te gebruiken voor training en uitrol. In april sloot Anthropic daarnaast een tienjarig contract van meer dan 100 miljard dollar voor de Trainium-chips van Amazon Web Services. Het bedrijf draait Claude ook op de TPU’s van Google en op NVIDIA-hardware.

Die spreiding verkleint de afhankelijkheid van één leverancier en drukt de kosten van inferentie, de grootste structurele uitgave naarmate meer mensen Claude dagelijks gebruiken. Het bedrijf groeit hard en bereidt volgens berichten een beursgang voor, zoals we beschreven bij de verwachte IPO van Anthropic. Goedkopere inferentie raakt daarbij direct de marges.

Het voorbehoud bij precisie

Een open vraag is de nauwkeurigheid. Inferentie op zuinige chips gebruikt vaak FP8-rekenwerk, een lager precisieformaat dat de kwaliteit van uitvoer op sommige taken met een fractie van een procent kan verlagen. Anthropic noemt betrouwbaarheid een kernbelofte van zijn product en veiligheid. Het bedrijf zal eerst moeten vaststellen dat de afwegingen van de Maia 200 acceptabel zijn voor Claude voordat het productieverkeer naar de chip verplaatst.

Wat betekent dit

De gesprekken laten zien dat de strijd om AI-rekenkracht zich verplaatst van trainen naar inferentie, waar het dagelijkse geld omgaat. Voor Microsoft is een topmodel als Claude op de Maia 200 een ijkpunt voor zijn chipambities. Voor Anthropic is het een manier om niet vast te zitten aan NVIDIA en de kosten per gebruiker omlaag te krijgen. Komt de deal rond, dan zet dat druk op de prijzen in de hele sector, ook bij partijen die rekenkracht verhuren. De gesprekken zijn nog pril en kunnen alsnog stuklopen.