Claude Fable 5 haalt 80 procent op SWE-Bench Pro

Anthropic heeft op 9 juni Claude Fable 5 uitgebracht, het model dat het bedrijf naar eigen zeggen het verst brengt op langlopend programmeerwerk. De cijfers die Anthropic en techsite The Decoder noemen, laten een duidelijke stap zien ten opzichte van Claude Opus 4.8.

Grote sprong op codebenchmarks

Op SWE-Bench Pro haalt Fable 5 volgens Anthropic 80,3 procent, tegen 69,2 procent voor Opus 4.8, 58,6 procent voor GPT-5.5 en 54,2 procent voor Gemini 3.1 Pro. Op FrontierCode, een test van Cognition voor zwaar engineeringwerk, gaat de score van 13,4 naar 29,3 procent. Anthropic geeft als voorbeeld een codemigratie voor Stripe die Fable 5 in één dag afrondde, werk waar een team naar schatting twee maanden mee bezig zou zijn. Die nadruk op code past in een drukke maand. Eerder zette Microsoft een eigen codeermodel in Copilot en trainde xAI zijn Grok V9-Medium op echte ontwikkeldata.

Sterker in beeld en over lange tekst

Anthropic noemt Fable 5 zijn beste vision-model tot nu toe. Het haalt getallen uit gedetailleerde wetenschappelijke grafieken en bouwt de broncode van een webapp na op basis van alleen schermafbeeldingen. In een opvallende test speelde het model Pokémon FireRed puur op basis van screenshots, zonder hulpframework eromheen. Voor lange klussen blijft Fable 5 volgens het bedrijf gefocust over miljoenen tokens en gebruikt het notities die het onderweg zelf maakt. Dat is precies het soort werk, agents die een taak urenlang vasthouden, waar de rest van de markt ook op mikt.

Prijs en beschikbaarheid

Fable 5 is direct beschikbaar via de Claude API en zakelijke abonnementen. De prijs ligt op 10 dollar per miljoen invoertokens en 50 dollar per miljoen uitvoertokens, het dubbele van Opus 4.8. Op abonnementen telt elk gebruik dubbel mee. Naast Fable 5 bracht Anthropic ook Mythos 5 uit, met extra waarborgen voor specifieke klanten. De timing is gevoelig, want kort daarvoor legde de Amerikaanse overheid beperkingen op de toegang tot deze modellen, iets wat ook in Europa doorwerkt. Anthropic ging dit voorjaar zakelijk voorbij OpenAI, vooral dankzij Claude Code.

“Wat me opvalt is de uithoudingskracht. Een model dat uren achtereen code blijft overzien, scheelt mij als trainer veel uitleg over de plekken waar het eerder vastliep.”

Leon Tindemans, AI-expert en Copilot- & ChatGPT-trainer. Hij verzorgt onder meer Copilot-training bij TTM Communicatie.

Wat betekent dit

Voor Nederlandse ontwikkelaars en bedrijven verschuift de afweging. Fable 5 is duurder, maar de scores wijzen op meer waarde bij grote, langlopende codeklussen waar fouten zich anders opstapelen. Tegelijk maakt de exportkwestie de beschikbaarheid op termijn onzeker. Wie nu op Claude bouwt, doet er goed aan een terugvaloptie te kennen, bijvoorbeeld een open codeermodel als Kimi K2.7-Code. Voorlopig legt Fable 5 de lat voor wat een commercieel model aan code- en beeldwerk aankan een stuk hoger.