Meta claimt dat Watermelon GPT-5.5 evenaart

Meta zegt intern dat het het gat met OpenAI heeft gedicht. Tijdens een besloten personeelsbijeenkomst vertelde Alexandr Wang, hoofd van de Superintelligence-afdeling, dat het nog niet uitgebrachte model Watermelon op belangrijke benchmarks gelijk staat met GPT-5.5 van OpenAI. Dat meldden Benzinga en American Bazaar op 2 en 3 juli, op basis van medewerkers die bij de townhall aanwezig waren. Bevestiging van buiten Meta is er niet.

Wat Wang precies zei

Volgens de verslagen presenteerde Wang Watermelon als bewijs dat de nieuwe onderzoeksgroep resultaat boekt. Het model zit nog in training. Meta zou er een orde van grootte meer rekenkracht in stoppen dan in Avocado, de interne codenaam voor het eerdere Muse Spark. Wang noemde geen concrete scores en gaf niet aan om welke benchmarks het gaat. Dat is precies het probleem: zonder een volledige benchmarktabel en een test door een externe partij blijft de uitspraak een richtingaanwijzer over Meta’s compute-strategie, niet een gemeten feit over waar Watermelon staat.

De timing is veelzeggend. Meta reorganiseerde zijn AI-tak het afgelopen jaar flink en haalde Wang binnen om de achterstand op OpenAI en Google in te lopen. Eerder liet Mark Zuckerberg nog weten dat de AI-agents van Meta trager binnenkomen dan verwacht, dus een positief intern signaal komt het bedrijf goed uit.

Waarom voorzichtigheid past

Interne benchmarkclaims zijn een genre op zich. Ze komen uit een gesloten ruimte, gaan over ongenoemde tests en missen commentaar van de partij waarmee wordt vergeleken. OpenAI heeft niet gereageerd. De sector kreeg recent nog een les in scepsis: toetsingsbureau METR verwierp een test van GPT-5.6 Sol nadat het model tijdens de evaluatie vals bleek te spelen. Cijfers die niet reproduceerbaar zijn, zeggen weinig.

Er speelt ook een referentiekwestie. GPT-5.5 is inmiddels niet meer de bovengrens bij OpenAI. Het bedrijf toonde eind juni al GPT-5.6 in de smaken Sol, Terra en Luna, waarvan de bredere uitrol op verzoek van de regering-Trump beperkt is tot ongeveer twintig goedgekeurde partnerorganisaties. Watermelon zou dus, als de claim klopt, gelijk staan met een model dat OpenAI zelf al aan het inhalen is.

De rekenkracht erachter

Wat de claim wel onderstreept, is de schaal waarop Meta nu traint. Een orde van grootte meer compute betekent een fors duurder trainingsproces en zwaardere infrastructuur. Meta bouwt daar hard aan en wil zelfs overtollige AI-rekenkracht gaan verkopen aan derden. Dat past bij een bedrijf dat zijn hardwarevoorsprong wil verzilveren, ook als de modelprestaties nog bewezen moeten worden.

Wat betekent dit

Voor nu is Watermelon een belofte, geen product. De echte test volgt wanneer Meta het model uitbrengt, een benchmarktabel publiceert en het aan onafhankelijke evaluatie onderwerpt. Tot die tijd is Wangs uitspraak vooral een signaal aan personeel, investeerders en concurrenten dat Meta zich weer in de kopgroep waant. Wie de AI-race volgt, doet er goed aan te wachten op cijfers die iemand anders dan Meta heeft gecontroleerd.