Gemini 3.5 Pro nadert algemene beschikbaarheid
Google’s Gemini 3.5 Pro lijkt eindelijk de stap naar brede beschikbaarheid te zetten. Analisten die de uitrol volgen, plaatsen de algemene beschikbaarheid (GA) tussen 23 en 30 juni 2026. Op het moment van schrijven draait het model nog in een beperkte preview voor zakelijke klanten via Vertex AI, en een publieke GA-aankondiging ontbreekt nog. Techsite TechTimes en nieuwsbrief AI Weekly meldden eerder deze maand hetzelfde tijdvenster.
Een venster van 2 miljoen tokens
De opvallendste specificatie is het contextvenster van 2 miljoen tokens. Dat is dubbel zoveel als de 1 miljoen van Gemini 3.5 Flash en daarmee het grootste venster in een productiemodel van de huidige generatie. In de praktijk kan het model zo hele codebases, lange contracten of complete dossiers in één keer verwerken, zonder dat een ontwikkelaar de input in stukken hoeft te knippen.
Google koppelt er een redeneerstand aan met de naam Deep Think. Die functie zit achter het Ultra-abonnement van 250 dollar per maand en is dus niet voor elke gebruiker beschikbaar. Het model verwerkt naast tekst ook beelden. Eerder bleef Gemini 3.5 Pro langer in preview hangen dan Google bij de onthulling op I/O van 19 mei had gesuggereerd.
Prijskaartje nog niet bevestigd
Over de kosten is Google nog stil. Schattingen in de markt komen uit op ongeveer 15 dollar per miljoen invoertokens en 60 dollar per miljoen uitvoertokens, grofweg tien keer het tarief van Gemini 3.5 Flash. Die cijfers zijn nadrukkelijk niet door Google bevestigd. De verwachting is dat het model eerst landt op de consumentenabonnementen van 20 dollar (Pro) en 250 dollar (Ultra), waarbij de zwaarste redeneerfuncties voor de duurste laag gereserveerd blijven.
De concurrentie zit niet stil
De timing is veelzeggend. Op dezelfde dag verdween Anthropics Fable 5 achter een betaalmuur, met een tarief van 10 dollar invoer en 50 dollar uitvoer per miljoen tokens, het dubbele van Claude Opus 4.8. Aanbieders schuiven hun duurste modellen dus richting de zakelijke markt, terwijl ze de instapmodellen goedkoop houden. Google probeert met het grote contextvenster een eigen verkoopargument neer te zetten tegenover die prijsdruk.
De strijd speelt zich niet alleen rond chatbots af. Bedrijven willen modellen die langdurige, agentische taken aankunnen, en Microsoft duwt intussen zijn eigen codeermodel naar alle Copilot-apps. Wie het grootste geheugen en de scherpste redenering levert, pakt daarin een voorsprong.
Wat betekent dit
Voor Nederlandse ontwikkelaars en bedrijven is vooral het contextvenster relevant. Een model dat 2 miljoen tokens vasthoudt, opent ruimte voor toepassingen die nu nog struikelen over geheugenlimieten, van juridische analyse tot softwareonderhoud. Tegelijk maakt de prijsstructuur duidelijk dat de zwaarste functies geld kosten. Wie wil opschalen, doet er goed aan de tarieven af te wachten voordat het model echt GA is. Ook de aankomende verplichtingen uit de EU AI Act spelen mee bij de keuze welk model je in productie neemt.
