DeepSeek maakt 75% prijsverlaging op V4‑Pro permanent: wat betekent dit voor AI-inferencekosten?

DeepSeek zet de prijsdruk in de AI-markt verder op scherp. Volgens Reuters maakt de Chinese AI-startup een permanente prijsverlaging van 75% op het flagshipmodel V4‑Pro (prijzen blijven dus op een kwart van het eerdere niveau). (Reuters via Investing.com, 23 mei 2026).

Op de eigen pricingpagina beschrijft DeepSeek bovendien dat de huidige promotieprijs na 31 mei 2026, 15:59 UTC wordt omgezet naar een officiële prijs die 1/4 is van het oorspronkelijke tarief. (DeepSeek API Docs).

Waarom dit ertoe doet: wie agentic workflows, code-assistants of reasoning-heavy apps runt, ziet inferencekosten vaak de grootste (en snelst groeiende) post worden. Een structurele prijsdaling bij een sterk model kan je routering, caching en zelfs je productpricing veranderen.

Wat is er precies aangekondigd?

Reuters meldt dat DeepSeek de 75% korting op V4‑Pro permanent maakt. Daarmee blijft het model geprijsd op een kwart van het eerdere niveau, met tarieven die (afhankelijk van gebruikstype) in yuan sterk dalen ten opzichte van eerder. (Reuters via UOL, 23 mei 2026).

DeepSeek’s eigen documentatie voegt daar een belangrijk detail aan toe: de promotie eindigt op 31 mei, maar daarna wordt de lijstprijs officieel herijkt naar 1/4 van het oude tarief. (DeepSeek API Docs).

Waarom dit de markt kan opschudden

De impact is groter dan “goedkoper is fijn”. Een 75% structurele daling kan:

Modelrouting veranderen: teams die nu voor ‘goedkoper’ (kleiner) kiezen, kunnen vaker naar een zwaarder model schakelen.
Meer experimenten mogelijk maken: langere context, meer tool-calls, meer evaluaties per user — zonder dat je kosten exploderen.
Concurrenten dwingen te reageren: prijsdruk werkt door in bundels, credits, en premium-tiers bij andere aanbieders.

SCMP koppelt de prijsdaling ook aan de internationale “bang-for-buck”-discussie rond V4‑Pro. (South China Morning Post, 24 mei 2026).

Wat je nu praktisch kunt doen (zonder te gokken)

Als je nu al LLM-kosten stuurt, is dit een goed moment om je policy te herijken — maar doe het defensief:

Verifieer de actuele tarieven direct in de officiële pricing. (DeepSeek API Docs).
Meet je workloadprofiel: ratio input/output, cache-hit, tool-calls, retries. Dan kun je échte “€ per taak” vergelijken.
Update je fallback-strategie: combineer een goedkoop ‘flash’-model voor bulk met een pro-model voor kritieke stappen.

Gerelateerd (handig in je afweging):
Claude Sandbox en security guidance voor agents,
waarom content provenance steeds urgenter wordt,
eerder: marktupdate over prijs- en toegangswijzigingen,
EU-plannen rond een AI-gezant,
en waarom modulair MoE kosten kan drukken.

Wat betekent dit?

De headline is simpel: inference wordt goedkoper. Maar strategisch is de boodschap groter: als frontier-achtige modellen structureel dalen in prijs, verschuift concurrentie naar integratie (tooling, workflows, veiligheid, compliance) en naar distributie (waar zitten je gebruikers?). Wie nu al modelrouting en kostenobservability op orde heeft, kan deze prijsdaling direct omzetten in betere productkwaliteit of hogere marges.