AI inference
WaveSpeed breidt “Any LLM”-API uit: waarom één laag voor meerdere AI-modellen nu belangrijk wordt
WaveSpeed breidt zijn “Any LLM” uit: één API om meerdere taalmodellen te gebruiken. Dit zegt veel over de groei van model-routing en inference-lagen.
SPAN lanceert XFRA: distributed datacenters in woningen om de AI ‘speed‑to‑power’ kloof te dichten
SPAN kondigt XFRA aan: een gedistribueerd netwerk van AI-compute nodes in woningen en kleine bedrijven om sneller op te schalen ondanks netcongestie.
DeepInfra haalt $107 miljoen op voor inference cloud: waarom tokens en latency nu bepalend zijn
DeepInfra haalt $107M op om zijn AI-inference cloud op te schalen. De funding onderstreept waarom cost-per-token, latency en betrouwbaarheid de nieuwe bottlenecks zijn voor agentic AI in productie.
