inference optimalisatie
Nieuwe arXiv-papers mikken op goedkoper én betrouwbaarder LLM-redeneren (met minder tokens)
Nieuwe arXiv-papers richten zich op één bottleneck van AI-reasoning: hoge tokenkosten. VecCISC belooft ~47% minder tokens door redeneringen te clusteren; Rubric-Grounded RL gebruikt rubrics voor beter generaliseerbare reasoning.
