Een n8n-workflow met vijf AI-stappen voelt goedkoop in een demo. In productie betaal je vaak voor reasoning tokens die je nooit ziet — en die komen op elke volgende node terug als input.
Theo (t3.gg) legde uit waarom sommige AI-modellen veel minder tokens nodig hebben dan alternatieven voor hetzelfde of een beter resultaat. Voor n8n-bouwers is dat geen model-fanboy-discussie. Het is een ontwerpkeuze: hoeveel context en reasoning laat je per node toe voordat je workflow onbetaalbaar wordt?
Het probleem: verborgen reasoning in elke node
Stel een agent-workflow: webhook → classificatie → kennisbank → conceptantwoord → CRM-post. Als node 2 intern 1.200 reasoning tokens produceert, beginnen node 3, 4 en 5 met een steeds zwaarder gesprek.
Benchmark die wél relevant is voor n8n
Op DeepSWE gebruikte GPT-5.5 medium circa 20.000 tokens per taak en scoorde hoger dan een Gemini-variant die ~270.000 tokens nodig had. Jouw workflow is geen DeepSWE, maar het principe is hetzelfde: tokens per afgeronde taak bepaalt je maandfactuur.
Praktische n8n-keuzes
- Log input/output tokens per AI-node.
- Scheid denk- en doe-stappen.
- Compacteer context tussen nodes.
- Human-in-the-loop bij hoge impact.
- Fallback-model voor classificatie en formatting.