Waarom AI met een vast stappenplan betrouwbaarder is dan een ‘slimme’ agent

Er zijn grofweg twee manieren om AI in te zetten voor bedrijfsprocessen. De eerste klinkt indrukwekkend: een slimme agent die zelf nadenkt en bepaalt wat hij moet doen. De tweede klinkt saaier: een workflow met vaste stappen waarbij AI alleen op specifieke momenten wordt ingezet. Tegen-intuïtief misschien, maar die tweede aanpak is vaak vele malen betrouwbaarder.

Twee manieren om AI in te zetten

Stel, je wilt dat AI binnenkomende klantvragen afhandelt. Er zijn twee benaderingen:

Benadering 1: De slimme agent

Je geeft de AI een instructie (een “prompt”):

“Je bent een klantenservice-medewerker voor bedrijf X. Je hebt toegang tot onze FAQ, ons ordersysteem en ons retourbeleid. Beantwoord klantvragen zo goed mogelijk. Als je iets niet weet, escaleer dan naar een mens.”

De AI moet nu zelf bedenken: wat vraagt de klant? Waar moet ik zoeken? Welke stappen moet ik nemen? Wanneer escaleer ik?

Benadering 2: De vaste workflow
Je tekent een stroomdiagram:

  1. Lees de klantvraag
  2. Classificeer: is dit een vraag over een bestelling, een klacht of iets anders?
  3. Als bestelling → zoek in ordersysteem → genereer antwoord
  4. Als klacht → zoek in retourbeleid → genereer antwoord
  5. Als anders of onduidelijk → stuur naar medewerker
  6. Controleer antwoord op volledigheid
  7. Verstuur

Bij elke stap weet je precies wat er gebeurt. AI wordt ingezet waar het nuttig is (tekst begrijpen, antwoord formuleren), maar de route ligt vast.

Waarom de slimme agent vaak misgaat

De eerste benadering klinkt aantrekkelijker. Waarom zou je alles uittekenen als AI slim genoeg is om zelf na te denken? Het probleem: AI is goed in taal, maar slecht in consistent redeneren. En daar lopen bedrijfsprocessen op vast.

Onvoorspelbaar gedrag
Vraag een AI-agent tien keer hetzelfde, en je krijgt tien verschillende routes naar het antwoord. Soms zoekt hij eerst in de FAQ, soms in het ordersysteem, soms vraagt hij om verduidelijking, soms gokt hij gewoon. Voor een persoonlijk gebruik is dat misschien minder erg, maar voor een bedrijfsproces waar consistentie belangrijk is wel.

Vergeten stappen
Een AI-agent kan stappen overslaan. Je instructie zegt “controleer altijd het retourbeleid”, maar na 500 vragen “vergeet” de AI die stap soms. Niet omdat hij stuk is, maar omdat taalmodellen probabilistisch werken. Ze genereren tekst op basis van waarschijnlijkheid, niet op basis van een checklist.

Afwijken van de opdracht
Hoe langer een gesprek duurt, hoe meer een AI-agent kan “afdwalen” van zijn oorspronkelijke instructie. Dit heet prompt drift. De AI raakt context kwijt of laat zich meeslepen door de richting van het gesprek.

Moeilijk te debuggen
Als een AI-agent iets fout doet, is het lastig te achterhalen waarom. Hij heeft geen logboek van zijn denkproces. Je ziet alleen de input en de output, niet de tussenstappen.

Hoe een vaste workflow deze problemen oplost

Een workflow-gebaseerde aanpak (technisch vaak gebouwd met frameworks zoals LangGraph) pakt dit fundamenteel anders aan.

Expliciete stappen
Elke stap is gedefinieerd. Stap 1, stap 2, stap 3. De AI kan niet zelf besluiten om stap 2 over te slaan of een andere route te nemen. Het pad ligt vast.

Vergelijk het met navigatie. Een slimme agent is alsof je iemand een kaart geeft en zegt: “Ga naar Amsterdam.” Hij kan 100 verschillende routes kiezen, soms efficiënt, soms via België. Een workflow is een stap-voor-stap routebeschrijving: “Neem de A1, afslag 12, rechtdoor bij het tankstation.”

AI alleen waar nodig
In een workflow gebruik je AI alleen voor de taken waar het goed in is: tekst begrijpen, classificeren, samenvatten, genereren. De beslissingsstructuur (“als X dan Y”) leg je vast in code, niet in een prompt.

Dit is betrouwbaarder omdat code vast staat. Dezelfde input geeft altijd dezelfde output. Een prompt is dat niet.

State management
Een workflow houdt bij waar je bent in het proces. “We zitten nu bij stap 4, we hebben het ordernummer al opgehaald, de klant heeft nog niet gereageerd.” Deze “state” blijft bewaard, ook als het proces uren of dagen duurt.

Ingebouwde controles
In een workflow kun je na elke stap een controle inbouwen. “Is dit antwoord langer dan 10 woorden? Bevat het een ordernummer? Zo niet, ga terug naar stap 3.” Een agent moet je via de prompt vragen om zichzelf te controleren en dat werkt inconsistent.

Verschil 5: Duidelijke foutafhandeling
Wat als het ordersysteem niet bereikbaar is? In een workflow definieer je dit expliciet: “Als systeem niet reageert → wacht 5 seconden → probeer opnieuw → na 3 pogingen, escaleer naar mens.” Een agent moet dit zelf bedenken op basis van de prompt en dat gaat vaak mis.

Wanneer wél een agent?

Dit betekent niet dat agents nooit werken. Voor sommige toepassingen zijn ze prima:

  • Brainstormen en creatief werk: Waar consistentie minder belangrijk is
  • Interne tools: Waar een fout geen grote gevolgen heeft
  • Onderzoek en analyse: Waar een mens de output toch controleert
  • Eenvoudige taken: Waar weinig stappen en beslissingen nodig zijn

Maar voor bedrijfskritische processen — klantenservice, offertes, administratie — waar consistentie, controleerbaarheid en betrouwbaarheid belangrijk zijn, is een workflow-aanpak vrijwel altijd beter.

De techniek erachter

Voor wie nieuwsgierig is: dit soort workflows worden vaak gebouwd met een framework genaamd LangGraph (onderdeel van LangChain). Het idee is simpel:

  • Je tekent een Graph (een soort stroomdiagram) van je proces
  • Elke stap (“node”) doet één ding: AI aanroepen, database checken, beslissing nemen
  • Pijlen (“edges”) bepalen welke stap daarna komt
  • De “state” (huidige status) wordt doorgegeven van stap naar stap

Het voordeel: je combineert de kracht van AI met de betrouwbaarheid van traditionele software. AI doet waar het goed in is, code doet de rest.

Conclusie

De verleiding is groot om AI zo “slim” mogelijk te maken. Geef hem een instructie en laat hem zijn gang gaan. Maar voor processen waar betrouwbaarheid telt, is juist het omgekeerde slimmer: beperk de vrijheid van AI, definieer het pad expliciet en zet AI alleen in waar het echt waarde toevoegt.

Minder sexy misschien. Maar wel werkend. Elke keer.