agenter-löpbok01

Att bygga effektiva AI-agenter: Den viktiga rollen för beskrivningar och runbooks

AI-agenter är vanligtvis multi-LLM-konstruktioner som får tillgång till API:er för att utföra uppgifter som tilldelas dem via uppmaningar.

Omfattningen av vad en AI-agent kan, bör och inte bör göra regleras på fem nivåer:

  1. LLM:ns inbyggda skyddsräcken och säkerhetsmekanismer
  2. Agentens roll och runbook
  3. De kunskapsfiler som tillhandahålls agenten
  4. Den prompt som triggar agenten
  5. API-åtgärder som är tillgängliga för agenten

I det här blogginlägget fokuserar vi på punkt nummer två – beskrivningen och runbooken.
Dessa två textfält ska inte förväxlas med prompten. Medan prompten beordrar agenten att utföra ”något” ger beskrivningen och runbooken konsekvent vägledning om hur agenten ska slutföra uppgifter på ett effektivt sätt. Till skillnad från en prompt, som kan ändras vid varje interaktion, ska beskrivningen och runbooken vara oförändrade. Även om det är möjligt att inkludera alla relevanta detaljer i en uppmaning är detta tillvägagångssätt ineffektivt för upprepade uppmaningar. En tumregel är att om vissa förberedande rader alltid behövs, placera dem i runbooken. För hantering av kritisk affärsdata är väldefinierade beskrivningar och runbooks avgörande för att säkerställa att agenten utför exakt det som processägaren förväntar sig – och inget annat.

Rollen som agent
Agentens roll är ett kort uttalande som förklarar agentens syfte. Vanligtvis definieras rollen i runbooken. Den är inte bara till för användarens referens, utan ger också ett sammanhang som hjälper agenten att arbeta mer effektivt.

Tips: Du kan också testa detta med en icke-agentisk, LLM-baserad lösning som ChatGPT. Om den saknar ett roll-/beskrivningsfält kan du börja din fråga med att ange vilken roll du vill att LLM:n ska anta. Om du till exempel ber ChatGPT att agera som en marinbiolog innan du frågar om djuphavsorganismer kommer du att få ett mer fokuserat och detaljerat svar.

Runbook
Runbook är nyckeln till en välfungerande AI-agent. Den innehåller tydliga instruktioner på naturligt språk som beskriver varje åtgärd som agenten ska utföra, utlösarna för varje åtgärd och de önskade resultaten. Medan många automationslösningar kräver flödesscheman för att fastställa lösningens logik, är en runbook ett dokument av typen arbetsinstruktion som går igenom processens åtgärder och deras beroenden, en efter en. Beroende på hur komplex åtgärden är kan du behöva inkludera detaljerade steg för att säkerställa ett konsekvent utförande. Repeterbarhet är avgörande – ytterligare instruktioner behövs sannolikt om agenten ger varierande resultat för samma uppgift.

Tips: Att hålla LLM-temperaturen låg hjälper till att upprätthålla konsekvensen.

Ju fler uppgifter agenten behöver hantera, desto längre blir runbooken. Varje åtgärd bör ha sitt eget avsnitt, där det anges exakt hur utdata ska tillhandahållas. Att inkludera exempel på förväntade in- och utdataformat är mycket effektivt och gör det möjligt för agenten att konsekvent arbeta som förväntat. Tänk dock på att längre instruktioner förbrukar fler input-tokens. För att optimera kan du överväga att använda flera agenter som var och en hanterar specifika uppgifter. Detta minskar användningen av token, eftersom varje agent bara behöver utföra en delmängd av åtgärder i stället för att hänvisa till en uttömmande lista varje gång. Att kedja ihop agenter förbättrar resultaten och förenklar felsökning och finjustering.

Kontakta våra experter om du vill ha mer vägledning om hur du bygger en robust AI-agent i företagsklass!