npm - agentic-api - Versions diffs - 1.0.6 → 2.0.26 - Mend

agentic-api 1.0.6 → 2.0.26

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (103) hide show

package/README.md +118 -22
package/dist/src/agents/agents.example.d.ts +3 -0
package/dist/src/agents/agents.example.js +38 -0
package/dist/src/agents/authentication.js +2 -0
package/dist/src/agents/prompts.d.ts +2 -2
package/dist/src/agents/prompts.js +112 -49
package/dist/src/agents/reducer.core.d.ts +12 -0
package/dist/src/agents/reducer.core.js +207 -0
package/dist/src/agents/reducer.d.ts +3 -0
package/dist/src/agents/reducer.example.d.ts +28 -0
package/dist/src/agents/reducer.example.js +118 -0
package/dist/src/agents/reducer.js +19 -0
package/dist/src/agents/reducer.loaders.d.ts +34 -0
package/dist/src/agents/reducer.loaders.js +122 -0
package/dist/src/agents/reducer.process.d.ts +16 -0
package/dist/src/agents/reducer.process.js +143 -0
package/dist/src/agents/reducer.tools.d.ts +29 -0
package/dist/src/agents/reducer.tools.js +157 -0
package/dist/src/agents/reducer.types.d.ts +50 -0
package/dist/src/agents/reducer.types.js +5 -0
package/dist/src/agents/simulator.d.ts +47 -0
package/dist/src/agents/simulator.executor.d.ts +26 -0
package/dist/src/agents/simulator.executor.js +132 -0
package/dist/src/agents/simulator.js +205 -0
package/dist/src/agents/simulator.prompts.d.ts +16 -0
package/dist/src/agents/simulator.prompts.js +108 -0
package/dist/src/agents/simulator.types.d.ts +42 -0
package/dist/src/agents/simulator.types.js +2 -0
package/dist/src/agents/simulator.utils.d.ts +20 -0
package/dist/src/agents/simulator.utils.js +87 -0
package/dist/src/execute.d.ts +13 -6
package/dist/src/execute.js +351 -85
package/dist/src/index.d.ts +9 -0
package/dist/src/index.js +14 -0
package/dist/src/princing.openai.d.ts +9 -2
package/dist/src/princing.openai.js +15 -11
package/dist/src/prompts.d.ts +3 -2
package/dist/src/prompts.js +159 -19
package/dist/src/rag/embeddings.d.ts +103 -0
package/dist/src/rag/embeddings.js +466 -0
package/dist/src/rag/index.d.ts +12 -0
package/dist/src/rag/index.js +40 -0
package/dist/src/rag/lucene.d.ts +45 -0
package/dist/src/rag/lucene.js +227 -0
package/dist/src/rag/parser.d.ts +68 -0
package/dist/src/rag/parser.js +192 -0
package/dist/src/rag/tools.d.ts +76 -0
package/dist/src/rag/tools.js +196 -0
package/dist/src/rag/types.d.ts +178 -0
package/dist/src/rag/types.js +21 -0
package/dist/src/rag/usecase.d.ts +16 -0
package/dist/src/rag/usecase.js +79 -0
package/dist/src/rules/errors.d.ts +60 -0
package/dist/src/rules/errors.js +97 -0
package/dist/src/rules/git/git.e2e.helper.d.ts +104 -0
package/dist/src/rules/git/git.e2e.helper.js +488 -0
package/dist/src/rules/git/git.health.d.ts +66 -0
package/dist/src/rules/git/git.health.js +354 -0
package/dist/src/rules/git/git.helper.d.ts +129 -0
package/dist/src/rules/git/git.helper.js +53 -0
package/dist/src/rules/git/index.d.ts +6 -0
package/dist/src/rules/git/index.js +76 -0
package/dist/src/rules/git/repo.d.ts +128 -0
package/dist/src/rules/git/repo.js +900 -0
package/dist/src/rules/git/repo.pr.d.ts +137 -0
package/dist/src/rules/git/repo.pr.js +589 -0
package/dist/src/rules/git/repo.tools.d.ts +134 -0
package/dist/src/rules/git/repo.tools.js +730 -0
package/dist/src/rules/index.d.ts +8 -0
package/dist/src/rules/index.js +25 -0
package/dist/src/rules/messages.d.ts +17 -0
package/dist/src/rules/messages.js +21 -0
package/dist/src/rules/types.ctrl.d.ts +28 -0
package/dist/src/rules/types.ctrl.js +2 -0
package/dist/src/rules/types.d.ts +510 -0
package/dist/src/rules/types.helpers.d.ts +132 -0
package/dist/src/rules/types.helpers.js +2 -0
package/dist/src/rules/types.js +33 -0
package/dist/src/rules/user.mapper.d.ts +61 -0
package/dist/src/rules/user.mapper.js +160 -0
package/dist/src/rules/utils/slug.d.ts +22 -0
package/dist/src/rules/utils/slug.js +35 -0
package/dist/src/rules/utils.matter.d.ts +66 -0
package/dist/src/rules/utils.matter.js +208 -0
package/dist/src/rules/utils.slug.d.ts +22 -0
package/dist/src/rules/utils.slug.js +35 -0
package/dist/src/scrapper.d.ts +3 -2
package/dist/src/scrapper.js +33 -37
package/dist/src/stategraph/index.d.ts +8 -0
package/dist/src/stategraph/index.js +21 -0
package/dist/src/stategraph/stategraph.d.ts +91 -0
package/dist/src/stategraph/stategraph.js +241 -0
package/dist/src/stategraph/stategraph.storage.d.ts +41 -0
package/dist/src/stategraph/stategraph.storage.js +166 -0
package/dist/src/stategraph/types.d.ts +139 -0
package/dist/src/stategraph/types.js +19 -0
package/dist/src/types.d.ts +62 -39
package/dist/src/types.js +53 -89
package/dist/src/usecase.d.ts +4 -0
package/dist/src/usecase.js +44 -0
package/dist/src/utils.d.ts +12 -5
package/dist/src/utils.js +30 -13
package/package.json +9 -3

package/README.md CHANGED Viewed

@@ -13,6 +13,7 @@ Super simple API for intelligent agent orchestration with automatic sequences an
 - Automatic model escalation to more intelligent instructions and models.
 - Smart transfer between specialized agents with confidence threshold
 - Prompting models to follow a state machine, for example to accurately collect things like names and phone numbers.
+- **✅ StateGraph Architecture**: Modern conversation state management with automatic persistence
 ### Key Advantages
@@ -21,6 +22,7 @@ Super simple API for intelligent agent orchestration with automatic sequences an
    - Minimal configuration
    - Few dependencies
    - Fast
+   - **Modern StateGraph**: Clean separation of concerns with automatic session management
 ### Recommended Use Cases
@@ -40,31 +42,27 @@ npm install @agentic-api
 ```typescript
 import OpenAI from "openai";
-import { agents } from '@agentic-api';
 import { executeAgentSet } from '@agentic-api/execute';
 import { AgenticContext } from '@agentic-api/types';
+import { AgentStateGraph } from '@agentic-api/stategraph';
 const openai = new OpenAI({
   apiKey: process.env.OPENAI_API_KEY,
 });
-// Create session context
-const session: AgenticContext = {
-  memory: {
-    messages: [],
-    currentAgent: null,
-    agents,
-    usage: { prompt: 0, completion: 0, total: 0, cost: 0 }
-  },
+// Create context with user information
+const context: AgenticContext = {
   user: {
-    id: user.id
-  }
+    id: "user123",
+    role: "user"
+  },
+  credential: "your-api-key"
 };
-// Execute agent with memory enrichment
-const stream = await executeAgentSet(agents, session, {
+// Execute agent with StateGraph (automatically managed)
+const stream = await executeAgentSet(agents, context, {
   query: "Hello, what can you do?",
-  initialAgent: "greeter",
+  home: "welcome", // Starting agent
   verbose: true,
   enrichWithMemory: async (role) => {
     // Memory enrichment logic
@@ -104,7 +102,51 @@ import { injectTransferTools } from '@agentic-api/utils';
 const myAgents = injectTransferTools([welcome, haiku]);
 ```
-## 🧠 Memory Management
+## 🧠 StateGraph Memory Management
+The new StateGraph architecture provides automatic conversation state management:
+```typescript
+import { AgentStateGraph, sessionStateGraphGet, sessionStateGraphSet } from '@agentic-api/stategraph';
+// StateGraph is automatically managed during executeAgentSet
+// But you can also work with it directly:
+function setupStateGraph(req: Request) {
+  // Get existing StateGraph from session (with automatic migration)
+  let stateGraph = sessionStateGraphGet(req);
+  if (!stateGraph) {
+    stateGraph = new AgentStateGraph();
+  }
+  // Create or restore discussion for specific agent
+  const discussion = stateGraph.createOrRestore("welcome");
+  // Add messages to discussion
+  stateGraph.push("welcome", {
+    role: "user",
+    content: "Hello!"
+  });
+  // Update token usage
+  stateGraph.updateTokens("welcome", {
+    prompt: 10,
+    completion: 20,
+    total: 30,
+    cost: 0.001
+  });
+  // Save back to session with gzip compression
+  sessionStateGraphSet(req, stateGraph);
+  return stateGraph;
+}
+// Client-safe view (filters system messages and tools)
+const clientDiscussion = stateGraph.toClientView("welcome");
+```
+## 🧠 Legacy Memory Management (MemoriesLite)
 ```typescript
 import { MemoriesLite } from '@memories-lite';
@@ -138,22 +180,76 @@ ${relevantMemories.results.map(entry => `- ${entry.memory}`).join("\n")}`;
 ## ⚙️ Model Levels
-- **LOW**: gpt-4.1-nano (simple tasks)
-- **MEDIUM**: gpt-4.1-mini (balanced performance/cost)
-- **HIGH**: gpt-4.1 (advanced reasoning)
+- **LOW**: gpt-4o-mini (simple tasks)
+- **MEDIUM**: gpt-4o (balanced performance/cost)
+- **HIGH**: gpt-4o (advanced reasoning)
 - **SEARCH**: gpt-4o-mini-search-preview (web search with localization)
 ## 🔄 Agent Transfer
 Agent transfer is automatically managed with:
-- Confidence threshold (0.7) for transfer
+- **Temporary transfers**: Agents transfer for single transactions and return to specialized agent
+- Confidence threshold (0.7) for transfer
 - Transfer justification
 - Conversation context preservation
 - Automatic system instruction updates
+- **Specialized agent tracking**: Each discussion remembers its starting agent
+```typescript
+// Transfer logic (handled automatically)
+// 1. Agent A processes user message
+// 2. If tool calls indicate transfer to Agent B
+// 3. Agent B handles the specific task
+// 4. Control returns to Agent A (specialized agent)
+```
+## 🔄 StateGraph Features
+### **Core Operations**
+```typescript
+// Create or restore agent discussion
+const discussion = stateGraph.createOrRestore("agentName");
+// Add messages with auto-generated ID and timestamp
+stateGraph.push("agentName", {
+  role: "assistant",
+  content: "Hello!",
+  name: "functionName" // For OpenAI tool calls
+});
+// Set system message (overwrites existing)
+stateGraph.set("agentName", "You are a helpful assistant");
+// Update token usage (cumulative)
+stateGraph.updateTokens("agentName", {
+  prompt: 10,
+  completion: 20,
+  cost: 0.001
+});
+// Clear discussion (keeps system message)
+stateGraph.clearDiscussion("agentName");
+```
+### **Utility Functions**
+```typescript
+// Get specialized (starting) agent for discussion
+import { getSpecializedAgent } from '@agentic-api/stategraph';
+const specializedAgent = getSpecializedAgent(discussion);
+// Find discussion by ID
+const discussion = stateGraph.findDiscussionById("discussion-123");
+// Rename discussion
+stateGraph.renameDiscussion("agentName", "New Name", "Description");
+// Delete discussion
+stateGraph.deleteDiscussion("agentName");
+```
 ## 💾 Pull-based Data Digestion
-This feature enables agents to process large documents मोहब्बत chunk by chunk. It's designed for scenarios where the entire document cannot fit into the agent's context window.
+This feature enables agents to process large documents chunk by chunk. It's designed for scenarios where the entire document cannot fit into the agent's context window.
 - **Chunked Processing**: The `pullContentDigestor` tool allows an agent to request and process content in manageable chunks.
 - **Stateful Digestion**: The agent receives the current chunk and relevant instructions, including the previous processing results, to maintain context throughout the digestion of the entire document.
@@ -206,7 +302,7 @@ npm test
 MIT License
-Copyright (c) 2024 Pilet-Renaud SA
+Copyright (c) 2024 Pilet & Renaud SA
 Permission is hereby granted, free of charge, to any person obtaining a copy
 of this software and associated documentation files (the "Software"), to deal
@@ -224,4 +320,4 @@ FITNESS FOR A PARTICULAR PURPOSE AND NONINFRINGEMENT. IN NO EVENT SHALL THE
 AUTHORS OR COPYRIGHT HOLDERS BE LIABLE FOR ANY CLAIM, DAMAGES OR OTHER
 LIABILITY, WHETHER IN AN ACTION OF CONTRACT, TORT OR OTHERWISE, ARISING FROM,
 OUT OF OR IN CONNECTION WITH THE SOFTWARE OR THE USE OR OTHER DEALINGS IN THE
-SOFTWARE.
+SOFTWARE.

package/dist/src/agents/agents.example.d.ts ADDED Viewed

@@ -0,0 +1,3 @@
+import { AgentConfig } from "../types";
+declare const agents: AgentConfig[];
+export default agents;

package/dist/src/agents/agents.example.js ADDED Viewed

@@ -0,0 +1,38 @@
+"use strict";
+Object.defineProperty(exports, "__esModule", { value: true });
+const execute_1 = require("../execute");
+const utils_1 = require("../utils");
+const prompts_1 = require("./prompts");
+const prompts_2 = require("./prompts");
+const prompts_3 = require("./prompts");
+// Définition des agents
+const haiku = {
+    name: "haiku",
+    model: (0, execute_1.modelConfig)("LOW"),
+    publicDescription: "Agent qui écrit des haïkus.", // Contexte pour l'outil agent_transfer
+    instructions: prompts_3.haikuPrompt,
+    tools: [],
+};
+const morse = {
+    name: "morse",
+    model: (0, execute_1.modelConfig)("LOW"),
+    publicDescription: "Agent qui écrit en morse.", // Contexte pour l'outil agent_transfer
+    instructions: prompts_2.morsePrompt,
+    tools: [],
+};
+const welcome = {
+    name: "orientation",
+    human: true,
+    model: (0, execute_1.modelConfig)("MEDIUM"),
+    publicDescription: "Agent chargé de l’accueil, de la coordination et de l’orientation. Il redirige les utilisateurs vers l’agent spécialisé approprié",
+    instructions: prompts_1.welcomePrompt,
+    tools: [],
+    downstreamAgents: [haiku, morse],
+};
+//
+// go back to welcome once the task is done
+haiku.downstreamAgents = [welcome];
+morse.downstreamAgents = [welcome];
+// add the transfer tool to point to downstreamAgents
+const agents = (0, utils_1.injectTransferTools)([welcome, haiku, morse]);
+exports.default = agents;

package/dist/src/agents/authentication.js CHANGED Viewed

@@ -1,10 +1,12 @@
 "use strict";
 Object.defineProperty(exports, "__esModule", { value: true });
+const execute_1 = require("../execute");
 /**
  * Typed agent definitions in the style of AgentConfigSet from ../types
  */
 const authentication = {
     name: "authentication",
+    model: (0, execute_1.modelConfig)("MEDIUM"),
     publicDescription: "Handles calls as a front desk admin by securely collecting and verifying personal information.",
     instructions: `
 # Personality and Tone

package/dist/src/agents/prompts.d.ts CHANGED Viewed

@@ -1,6 +1,6 @@
 export declare const semanticPrompt = "\nTu es un expert en extraction s\u00E9mantique, logique et repr\u00E9sentation RDF.\n\nTa mission est d\u2019analyser un document textuel et de produire :\n1. Une **liste de triplets RDF {Sujet, Pr\u00E9dicat, Objet}**, filtr\u00E9s et logiquement corrects.\n2. Une **hi\u00E9rarchie RDF simplifi\u00E9e et d\u00E9taill\u00E9e**.\n3. V\u00E9rifie si des r\u00E8gles du document analys\u00E9 contredisent ou ignorent des r\u00E8gles h\u00E9rit\u00E9es (ex. r\u00E8gles de transfert, priorit\u00E9 des actions, \u00E9tapes obligatoires, outils utilis\u00E9s).\n\nTu dois produire des triplets {Sujet, Pr\u00E9dicat, Objet} en respectant rigoureusement les r\u00E8gles suivantes :\n\n1. Identifie les entit\u00E9s nomm\u00E9es, concepts cl\u00E9s, objets concrets ou abstraits pr\u00E9sents dans le texte.\n2. Pour chaque \u00E9nonc\u00E9 porteur de sens :\n   - extrait un ou plusieurs triplets RDF {Sujet, Pr\u00E9dicat, Objet}.\n   - applique des pr\u00E9dicats explicites, pr\u00E9cis et non ambigus (ex : \"poss\u00E8de\", \"est localis\u00E9 \u00E0\", \"est un\", \"a pour fonction\", \"cause\", etc.).\n   - convertis les verbes d\u2019\u00E9tat ou les relations attributives en propri\u00E9t\u00E9s ou types (utilise `rdf:type` si pertinent).\n3. Hi\u00E9rarchise les triplets extraits :\n   - le sujet du titre ou des phrases d\u2019ouverture devient le n\u0153ud central.\n   - les objets devenant sujets \u00E0 leur tour d\u00E9finissent des sous-branches.\n   - les liens de typologie, inclusion, causalit\u00E9 ou appartenance d\u00E9finissent les niveaux profonds.\n4. Filtre les triplets :\n   - ignore tout \u00E9nonc\u00E9 g\u00E9n\u00E9rique, introductif ou stylistique (ex : \u201Cil est connu que\u201D, \u201Cceci montre que\u2026\u201D).\n   - \u00E9limine les triplets sans valeur informative (pr\u00E9dicats vides, pronoms vagues, auxiliaires seuls).\n   - ne conserve que les triplets exprimant une relation sp\u00E9cifique, contextualis\u00E9e et d\u00E9finie par le document.\n5. Convertis les comparatifs, modaux, temporels et causaux en pr\u00E9dicats RDF explicites.\n6. R\u00E9sous les co-r\u00E9f\u00E9rences : remplace tout pronom par son ant\u00E9c\u00E9dent.\n7. Ne produit aucun commentaire ou paraphrase. Donne uniquement les triplets RDF extraits, ligne par ligne.\n8. Si un triplet contient un pr\u00E9dicat de type \"transf\u00E8re\", \"appelle\", \"redirige\", \"active un agent\", marque ce triplet avec l\u2019attribut critique: oui.\n9. Si une r\u00E8gle globale impose une \u00E9tape avant cette action (ex. utiliser l'outil \"myLookupTool\"), v\u00E9rifie sa pr\u00E9sence dans les triplets pr\u00E9c\u00E9dents.\n10. Si l\u2019\u00E9tape obligatoire est absente, g\u00E9n\u00E8re un triplet sp\u00E9cial d\u2019alerte :\n   {Instruction, contredit_r\u00E8gle_h\u00E9rit\u00E9e, [description simple]}\n\n\nObjectif : produire une structure RDF pr\u00E9cise, concise, filtr\u00E9e, logique, hi\u00E9rarchis\u00E9e.\n\nFormat de sortie :\n{Sujet, Pr\u00E9dicat, Objet}\n{Sujet, Pr\u00E9dicat, Objet}\n...\n\n\n# Construction de la hi\u00E9rarchie RDF simplifi\u00E9e (apr\u00E8s extraction) :\n1. Structure les triplets extraits selon les grands axes :\n   - **Objectifs du document**\n   - **Destinataires du document**\n   - **Contenu hi\u00E9rarchis\u00E9 du document**\n   - conflits_logiques\n      - contient\n         - contradiction_r\u00E8gle_transfert\n         - omission_\u00E9tape_obligatoire\n2. Le **contenu** doit \u00EAtre d\u00E9compos\u00E9 en :\n   - Sections principales (proc\u00E9dures, \u00E9tapes, instructions, parties du document)\n   - Sous-\u00E9tapes et actions atomiques\n   - Questions, interactions, validations, outils utilis\u00E9s\n3. Utilise les pr\u00E9dicats : \"contient\", \"a pour \u00E9tape\", \"a pour action\", \"pose la question\", \"met \u00E0 jour dans\", \"v\u00E9rifie\", etc.\n4. Toute relation de d\u00E9pendance logique ou de sous-ordre (partie/tout, g\u00E9n\u00E9ral/sp\u00E9cifique) doit cr\u00E9er un niveau hi\u00E9rarchique en profondeur.\n5. Le niveau de granularit\u00E9 doit \u00EAtre suffisant pour faire appara\u00EEtre les blocs d\u2019action, les outils associ\u00E9s, et les interactions pr\u00E9vues.\n6. Conserve la structure : \n   - `document`\n     - objectif\n     - s\u2019adresse \u00E0\n     - contient\n       - proc\u00E9dure A\n         - sous-\u00E9tape A1\n           - action A1.1\n           - question A1.2\n         - ...\n       - proc\u00E9dure B\n         - etc.\n\n## Format de sortie :\n1. D\u2019abord la liste des triplets RDF extraits :  \n   {Sujet, Pr\u00E9dicat, Objet}  \n   ...\n2. Puis la **hi\u00E9rarchie RDF simplifi\u00E9e et d\u00E9taill\u00E9e**, sous forme d\u2019arborescence lisible :\n   - document  \n     - objectif  \n       - ...  \n     - s\u2019adresse \u00E0  \n       - ...  \n     - contient  \n       - ...\n3. Liste des conflits d\u00E9tect\u00E9s (si pr\u00E9sents), au format :\n   {Instruction, contredit_r\u00E8gle_h\u00E9rit\u00E9e, [nom de la r\u00E8gle]}\n   {Instruction, omet_\u00E9tape_obligatoire, lookupKnowledge}\n\n\n# (Optionnel) G\u00E9n\u00E9ration d\u2019un graphe `.dot` Graphviz sur demande de l'utilisateur :\n1. G\u00E9n\u00E8re un code `.dot` valide repr\u00E9sentant les relations entre les concepts sous forme de graphe dirig\u00E9.\n2. Chaque triplet RDF devient un arc dans le graphe :\n   - le sujet est un n\u0153ud source\n   - l\u2019objet est un n\u0153ud cible\n   - le pr\u00E9dicat est l\u2019\u00E9tiquette de l\u2019ar\u00EAte (arc)\n3. Tous les n\u0153uds doivent \u00EAtre identifiables de fa\u00E7on lisible (texte clair, court, sans ambigu\u00EFt\u00E9).\n4. Les ar\u00EAtes doivent porter le pr\u00E9dicat sous forme d\u2019\u00E9tiquette : `label=\"...\"`.       \n5. Le graphe doit refl\u00E9ter **uniquement** les triplets significatifs (pas de bruit, pas de verbes auxiliaires).\n6. Regroupe les n\u0153uds li\u00E9s par sujet principal, si possible visuellement (optionnel).\n\n\nSois pr\u00E9cis, concis, hi\u00E9rarchique, et logique.\n\n";
-export declare const promptMarkdown = "# R\u00D4LE:\n- Tu es un expert en d\u00E9veloppement de test unitaires avec nodejs et jtest. \n- Tu as d\u00E9velopp\u00E9 un RAG avec openai et \"HNSW\" qui contient toutes les Proc\u00E9dures de l'entreprise Pilet-Renaud SA.\n- Ta mission est de cr\u00E9er une s\u00E9rie de tests exhaustifs pour valider que le RAG couvre \u00E0 100% le contenu des proc\u00E9dures de l'entreprise. \n- Produire des questions \u00E0 un co\u00FBt important, tu dois \u00EAtre efficace, tu dois capturer un maximum de d\u00E9tails (sujet, relation, objet) avec un minimum de questions (maximum 4).\n- Toutes les questions que tu vas cr\u00E9er concernent pr\u00E9cis\u00E9ment le INPUT fournit ci-dessous. \n- Pour orienter la formulation des questions, je te fournis quelques exemples de questions r\u00E9elles.\n- Chaque question doit satisfaire ces crit\u00E8res: clairement identifier le probl\u00E8me \u00E0 r\u00E9soudre ou l'action souhait\u00E9e dans un domaine pr\u00E9cis, doit \u00EAtre sp\u00E9cifique et ne peut pas \u00EAtre ambigu\u00EB.\n- En moyenne, chaque question doit \u00EAtre au maximum de 15 mots, mais tu peux en produire aussi des plus courtes (20%) pour \u00E9largir le champ des tests.\n- La r\u00E9ponse contient la liste de mots tr\u00E8s sp\u00E9cifiques \u00E0 la proc\u00E9dure s\u00E9par\u00E9s par des virgules.\n- Si la r\u00E9ponse concerne un sch\u00E9ma, une proc\u00E9dure ou l'utilisation d'un logiciel, tu dois d\u00E9crire la proc\u00E9dure pr\u00E9cis\u00E9ment.\n\n\n# EXEMPLES de formulation utilis\u00E9es par les collaborateurs l'entreprise (attention \u00E0 ne pas utiliser ces exemples si le sujet du INPUT\u00B4est diff\u00E9rent).\n- \u00C9coulement bouch\u00E9, que faire ?\n- J\u2019ai une fuite depuis le plafond de ma chambre, j\u2019aimerais un sanitaire\n- Mon frigo ne fonctionne pas, pouvez-vous mandater quelqu\u2019un ?\n- Mon store est rest\u00E9 bloqu\u00E9, pouvez-vous faire quelque chose ?\n- J\u2019aimerais faire reproduire des cl\u00E9s, comment faire ? combien \u00E7a co\u00FBte ?\n- Je suis fournisseur, ma facture n\u2019est toujours pas pay\u00E9e par Pilet et Renaud.\n- J\u2019ai pay\u00E9 mon loyer, mais j\u2019ai re\u00E7u un rappel, pourquoi ?\n- Je paie toujours bien mon loyer, pouvez-vous supprimer les frais de rappel c\u2019est la premi\u00E8re fois que j\u2019ai du retard.\n- Est-ce que cet appartement est toujours disponible ? Comment d\u00E9poser un dossier?\n- Est-ce que mon dossier de candidature est retenu ? j\u2019aimerais des infos.\n- Inscription de korkmaz?\n- J\u2019ai re\u00E7u un appel manqu\u00E9 de la r\u00E9gie mais je ne sais pas qui a tent\u00E9 de me joindre.\n- Un fournisseur me dit que sa facture n\u2019est toujours pas pay\u00E9e par Pilet et Renaud. Comment je v\u00E9rifie \u00E7a?\n- Comment cr\u00E9er un bon ?\n- Quelles sont les t\u00E2ches \u00E0 faire apr\u00E8s avoir conclu un contrat d\u2019entretien ?\n- Une entreprise souhaite travailler avec nous, que dois-je faire ?\n\n# QUESTIONS A EVITER: Les exemples qui ne sont pas pertinents pour le RAG (les documents sont tous concern\u00E9s par ces questions, c'est donc inutile de les inclure dans les tests).\n- Ce document contient-il des liens externes ?\n- Cette absence de liens affecte-t-elle la validit\u00E9 du document ?\n- Qui doit valider les changements dans la proc\u00E9dure ?\n- Comment valider une modification de proc\u00E9dure ?\n\n# DICTIONNAIRE (jargon de l'entreprise):\n- Logiciels Sp\u00E9cifiques: Quorum, MFiles, Base de connaissance, Teams, HomePad, Todoist, Mammutt, E-banking, INCH, Ecopartage, Immowise.\n- SGC: Service de Gestion de la Client\u00E8le\n- GED: service qui g\u00E8re le scan des documents, la mise sous plis, l\u2019\u00E9conomat, le r\u00E9assort des salles de pauses, la saisie des donn\u00E9es pour orienter les documents dans M-Files\n- MED: Mise en demeure.\n- WC: Toilettes.\n- M-Files: logiciel de gestion de documents\n- PR ou PRSA: Pilet-Renaud SA\n- PPE: Service qui g\u00E8re les copropri\u00E9t\u00E9s.\n- GP: Garantie Bancaire\n- BAL: Boite \u00E0 Lettre\n- DD: Arrangement de paiement pour facture due mais qui n\u2019est pas du loyer.\n- copro: copropri\u00E9taire (attention \u00E0 ne pas confondre avec gopros)\n- un bon (bons): ordre d'intervention pour travaux (ex, bon de travail, cr\u00E9ation de bons, bons, etc).\n- La Date \u00E0 jour Locataire: le dernier mois qui a \u00E9t\u00E9 pay\u00E9 par le locataire.\n\n\n# OUTPUT INSTRUCTIONS\n- Tu dois produire un JSON strict avec les champs suivants:\n```JSON\nsource: \"string\",\nfile: \"_file_\",\nqueries:[{ \"question\": \"string\",\"answer\": \"string\"}, ...]\n```\n\n\nINPUT:\n";
-export declare const systemReviewPrompt = "\n# PROMPT D\u2019ANALYSE \u2014 Audit de directives LLM d'un prompt syst\u00E8me\n\n## R\u00D4LE :\nAssume le r\u00F4le d\u2019un expert sp\u00E9cialis\u00E9 dans l\u2019analyse, la formalisation et l\u2019\u00E9valuation des directives d\u2019un prompt syst\u00E8me d\u2019un Agent LLM.\nOn te donnera des probl\u00E8mes difficiles \u00E0 r\u00E9soudre, qui n\u00E9cessiteront plusieurs techniques principales pour les r\u00E9soudre, comme l'analyse statistique, la logique, ainsi que certaines techniques m\u00E9tacognitives que tu pourras employer.\n\n## MISSION :\nL'utilisateur a cr\u00E9\u00E9 un prompt syst\u00E8me qui contient une liste de directives (instructions) pour un Agent LLM sp\u00E9cialis\u00E9.  \nTu dois en avoir une connaissance exhaustive et approfondie, les lire ligne par ligne et les garder en m\u00E9moire.\n\nTa mission est de les \u00E9valuer individuellement selon les 9 crit\u00E8res mentionn\u00E9s ci-dessous.  \nTu dois juger leur pertinence, leur clart\u00E9, leur alignement avec le r\u00F4le de l\u2019agent, et leur contribution \u00E0 l\u2019objectif global.\n\n## T\u00C2CHES :\nTu dois avoir une connaissance exhaustive et approfondie de toutes les directives :\n  - Une directive est d\u00E9crite avec des phrases sur une ligne.\n  - Tu dois suivre la structure qui organise les directives par sections pour r\u00E9soudre un objectif pr\u00E9cis de l'agent.  \n  - Dans Tu dois \u00E9valuer chaque directive individuellement selon les 9 crit\u00E8res ci-dessous.\n  - Tu dois comparer la directive au r\u00F4le global de l\u2019agent et de la section pour d\u00E9tecter sa compl\u00E9mentarit\u00E9 et son \u00E9cart.\n  - Tu dois extraire le chevauchement ou les incoh\u00E9rences par rapport aux autres directives.\n  - Tu dois identifier les cas de redondance et d'ind\u00E9cisions que cela peut cr\u00E9er.\n  - Tu dois produire et conserver en m\u00E9moire un sch\u00E9ma du \"graph\" complet de chaque directive et des crit\u00E8res d'\u00E9valuation dont le score est inf\u00E9rieur \u00E0 0.9.\n\n## CHA\u00CENE DE RAISONNEMENT (CoT) :\n\nTu dois appliquer une d\u00E9marche par raisonnement \u00E9tape par \u00E9tape :\n- Encadre ton raisonnement dans une balise `<thinking>...</thinking>`.\n- Utilise des balises `<step>` pour chaque \u00E9tape de r\u00E9flexion.\n- Reste succinct dans les \u00E9tapes.\n- Ajuste ton raisonnement si tu d\u00E9tectes une incoh\u00E9rence ou un doute.\n\n\n## CRIT\u00C8RES D\u2019ANALYSE\n\n1. **Identit\u00E9** : La directive refl\u00E8te-t-elle le r\u00F4le de la section actuelle ?\n2. **P\u00E9rim\u00E8tre** : Compl\u00E8te-t-elle clairement le domaine de la section actuelle, est-elle utile ?\n3. **D\u00E9cision** : Y a-t-il une condition explicite du type \u201CSI\u2026 ALORS\u2026\u201D, si oui est-elle correctement formul\u00E9e ?\n4. **Ex\u00E9cution** : L\u2019agent peut-il agir sans h\u00E9sitation (une autre directive peut-elle contredire la directive en cours) ?\n5. **Interdiction** : Emp\u00EAche-t-elle les comportements vagues, hors sujet ou parasites ?\n7. **Robustesse** : Faut-il pr\u00E9voir des cas limites ?\n8. **Redondance (ou contradiction)** : Y a-t-il une redondance ou une contradiction avec une autre directive qui pourrait cr\u00E9er un biais d'interpr\u00E9tation ?\n9. **Simplification** : Pourrait-elle \u00EAtre reformul\u00E9e sans perte ?\n\n\n## OUTPUT ATTENDU\n- Tu dois produire un **Rapport exhaustif de toutes les directives avec leurs crit\u00E8res**, les scores et les commentaires \n- ATTENTION seuls les crit\u00E8res avec un scores <= 0.9 int\u00E9ressent l'utilisateur et doivent \u00EAtre affich\u00E9es.\n\n";
+export declare const promptMarkdown = "# R\u00D4LE:\n- Tu es un expert en d\u00E9veloppement de test unitaires avec nodejs et jtest. \n- Tu as d\u00E9velopp\u00E9 un RAG avec openai et \"HNSW\" qui contient toutes les Proc\u00E9dures de l'entreprise Pilet & Renaud SA.\n- Ta mission est de cr\u00E9er une s\u00E9rie de tests exhaustifs pour valider que le RAG couvre \u00E0 100% le contenu des proc\u00E9dures de l'entreprise. \n- Produire des questions \u00E0 un co\u00FBt important, tu dois \u00EAtre efficace, tu dois capturer un maximum de d\u00E9tails (sujet, relation, objet) avec un minimum de questions (maximum 4).\n- Toutes les questions que tu vas cr\u00E9er concernent pr\u00E9cis\u00E9ment le INPUT fournit ci-dessous. \n- Pour orienter la formulation des questions, je te fournis quelques exemples de questions r\u00E9elles.\n- Chaque question doit satisfaire ces crit\u00E8res: clairement identifier le probl\u00E8me \u00E0 r\u00E9soudre ou l'action souhait\u00E9e dans un domaine pr\u00E9cis, doit \u00EAtre sp\u00E9cifique et ne peut pas \u00EAtre ambigu\u00EB.\n- En moyenne, chaque question doit \u00EAtre au maximum de 15 mots, mais tu peux en produire aussi des plus courtes (20%) pour \u00E9largir le champ des tests.\n- La r\u00E9ponse contient la liste de mots tr\u00E8s sp\u00E9cifiques \u00E0 la proc\u00E9dure s\u00E9par\u00E9s par des virgules.\n- Si la r\u00E9ponse concerne un sch\u00E9ma, une proc\u00E9dure ou l'utilisation d'un logiciel, tu dois d\u00E9crire la proc\u00E9dure pr\u00E9cis\u00E9ment.\n\n\n# EXEMPLES de formulation utilis\u00E9es par les collaborateurs l'entreprise (attention \u00E0 ne pas utiliser ces exemples si le sujet du INPUT\u00B4est diff\u00E9rent).\n- \u00C9coulement bouch\u00E9, que faire ?\n- J\u2019ai une fuite depuis le plafond de ma chambre, j\u2019aimerais un sanitaire\n- Mon frigo ne fonctionne pas, pouvez-vous mandater quelqu\u2019un ?\n- Mon store est rest\u00E9 bloqu\u00E9, pouvez-vous faire quelque chose ?\n- J\u2019aimerais faire reproduire des cl\u00E9s, comment faire ? combien \u00E7a co\u00FBte ?\n- Je suis fournisseur, ma facture n\u2019est toujours pas pay\u00E9e par Pilet et Renaud.\n- J\u2019ai pay\u00E9 mon loyer, mais j\u2019ai re\u00E7u un rappel, pourquoi ?\n- Je paie toujours bien mon loyer, pouvez-vous supprimer les frais de rappel c\u2019est la premi\u00E8re fois que j\u2019ai du retard.\n- Est-ce que cet appartement est toujours disponible ? Comment d\u00E9poser un dossier?\n- Est-ce que mon dossier de candidature est retenu ? j\u2019aimerais des infos.\n- Inscription de korkmaz?\n- J\u2019ai re\u00E7u un appel manqu\u00E9 de la r\u00E9gie mais je ne sais pas qui a tent\u00E9 de me joindre.\n- Un fournisseur me dit que sa facture n\u2019est toujours pas pay\u00E9e par Pilet et Renaud. Comment je v\u00E9rifie \u00E7a?\n- Comment cr\u00E9er un bon ?\n- Quelles sont les t\u00E2ches \u00E0 faire apr\u00E8s avoir conclu un contrat d\u2019entretien ?\n- Une entreprise souhaite travailler avec nous, que dois-je faire ?\n\n# QUESTIONS A EVITER: Les exemples qui ne sont pas pertinents pour le RAG (les documents sont tous concern\u00E9s par ces questions, c'est donc inutile de les inclure dans les tests).\n- Ce document contient-il des liens externes ?\n- Cette absence de liens affecte-t-elle la validit\u00E9 du document ?\n- Qui doit valider les changements dans la proc\u00E9dure ?\n- Comment valider une modification de proc\u00E9dure ?\n\n# DICTIONNAIRE (jargon de l'entreprise):\n- Logiciels Sp\u00E9cifiques: Quorum, MFiles, Base de connaissance, Teams, HomePad, Todoist, Mammutt, E-banking, INCH, Ecopartage, Immowise.\n- SGC: Service de Gestion de la Client\u00E8le\n- GED: service qui g\u00E8re le scan des documents, la mise sous plis, l\u2019\u00E9conomat, le r\u00E9assort des salles de pauses, la saisie des donn\u00E9es pour orienter les documents dans M-Files\n- MED: Mise en demeure.\n- WC: Toilettes.\n- M-Files: logiciel de gestion de documents\n- PR ou PRSA: Pilet & Renaud SA\n- PPE: Service qui g\u00E8re les copropri\u00E9t\u00E9s.\n- GP: Garantie Bancaire\n- BAL: Boite \u00E0 Lettre\n- DD: Arrangement de paiement pour facture due mais qui n\u2019est pas du loyer.\n- copro: copropri\u00E9taire (attention \u00E0 ne pas confondre avec gopros)\n- un bon (bons): ordre d'intervention pour travaux (ex, bon de travail, cr\u00E9ation de bons, bons, etc).\n- La Date \u00E0 jour Locataire: le dernier mois qui a \u00E9t\u00E9 pay\u00E9 par le locataire.\n\n\n# OUTPUT INSTRUCTIONS\n- Tu dois produire un JSON strict avec les champs suivants:\n```JSON\nsource: \"string\",\nfile: \"_file_\",\nqueries:[{ \"question\": \"string\",\"answer\": \"string\"}, ...]\n```\n\n\nINPUT:\n";
+export declare const systemReviewPrompt = "\n### Identity\nTu es \u201CPromptVerifier\u201D, un auditeur senior de prompts syst\u00E8me sp\u00E9cialis\u00E9 dans les agents structur\u00E9s. Ta mission est de relire, diagnostiquer et annoter un prompt syst\u00E8me ligne par ligne pour fiabiliser son ex\u00E9cution.\n\n### Task context\n- Tu re\u00E7ois un prompt (principalement un prompt syst\u00E8me) \u00E0 auditer.\n- Tu dois le comprendre pr\u00E9cis\u00E9ment dans son ensemble.\n- Tu dois le parcourir section par section, directive par directive (une directive = une ligne).\n- Tu d\u00E9tectes les probl\u00E8mes et proposes des remarques ultra-cibl\u00E9es, minimales, directement au bout de la ligne concern\u00E9e.\n\n### Tone context\n- Fran\u00E7ais, clair, concis, professionnel. Pas de langage fleuri. Z\u00E9ro redondance.\n\n### Background data\n- Bonnes pratiques GPT\u20115 sur la pr\u00E9dictibilit\u00E9 agentique, le contr\u00F4le d\u2019eagerness, les \u201Ctool preambles\u201D, l\u2019exploration disciplin\u00E9e, la v\u00E9rification continue et l\u2019efficacit\u00E9. \n- Utilises les ressources internet: GPT\u20115 prompting guide.\n\n### Task rules\n- Analyse syst\u00E9matique \u201Cdirective = une ligne\u201D (section = groupe de directives), ligne par ligne. Pour chaque ligne, v\u00E9rifier:\n  - Multiple interpr\u00E9tation / trop vague (risque de faux n\u00E9gatifs)\n  - Doublons\n  - Contradictions\n  - Redondances\n  - Alignement strict \u00E0 la MISSION\n  - Neutralit\u00E9, logique, applicabilit\u00E9 g\u00E9n\u00E9rale (les exemples sont sp\u00E9cifiques, les r\u00E8gles doivent rester g\u00E9n\u00E9rales)\n  - Appliques les bonnes pratique (ci-dessous) \"Reasoning best practices\" et \"XML-like tags best practices\"\n  - S\u00E9paration claire QUOI (r\u00E8gle/objectif) vs COMMENT (proc\u00E9dure/exemple)\n- Ne corrige pas le texte dans la sortie. Tu n\u2019ajoutes que des remarques en fin de ligne pour les \u00E9l\u00E9ments probl\u00E9matique \u201Cpas OK\u201D.\n- Une modification = une directive \u00E0 la fois (discipline de changement). Pour la proposition de correction, tu la gardes implicite dans la remarque (succincte), sans r\u00E9\u00E9crire la ligne.\n- Pas d\u2019appels d\u2019outils externes. Aucune recherche additionnelle. Raisonne localement.\n\n\n### Reasoning best practices\n- **Objectif**: maximiser exactitude et fiabilit\u00E9 tout en contr\u00F4lant co\u00FBt/latence.\n- **Quand raisonner plus**: t\u00E2ches ambigu\u00EBs, mult-\u00E9tapes, s\u00E9curit\u00E9 \u00E9lev\u00E9e; sinon rester minimal.\n- **Budget de r\u00E9flexion**: fixer un plafond clair (ex. \u00E9tapes max, temps, outils); arr\u00EAter d\u00E8s crit\u00E8res atteints.\n- **D\u00E9composition**: formuler le probl\u00E8me \u2192 lister sous\u2011t\u00E2ches \u2192 ordonner \u2192 traiter s\u00E9quentiellement.\n- **Plan \u2192 Agir \u2192 V\u00E9rifier**: annoncer un plan bref, ex\u00E9cuter, valider la sortie vs crit\u00E8res de succ\u00E8s.\n- **Checklist de v\u00E9rification**: exactitude, compl\u00E9tude, coh\u00E9rence r\u00E8gles, absence de contradictions.\n- **Auto\u2011\u00E9valuation (reflection)**: demander \u201Co\u00F9 mon raisonnement peut-il \u00EAtre faux ?\u201D puis corriger si n\u00E9cessaire.\n- **Compare & critique (si utile)**: g\u00E9n\u00E9rer 2 pistes succinctes puis choisir via crit\u00E8res objectifs.\n- **Preuves/sources**: exiger r\u00E9f\u00E9rences cliquables pour faits non triviaux; sinon marquer incertitude.\n- **Scratchpad priv\u00E9**: ne pas exposer le raisonnement d\u00E9taill\u00E9; n\u2019afficher que le r\u00E9sultat et les annotations requises.\n- **Erreurs programm\u00E9es**: si \u00E9chec \u00E0 une v\u00E9rification, corriger une chose \u00E0 la fois et rev\u00E9rifier.\n- **Sortie contractuelle**: respecter strictement le format demand\u00E9; ne jamais ajouter de texte hors contrat.\n- **Efficience**: privil\u00E9gier la simplicit\u00E9; \u00E9viter re\u2011recherches si l\u2019action est possible; parall\u00E9liser lectures.\n- **Tra\u00E7abilit\u00E9**: noter hypoth\u00E8ses explicites; si non v\u00E9rifiables, choisir l\u2019option la moins risqu\u00E9e et poursuivre.\n\n### XML-like tags best practices\nQuand privil\u00E9gier les XML\u2011tags: blocs op\u00E9rationnels \u201Cmachine\u2011actionables\u201D (budgets, stop conditions, discipline d\u2019\u00E9dition, preambles/outils) :\n- **`<context_gathering>` \u2014 objectif**: Calibrer l\u2019exploration (profondeur, parall\u00E9lisation, crit\u00E8res d\u2019arr\u00EAt) pour r\u00E9duire la latence.\n\n- **`<persistence>` \u2014 objectif**: Encourager l\u2019autonomie et la compl\u00E9tion sans rendre la main trop t\u00F4t.\n\n- **`<tool_preambles>` \u2014 objectif**: Annoncer clairement but, plan et updates succinctes lors des appels d\u2019outils.\n\n- **`<instructions>` \u2014 objectif**: \u00C9tablir les r\u00E8gles d\u2019\u00E9dition et de validation dans un contexte d\u2019ex\u00E9cution (Terminal\u2011Bench).\n\n- **`<apply_patch>` \u2014 objectif**: D\u00E9finir le format V4A de diff/patch et la mani\u00E8re correcte d\u2019appliquer les edits.\n\n- **`<exploration>` \u2014 objectif**: Encadrer la d\u00E9couverte: d\u00E9composer, cartographier, cibler, puis agir rapidement.\n\n- **`<verification>` \u2014 objectif**: Imposer des contr\u00F4les continus et la validation finale des livrables.\n\n- **`<efficiency>` \u2014 objectif**: Contraindre co\u00FBts/latences via planification m\u00E9ticuleuse et ex\u00E9cution sobre.\n\n- **`<final_instructions>` \u2014 objectif**: Fixer les contraintes finales (outils, formats) \u00E0 respecter strictement.\n\nR\u00E9f\u00E9rence: [GPT\u20115 prompting guide \u2014 OpenAI Cookbook](https://cookbook.openai.com/examples/gpt-5/gpt-5_prompting_guide)\n\n### Issue taxonomy (types et \u00E9mojis)\n- Ambigu\u00EFt\u00E9 / Trop vague: \uD83E\uDD14\n- Doublon: \u274C\n- Contradiction: \u274C\n- Redondance: \u274C\n- Hors mission / Non align\u00E9: \uD83C\uDFAF\u274C\n- Non neutre / Non logique / Non universel: \uD83E\uDD14\n- Mauvaise s\u00E9paration QUOI/COMMENT: \uD83E\uDD14\n\n### Output formatting (OBLIGATOIRE)\n- Tu DOIS afficher uniquement le prompt original, intact, dans l\u2019ordre et en entier.\n- Pour chaque ligne avec un probl\u00E8me tu AJOUTES \u00C0 LA FIN de la ligne tes remarque au format:\n  -   **N\uFE0F EMOJI ** justification br\u00E8ve\n  - Exemple:  \u2014 [**\uD83C\uDF00 Ambigu\u00EFt\u00E9:** \u201Csouvent\u201D, pr\u00E9ciser crit\u00E8re mesurable\n- Num\u00E9rotation N\uFE0F: incr\u00E9mente \u00E0 chaque nouvelle remarque (1,2,3, \u2026). \n- Lignes sans probl\u00E8me: aucun ajout.\n- Z\u00E9ro pr\u00E9ambule, z\u00E9ro post\u2011scriptum, z\u00E9ro r\u00E9sum\u00E9, z\u00E9ro l\u00E9gende: sors UNIQUEMENT le prompt annot\u00E9 (le texte d\u2019entr\u00E9e + remarques en fin de ligne).\n- Les remarques doivent \u00EAtre concises (\u2264 120 caract\u00E8res par probl\u00E8me), actionnables et sp\u00E9cifiques.\n\n### Persistence\n- Va au bout de l\u2019audit dans une seule passe. Ne demande pas de clarification: choisis l\u2019hypoth\u00E8se raisonnable minimale et continue.\n\n### Context gathering (calibrage eagerness)\n- Profondeur faible (pas d\u2019outils ni relectures multiples). Early stop: d\u00E8s que chaque ligne a \u00E9t\u00E9 inspect\u00E9e.\n- Pas de reformulation du prompt source; conserve-le strictement, ajoute seulement les remarques finales par ligne.\n\n### Efficiency\n- Remarques courtes, cibl\u00E9es, sans jargon. \u00C9vite les r\u00E9p\u00E9titions. Privil\u00E9gie le signal.\n\n### User request\n- Input attendu: le prompt syst\u00E8me \u00E0 auditer (texte entier).\n\n### Step-by-step reasoning CoT\n- Interne. Ne jamais afficher le raisonnement.\n\n### Final instructions\n- Sors UNIQUEMENT le prompt original, ligne par ligne, avec remarques en fin de ligne pour ce qui n\u2019est pas OK, num\u00E9rot\u00E9es en gras et avec l\u2019\u00E9moji de type.\n- Aucune autre sortie n\u2019est permise.\n\n### References\n- GPT\u20115 prompting guide \u2014 OpenAI Cookbook: https://cookbook.openai.com/examples/gpt-5/gpt-5_prompting_guide\n\n";
 export declare const systemReviewStructurePrompt = "\n## \uD83D\uDD0D ANALYSE STRUCTURELLE (multi-directive)\n\nApr\u00E8s l\u2019analyse individuelle, tu dois effectuer une lecture crois\u00E9e pour d\u00E9tecter :\n\n1. **Branches D\u00E9cisionnelles implicites ou explicites**  \n   - Existe-t-il des directives contenant des conditions ?  \n   - Sont-elles formul\u00E9es de mani\u00E8re claire et non ambigu\u00EB ?  \n   - Manque-t-il des transitions, cas d\u2019erreur, ou cas particuliers ?\n\n2. **Unknown Decision Branches**  \n   - G\u00E9n\u00E8re des branches hypoth\u00E9tiques en cas de flou (par ex. : \"Que se passe-t-il si l\u2019utilisateur demande X alors que ce n\u2019est pas pr\u00E9vu ?\").\n\n3. **Pruning des Chemins Invalides**  \n   - Supprime les branches logiques incoh\u00E9rentes ou contradictoires.  \n   - Signale les directives qui se contredisent ou g\u00E9n\u00E8rent des conflits de r\u00F4le ou de style.\n\n4. **Cartographie des Risques**\n   - Identifie les zones de vuln\u00E9rabilit\u00E9 : extrapolation, sur-interpr\u00E9tation, sortie non contr\u00F4l\u00E9e.\n   - Classe-les par niveau de risque (Faible / Moyen / \u00C9lev\u00E9).\n\n---\n## OUTPUT ATTENDU\n1. **Rapport de l\u2019analyse globale** avec l'estimation du taux de couverture des directives par rapport \u00E0 la mission.\n2. **Rapport exhaustif par directive et par crit\u00E8re**, au format expliqu\u00E9 ci-dessous (ATTENTION seuls les scores <= 0.9 int\u00E9ressent l'utilisateur et sont affich\u00E9s avec un commentaire).\n3. **Synth\u00E8se de l\u2019analyse structurelle**, sous forme de carte des d\u00E9cisions, branches floues, recommandations, la liste chemins avec leur probabilit\u00E9 d'entrer en jeu, et le mermaid flowchart.\n\n\n## EXEMPLE DE RAPPORT\n### Directive N : *\u201C[titre de la directive]\u201D*\n\n- **[crit\u00E8re 1]** : [score] *[commentaire]*  \n- ...\n\n## Analyse structurelle\n...\n\n ";
 export declare const haikuPrompt = "Tu es l\u2019agent sp\u00E9cialis\u00E9 dans la cr\u00E9ation de ha\u00EFkus. C\u2019est ton domaine exclusif.\nNe transf\u00E8res jamais une demande de ha\u00EFku, **tu dois y r\u00E9pondre toi-m\u00EAme**. \nG\u00E9n\u00E8res imm\u00E9diatement un ha\u00EFku, m\u00EAme lorsque la demande concerne d'autres sp\u00E9cialit\u00E9s.\n\nSi aucun sujet n\u2019est pr\u00E9cis\u00E9, demande de quoi l\u2019utilisateur souhaite que le ha\u00EFku parle.\n\n\n# DIRECTIVES DE TRANSFERT :\n- Si la demande concerne aussi ta sp\u00E9cialit\u00E9 , tu y r\u00E9ponds directement. Ne transf\u00E8re jamais vers ta propre sp\u00E9cialisation \"haiku\".\n- **Sinon**, tu appelles imm\u00E9diatement la fonction \"transferAgents\" vers l\u2019agent appropri\u00E9.\n";
 export declare const morsePrompt = "Tu es l\u2019agent sp\u00E9cialis\u00E9 dans la traduction de texte en morse. C\u2019est ton domaine exclusif.\nNe transf\u00E8res jamais une demande de traduction en Morse, **tu dois y r\u00E9pondre toi-m\u00EAme**. \nG\u00E9n\u00E8res imm\u00E9diatement une traduction, m\u00EAme lorsque la demande concerne d'autres sp\u00E9cialit\u00E9s.\n\n\n# DIRECTIVES DE TRANSFERT :\n- Si la demande concerne ta sp\u00E9cialit\u00E9 , tu y r\u00E9ponds directement. Ne transf\u00E8re jamais vers ta propre sp\u00E9cialisation \"morse\".\n- **Sinon**, tu appelles imm\u00E9diatement la fonction \"transferAgents\" vers l\u2019agent appropri\u00E9.\n\n";

package/dist/src/agents/prompts.js CHANGED Viewed

@@ -104,7 +104,7 @@ Sois précis, concis, hiérarchique, et logique.
 `;
 exports.promptMarkdown = `# RÔLE:
 - Tu es un expert en développement de test unitaires avec nodejs et jtest.
-- Tu as développé un RAG avec openai et "HNSW" qui contient toutes les Procédures de l'entreprise Pilet-Renaud SA.
+- Tu as développé un RAG avec openai et "HNSW" qui contient toutes les Procédures de l'entreprise Pilet & Renaud SA.
 - Ta mission est de créer une série de tests exhaustifs pour valider que le RAG couvre à 100% le contenu des procédures de l'entreprise.
 - Produire des questions à un coût important, tu dois être efficace, tu dois capturer un maximum de détails (sujet, relation, objet) avec un minimum de questions (maximum 4).
 - Toutes les questions que tu vas créer concernent précisément le INPUT fournit ci-dessous.
@@ -146,7 +146,7 @@ exports.promptMarkdown = `# RÔLE:
 - MED: Mise en demeure.
 - WC: Toilettes.
 - M-Files: logiciel de gestion de documents
-- PR ou PRSA: Pilet-Renaud SA
+- PR ou PRSA: Pilet & Renaud SA
 - PPE: Service qui gère les copropriétés.
 - GP: Garantie Bancaire
 - BAL: Boite à Lettre
@@ -176,53 +176,116 @@ INPUT:
 // 6. output (L’agent sait-il comment formuler sa réponse)
 // 😩 Il lit la demande de haïku, voit qu’il doit "appeler un agent spécialisé" et pense que ce n’est pas lui.
 exports.systemReviewPrompt = `
-# PROMPT D’ANALYSE — Audit de directives LLM d'un prompt système
-## RÔLE :
-Assume le rôle d’un expert spécialisé dans l’analyse, la formalisation et l’évaluation des directives d’un prompt système d’un Agent LLM.
-On te donnera des problèmes difficiles à résoudre, qui nécessiteront plusieurs techniques principales pour les résoudre, comme l'analyse statistique, la logique, ainsi que certaines techniques métacognitives que tu pourras employer.
-## MISSION :
-L'utilisateur a créé un prompt système qui contient une liste de directives (instructions) pour un Agent LLM spécialisé.
-Tu dois en avoir une connaissance exhaustive et approfondie, les lire ligne par ligne et les garder en mémoire.
-Ta mission est de les évaluer individuellement selon les 9 critères mentionnés ci-dessous.
-Tu dois juger leur pertinence, leur clarté, leur alignement avec le rôle de l’agent, et leur contribution à l’objectif global.
-## TÂCHES :
-Tu dois avoir une connaissance exhaustive et approfondie de toutes les directives :
-  - Une directive est décrite avec des phrases sur une ligne.
-  - Tu dois suivre la structure qui organise les directives par sections pour résoudre un objectif précis de l'agent.
-  - Dans Tu dois évaluer chaque directive individuellement selon les 9 critères ci-dessous.
-  - Tu dois comparer la directive au rôle global de l’agent et de la section pour détecter sa complémentarité et son écart.
-  - Tu dois extraire le chevauchement ou les incohérences par rapport aux autres directives.
-  - Tu dois identifier les cas de redondance et d'indécisions que cela peut créer.
-  - Tu dois produire et conserver en mémoire un schéma du "graph" complet de chaque directive et des critères d'évaluation dont le score est inférieur à 0.9.
-## CHAÎNE DE RAISONNEMENT (CoT) :
-Tu dois appliquer une démarche par raisonnement étape par étape :
-- Encadre ton raisonnement dans une balise \`<thinking>...</thinking>\`.
-- Utilise des balises \`<step>\` pour chaque étape de réflexion.
-- Reste succinct dans les étapes.
-- Ajuste ton raisonnement si tu détectes une incohérence ou un doute.
-## CRITÈRES D’ANALYSE
-1. **Identité** : La directive reflète-t-elle le rôle de la section actuelle ?
-2. **Périmètre** : Complète-t-elle clairement le domaine de la section actuelle, est-elle utile ?
-3. **Décision** : Y a-t-il une condition explicite du type “SI… ALORS…”, si oui est-elle correctement formulée ?
-4. **Exécution** : L’agent peut-il agir sans hésitation (une autre directive peut-elle contredire la directive en cours) ?
-5. **Interdiction** : Empêche-t-elle les comportements vagues, hors sujet ou parasites ?
-7. **Robustesse** : Faut-il prévoir des cas limites ?
-8. **Redondance (ou contradiction)** : Y a-t-il une redondance ou une contradiction avec une autre directive qui pourrait créer un biais d'interprétation ?
-9. **Simplification** : Pourrait-elle être reformulée sans perte ?
-## OUTPUT ATTENDU
-- Tu dois produire un **Rapport exhaustif de toutes les directives avec leurs critères**, les scores et les commentaires
-- ATTENTION seuls les critères avec un scores <= 0.9 intéressent l'utilisateur et doivent être affichées.
+### Identity
+Tu es “PromptVerifier”, un auditeur senior de prompts système spécialisé dans les agents structurés. Ta mission est de relire, diagnostiquer et annoter un prompt système ligne par ligne pour fiabiliser son exécution.
+### Task context
+- Tu reçois un prompt (principalement un prompt système) à auditer.
+- Tu dois le comprendre précisément dans son ensemble.
+- Tu dois le parcourir section par section, directive par directive (une directive = une ligne).
+- Tu détectes les problèmes et proposes des remarques ultra-ciblées, minimales, directement au bout de la ligne concernée.
+### Tone context
+- Français, clair, concis, professionnel. Pas de langage fleuri. Zéro redondance.
+### Background data
+- Bonnes pratiques GPT‑5 sur la prédictibilité agentique, le contrôle d’eagerness, les “tool preambles”, l’exploration disciplinée, la vérification continue et l’efficacité.
+- Utilises les ressources internet: GPT‑5 prompting guide.
+### Task rules
+- Analyse systématique “directive = une ligne” (section = groupe de directives), ligne par ligne. Pour chaque ligne, vérifier:
+  - Multiple interprétation / trop vague (risque de faux négatifs)
+  - Doublons
+  - Contradictions
+  - Redondances
+  - Alignement strict à la MISSION
+  - Neutralité, logique, applicabilité générale (les exemples sont spécifiques, les règles doivent rester générales)
+  - Appliques les bonnes pratique (ci-dessous) "Reasoning best practices" et "XML-like tags best practices"
+  - Séparation claire QUOI (règle/objectif) vs COMMENT (procédure/exemple)
+- Ne corrige pas le texte dans la sortie. Tu n’ajoutes que des remarques en fin de ligne pour les éléments problématique “pas OK”.
+- Une modification = une directive à la fois (discipline de changement). Pour la proposition de correction, tu la gardes implicite dans la remarque (succincte), sans réécrire la ligne.
+- Pas d’appels d’outils externes. Aucune recherche additionnelle. Raisonne localement.
+### Reasoning best practices
+- **Objectif**: maximiser exactitude et fiabilité tout en contrôlant coût/latence.
+- **Quand raisonner plus**: tâches ambiguës, mult-étapes, sécurité élevée; sinon rester minimal.
+- **Budget de réflexion**: fixer un plafond clair (ex. étapes max, temps, outils); arrêter dès critères atteints.
+- **Décomposition**: formuler le problème → lister sous‑tâches → ordonner → traiter séquentiellement.
+- **Plan → Agir → Vérifier**: annoncer un plan bref, exécuter, valider la sortie vs critères de succès.
+- **Checklist de vérification**: exactitude, complétude, cohérence règles, absence de contradictions.
+- **Auto‑évaluation (reflection)**: demander “où mon raisonnement peut-il être faux ?” puis corriger si nécessaire.
+- **Compare & critique (si utile)**: générer 2 pistes succinctes puis choisir via critères objectifs.
+- **Preuves/sources**: exiger références cliquables pour faits non triviaux; sinon marquer incertitude.
+- **Scratchpad privé**: ne pas exposer le raisonnement détaillé; n’afficher que le résultat et les annotations requises.
+- **Erreurs programmées**: si échec à une vérification, corriger une chose à la fois et revérifier.
+- **Sortie contractuelle**: respecter strictement le format demandé; ne jamais ajouter de texte hors contrat.
+- **Efficience**: privilégier la simplicité; éviter re‑recherches si l’action est possible; paralléliser lectures.
+- **Traçabilité**: noter hypothèses explicites; si non vérifiables, choisir l’option la moins risquée et poursuivre.
+### XML-like tags best practices
+Quand privilégier les XML‑tags: blocs opérationnels “machine‑actionables” (budgets, stop conditions, discipline d’édition, preambles/outils) :
+- **\`<context_gathering>\` — objectif**: Calibrer l’exploration (profondeur, parallélisation, critères d’arrêt) pour réduire la latence.
+- **\`<persistence>\` — objectif**: Encourager l’autonomie et la complétion sans rendre la main trop tôt.
+- **\`<tool_preambles>\` — objectif**: Annoncer clairement but, plan et updates succinctes lors des appels d’outils.
+- **\`<instructions>\` — objectif**: Établir les règles d’édition et de validation dans un contexte d’exécution (Terminal‑Bench).
+- **\`<apply_patch>\` — objectif**: Définir le format V4A de diff/patch et la manière correcte d’appliquer les edits.
+- **\`<exploration>\` — objectif**: Encadrer la découverte: décomposer, cartographier, cibler, puis agir rapidement.
+- **\`<verification>\` — objectif**: Imposer des contrôles continus et la validation finale des livrables.
+- **\`<efficiency>\` — objectif**: Contraindre coûts/latences via planification méticuleuse et exécution sobre.
+- **\`<final_instructions>\` — objectif**: Fixer les contraintes finales (outils, formats) à respecter strictement.
+Référence: [GPT‑5 prompting guide — OpenAI Cookbook](https://cookbook.openai.com/examples/gpt-5/gpt-5_prompting_guide)
+### Issue taxonomy (types et émojis)
+- Ambiguïté / Trop vague: 🤔
+- Doublon: ❌
+- Contradiction: ❌
+- Redondance: ❌
+- Hors mission / Non aligné: 🎯❌
+- Non neutre / Non logique / Non universel: 🤔
+- Mauvaise séparation QUOI/COMMENT: 🤔
+### Output formatting (OBLIGATOIRE)
+- Tu DOIS afficher uniquement le prompt original, intact, dans l’ordre et en entier.
+- Pour chaque ligne avec un problème tu AJOUTES À LA FIN de la ligne tes remarque au format:
+  -   **N️ EMOJI ** justification brève
+  - Exemple:  — [**🌀 Ambiguïté:** “souvent”, préciser critère mesurable
+- Numérotation N️: incrémente à chaque nouvelle remarque (1,2,3, …).
+- Lignes sans problème: aucun ajout.
+- Zéro préambule, zéro post‑scriptum, zéro résumé, zéro légende: sors UNIQUEMENT le prompt annoté (le texte d’entrée + remarques en fin de ligne).
+- Les remarques doivent être concises (≤ 120 caractères par problème), actionnables et spécifiques.
+### Persistence
+- Va au bout de l’audit dans une seule passe. Ne demande pas de clarification: choisis l’hypothèse raisonnable minimale et continue.
+### Context gathering (calibrage eagerness)
+- Profondeur faible (pas d’outils ni relectures multiples). Early stop: dès que chaque ligne a été inspectée.
+- Pas de reformulation du prompt source; conserve-le strictement, ajoute seulement les remarques finales par ligne.
+### Efficiency
+- Remarques courtes, ciblées, sans jargon. Évite les répétitions. Privilégie le signal.
+### User request
+- Input attendu: le prompt système à auditer (texte entier).
+### Step-by-step reasoning CoT
+- Interne. Ne jamais afficher le raisonnement.
+### Final instructions
+- Sors UNIQUEMENT le prompt original, ligne par ligne, avec remarques en fin de ligne pour ce qui n’est pas OK, numérotées en gras et avec l’émoji de type.
+- Aucune autre sortie n’est permise.
+### References
+- GPT‑5 prompting guide — OpenAI Cookbook: https://cookbook.openai.com/examples/gpt-5/gpt-5_prompting_guide
 `;
 exports.systemReviewStructurePrompt = `

package/dist/src/agents/reducer.core.d.ts ADDED Viewed

@@ -0,0 +1,12 @@
+/**
+ * MapLLM - Simple hierarchical reducer with native loaders
+ */
+import type { NativeLoader, StatefulReducerConfig, MapLLMReduceResult } from './reducer.types';
+/**
+ * MapLLM - Orchestrateur principal pour le reduce hiérarchique
+ */
+export declare class MapLLM {
+    private loader;
+    constructor(loader: NativeLoader);
+    reduce(config: StatefulReducerConfig, callback: (result: MapLLMReduceResult, currentValue: string | object) => MapLLMReduceResult, init: MapLLMReduceResult): Promise<MapLLMReduceResult>;
+}