npm - agent-tool-forge - Versions diffs - 0.3.0 - Mend

agent-tool-forge 0.3.0

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (107) hide show

package/LICENSE +21 -0
package/README.md +209 -0
package/lib/agent-registry.js +170 -0
package/lib/api-client.js +792 -0
package/lib/api-loader.js +260 -0
package/lib/auth.d.ts +25 -0
package/lib/auth.js +158 -0
package/lib/checks/check-adapter.js +172 -0
package/lib/checks/compose.js +42 -0
package/lib/checks/content-match.js +14 -0
package/lib/checks/cost-budget.js +11 -0
package/lib/checks/index.js +18 -0
package/lib/checks/json-valid.js +15 -0
package/lib/checks/latency.js +11 -0
package/lib/checks/length-bounds.js +17 -0
package/lib/checks/negative-match.js +14 -0
package/lib/checks/no-hallucinated-numbers.js +63 -0
package/lib/checks/non-empty.js +34 -0
package/lib/checks/regex-match.js +12 -0
package/lib/checks/run-checks.js +84 -0
package/lib/checks/schema-match.js +26 -0
package/lib/checks/tool-call-count.js +16 -0
package/lib/checks/tool-selection.js +34 -0
package/lib/checks/types.js +45 -0
package/lib/comparison/compare.js +86 -0
package/lib/comparison/format.js +104 -0
package/lib/comparison/index.js +6 -0
package/lib/comparison/statistics.js +59 -0
package/lib/comparison/types.js +41 -0
package/lib/config-schema.js +200 -0
package/lib/config.d.ts +66 -0
package/lib/conversation-store.d.ts +77 -0
package/lib/conversation-store.js +443 -0
package/lib/db.d.ts +6 -0
package/lib/db.js +1112 -0
package/lib/dep-check.js +99 -0
package/lib/drift-background.js +61 -0
package/lib/drift-monitor.js +187 -0
package/lib/eval-runner.js +566 -0
package/lib/fixtures/fixture-store.js +161 -0
package/lib/fixtures/index.js +11 -0
package/lib/forge-engine.js +982 -0
package/lib/forge-eval-generator.js +417 -0
package/lib/forge-file-writer.js +386 -0
package/lib/forge-service-client.js +190 -0
package/lib/forge-service.d.ts +4 -0
package/lib/forge-service.js +655 -0
package/lib/forge-verifier-generator.js +271 -0
package/lib/handlers/admin.js +151 -0
package/lib/handlers/agents.js +229 -0
package/lib/handlers/chat-resume.js +334 -0
package/lib/handlers/chat-sync.js +320 -0
package/lib/handlers/chat.js +320 -0
package/lib/handlers/conversations.js +92 -0
package/lib/handlers/preferences.js +88 -0
package/lib/handlers/tools-list.js +58 -0
package/lib/hitl-engine.d.ts +60 -0
package/lib/hitl-engine.js +261 -0
package/lib/http-utils.js +92 -0
package/lib/index.d.ts +20 -0
package/lib/index.js +141 -0
package/lib/init.js +636 -0
package/lib/manual-entry.js +59 -0
package/lib/mcp-server.js +252 -0
package/lib/output-groups.js +54 -0
package/lib/postgres-store.d.ts +31 -0
package/lib/postgres-store.js +465 -0
package/lib/preference-store.d.ts +47 -0
package/lib/preference-store.js +79 -0
package/lib/prompt-store.d.ts +42 -0
package/lib/prompt-store.js +60 -0
package/lib/rate-limiter.d.ts +30 -0
package/lib/rate-limiter.js +104 -0
package/lib/react-engine.d.ts +110 -0
package/lib/react-engine.js +337 -0
package/lib/runner/cli.js +156 -0
package/lib/runner/cost-estimator.js +71 -0
package/lib/runner/gate.js +46 -0
package/lib/runner/index.js +165 -0
package/lib/sidecar.d.ts +83 -0
package/lib/sidecar.js +161 -0
package/lib/sse.d.ts +15 -0
package/lib/sse.js +30 -0
package/lib/tools-scanner.js +91 -0
package/lib/tui.js +253 -0
package/lib/verifier-report.js +78 -0
package/lib/verifier-runner.js +338 -0
package/lib/verifier-scanner.js +70 -0
package/lib/verifier-worker-pool.js +196 -0
package/lib/views/chat.js +340 -0
package/lib/views/endpoints.js +203 -0
package/lib/views/eval-run.js +206 -0
package/lib/views/forge-agent.js +538 -0
package/lib/views/forge.js +410 -0
package/lib/views/main-menu.js +275 -0
package/lib/views/mediation.js +381 -0
package/lib/views/model-compare.js +430 -0
package/lib/views/model-comparison.js +333 -0
package/lib/views/onboarding.js +470 -0
package/lib/views/performance.js +237 -0
package/lib/views/run-evals.js +205 -0
package/lib/views/settings.js +829 -0
package/lib/views/tools-evals.js +514 -0
package/lib/views/verifier-coverage.js +617 -0
package/lib/workers/verifier-worker.js +52 -0
package/package.json +123 -0
package/widget/forge-chat.js +789 -0

package/lib/views/mediation.js ADDED Viewed

@@ -0,0 +1,381 @@
+/**
+ * Mediation View — Fast-track dialogue for resolving tool registry drift.
+ *
+ * Reuses forgeStep from forge-engine. Starts at 'description' phase with spec.name
+ * pre-filled from config._mediationTarget. Right panel shows overlap matrix.
+ *
+ * Active phases: description, evals only (skips explore/skeptic/fields/routing/deps).
+ */
+import blessed from 'blessed';
+import { existsSync, readFileSync } from 'fs';
+import { resolve } from 'path';
+// ── Helpers ────────────────────────────────────────────────────────────────
+function loadEnv(projectRoot) {
+  const envPath = resolve(projectRoot, '.env');
+  if (!existsSync(envPath)) return {};
+  const lines = readFileSync(envPath, 'utf-8').split('\n');
+  const out = {};
+  for (const line of lines) {
+    const t = line.trim();
+    if (!t || t.startsWith('#')) continue;
+    const eq = t.indexOf('=');
+    if (eq === -1) continue;
+    out[t.slice(0, eq).trim()] = t.slice(eq + 1).trim().replace(/^["']|["']$/g, '');
+  }
+  return out;
+}
+// ── View ───────────────────────────────────────────────────────────────────
+export function createView({ screen, content, config, navigate, setFooter, screenKey, openPopup, closePopup, startService }) {
+  const toolName = config._mediationTarget || null;
+  config._mediationTarget = null; // consume — prevent stale reads on re-entry
+  const container = blessed.box({
+    top: 0, left: 0, width: '100%', height: '100%', tags: true
+  });
+  // ── Layout: left chat, right overlap matrix ────────────────────────────
+  const chatBox = blessed.box({
+    parent: container,
+    top: 0, left: 0,
+    width: '60%', height: '100%',
+    tags: true, scrollable: true,
+    border: { type: 'line' },
+    label: ` Mediation: ${toolName || '(no target)'} `,
+    style: { border: { fg: 'yellow' } }
+  });
+  const rightPanel = blessed.box({
+    parent: container,
+    top: 0, right: 0,
+    width: '40%', height: '50%',
+    tags: true, scrollable: true,
+    border: { type: 'line' },
+    label: ' Overlap Matrix ',
+    style: { border: { fg: 'cyan' } }
+  });
+  const specPanel = blessed.box({
+    parent: container,
+    bottom: 0, right: 0,
+    width: '40%', height: '50%',
+    tags: true, scrollable: true,
+    border: { type: 'line' },
+    label: ' Current Spec ',
+    style: { border: { fg: '#555555' } }
+  });
+  const inputBox = blessed.textbox({
+    parent: container,
+    bottom: 0, left: 0,
+    width: '60%', height: 3,
+    border: { type: 'line' },
+    label: ' Your reply ',
+    keys: true, inputOnFocus: true,
+    style: { border: { fg: 'blue' }, focus: { border: { fg: 'cyan' } } }
+  });
+  setFooter(' {cyan-fg}Enter{/cyan-fg} send  {cyan-fg}b{/cyan-fg} back (abandon mediation)');
+  if (!toolName) {
+    chatBox.setContent('\n  {red-fg}No mediation target set. Go to Tools & Evals and use Mediate.{/red-fg}');
+    screen.render();
+    return container;
+  }
+  // ── State ──────────────────────────────────────────────────────────────
+  let forgeState = null;
+  let modelConfig = null;
+  let db = null;
+  let openAlertId = null;
+  let baselinePassRate = null;
+  let busy = false;
+  const chatHistory = [];
+  function appendChat(role, text) {
+    chatHistory.push({ role, text });
+    const rendered = chatHistory.map((m) =>
+      m.role === 'assistant'
+        ? `{cyan-fg}Forge:{/cyan-fg} ${m.text}`
+        : `{white-fg}You:{/white-fg} ${m.text}`
+    ).join('\n\n');
+    chatBox.setContent('\n' + rendered);
+    chatBox.setScrollPerc(100);
+    screen.render();
+  }
+  function updateSpecPanel(spec) {
+    if (!spec) { specPanel.setContent(''); return; }
+    const lines = [
+      spec.name ? `{cyan-fg}name:{/cyan-fg} ${spec.name}` : '',
+      spec.description ? `{cyan-fg}desc:{/cyan-fg} ${spec.description}` : '',
+      spec.triggerPhrases?.length ? `{cyan-fg}triggers:{/cyan-fg}\n  ${spec.triggerPhrases.join('\n  ')}` : '',
+    ].filter(Boolean);
+    specPanel.setContent('\n ' + lines.join('\n '));
+    screen.render();
+  }
+  // ── Init ───────────────────────────────────────────────────────────────
+  async function init() {
+    busy = true;
+    openPopup?.(); // block global keys during init
+    try {
+      // Load env + model config
+      const projectRoot = process.cwd();
+      const env = loadEnv(projectRoot);
+      const { resolveModelConfig } = await import('../api-client.js');
+      modelConfig = resolveModelConfig(config, env, 'generation');
+      if (!modelConfig.apiKey) {
+        appendChat('assistant', '{red-fg}No API key found. Add one in Settings → API Keys.{/red-fg}');
+        closePopup?.();
+        busy = false;
+        return;
+      }
+      // Load DB + open alert
+      const dbPath = resolve(projectRoot, config?.dbPath || 'forge.db');
+      if (existsSync(dbPath)) {
+        const { getDb, getDriftAlerts, getToolRegistry } = await import('../db.js');
+        db = getDb(dbPath);
+        const alerts = getDriftAlerts(db, toolName);
+        if (alerts.length > 0) {
+          openAlertId = alerts[0].id;
+        }
+        const regRow = getToolRegistry(db, toolName);
+        baselinePassRate = regRow?.baseline_pass_rate ?? null;
+      }
+      // Load forge engine and create initial state at 'description' phase
+      const { createInitialState, forgeStep } = await import('../forge-engine.js');
+      forgeState = createInitialState();
+      forgeState.phase = 'description';
+      forgeState.spec.name = toolName;
+      // Build overlap matrix via one-shot LLM call
+      await buildOverlapMatrix();
+      // Kick off description phase
+      closePopup?.();
+      busy = false;
+      await advanceForge(null);
+    } catch (err) {
+      appendChat('assistant', `{red-fg}Init error: ${err.message}{/red-fg}`);
+      closePopup?.();
+      busy = false;
+    }
+  }
+  async function buildOverlapMatrix() {
+    let matrixContent = ' {#888888-fg}(loading overlap matrix…){/#888888-fg}';
+    rightPanel.setContent(matrixContent);
+    screen.render();
+    try {
+      // Get suspects from drift alert
+      let suspects = [];
+      if (db && openAlertId) {
+        const alert = db.prepare('SELECT trigger_tools FROM drift_alerts WHERE id = ?').get(openAlertId);
+        if (alert?.trigger_tools) {
+          try { suspects = JSON.parse(alert.trigger_tools); } catch (_) {}
+        }
+      }
+      if (suspects.length === 0) {
+        rightPanel.setContent(' {#888888-fg}No overlap suspects identified.{/#888888-fg}');
+        screen.render();
+        return;
+      }
+      // Assess overlap with one LLM call
+      const { llmTurn } = await import('../api-client.js');
+      const { getToolsWithMetadata } = await import('../tools-scanner.js');
+      const project = config?.project || {};
+      const allTools = getToolsWithMetadata(project);
+      const flaggedTool = allTools.find((t) => t.name === toolName);
+      const suspectTools = allTools.filter((t) => suspects.includes(t.name));
+      if (!flaggedTool || suspectTools.length === 0) {
+        rightPanel.setContent(` {yellow-fg}Suspects: ${suspects.join(', ')}{/yellow-fg}\n {#888888-fg}(tool files not found){/#888888-fg}`);
+        screen.render();
+        return;
+      }
+      const prompt = `Assess description and trigger phrase overlap between the flagged tool and each suspect.
+Flagged tool:
+Name: ${flaggedTool.name}
+Description: ${flaggedTool.description || '(none)'}
+Triggers: ${(flaggedTool.triggerPhrases || []).join(', ') || '(none)'}
+Suspects:
+${suspectTools.map((t) => `Name: ${t.name}\nDescription: ${t.description || '(none)'}\nTriggers: ${(t.triggerPhrases || []).join(', ') || '(none)'}`).join('\n\n')}
+For each suspect, rate overlap as: high / medium / low / none.
+Respond with one line per suspect in this format:
+[suspect_name]: [overlap_level] — [one sentence reason]`;
+      const result = await llmTurn({
+        provider: modelConfig.provider,
+        apiKey: modelConfig.apiKey,
+        model: modelConfig.model,
+        messages: [{ role: 'user', content: prompt }],
+        maxTokens: 512,
+        timeoutMs: 30_000
+      });
+      const lines = (result.text || '').split('\n').filter((l) => l.trim());
+      const matrixLines = lines.map((l) => {
+        if (l.includes('high')) return ` {red-fg}${l}{/red-fg}`;
+        if (l.includes('medium')) return ` {yellow-fg}${l}{/yellow-fg}`;
+        if (l.includes('low')) return ` {green-fg}${l}{/green-fg}`;
+        return ` {#888888-fg}${l}{/#888888-fg}`;
+      });
+      rightPanel.setContent(matrixLines.join('\n') || ' {#888888-fg}(no overlap data){/#888888-fg}');
+      screen.render();
+    } catch (_) {
+      rightPanel.setContent(' {red-fg}Overlap matrix unavailable{/red-fg}');
+      screen.render();
+    }
+  }
+  async function advanceForge(userInput) {
+    if (!forgeState || !modelConfig) return;
+    // Only allow description and evals phases in mediation
+    const allowedPhases = ['description', 'evals'];
+    if (!allowedPhases.includes(forgeState.phase)) {
+      // Skip to description or signal completion
+      if (forgeState.phase === 'done' || forgeState.phase === 'verifiers') {
+        await handleMediationComplete();
+        return;
+      }
+      // Jump to done if past evals
+      forgeState.phase = 'done';
+      await handleMediationComplete();
+      return;
+    }
+    busy = true;
+    try {
+      const { forgeStep } = await import('../forge-engine.js');
+      const result = await forgeStep({
+        state: forgeState,
+        userInput,
+        modelConfig,
+        projectConfig: config,
+        projectRoot: process.cwd()
+      });
+      forgeState = result.nextState;
+      updateSpecPanel(forgeState.spec);
+      if (result.assistantText) {
+        appendChat('assistant', result.assistantText);
+      }
+      // Check for write_evals action
+      const evalsAction = result.actions?.find((a) => a.type === 'write_evals');
+      if (evalsAction) {
+        await runMediationEvals();
+        return;
+      }
+      // If done phase reached
+      if (forgeState.phase === 'done') {
+        await handleMediationComplete();
+        return;
+      }
+    } catch (err) {
+      appendChat('assistant', `{red-fg}Error: ${err.message}{/red-fg}`);
+    } finally {
+      busy = false;
+    }
+  }
+  async function runMediationEvals() {
+    appendChat('assistant', 'Running evals to check if description/triggers resolve the drift…');
+    busy = true;
+    try {
+      const { runEvals } = await import('../eval-runner.js');
+      const result = await runEvals(
+        toolName,
+        config,
+        process.cwd(),
+        (progress) => {
+          appendChat('assistant', `  Case ${progress.done}/${progress.total}: ${progress.passed ? '✓' : '✗'}`);
+        }
+      );
+      const newPassRate = result.total > 0 ? result.passed / result.total : 0;
+      const recovered = baselinePassRate != null
+        ? newPassRate >= baselinePassRate - 0.05
+        : newPassRate >= 0.8;
+      appendChat('assistant',
+        `Eval complete: ${result.passed}/${result.total} passed (${Math.round(newPassRate * 100)}%). ` +
+        (recovered
+          ? '{green-fg}Recovery threshold met!{/green-fg}'
+          : `{yellow-fg}Not yet at baseline (${baselinePassRate != null ? Math.round(baselinePassRate * 100) + '%' : '?'}). Try refining further.{/yellow-fg}`)
+      );
+      if (recovered && openAlertId && db) {
+        // Resolve the alert and promote the same tool back to 'promoted' state.
+        // We do NOT call resolveDrift (which swaps in a replacement); we resolve
+        // the alert directly and update the lifecycle.
+        const { resolveDriftAlert, updateToolLifecycle } = await import('../db.js');
+        resolveDriftAlert(db, openAlertId);
+        updateToolLifecycle(db, toolName, {
+          lifecycle_state: 'promoted',
+          promoted_at: new Date().toISOString()
+        });
+        appendChat('assistant', '{green-fg}Drift resolved. Navigating to Tools & Evals…{/green-fg}');
+        setTimeout(() => navigate('tools-evals'), 2000);
+      }
+    } catch (err) {
+      appendChat('assistant', `{red-fg}Eval error: ${err.message}{/red-fg}`);
+    } finally {
+      busy = false;
+    }
+  }
+  async function handleMediationComplete() {
+    appendChat('assistant', 'Mediation dialogue complete. Returning to Tools & Evals.');
+    setTimeout(() => navigate('tools-evals'), 1500);
+  }
+  // ── Input handling ─────────────────────────────────────────────────────
+  inputBox.key('enter', async () => {
+    if (busy) return;
+    const val = inputBox.getValue().trim();
+    inputBox.clearValue();
+    screen.render();
+    if (!val) return;
+    appendChat('user', val);
+    await advanceForge(val);
+  });
+  inputBox.key(['escape'], () => {
+    // Don't navigate — let global b handle it
+  });
+  // ── Start init ─────────────────────────────────────────────────────────
+  init().catch((err) => {
+    appendChat('assistant', `{red-fg}Fatal: ${err.message}{/red-fg}`);
+  });
+  inputBox.focus();
+  screen.render();
+  return container;
+}