npm - stagent - Versions diffs - 0.1.11 → 0.1.12 - Mend

stagent 0.1.11 → 0.1.12

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (81) hide show

package/README.md +35 -4
package/package.json +3 -2
package/src/__tests__/e2e/blueprint.test.ts +63 -0
package/src/__tests__/e2e/cross-runtime.test.ts +77 -0
package/src/__tests__/e2e/helpers.ts +286 -0
package/src/__tests__/e2e/parallel-workflow.test.ts +120 -0
package/src/__tests__/e2e/sequence-workflow.test.ts +109 -0
package/src/__tests__/e2e/setup.ts +156 -0
package/src/__tests__/e2e/single-task.test.ts +170 -0
package/src/app/api/command-palette/recent/route.ts +41 -18
package/src/app/api/context/batch/route.ts +44 -0
package/src/app/api/permissions/presets/route.ts +80 -0
package/src/app/api/playbook/status/route.ts +15 -0
package/src/app/api/profiles/route.ts +23 -20
package/src/app/api/settings/pricing/route.ts +15 -0
package/src/app/costs/page.tsx +53 -43
package/src/app/playbook/[slug]/page.tsx +76 -0
package/src/app/playbook/page.tsx +54 -0
package/src/app/profiles/page.tsx +7 -4
package/src/app/settings/page.tsx +2 -2
package/src/components/costs/cost-dashboard.tsx +226 -320
package/src/components/dashboard/activity-feed.tsx +6 -2
package/src/components/notifications/batch-proposal-review.tsx +150 -0
package/src/components/notifications/notification-item.tsx +6 -3
package/src/components/notifications/pending-approval-host.tsx +57 -11
package/src/components/playbook/adoption-heatmap.tsx +69 -0
package/src/components/playbook/journey-card.tsx +110 -0
package/src/components/playbook/playbook-action-button.tsx +22 -0
package/src/components/playbook/playbook-browser.tsx +143 -0
package/src/components/playbook/playbook-card.tsx +102 -0
package/src/components/playbook/playbook-detail-view.tsx +223 -0
package/src/components/playbook/playbook-homepage.tsx +142 -0
package/src/components/playbook/playbook-toc.tsx +90 -0
package/src/components/playbook/playbook-updated-badge.tsx +23 -0
package/src/components/playbook/related-docs.tsx +30 -0
package/src/components/profiles/__tests__/learned-context-panel.test.tsx +175 -0
package/src/components/profiles/context-proposal-review.tsx +7 -3
package/src/components/profiles/learned-context-panel.tsx +116 -8
package/src/components/profiles/profile-detail-view.tsx +6 -3
package/src/components/settings/__tests__/auth-config-section.test.tsx +147 -0
package/src/components/settings/api-key-form.tsx +5 -43
package/src/components/settings/auth-config-section.tsx +10 -6
package/src/components/settings/auth-status-badge.tsx +8 -0
package/src/components/settings/budget-guardrails-section.tsx +403 -620
package/src/components/settings/connection-test-control.tsx +63 -0
package/src/components/settings/permissions-section.tsx +85 -75
package/src/components/settings/permissions-sections.tsx +24 -0
package/src/components/settings/presets-section.tsx +159 -0
package/src/components/settings/pricing-registry-panel.tsx +164 -0
package/src/components/shared/app-sidebar.tsx +2 -0
package/src/components/shared/command-palette.tsx +30 -0
package/src/components/shared/light-markdown.tsx +134 -0
package/src/components/workflows/loop-status-view.tsx +8 -4
package/src/components/workflows/workflow-status-view.tsx +16 -9
package/src/lib/agents/learned-context.ts +27 -15
package/src/lib/agents/learning-session.ts +234 -0
package/src/lib/agents/pattern-extractor.ts +19 -0
package/src/lib/agents/profiles/__tests__/sort.test.ts +42 -0
package/src/lib/agents/profiles/sort.ts +7 -0
package/src/lib/constants/settings.ts +1 -0
package/src/lib/db/schema.ts +3 -0
package/src/lib/docs/adoption.ts +105 -0
package/src/lib/docs/journey-tracker.ts +21 -0
package/src/lib/docs/reader.ts +102 -0
package/src/lib/docs/types.ts +54 -0
package/src/lib/docs/usage-stage.ts +60 -0
package/src/lib/notifications/actionable.ts +18 -10
package/src/lib/settings/__tests__/budget-guardrails.test.ts +86 -24
package/src/lib/settings/budget-guardrails.ts +213 -85
package/src/lib/settings/permission-presets.ts +150 -0
package/src/lib/settings/runtime-setup.ts +71 -0
package/src/lib/usage/__tests__/ledger.test.ts +2 -2
package/src/lib/usage/__tests__/pricing-registry.test.ts +78 -0
package/src/lib/usage/ledger.ts +1 -1
package/src/lib/usage/pricing-registry.ts +570 -0
package/src/lib/usage/pricing.ts +15 -95
package/src/lib/utils/__tests__/learned-context-history.test.ts +171 -0
package/src/lib/utils/learned-context-history.ts +150 -0
package/src/lib/validators/__tests__/settings.test.ts +23 -16
package/src/lib/validators/settings.ts +3 -9
package/src/lib/workflows/engine.ts +18 -0

package/src/__tests__/e2e/parallel-workflow.test.ts ADDED Viewed

@@ -0,0 +1,120 @@
+/**
+ * E2E: Parallel workflow execution.
+ *
+ * Tests that parallel workflows run branches concurrently and
+ * synthesis steps wait for all dependencies before executing.
+ */
+import {
+  setupE2E,
+  teardownE2E,
+  testProjectId,
+  claudeAvailable,
+  codexAvailable,
+} from "./setup";
+import {
+  createWorkflow,
+  executeWorkflow,
+  pollWorkflowUntilDone,
+} from "./helpers";
+beforeAll(async () => {
+  await setupE2E();
+});
+afterAll(async () => {
+  await teardownE2E();
+});
+describe("Parallel Workflow — Claude Code", () => {
+  it.skipIf(!claudeAvailable)(
+    "runs branches concurrently with synthesis",
+    async () => {
+      const { ok, data: workflow } = await createWorkflow({
+        name: "E2E Parallel Test",
+        projectId: testProjectId,
+        definition: {
+          pattern: "parallel",
+          steps: [
+            {
+              id: "metrics",
+              name: "Code Metrics",
+              prompt:
+                "Count the number of TypeScript files and total lines of code in the project.",
+              agentProfile: "general",
+            },
+            {
+              id: "deps",
+              name: "Dependency Check",
+              prompt:
+                "List all dependencies and devDependencies from package.json with their versions.",
+              agentProfile: "general",
+            },
+            {
+              id: "synthesize",
+              name: "Summary Report",
+              prompt:
+                "Combine the code metrics and dependency information into a brief project summary.",
+              agentProfile: "document-writer",
+              dependsOn: ["metrics", "deps"],
+            },
+          ],
+        },
+      });
+      expect(ok).toBe(true);
+      const exec = await executeWorkflow(workflow!.id);
+      expect(exec.status).toBe(202);
+      const result = await pollWorkflowUntilDone(workflow!.id);
+      expect(result.status).toBe("completed");
+    }
+  );
+});
+describe("Parallel Workflow — Codex", () => {
+  it.skipIf(!codexAvailable)(
+    "runs parallel branches via Codex runtime",
+    async () => {
+      const { ok, data: workflow } = await createWorkflow({
+        name: "E2E Codex Parallel Test",
+        projectId: testProjectId,
+        definition: {
+          pattern: "parallel",
+          steps: [
+            {
+              id: "files",
+              name: "List Files",
+              prompt: "List all files in the project directory.",
+              assignedAgent: "codex",
+              agentProfile: "general",
+            },
+            {
+              id: "structure",
+              name: "Describe Structure",
+              prompt: "Describe the project directory structure and purpose of each file.",
+              assignedAgent: "codex",
+              agentProfile: "general",
+            },
+            {
+              id: "combine",
+              name: "Combined Report",
+              prompt:
+                "Combine the file list and structure description into a single overview.",
+              assignedAgent: "codex",
+              agentProfile: "document-writer",
+              dependsOn: ["files", "structure"],
+            },
+          ],
+        },
+      });
+      expect(ok).toBe(true);
+      const exec = await executeWorkflow(workflow!.id);
+      expect(exec.status).toBe(202);
+      const result = await pollWorkflowUntilDone(workflow!.id);
+      expect(result.status).toBe("completed");
+    }
+  );
+});

package/src/__tests__/e2e/sequence-workflow.test.ts ADDED Viewed

@@ -0,0 +1,109 @@
+/**
+ * E2E: Sequence workflow execution.
+ *
+ * Tests that multi-step sequence workflows execute steps in order,
+ * pass context between steps, and produce combined results.
+ */
+import {
+  setupE2E,
+  teardownE2E,
+  testProjectId,
+  claudeAvailable,
+  codexAvailable,
+} from "./setup";
+import {
+  createWorkflow,
+  executeWorkflow,
+  pollWorkflowUntilDone,
+  createTask,
+  getTask,
+} from "./helpers";
+beforeAll(async () => {
+  await setupE2E();
+});
+afterAll(async () => {
+  await teardownE2E();
+});
+describe("Sequence Workflow — Claude Code", () => {
+  it.skipIf(!claudeAvailable)(
+    "executes steps in order with context passing",
+    async () => {
+      const { ok, data: workflow } = await createWorkflow({
+        name: "E2E Sequence Test",
+        projectId: testProjectId,
+        definition: {
+          pattern: "sequence",
+          steps: [
+            {
+              id: "analyze",
+              name: "Analyze Code",
+              prompt:
+                "Analyze the TypeScript code in the project. List the main functions and any bugs you find.",
+              agentProfile: "general",
+            },
+            {
+              id: "suggest",
+              name: "Suggest Tests",
+              prompt:
+                "Based on the analysis from the previous step, suggest specific test cases that would catch the bugs identified.",
+              agentProfile: "code-reviewer",
+              dependsOn: ["analyze"],
+            },
+          ],
+        },
+      });
+      expect(ok).toBe(true);
+      const exec = await executeWorkflow(workflow!.id);
+      expect(exec.status).toBe(202);
+      const result = await pollWorkflowUntilDone(workflow!.id);
+      expect(result.status).toBe("completed");
+    }
+  );
+});
+describe("Sequence Workflow — Codex", () => {
+  it.skipIf(!codexAvailable)(
+    "executes sequence steps via Codex runtime",
+    async () => {
+      const { ok, data: workflow } = await createWorkflow({
+        name: "E2E Codex Sequence Test",
+        projectId: testProjectId,
+        definition: {
+          pattern: "sequence",
+          steps: [
+            {
+              id: "describe",
+              name: "Describe Code",
+              prompt:
+                "Describe the TypeScript code in the project. List the main functions.",
+              assignedAgent: "codex",
+              agentProfile: "general",
+            },
+            {
+              id: "review",
+              name: "Review Code",
+              prompt:
+                "Based on the description from the previous step, review the code for bugs.",
+              assignedAgent: "codex",
+              agentProfile: "code-reviewer",
+              dependsOn: ["describe"],
+            },
+          ],
+        },
+      });
+      expect(ok).toBe(true);
+      const exec = await executeWorkflow(workflow!.id);
+      expect(exec.status).toBe(202);
+      const result = await pollWorkflowUntilDone(workflow!.id);
+      expect(result.status).toBe("completed");
+    }
+  );
+});

package/src/__tests__/e2e/setup.ts ADDED Viewed

@@ -0,0 +1,156 @@
+/**
+ * E2E test setup — creates a test project and sandbox, tears down after all tests.
+ *
+ * This file is imported by test files that need a shared project context.
+ * It does NOT run as a vitest setupFile — each test suite imports it explicitly.
+ */
+import { mkdirSync, rmSync, writeFileSync, existsSync } from "fs";
+import { join } from "path";
+import { tmpdir } from "os";
+import {
+  createProject,
+  deleteProject,
+  isServerReachable,
+  isRuntimeAvailable,
+} from "./helpers";
+// ---------------------------------------------------------------------------
+// Shared test state
+// ---------------------------------------------------------------------------
+export let testProjectId = "";
+export let sandboxDir = "";
+export let claudeAvailable = false;
+export let codexAvailable = false;
+// ---------------------------------------------------------------------------
+// Sandbox files — minimal TypeScript project for agents to analyze
+// ---------------------------------------------------------------------------
+const SANDBOX_FILES: Record<string, string> = {
+  "package.json": JSON.stringify(
+    {
+      name: "stagent-e2e-sandbox",
+      version: "1.0.0",
+      scripts: { build: "tsc" },
+      devDependencies: { typescript: "^5.5.0" },
+    },
+    null,
+    2
+  ),
+  "tsconfig.json": JSON.stringify(
+    {
+      compilerOptions: {
+        target: "ES2022",
+        module: "ESNext",
+        moduleResolution: "bundler",
+        outDir: "dist",
+        strict: true,
+      },
+      include: ["src"],
+    },
+    null,
+    2
+  ),
+  "src/index.ts": `
+export interface Task {
+  id: number;
+  title: string;
+  completed: boolean;
+}
+const tasks: Task[] = [];
+export function addTask(title: string): Task {
+  // Deliberate bug: ID based on array length → duplicates after deletion
+  const task: Task = { id: tasks.length, title, completed: false };
+  tasks.push(task);
+  return task;
+}
+export function completeTask(id: number): boolean {
+  const task = tasks.find((t) => t.id === id);
+  if (task) {
+    task.completed = true;
+    return true;
+  }
+  return false;
+}
+export function getIncompleteTasks(): Task[] {
+  return tasks.filter((t) => !t.completed);
+}
+`.trimStart(),
+  "src/utils.ts": `
+export function formatDate(date: Date): string {
+  // Deliberate bug: getMonth() is zero-based
+  return \`\${date.getFullYear()}-\${date.getMonth()}-\${date.getDate()}\`;
+}
+export function parseCSV(csv: string): string[][] {
+  // Deliberate bug: naive parsing — no quoted field support
+  return csv.split("\\n").map((line) => line.split(","));
+}
+export function slugify(text: string): string {
+  return text
+    .toLowerCase()
+    .replace(/\\s+/g, "-")
+    .replace(/[^a-z0-9-]/g, "");
+}
+`.trimStart(),
+};
+// ---------------------------------------------------------------------------
+// Setup & Teardown
+// ---------------------------------------------------------------------------
+export async function setupE2E(): Promise<void> {
+  // 1. Check server reachability
+  const reachable = await isServerReachable();
+  if (!reachable) {
+    throw new Error(
+      "Stagent server is not reachable at the configured URL. " +
+        "Start the dev server with `npm run dev` before running E2E tests."
+    );
+  }
+  // 2. Create sandbox directory with test files
+  sandboxDir = join(tmpdir(), `stagent-e2e-${Date.now()}`);
+  mkdirSync(join(sandboxDir, "src"), { recursive: true });
+  for (const [relativePath, content] of Object.entries(SANDBOX_FILES)) {
+    const fullPath = join(sandboxDir, relativePath);
+    const dir = fullPath.substring(0, fullPath.lastIndexOf("/"));
+    mkdirSync(dir, { recursive: true });
+    writeFileSync(fullPath, content, "utf-8");
+  }
+  // 3. Create test project pointing at the sandbox
+  const { ok, data } = await createProject({
+    name: `E2E Test ${new Date().toISOString().slice(0, 19)}`,
+    description: "Automated E2E test project — safe to delete",
+    workingDirectory: sandboxDir,
+  });
+  if (!ok || !data?.id) {
+    throw new Error("Failed to create E2E test project");
+  }
+  testProjectId = data.id;
+  // 4. Detect runtime availability
+  claudeAvailable = await isRuntimeAvailable("claude-code");
+  codexAvailable = await isRuntimeAvailable("openai-codex-app-server");
+}
+export async function teardownE2E(): Promise<void> {
+  // Clean up test project
+  if (testProjectId) {
+    await deleteProject(testProjectId).catch(() => {});
+  }
+  // Clean up sandbox directory
+  if (sandboxDir && existsSync(sandboxDir)) {
+    rmSync(sandboxDir, { recursive: true, force: true });
+  }
+}

package/src/__tests__/e2e/single-task.test.ts ADDED Viewed

@@ -0,0 +1,170 @@
+/**
+ * E2E: Single task execution across profiles and runtimes.
+ *
+ * Tests that individual tasks execute and produce results via both
+ * Claude Code and Codex runtimes with different agent profiles.
+ */
+import {
+  setupE2E,
+  teardownE2E,
+  testProjectId,
+  claudeAvailable,
+  codexAvailable,
+} from "./setup";
+import {
+  createTask,
+  executeTask,
+  pollTaskUntilDone,
+  updateTask,
+} from "./helpers";
+beforeAll(async () => {
+  await setupE2E();
+});
+afterAll(async () => {
+  await teardownE2E();
+});
+// ---------------------------------------------------------------------------
+// Claude Code runtime
+// ---------------------------------------------------------------------------
+describe("Single Task — Claude Code", () => {
+  beforeAll(() => {
+    if (!claudeAvailable) {
+      console.warn("Skipping Claude Code tests — runtime not available");
+    }
+  });
+  it.skipIf(!claudeAvailable)(
+    "general profile describes code",
+    async () => {
+      const { ok, data: task } = await createTask({
+        title: "Describe the TypeScript code in src/",
+        description:
+          "Read the TypeScript files in the project and describe what the code does.",
+        projectId: testProjectId,
+        agentProfile: "general",
+      });
+      expect(ok).toBe(true);
+      // Queue → execute
+      await updateTask(task!.id, { status: "queued" });
+      const exec = await executeTask(task!.id);
+      expect(exec.status).toBe(202);
+      // Poll until done
+      const result = await pollTaskUntilDone(task!.id);
+      expect(result.status).toBe("completed");
+      expect(result.result).toBeTruthy();
+      expect(result.result!.length).toBeGreaterThan(50);
+    }
+  );
+  it.skipIf(!claudeAvailable)(
+    "code-reviewer profile finds bugs",
+    async () => {
+      const { ok, data: task } = await createTask({
+        title: "Review code for bugs",
+        description:
+          "Review all TypeScript files in the project. Find bugs and report them with severity levels.",
+        projectId: testProjectId,
+        agentProfile: "code-reviewer",
+      });
+      expect(ok).toBe(true);
+      await updateTask(task!.id, { status: "queued" });
+      const exec = await executeTask(task!.id);
+      expect(exec.status).toBe(202);
+      const result = await pollTaskUntilDone(task!.id);
+      expect(result.status).toBe("completed");
+      expect(result.result).toBeTruthy();
+      // Code reviewer should find at least some issues
+      expect(result.result!.length).toBeGreaterThan(100);
+    }
+  );
+  it.skipIf(!claudeAvailable)(
+    "document-writer profile generates overview",
+    async () => {
+      const { ok, data: task } = await createTask({
+        title: "Write a technical overview document",
+        description:
+          "Generate a technical overview of this project including structure, modules, and dependencies.",
+        projectId: testProjectId,
+        agentProfile: "document-writer",
+      });
+      expect(ok).toBe(true);
+      await updateTask(task!.id, { status: "queued" });
+      const exec = await executeTask(task!.id);
+      expect(exec.status).toBe(202);
+      const result = await pollTaskUntilDone(task!.id);
+      expect(result.status).toBe("completed");
+      expect(result.result).toBeTruthy();
+    }
+  );
+});
+// ---------------------------------------------------------------------------
+// Codex runtime
+// ---------------------------------------------------------------------------
+describe("Single Task — Codex", () => {
+  beforeAll(() => {
+    if (!codexAvailable) {
+      console.warn("Skipping Codex tests — runtime not available");
+    }
+  });
+  it.skipIf(!codexAvailable)(
+    "general profile describes code via Codex",
+    async () => {
+      const { ok, data: task } = await createTask({
+        title: "Describe the TypeScript code in src/",
+        description:
+          "Read the TypeScript files in the project and describe what the code does.",
+        projectId: testProjectId,
+        assignedAgent: "codex",
+        agentProfile: "general",
+      });
+      expect(ok).toBe(true);
+      await updateTask(task!.id, { status: "queued" });
+      const exec = await executeTask(task!.id);
+      expect(exec.status).toBe(202);
+      const result = await pollTaskUntilDone(task!.id);
+      expect(result.status).toBe("completed");
+      expect(result.result).toBeTruthy();
+      expect(result.result!.length).toBeGreaterThan(50);
+    }
+  );
+  it.skipIf(!codexAvailable)(
+    "code-reviewer profile finds bugs via Codex",
+    async () => {
+      const { ok, data: task } = await createTask({
+        title: "Review code for bugs",
+        description:
+          "Review all TypeScript files in the project. Find bugs and report them with severity levels.",
+        projectId: testProjectId,
+        assignedAgent: "codex",
+        agentProfile: "code-reviewer",
+      });
+      expect(ok).toBe(true);
+      await updateTask(task!.id, { status: "queued" });
+      const exec = await executeTask(task!.id);
+      expect(exec.status).toBe(202);
+      const result = await pollTaskUntilDone(task!.id);
+      expect(result.status).toBe("completed");
+      expect(result.result).toBeTruthy();
+    }
+  );
+});

package/src/app/api/command-palette/recent/route.ts CHANGED Viewed

@@ -2,30 +2,53 @@ import { NextResponse } from "next/server";
 import { db } from "@/lib/db";
 import { projects, tasks } from "@/lib/db/schema";
 import { desc } from "drizzle-orm";
+import { getManifest } from "@/lib/docs/reader";
 export async function GET() {
-  const recentProjects = await db
-    .select({
-      id: projects.id,
-      name: projects.name,
-      status: projects.status,
-    })
-    .from(projects)
-    .orderBy(desc(projects.updatedAt))
-    .limit(5);
+  const [recentProjects, recentTasks] = await Promise.all([
+    db
+      .select({
+        id: projects.id,
+        name: projects.name,
+        status: projects.status,
+      })
+      .from(projects)
+      .orderBy(desc(projects.updatedAt))
+      .limit(5),
+    db
+      .select({
+        id: tasks.id,
+        title: tasks.title,
+        status: tasks.status,
+      })
+      .from(tasks)
+      .orderBy(desc(tasks.updatedAt))
+      .limit(5),
+  ]);
-  const recentTasks = await db
-    .select({
-      id: tasks.id,
-      title: tasks.title,
-      status: tasks.status,
-    })
-    .from(tasks)
-    .orderBy(desc(tasks.updatedAt))
-    .limit(5);
+  // Read playbook items from manifest
+  let playbook: { slug: string; title: string; tags: string[] }[] = [];
+  try {
+    const manifest = getManifest();
+    playbook = [
+      ...manifest.sections.map((s) => ({
+        slug: s.slug,
+        title: s.title,
+        tags: s.tags,
+      })),
+      ...manifest.journeys.map((j) => ({
+        slug: j.slug,
+        title: j.title,
+        tags: [j.persona, j.difficulty],
+      })),
+    ];
+  } catch {
+    // docs/manifest.json may not exist — graceful fallback
+  }
   return NextResponse.json({
     projects: recentProjects,
     tasks: recentTasks,
+    playbook,
   });
 }

package/src/app/api/context/batch/route.ts ADDED Viewed

@@ -0,0 +1,44 @@
+import { NextRequest, NextResponse } from "next/server";
+import { z } from "zod";
+import {
+  batchApproveProposals,
+  batchRejectProposals,
+} from "@/lib/agents/learning-session";
+const batchSchema = z.object({
+  proposalIds: z.array(z.string().min(1)).min(1),
+  action: z.enum(["approve", "reject"]),
+});
+/**
+ * POST /api/context/batch — batch approve or reject context proposals.
+ *
+ * Used by the batch proposal review UI after workflow completion.
+ * Accepts an array of learned_context row IDs and an action.
+ */
+export async function POST(req: NextRequest) {
+  try {
+    const body = await req.json();
+    const parsed = batchSchema.safeParse(body);
+    if (!parsed.success) {
+      return NextResponse.json(
+        { error: "proposalIds (string[]) and action ('approve'|'reject') are required" },
+        { status: 400 }
+      );
+    }
+    const { proposalIds, action } = parsed.data;
+    const count =
+      action === "approve"
+        ? await batchApproveProposals(proposalIds)
+        : await batchRejectProposals(proposalIds);
+    return NextResponse.json({ success: true, action, count });
+  } catch (err: unknown) {
+    const message =
+      err instanceof Error ? err.message : "Batch operation failed";
+    return NextResponse.json({ error: message }, { status: 500 });
+  }
+}