npm - @spacek33z/autoauto - Versions diffs - 0.0.1 - Mend

@spacek33z/autoauto 0.0.1

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (67) hide show

package/README.md +197 -0
package/package.json +51 -0
package/src/App.tsx +224 -0
package/src/cli.ts +772 -0
package/src/components/AgentPanel.tsx +254 -0
package/src/components/Chat.test.tsx +71 -0
package/src/components/Chat.tsx +308 -0
package/src/components/CycleField.tsx +23 -0
package/src/components/ModelPicker.tsx +97 -0
package/src/components/PostUpdatePrompt.tsx +46 -0
package/src/components/ResultsTable.tsx +172 -0
package/src/components/RunCompletePrompt.tsx +90 -0
package/src/components/RunSettingsOverlay.tsx +49 -0
package/src/components/RunsTable.tsx +219 -0
package/src/components/StatsHeader.tsx +100 -0
package/src/daemon.ts +264 -0
package/src/index.tsx +8 -0
package/src/lib/agent/agent-provider.test.ts +133 -0
package/src/lib/agent/claude-provider.ts +277 -0
package/src/lib/agent/codex-provider.ts +413 -0
package/src/lib/agent/default-providers.ts +10 -0
package/src/lib/agent/index.ts +32 -0
package/src/lib/agent/mock-provider.ts +61 -0
package/src/lib/agent/opencode-provider.ts +424 -0
package/src/lib/agent/types.ts +73 -0
package/src/lib/auth.ts +11 -0
package/src/lib/config.ts +152 -0
package/src/lib/daemon-callbacks.ts +59 -0
package/src/lib/daemon-client.ts +16 -0
package/src/lib/daemon-lifecycle.ts +368 -0
package/src/lib/daemon-spawn.ts +122 -0
package/src/lib/daemon-status.ts +189 -0
package/src/lib/daemon-watcher.ts +192 -0
package/src/lib/experiment-loop.ts +679 -0
package/src/lib/experiment.ts +356 -0
package/src/lib/finalize.test.ts +143 -0
package/src/lib/finalize.ts +511 -0
package/src/lib/format.test.ts +32 -0
package/src/lib/format.ts +44 -0
package/src/lib/git.ts +176 -0
package/src/lib/ideas-backlog.test.ts +54 -0
package/src/lib/ideas-backlog.ts +109 -0
package/src/lib/measure.ts +472 -0
package/src/lib/model-options.ts +24 -0
package/src/lib/programs.ts +247 -0
package/src/lib/push-stream.ts +48 -0
package/src/lib/run-context.ts +112 -0
package/src/lib/run-setup.ts +34 -0
package/src/lib/run.ts +383 -0
package/src/lib/syntax-theme.ts +39 -0
package/src/lib/system-prompts/experiment.ts +77 -0
package/src/lib/system-prompts/finalize.ts +90 -0
package/src/lib/system-prompts/index.ts +7 -0
package/src/lib/system-prompts/setup.ts +516 -0
package/src/lib/system-prompts/update.ts +188 -0
package/src/lib/tool-events.ts +99 -0
package/src/lib/validate-measurement.ts +326 -0
package/src/lib/worktree.ts +40 -0
package/src/screens/AuthErrorScreen.tsx +31 -0
package/src/screens/ExecutionScreen.tsx +851 -0
package/src/screens/FirstSetupScreen.tsx +168 -0
package/src/screens/HomeScreen.tsx +406 -0
package/src/screens/PreRunScreen.tsx +206 -0
package/src/screens/SettingsScreen.tsx +189 -0
package/src/screens/SetupScreen.tsx +226 -0
package/src/tui.tsx +17 -0
package/tsconfig.json +17 -0

package/src/components/StatsHeader.tsx ADDED Viewed

@@ -0,0 +1,100 @@
+interface StatsHeaderProps {
+  experimentNumber: number
+  maxExperiments: number
+  width: number
+  modelLabel: string
+  totalKeeps: number
+  totalDiscards: number
+  totalCrashes: number
+  currentBaseline: number
+  originalBaseline: number
+  bestMetric: number
+  direction: "lower" | "higher"
+  metricField: string
+  totalCostUsd: number
+  metricHistory: number[]
+  currentPhaseLabel: string
+  improvementPct: number
+}
+const BLOCKS = "▁▂▃▄▅▆▇█"
+function renderSparkline(values: number[], direction: "lower" | "higher"): string {
+  if (values.length === 0) return ""
+  // Cap to last 50 values
+  const recent = values.length > 50 ? values.slice(-50) : values
+  const min = Math.min(...recent)
+  const max = Math.max(...recent)
+  if (min === max) return BLOCKS[4].repeat(recent.length)
+  return recent
+    .map((v) => {
+      let normalized = (v - min) / (max - min)
+      // For "lower" direction, invert so improvements (lower values) render as higher blocks
+      if (direction === "lower") normalized = 1 - normalized
+      const index = Math.round(normalized * 7)
+      return BLOCKS[index]
+    })
+    .join("")
+}
+function formatImprovementPct(pct: number): string {
+  if (pct === 0) return ""
+  return `${pct > 0 ? "+" : ""}${pct.toFixed(1)}%`
+}
+export function StatsHeader(props: StatsHeaderProps) {
+  const improvementStr = formatImprovementPct(props.improvementPct)
+  const sparkline = renderSparkline(props.metricHistory, props.direction)
+  const contentWidth = Math.max(props.width - 4, 0)
+  return (
+      <box paddingX={1} flexDirection="column">
+        <box width={contentWidth} flexDirection="row" justifyContent="space-between">
+          <text selectable>
+            <span fg="#9ece6a"><strong>kept {props.totalKeeps}</strong></span>
+            {"    "}
+            <span fg="#ff5555">disc {props.totalDiscards}</span>
+            {"    "}
+            <span fg="#ffffff">crash {props.totalCrashes}</span>
+            {"    "}
+            <span fg="#ffffff">$</span>
+            <span fg="#ffffff">{props.totalCostUsd.toFixed(2)}</span>
+            {"    "}
+            <span fg="#ffffff">#{props.experimentNumber}/{props.maxExperiments}</span>
+          </text>
+          <text fg="#666666" selectable>{props.modelLabel}</text>
+        </box>
+        <box>
+          <text selectable>
+            <span fg="#ffffff">baseline </span>
+            <span fg="#7aa2f7">{props.currentBaseline}</span>
+            {"    "}
+            <span fg="#ffffff">{"best "}</span>
+            <span fg="#9ece6a">{props.bestMetric}</span>
+            {improvementStr ? (
+              <>
+                {"    "}
+                <span fg="#e0af68">{improvementStr}</span>
+              </>
+            ) : null}
+            {sparkline ? (
+              <>
+                {"    "}
+                <span fg="#7aa2f7">{sparkline}</span>
+              </>
+            ) : null}
+          </text>
+        </box>
+        <box>
+          <text selectable>
+            <span fg="#ffffff">{"> "}</span>
+            <span fg="#ffffff">{props.currentPhaseLabel}</span>
+          </text>
+        </box>
+      </box>
+  )
+}

package/src/daemon.ts ADDED Viewed

@@ -0,0 +1,264 @@
+/**
+ * AutoAuto Daemon — background experiment loop runner.
+ *
+ * Spawned by the TUI as a detached process. Runs the experiment loop
+ * inside a git worktree, writes state to files in the main .autoauto/ dir.
+ *
+ * Usage:
+ *   bun <path>/daemon.ts --program <slug> --run-id <id> --main-root <path> --worktree <path>
+ */
+import { join } from "node:path"
+import { closeProviders } from "./lib/agent/index.ts"
+import { registerDefaultProviders } from "./lib/agent/default-providers.ts"
+import { loadProgramConfig } from "./lib/programs.ts"
+import { readState, writeState, appendResult, serializeSecondaryValues } from "./lib/run.ts"
+import { lockMeasurement, unlockMeasurement } from "./lib/run-setup.ts"
+import type { RunState } from "./lib/run.ts"
+import { runExperimentLoop } from "./lib/experiment-loop.ts"
+import { runMeasurementSeries } from "./lib/measure.ts"
+import { getFullSha, getCurrentBranch, formatShellError } from "./lib/git.ts"
+import { createFileCallbacks } from "./lib/daemon-callbacks.ts"
+import {
+  writeDaemonJson,
+  startHeartbeat,
+  readRunConfig,
+  runConfigToModelSlot,
+  readControl,
+  releaseLock,
+  recoverFromCrash,
+  waitForDaemonStub,
+  killChildProcessTree,
+} from "./lib/daemon-lifecycle.ts"
+// --- Parse CLI args ---
+function parseArgs(): { programSlug: string; runId: string; mainRoot: string; worktreePath: string; daemonId: string; inPlace: boolean } {
+  const args = process.argv.slice(2)
+  const inPlace = args.includes("--in-place")
+  // Remove --in-place before key-value parsing (it's a boolean flag)
+  const kvArgs = args.filter((a) => a !== "--in-place")
+  const map = new Map<string, string>()
+  for (let i = 0; i < kvArgs.length; i += 2) {
+    const key = kvArgs[i]?.replace(/^--/, "")
+    const val = kvArgs[i + 1]
+    if (key && val) map.set(key, val)
+  }
+  const programSlug = map.get("program")
+  const runId = map.get("run-id")
+  const mainRoot = map.get("main-root")
+  const worktreePath = map.get("worktree")
+  const daemonId = map.get("daemon-id")
+  if (!programSlug || !runId || !mainRoot || !worktreePath || !daemonId) {
+    process.stderr.write("Usage: daemon.ts --program <slug> --run-id <id> --main-root <path> --worktree <path> --daemon-id <id> [--in-place]\n")
+    process.exit(1)
+  }
+  return { programSlug, runId, mainRoot, worktreePath, daemonId, inPlace }
+}
+// --- Main ---
+async function main() {
+  registerDefaultProviders()
+  const { programSlug, runId, mainRoot, worktreePath, daemonId, inPlace } = parseArgs()
+  const programDir = join(mainRoot, ".autoauto", "programs", programSlug)
+  const runDir = join(programDir, "runs", runId)
+  // 1. Write daemon.json with daemon_id + heartbeat
+  await waitForDaemonStub(runDir, daemonId)
+  await writeDaemonJson(runDir, runId, worktreePath, daemonId)
+  const heartbeatInterval = startHeartbeat(runDir, daemonId)
+  // 2. Read per-run config
+  const runConfig = await readRunConfig(runDir)
+  const modelConfig = runConfig ? runConfigToModelSlot(runConfig) : { provider: "claude" as const, model: "sonnet", effort: "high" as const }
+  if (!runConfig?.max_experiments) throw new Error("run-config.json must specify max_experiments")
+  const maxExperiments = runConfig.max_experiments
+  const ideasBacklogEnabled = runConfig?.ideas_backlog_enabled ?? true
+  // 3. Stop/abort signals
+  let stopRequested = false
+  const abortController = new AbortController()
+  process.on("SIGTERM", async () => {
+    const control = await readControl(runDir)
+    if (control?.action === "abort") {
+      abortController.abort()
+      setTimeout(() => {
+        killChildProcessTree(process.pid).catch(() => {})
+      }, 3_000).unref()
+    } else {
+      // Default: stop after current experiment
+      stopRequested = true
+    }
+  })
+  try {
+    // 5. Crash recovery
+    const recoveredState = await recoverFromCrash(runDir, worktreePath)
+    if (recoveredState === null) {
+      // Either first run (no state.json yet) or crashed during baseline.
+      // Check if state.json exists and is in crashed state
+      let existingState: RunState | null = null
+      try {
+        existingState = await readState(runDir)
+      } catch {
+        // No state.json — first run
+      }
+      if (existingState?.phase === "crashed") {
+        // Baseline crash — nothing we can do
+        process.stderr.write(`Run crashed during ${existingState.error_phase}: ${existingState.error}\n`)
+        return
+      }
+      // 6. Fresh run: write initial state with phase: "baseline"
+      const config = await loadProgramConfig(programDir)
+      const originalBranch = await getCurrentBranch(mainRoot)
+      const now = new Date().toISOString()
+      const baselineState: RunState = {
+        run_id: runId,
+        program_slug: programSlug,
+        phase: "baseline",
+        experiment_number: 0,
+        original_baseline: 0,
+        current_baseline: 0,
+        best_metric: 0,
+        best_experiment: 0,
+        total_keeps: 0,
+        total_discards: 0,
+        total_crashes: 0,
+        branch_name: `autoauto-${programSlug}-${runId}`,
+        original_baseline_sha: "",
+        last_known_good_sha: "",
+        candidate_sha: null,
+        started_at: now,
+        updated_at: now,
+        model: modelConfig.model,
+        provider: modelConfig.provider,
+        effort: modelConfig.effort,
+        total_tokens: 0,
+        total_cost_usd: 0,
+        termination_reason: null,
+        original_branch: originalBranch,
+        worktree_path: worktreePath,
+        in_place: inPlace || undefined,
+        error: null,
+        error_phase: null,
+      }
+      await writeState(runDir, baselineState)
+      // 7. Lock measurement files + run baseline
+      await lockMeasurement(programDir)
+      const measureShPath = join(programDir, "measure.sh")
+      const buildShPath = join(programDir, "build.sh")
+      const baseline = await runMeasurementSeries(measureShPath, worktreePath, config, abortController.signal, buildShPath)
+      if (!baseline.success) {
+        const errorState: RunState = {
+          ...baselineState,
+          phase: "crashed",
+          error: `Baseline measurement failed: ${baseline.failure_reason ?? "unknown error"}`,
+          error_phase: "baseline",
+          updated_at: new Date().toISOString(),
+        }
+        await writeState(runDir, errorState)
+        await unlockMeasurement(programDir)
+        await releaseLock(programDir)
+        return
+      }
+      if (!baseline.quality_gates_passed) {
+        const errorState: RunState = {
+          ...baselineState,
+          phase: "crashed",
+          error: `Baseline quality gates failed: ${baseline.gate_violations.join(", ")}`,
+          error_phase: "baseline",
+          updated_at: new Date().toISOString(),
+        }
+        await writeState(runDir, errorState)
+        await unlockMeasurement(programDir)
+        await releaseLock(programDir)
+        return
+      }
+      const fullSha = await getFullSha(worktreePath)
+      await appendResult(runDir, {
+        experiment_number: 0,
+        commit: fullSha.slice(0, 7),
+        metric_value: baseline.median_metric,
+        secondary_values: serializeSecondaryValues(baseline.median_quality_gates, baseline.median_secondary_metrics),
+        status: "keep",
+        description: "baseline",
+        measurement_duration_ms: baseline.duration_ms,
+      })
+      const readyState: RunState = {
+        ...baselineState,
+        phase: "idle",
+        original_baseline: baseline.median_metric,
+        current_baseline: baseline.median_metric,
+        best_metric: baseline.median_metric,
+        original_baseline_sha: fullSha,
+        last_known_good_sha: fullSha,
+        updated_at: new Date().toISOString(),
+      }
+      await writeState(runDir, readyState)
+      // 8. Run the experiment loop
+      const callbacks = createFileCallbacks(runDir)
+      await runExperimentLoop(
+        worktreePath,
+        programDir,
+        runDir,
+        config,
+        modelConfig,
+        callbacks,
+        {
+          maxExperiments,
+          signal: abortController.signal,
+          stopRequested: () => stopRequested,
+          ideasBacklogEnabled,
+          baselineDiagnostics: baseline.diagnostics,
+        },
+      )
+    } else {
+      // Recovered from crash — resume the loop
+      const config = await loadProgramConfig(programDir)
+      const callbacks = createFileCallbacks(runDir)
+      await runExperimentLoop(
+        worktreePath,
+        programDir,
+        runDir,
+        config,
+        modelConfig,
+        callbacks,
+        {
+          maxExperiments,
+          signal: abortController.signal,
+          stopRequested: () => stopRequested,
+          ideasBacklogEnabled,
+        },
+      )
+    }
+  } finally {
+    // Cleanup
+    clearInterval(heartbeatInterval)
+    await closeProviders()
+    await releaseLock(programDir)
+    await unlockMeasurement(programDir).catch(() => {})
+  }
+}
+main().catch((err) => {
+  process.stderr.write(`Daemon fatal error: ${formatShellError(err)}\n`)
+  process.exit(1)
+})

package/src/index.tsx ADDED Viewed

@@ -0,0 +1,8 @@
+#!/usr/bin/env bun
+if (process.argv.length > 2) {
+  const { run } = await import("./cli.ts")
+  await run(process.argv.slice(2))
+} else {
+  await import("./tui.tsx")
+}

package/src/lib/agent/agent-provider.test.ts ADDED Viewed

@@ -0,0 +1,133 @@
+import { describe, test, expect } from "bun:test"
+import { MockProvider } from "./mock-provider.ts"
+import { setProvider, getProvider } from "./index.ts"
+import type { AgentEvent } from "./types.ts"
+describe("AgentProvider contract", () => {
+  test("one-shot session: runOnce yields events and ends with result", async () => {
+    const events: AgentEvent[] = [
+      { type: "text_delta", text: "Hello " },
+      { type: "text_delta", text: "world" },
+      { type: "tool_use", tool: "Read", input: { file_path: "/tmp/test.ts" } },
+      { type: "assistant_complete", text: "Hello world" },
+      { type: "result", success: true, cost: {
+        total_cost_usd: 0.01,
+        duration_ms: 1000,
+        duration_api_ms: 800,
+        num_turns: 1,
+        input_tokens: 100,
+        output_tokens: 50,
+      }},
+    ]
+    const provider = new MockProvider(events)
+    const session = provider.runOnce("Do something", { tools: ["Read"] })
+    const received: AgentEvent[] = []
+    for await (const event of session) {
+      received.push(event)
+    }
+    expect(received).toEqual(events)
+    expect(received.at(-1)?.type).toBe("result")
+  })
+  test("multi-turn session: pushMessage accepts messages over time", async () => {
+    const events: AgentEvent[] = [
+      { type: "assistant_complete", text: "Got it" },
+      { type: "result", success: true },
+    ]
+    const provider = new MockProvider(events)
+    const session = provider.createSession({ systemPrompt: "Be helpful" })
+    // Push a message (should not throw)
+    session.pushMessage("First message")
+    session.pushMessage("Second message")
+    const received: AgentEvent[] = []
+    for await (const event of session) {
+      received.push(event)
+    }
+    expect(received).toHaveLength(2)
+    expect(received[0].type).toBe("assistant_complete")
+  })
+  test("auth check: returns success", async () => {
+    const provider = new MockProvider()
+    const result = await provider.checkAuth()
+    expect(result.authenticated).toBe(true)
+    if (result.authenticated) {
+      expect(result.account.email).toBe("test@example.com")
+    }
+  })
+  test("auth check: returns failure", async () => {
+    const provider = new MockProvider([], {
+      authenticated: false,
+      error: "Invalid API key",
+    })
+    const result = await provider.checkAuth()
+    expect(result.authenticated).toBe(false)
+    if (!result.authenticated) {
+      expect(result.error).toBe("Invalid API key")
+    }
+  })
+  test("error during stream: provider emits error event", async () => {
+    const events: AgentEvent[] = [
+      { type: "text_delta", text: "Starting..." },
+      { type: "error", error: "Rate limit exceeded", retriable: true },
+      { type: "result", success: false, error: "Rate limit exceeded" },
+    ]
+    const provider = new MockProvider(events)
+    const session = provider.runOnce("Do something", {})
+    const received: AgentEvent[] = []
+    for await (const event of session) {
+      received.push(event)
+    }
+    const errorEvent = received.find((e) => e.type === "error")
+    expect(errorEvent).toBeDefined()
+    if (errorEvent?.type === "error") {
+      expect(errorEvent.retriable).toBe(true)
+      expect(errorEvent.error).toBe("Rate limit exceeded")
+    }
+  })
+  test("abort mid-stream: close() stops iteration", async () => {
+    const events: AgentEvent[] = [
+      { type: "text_delta", text: "First" },
+      { type: "text_delta", text: "Second" },
+      { type: "text_delta", text: "Third" },
+      { type: "result", success: true },
+    ]
+    const provider = new MockProvider(events)
+    const session = provider.createSession({})
+    session.pushMessage("Go")
+    const received: AgentEvent[] = []
+    for await (const event of session) {
+      received.push(event)
+      if (received.length === 1) {
+        session.close()
+      }
+    }
+    // Should have stopped after close() — got at most 1 event
+    expect(received.length).toBeLessThanOrEqual(1)
+  })
+  test("registry: getProvider throws before setProvider", () => {
+    // Reset — create a fresh import context isn't easy, so just test the pattern
+    const provider = new MockProvider()
+    setProvider("claude", provider)
+    expect(getProvider("claude")).toBe(provider)
+  })
+})