npm - agent-eval-opencode - Versions diffs - 0.10.0 - Mend

agent-eval-opencode 0.10.0

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (129) hide show

package/dist/cli.d.ts +6 -0
package/dist/cli.d.ts.map +1 -0
package/dist/cli.js +590 -0
package/dist/cli.js.map +1 -0
package/dist/index.d.ts +30 -0
package/dist/index.d.ts.map +1 -0
package/dist/index.js +29 -0
package/dist/index.js.map +1 -0
package/dist/lib/agents/claude-code.d.ts +12 -0
package/dist/lib/agents/claude-code.d.ts.map +1 -0
package/dist/lib/agents/claude-code.js +231 -0
package/dist/lib/agents/claude-code.js.map +1 -0
package/dist/lib/agents/codex.d.ts +12 -0
package/dist/lib/agents/codex.d.ts.map +1 -0
package/dist/lib/agents/codex.js +267 -0
package/dist/lib/agents/codex.js.map +1 -0
package/dist/lib/agents/cursor.d.ts +10 -0
package/dist/lib/agents/cursor.d.ts.map +1 -0
package/dist/lib/agents/cursor.js +204 -0
package/dist/lib/agents/cursor.js.map +1 -0
package/dist/lib/agents/gemini.d.ts +10 -0
package/dist/lib/agents/gemini.d.ts.map +1 -0
package/dist/lib/agents/gemini.js +207 -0
package/dist/lib/agents/gemini.js.map +1 -0
package/dist/lib/agents/index.d.ts +7 -0
package/dist/lib/agents/index.d.ts.map +1 -0
package/dist/lib/agents/index.js +20 -0
package/dist/lib/agents/index.js.map +1 -0
package/dist/lib/agents/opencode.d.ts +11 -0
package/dist/lib/agents/opencode.d.ts.map +1 -0
package/dist/lib/agents/opencode.js +245 -0
package/dist/lib/agents/opencode.js.map +1 -0
package/dist/lib/agents/registry.d.ts +23 -0
package/dist/lib/agents/registry.d.ts.map +1 -0
package/dist/lib/agents/registry.js +35 -0
package/dist/lib/agents/registry.js.map +1 -0
package/dist/lib/agents/shared.d.ts +83 -0
package/dist/lib/agents/shared.d.ts.map +1 -0
package/dist/lib/agents/shared.js +192 -0
package/dist/lib/agents/shared.js.map +1 -0
package/dist/lib/agents/types.d.ts +73 -0
package/dist/lib/agents/types.d.ts.map +1 -0
package/dist/lib/agents/types.js +5 -0
package/dist/lib/agents/types.js.map +1 -0
package/dist/lib/classifier.d.ts +89 -0
package/dist/lib/classifier.d.ts.map +1 -0
package/dist/lib/classifier.js +285 -0
package/dist/lib/classifier.js.map +1 -0
package/dist/lib/config.d.ts +37 -0
package/dist/lib/config.d.ts.map +1 -0
package/dist/lib/config.js +187 -0
package/dist/lib/config.js.map +1 -0
package/dist/lib/dashboard.d.ts +65 -0
package/dist/lib/dashboard.d.ts.map +1 -0
package/dist/lib/dashboard.js +237 -0
package/dist/lib/dashboard.js.map +1 -0
package/dist/lib/docker-sandbox.d.ts +92 -0
package/dist/lib/docker-sandbox.d.ts.map +1 -0
package/dist/lib/docker-sandbox.js +375 -0
package/dist/lib/docker-sandbox.js.map +1 -0
package/dist/lib/fingerprint.d.ts +15 -0
package/dist/lib/fingerprint.d.ts.map +1 -0
package/dist/lib/fingerprint.js +59 -0
package/dist/lib/fingerprint.js.map +1 -0
package/dist/lib/fixture.d.ts +55 -0
package/dist/lib/fixture.d.ts.map +1 -0
package/dist/lib/fixture.js +215 -0
package/dist/lib/fixture.js.map +1 -0
package/dist/lib/housekeeping.d.ts +26 -0
package/dist/lib/housekeeping.d.ts.map +1 -0
package/dist/lib/housekeeping.js +170 -0
package/dist/lib/housekeeping.js.map +1 -0
package/dist/lib/init.d.ts +21 -0
package/dist/lib/init.d.ts.map +1 -0
package/dist/lib/init.js +275 -0
package/dist/lib/init.js.map +1 -0
package/dist/lib/o11y/index.d.ts +13 -0
package/dist/lib/o11y/index.d.ts.map +1 -0
package/dist/lib/o11y/index.js +13 -0
package/dist/lib/o11y/index.js.map +1 -0
package/dist/lib/o11y/parsers/claude-code.d.ts +18 -0
package/dist/lib/o11y/parsers/claude-code.d.ts.map +1 -0
package/dist/lib/o11y/parsers/claude-code.js +343 -0
package/dist/lib/o11y/parsers/claude-code.js.map +1 -0
package/dist/lib/o11y/parsers/codex.d.ts +17 -0
package/dist/lib/o11y/parsers/codex.d.ts.map +1 -0
package/dist/lib/o11y/parsers/codex.js +364 -0
package/dist/lib/o11y/parsers/codex.js.map +1 -0
package/dist/lib/o11y/parsers/cursor.d.ts +21 -0
package/dist/lib/o11y/parsers/cursor.d.ts.map +1 -0
package/dist/lib/o11y/parsers/cursor.js +226 -0
package/dist/lib/o11y/parsers/cursor.js.map +1 -0
package/dist/lib/o11y/parsers/gemini.d.ts +21 -0
package/dist/lib/o11y/parsers/gemini.d.ts.map +1 -0
package/dist/lib/o11y/parsers/gemini.js +241 -0
package/dist/lib/o11y/parsers/gemini.js.map +1 -0
package/dist/lib/o11y/parsers/index.d.ts +55 -0
package/dist/lib/o11y/parsers/index.d.ts.map +1 -0
package/dist/lib/o11y/parsers/index.js +284 -0
package/dist/lib/o11y/parsers/index.js.map +1 -0
package/dist/lib/o11y/parsers/opencode.d.ts +17 -0
package/dist/lib/o11y/parsers/opencode.d.ts.map +1 -0
package/dist/lib/o11y/parsers/opencode.js +320 -0
package/dist/lib/o11y/parsers/opencode.js.map +1 -0
package/dist/lib/o11y/types.d.ts +113 -0
package/dist/lib/o11y/types.d.ts.map +1 -0
package/dist/lib/o11y/types.js +6 -0
package/dist/lib/o11y/types.js.map +1 -0
package/dist/lib/results.d.ts +91 -0
package/dist/lib/results.d.ts.map +1 -0
package/dist/lib/results.js +361 -0
package/dist/lib/results.js.map +1 -0
package/dist/lib/runner.d.ts +71 -0
package/dist/lib/runner.d.ts.map +1 -0
package/dist/lib/runner.js +267 -0
package/dist/lib/runner.js.map +1 -0
package/dist/lib/sandbox.d.ts +173 -0
package/dist/lib/sandbox.d.ts.map +1 -0
package/dist/lib/sandbox.js +337 -0
package/dist/lib/sandbox.js.map +1 -0
package/dist/lib/types.d.ts +258 -0
package/dist/lib/types.d.ts.map +1 -0
package/dist/lib/types.js +15 -0
package/dist/lib/types.js.map +1 -0
package/dist/test-setup.d.ts +2 -0
package/dist/test-setup.d.ts.map +1 -0
package/dist/test-setup.js +6 -0
package/dist/test-setup.js.map +1 -0
package/package.json +72 -0

package/dist/lib/init.js ADDED Viewed

@@ -0,0 +1,275 @@
+/**
+ * Project initialization - create new eval projects.
+ */
+import { mkdirSync, writeFileSync, existsSync } from 'fs';
+import { join, dirname } from 'path';
+import pkg from '../../package.json' with { type: 'json' };
+/**
+ * Get the package.json template.
+ */
+function getPackageJson(projectName) {
+    return JSON.stringify({
+        name: projectName,
+        version: '0.0.1',
+        private: true,
+        type: 'module',
+        devDependencies: {
+            '@vercel/agent-eval': `^${pkg.version}`,
+            '@types/node': '^22.0.0',
+            typescript: '^5.6.0',
+            vitest: '^2.1.0',
+        },
+    }, null, 2);
+}
+/**
+ * Get the .env.example template.
+ */
+function getEnvExample() {
+    return `# OpenCode agent uses credentials from your local OpenCode installation.
+# No API keys are needed here -- auth is read from ~/.local/share/opencode/auth.json
+# and ~/.config/github-copilot/apps.json automatically.
+# To use the Vercel sandbox instead of Docker, set these:
+# VERCEL_TOKEN=your-vercel-token
+# VERCEL_TEAM_ID=your-team-id
+# VERCEL_PROJECT_ID=your-project-id
+`;
+}
+/**
+ * Get the .gitignore template.
+ */
+function getGitignore() {
+    return `node_modules/
+dist/
+.env
+.env.local
+results/
+*.log
+.DS_Store
+`;
+}
+/**
+ * Get the README.md template.
+ */
+function getReadme() {
+    return `# Agent Evaluation Suite
+Test AI coding agents to measure what actually works.
+## Prerequisites
+- **Docker** running (Colima, Docker Desktop, or OrbStack)
+- **OpenCode** authenticated with GitHub Copilot (\`~/.local/share/opencode/auth.json\` must exist)
+## Setup
+1. **Install dependencies:**
+   \`\`\`bash
+   npm install
+   \`\`\`
+## Running Evals
+### Preview (no cost)
+See what will run without making API calls:
+\`\`\`bash
+npx @vercel/agent-eval opencode --dry
+\`\`\`
+### Run Experiments
+\`\`\`bash
+npx @vercel/agent-eval opencode
+\`\`\`
+### View Results
+Launch the web-based results viewer:
+\`\`\`bash
+npx @vercel/agent-eval playground
+\`\`\`
+Open [http://localhost:3000](http://localhost:3000) to browse results.
+`;
+}
+function getOpencodeExperiment() {
+    return `import type { ExperimentConfig } from '@vercel/agent-eval';
+const config: ExperimentConfig = {
+  agent: 'opencode',
+  model: 'github-copilot/claude-opus-4.6',
+  sandbox: 'docker',
+  runs: 1,
+  earlyExit: true,
+  scripts: ['build'],
+  timeout: 600,
+};
+export default config;
+`;
+}
+/**
+ * Get the example eval fixture PROMPT.md.
+ */
+function getExamplePrompt() {
+    return `Add a greeting message below the heading that says "Welcome, user!"
+Requirements:
+- Add a paragraph element below the h1
+- The text should be exactly "Welcome, user!"
+- Keep the existing heading unchanged
+`;
+}
+/**
+ * Get the example eval fixture EVAL.ts.
+ */
+function getExampleEval() {
+    return `import { readFileSync } from 'fs';
+import { execSync } from 'child_process';
+import { test, expect } from 'vitest';
+test('greeting message exists in source', () => {
+  const content = readFileSync('src/App.tsx', 'utf-8');
+  expect(content).toContain('Welcome, user!');
+});
+test('app still builds', () => {
+  // This throws if the build fails
+  execSync('npm run build', { stdio: 'pipe' });
+});
+`;
+}
+/**
+ * Get the example eval fixture package.json.
+ */
+function getExamplePackageJson() {
+    return JSON.stringify({
+        name: 'add-greeting',
+        type: 'module',
+        scripts: {
+            build: 'tsc',
+        },
+        dependencies: {
+            react: '^18.0.0',
+        },
+        devDependencies: {
+            '@types/react': '^18.0.0',
+            typescript: '^5.0.0',
+            vitest: '^2.1.0',
+        },
+    }, null, 2);
+}
+/**
+ * Get the root tsconfig.json for the project.
+ */
+function getRootTsconfig() {
+    return JSON.stringify({
+        compilerOptions: {
+            target: 'ES2022',
+            module: 'NodeNext',
+            moduleResolution: 'NodeNext',
+            strict: true,
+            skipLibCheck: true,
+            noEmit: true,
+            lib: ['ES2022'],
+        },
+        include: ['experiments'],
+    }, null, 2);
+}
+/**
+ * Get the example eval fixture tsconfig.json.
+ */
+function getExampleTsconfig() {
+    return JSON.stringify({
+        compilerOptions: {
+            target: 'ES2020',
+            module: 'ESNext',
+            moduleResolution: 'bundler',
+            jsx: 'react-jsx',
+            strict: true,
+            outDir: 'dist',
+            skipLibCheck: true,
+        },
+        include: ['src'],
+    }, null, 2);
+}
+/**
+ * Get the example eval fixture App.tsx.
+ */
+function getExampleApp() {
+    return `export function App() {
+  return (
+    <div>
+      <h1>Hello World</h1>
+      {/* TODO: Add greeting message here */}
+    </div>
+  );
+}
+export default App;
+`;
+}
+/**
+ * Get all template files for a new project.
+ */
+function getTemplateFiles(projectName) {
+    return [
+        { path: 'package.json', content: getPackageJson(projectName) },
+        { path: 'tsconfig.json', content: getRootTsconfig() },
+        { path: '.env.example', content: getEnvExample() },
+        { path: '.gitignore', content: getGitignore() },
+        { path: 'README.md', content: getReadme() },
+        { path: 'experiments/opencode.ts', content: getOpencodeExperiment() },
+        { path: 'evals/add-greeting/PROMPT.md', content: getExamplePrompt() },
+        { path: 'evals/add-greeting/EVAL.ts', content: getExampleEval() },
+        { path: 'evals/add-greeting/package.json', content: getExamplePackageJson() },
+        { path: 'evals/add-greeting/tsconfig.json', content: getExampleTsconfig() },
+        { path: 'evals/add-greeting/src/App.tsx', content: getExampleApp() },
+    ];
+}
+/**
+ * Initialize a new eval project.
+ */
+export function initProject(options) {
+    const targetDir = options.targetDir ?? process.cwd();
+    const projectDir = join(targetDir, options.name);
+    // Check if directory already exists
+    if (existsSync(projectDir)) {
+        throw new Error(`Directory already exists: ${projectDir}`);
+    }
+    // Create project directory
+    mkdirSync(projectDir, { recursive: true });
+    // Write all template files
+    const files = getTemplateFiles(options.name);
+    for (const file of files) {
+        const filePath = join(projectDir, file.path);
+        const fileDir = dirname(filePath);
+        // Create parent directories
+        mkdirSync(fileDir, { recursive: true });
+        // Write file
+        writeFileSync(filePath, file.content);
+    }
+    return projectDir;
+}
+/**
+ * Get instructions for after project creation.
+ */
+export function getPostInitInstructions(projectDir, projectName) {
+    return `
+Project created at: ${projectDir}
+Next steps:
+  1. cd ${projectName}
+  2. npm install
+  3. npx @vercel/agent-eval opencode
+Prerequisites:
+  - Docker running (Colima, Docker Desktop, or OrbStack)
+  - OpenCode authenticated with GitHub Copilot
+`;
+}
+//# sourceMappingURL=init.js.map

package/dist/lib/init.js.map ADDED Viewed

@@ -0,0 +1 @@

+ {"version":3,"file":"init.js","sourceRoot":"","sources":["../../src/lib/init.ts"],"names":[],"mappings":"AAAA;;GAEG;AAEH,OAAO,EAAE,SAAS,EAAE,aAAa,EAAE,UAAU,EAAE,MAAM,IAAI,CAAC;AAC1D,OAAO,EAAE,IAAI,EAAE,OAAO,EAAE,MAAM,MAAM,CAAC;AACrC,OAAO,GAAG,MAAM,oBAAoB,CAAC,OAAO,IAAI,EAAE,MAAM,EAAE,CAAC;AAoB3D;;GAEG;AACH,SAAS,cAAc,CAAC,WAAmB;IACzC,OAAO,IAAI,CAAC,SAAS,CACnB;QACE,IAAI,EAAE,WAAW;QACjB,OAAO,EAAE,OAAO;QAChB,OAAO,EAAE,IAAI;QACb,IAAI,EAAE,QAAQ;QACd,eAAe,EAAE;YACf,oBAAoB,EAAE,IAAI,GAAG,CAAC,OAAO,EAAE;YACvC,aAAa,EAAE,SAAS;YACxB,UAAU,EAAE,QAAQ;YACpB,MAAM,EAAE,QAAQ;SACjB;KACF,EACD,IAAI,EACJ,CAAC,CACF,CAAC;AACJ,CAAC;AAED;;GAEG;AACH,SAAS,aAAa;IACpB,OAAO;;;;;;;;CAQR,CAAC;AACF,CAAC;AAED;;GAEG;AACH,SAAS,YAAY;IACnB,OAAO;;;;;;;CAOR,CAAC;AACF,CAAC;AAED;;GAEG;AACH,SAAS,SAAS;IAChB,OAAO;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;CA0CR,CAAC;AACF,CAAC;AAED,SAAS,qBAAqB;IAC5B,OAAO;;;;;;;;;;;;;CAaR,CAAC;AACF,CAAC;AAED;;GAEG;AACH,SAAS,gBAAgB;IACvB,OAAO;;;;;;CAMR,CAAC;AACF,CAAC;AAED;;GAEG;AACH,SAAS,cAAc;IACrB,OAAO;;;;;;;;;;;;;CAaR,CAAC;AACF,CAAC;AAED;;GAEG;AACH,SAAS,qBAAqB;IAC5B,OAAO,IAAI,CAAC,SAAS,CACnB;QACE,IAAI,EAAE,cAAc;QACpB,IAAI,EAAE,QAAQ;QACd,OAAO,EAAE;YACP,KAAK,EAAE,KAAK;SACb;QACD,YAAY,EAAE;YACZ,KAAK,EAAE,SAAS;SACjB;QACD,eAAe,EAAE;YACf,cAAc,EAAE,SAAS;YACzB,UAAU,EAAE,QAAQ;YACpB,MAAM,EAAE,QAAQ;SACjB;KACF,EACD,IAAI,EACJ,CAAC,CACF,CAAC;AACJ,CAAC;AAED;;GAEG;AACH,SAAS,eAAe;IACtB,OAAO,IAAI,CAAC,SAAS,CACnB;QACE,eAAe,EAAE;YACf,MAAM,EAAE,QAAQ;YAChB,MAAM,EAAE,UAAU;YAClB,gBAAgB,EAAE,UAAU;YAC5B,MAAM,EAAE,IAAI;YACZ,YAAY,EAAE,IAAI;YAClB,MAAM,EAAE,IAAI;YACZ,GAAG,EAAE,CAAC,QAAQ,CAAC;SAChB;QACD,OAAO,EAAE,CAAC,aAAa,CAAC;KACzB,EACD,IAAI,EACJ,CAAC,CACF,CAAC;AACJ,CAAC;AAED;;GAEG;AACH,SAAS,kBAAkB;IACzB,OAAO,IAAI,CAAC,SAAS,CACnB;QACE,eAAe,EAAE;YACf,MAAM,EAAE,QAAQ;YAChB,MAAM,EAAE,QAAQ;YAChB,gBAAgB,EAAE,SAAS;YAC3B,GAAG,EAAE,WAAW;YAChB,MAAM,EAAE,IAAI;YACZ,MAAM,EAAE,MAAM;YACd,YAAY,EAAE,IAAI;SACnB;QACD,OAAO,EAAE,CAAC,KAAK,CAAC;KACjB,EACD,IAAI,EACJ,CAAC,CACF,CAAC;AACJ,CAAC;AAED;;GAEG;AACH,SAAS,aAAa;IACpB,OAAO;;;;;;;;;;CAUR,CAAC;AACF,CAAC;AAED;;GAEG;AACH,SAAS,gBAAgB,CAAC,WAAmB;IAC3C,OAAO;QACL,EAAE,IAAI,EAAE,cAAc,EAAE,OAAO,EAAE,cAAc,CAAC,WAAW,CAAC,EAAE;QAC9D,EAAE,IAAI,EAAE,eAAe,EAAE,OAAO,EAAE,eAAe,EAAE,EAAE;QACrD,EAAE,IAAI,EAAE,cAAc,EAAE,OAAO,EAAE,aAAa,EAAE,EAAE;QAClD,EAAE,IAAI,EAAE,YAAY,EAAE,OAAO,EAAE,YAAY,EAAE,EAAE;QAC/C,EAAE,IAAI,EAAE,WAAW,EAAE,OAAO,EAAE,SAAS,EAAE,EAAE;QAC3C,EAAE,IAAI,EAAE,yBAAyB,EAAE,OAAO,EAAE,qBAAqB,EAAE,EAAE;QACrE,EAAE,IAAI,EAAE,8BAA8B,EAAE,OAAO,EAAE,gBAAgB,EAAE,EAAE;QACrE,EAAE,IAAI,EAAE,4BAA4B,EAAE,OAAO,EAAE,cAAc,EAAE,EAAE;QACjE,EAAE,IAAI,EAAE,iCAAiC,EAAE,OAAO,EAAE,qBAAqB,EAAE,EAAE;QAC7E,EAAE,IAAI,EAAE,kCAAkC,EAAE,OAAO,EAAE,kBAAkB,EAAE,EAAE;QAC3E,EAAE,IAAI,EAAE,gCAAgC,EAAE,OAAO,EAAE,aAAa,EAAE,EAAE;KACrE,CAAC;AACJ,CAAC;AAED;;GAEG;AACH,MAAM,UAAU,WAAW,CAAC,OAAoB;IAC9C,MAAM,SAAS,GAAG,OAAO,CAAC,SAAS,IAAI,OAAO,CAAC,GAAG,EAAE,CAAC;IACrD,MAAM,UAAU,GAAG,IAAI,CAAC,SAAS,EAAE,OAAO,CAAC,IAAI,CAAC,CAAC;IAEjD,oCAAoC;IACpC,IAAI,UAAU,CAAC,UAAU,CAAC,EAAE,CAAC;QAC3B,MAAM,IAAI,KAAK,CAAC,6BAA6B,UAAU,EAAE,CAAC,CAAC;IAC7D,CAAC;IAED,2BAA2B;IAC3B,SAAS,CAAC,UAAU,EAAE,EAAE,SAAS,EAAE,IAAI,EAAE,CAAC,CAAC;IAE3C,2BAA2B;IAC3B,MAAM,KAAK,GAAG,gBAAgB,CAAC,OAAO,CAAC,IAAI,CAAC,CAAC;IAC7C,KAAK,MAAM,IAAI,IAAI,KAAK,EAAE,CAAC;QACzB,MAAM,QAAQ,GAAG,IAAI,CAAC,UAAU,EAAE,IAAI,CAAC,IAAI,CAAC,CAAC;QAC7C,MAAM,OAAO,GAAG,OAAO,CAAC,QAAQ,CAAC,CAAC;QAElC,4BAA4B;QAC5B,SAAS,CAAC,OAAO,EAAE,EAAE,SAAS,EAAE,IAAI,EAAE,CAAC,CAAC;QAExC,aAAa;QACb,aAAa,CAAC,QAAQ,EAAE,IAAI,CAAC,OAAO,CAAC,CAAC;IACxC,CAAC;IAED,OAAO,UAAU,CAAC;AACpB,CAAC;AAED;;GAEG;AACH,MAAM,UAAU,uBAAuB,CAAC,UAAkB,EAAE,WAAmB;IAC7E,OAAO;sBACa,UAAU;;;UAGtB,WAAW;;;;;;;CAOpB,CAAC;AACF,CAAC"}

package/dist/lib/o11y/index.d.ts ADDED Viewed

@@ -0,0 +1,13 @@
+/**
+ * Observability module for agent-eval.
+ * Provides transcript parsing and analysis across all agents.
+ */
+export type { ToolName, TranscriptEvent, WebFetchInfo, FileOperationInfo, ShellCommandInfo, TranscriptSummary, Transcript, } from './types.js';
+export { parseTranscript, parseTranscriptSummary, loadTranscript, SUPPORTED_AGENTS } from './parsers/index.js';
+export type { ParseableAgent } from './parsers/index.js';
+export { parseClaudeCodeTranscript } from './parsers/claude-code.js';
+export { parseCodexTranscript } from './parsers/codex.js';
+export { parseOpenCodeTranscript } from './parsers/opencode.js';
+export { parseGeminiTranscript } from './parsers/gemini.js';
+export { parseCursorTranscript } from './parsers/cursor.js';
+//# sourceMappingURL=index.d.ts.map

package/dist/lib/o11y/index.d.ts.map ADDED Viewed

@@ -0,0 +1 @@

+ {"version":3,"file":"index.d.ts","sourceRoot":"","sources":["../../../src/lib/o11y/index.ts"],"names":[],"mappings":"AAAA;;;GAGG;AAGH,YAAY,EACV,QAAQ,EACR,eAAe,EACf,YAAY,EACZ,iBAAiB,EACjB,gBAAgB,EAChB,iBAAiB,EACjB,UAAU,GACX,MAAM,YAAY,CAAC;AAGpB,OAAO,EAAE,eAAe,EAAE,sBAAsB,EAAE,cAAc,EAAE,gBAAgB,EAAE,MAAM,oBAAoB,CAAC;AAC/G,YAAY,EAAE,cAAc,EAAE,MAAM,oBAAoB,CAAC;AAGzD,OAAO,EAAE,yBAAyB,EAAE,MAAM,0BAA0B,CAAC;AACrE,OAAO,EAAE,oBAAoB,EAAE,MAAM,oBAAoB,CAAC;AAC1D,OAAO,EAAE,uBAAuB,EAAE,MAAM,uBAAuB,CAAC;AAChE,OAAO,EAAE,qBAAqB,EAAE,MAAM,qBAAqB,CAAC;AAC5D,OAAO,EAAE,qBAAqB,EAAE,MAAM,qBAAqB,CAAC"}

package/dist/lib/o11y/index.js ADDED Viewed

@@ -0,0 +1,13 @@
+/**
+ * Observability module for agent-eval.
+ * Provides transcript parsing and analysis across all agents.
+ */
+// Main parsing functions
+export { parseTranscript, parseTranscriptSummary, loadTranscript, SUPPORTED_AGENTS } from './parsers/index.js';
+// Individual parsers (for advanced use)
+export { parseClaudeCodeTranscript } from './parsers/claude-code.js';
+export { parseCodexTranscript } from './parsers/codex.js';
+export { parseOpenCodeTranscript } from './parsers/opencode.js';
+export { parseGeminiTranscript } from './parsers/gemini.js';
+export { parseCursorTranscript } from './parsers/cursor.js';
+//# sourceMappingURL=index.js.map

package/dist/lib/o11y/index.js.map ADDED Viewed

@@ -0,0 +1 @@

+ {"version":3,"file":"index.js","sourceRoot":"","sources":["../../../src/lib/o11y/index.ts"],"names":[],"mappings":"AAAA;;;GAGG;AAaH,yBAAyB;AACzB,OAAO,EAAE,eAAe,EAAE,sBAAsB,EAAE,cAAc,EAAE,gBAAgB,EAAE,MAAM,oBAAoB,CAAC;AAG/G,wCAAwC;AACxC,OAAO,EAAE,yBAAyB,EAAE,MAAM,0BAA0B,CAAC;AACrE,OAAO,EAAE,oBAAoB,EAAE,MAAM,oBAAoB,CAAC;AAC1D,OAAO,EAAE,uBAAuB,EAAE,MAAM,uBAAuB,CAAC;AAChE,OAAO,EAAE,qBAAqB,EAAE,MAAM,qBAAqB,CAAC;AAC5D,OAAO,EAAE,qBAAqB,EAAE,MAAM,qBAAqB,CAAC"}

package/dist/lib/o11y/parsers/claude-code.d.ts ADDED Viewed

@@ -0,0 +1,18 @@
+/**
+ * Parser for Claude Code transcript format.
+ * Claude Code stores transcripts as JSONL at ~/.claude/projects/{path}/{session}.jsonl
+ *
+ * Format reference (based on Claude Code CLI output):
+ * - Messages have type: "user" | "assistant"
+ * - Tool use appears in assistant messages with tool_use blocks
+ * - Tool results appear as separate messages with type: "tool_result"
+ */
+import type { TranscriptEvent } from '../types.js';
+/**
+ * Parse Claude Code JSONL transcript into events.
+ */
+export declare function parseClaudeCodeTranscript(raw: string): {
+    events: TranscriptEvent[];
+    errors: string[];
+};
+//# sourceMappingURL=claude-code.d.ts.map

package/dist/lib/o11y/parsers/claude-code.d.ts.map ADDED Viewed

	@@ -0,0 +1 @@
1	+ {"version":3,"file":"claude-code.d.ts","sourceRoot":"","sources":["../../../../src/lib/o11y/parsers/claude-code.ts"],"names":[],"mappings":"AAAA;;;;;;;;GAQG;AAEH,OAAO,KAAK,EAAE,eAAe,EAAY,MAAM,aAAa,CAAC;AA8T7D;;GAEG;AACH,wBAAgB,yBAAyB,CAAC,GAAG,EAAE,MAAM,GAAG;IACtD,MAAM,EAAE,eAAe,EAAE,CAAC;IAC1B,MAAM,EAAE,MAAM,EAAE,CAAC;CAClB,CAgDA"}

package/dist/lib/o11y/parsers/claude-code.js ADDED Viewed

@@ -0,0 +1,343 @@
+/**
+ * Parser for Claude Code transcript format.
+ * Claude Code stores transcripts as JSONL at ~/.claude/projects/{path}/{session}.jsonl
+ *
+ * Format reference (based on Claude Code CLI output):
+ * - Messages have type: "user" | "assistant"
+ * - Tool use appears in assistant messages with tool_use blocks
+ * - Tool results appear as separate messages with type: "tool_result"
+ */
+/**
+ * Map Claude Code tool names to canonical names.
+ */
+function normalizeToolName(name) {
+    const toolMap = {
+        // File operations
+        Read: 'file_read',
+        read_file: 'file_read',
+        ReadFile: 'file_read',
+        Write: 'file_write',
+        write_file: 'file_write',
+        WriteFile: 'file_write',
+        write_to_file: 'file_write',
+        Edit: 'file_edit',
+        edit_file: 'file_edit',
+        EditFile: 'file_edit',
+        str_replace_editor: 'file_edit',
+        StrReplace: 'file_edit',
+        // Shell
+        Bash: 'shell',
+        bash: 'shell',
+        Shell: 'shell',
+        shell: 'shell',
+        execute_command: 'shell',
+        run_command: 'shell',
+        // Web
+        WebFetch: 'web_fetch',
+        web_fetch: 'web_fetch',
+        fetch_url: 'web_fetch',
+        mcp__fetch__fetch: 'web_fetch',
+        WebSearch: 'web_search',
+        web_search: 'web_search',
+        // Search/navigation
+        Glob: 'glob',
+        glob: 'glob',
+        list_files: 'glob',
+        Grep: 'grep',
+        grep: 'grep',
+        search_files: 'grep',
+        LS: 'list_dir',
+        list_dir: 'list_dir',
+        ListDir: 'list_dir',
+        // Agent/subagent tools
+        Task: 'agent_task',
+        task: 'agent_task',
+    };
+    return toolMap[name] || 'unknown';
+}
+/**
+ * Extract file path from tool arguments.
+ */
+function extractFilePath(args) {
+    return (args.path || args.file_path || args.filename || args.file);
+}
+/**
+ * Extract URL from tool arguments.
+ */
+function extractUrl(args) {
+    return (args.url || args.uri || args.href);
+}
+/**
+ * Extract command from tool arguments.
+ */
+function extractCommand(args) {
+    if (typeof args.command === 'string')
+        return args.command;
+    if (Array.isArray(args.command))
+        return args.command.join(' ');
+    if (typeof args.cmd === 'string')
+        return args.cmd;
+    return undefined;
+}
+/**
+ * Parse a single JSONL line from Claude Code transcript.
+ */
+function parseClaudeCodeLine(line) {
+    const events = [];
+    try {
+        const data = JSON.parse(line);
+        // Handle different Claude Code message formats
+        if (data.type === 'user' || data.role === 'user') {
+            // Check if this is a tool_result message (user message containing tool results)
+            const contentArray = getContentArray(data);
+            const toolResults = contentArray?.filter((block) => block.type === 'tool_result');
+            if (toolResults && toolResults.length > 0) {
+                // Extract tool results from user message
+                for (const result of toolResults) {
+                    const r = result;
+                    events.push({
+                        timestamp: data.timestamp,
+                        type: 'tool_result',
+                        tool: {
+                            name: 'unknown',
+                            originalName: (r.tool_use_id || 'unknown'),
+                            result: r.content,
+                            success: !r.is_error && !r.error,
+                        },
+                        raw: r,
+                    });
+                }
+            }
+            else {
+                // Regular user message
+                events.push({
+                    timestamp: data.timestamp,
+                    type: 'message',
+                    role: 'user',
+                    content: extractContent(data),
+                    raw: data,
+                });
+            }
+        }
+        else if (data.type === 'assistant' || data.role === 'assistant') {
+            // Assistant message - may contain text and/or tool_use blocks
+            const content = extractContent(data);
+            if (content) {
+                events.push({
+                    timestamp: data.timestamp,
+                    type: 'message',
+                    role: 'assistant',
+                    content,
+                    raw: data,
+                });
+            }
+            // Extract tool_use blocks
+            const toolUses = extractToolUses(data);
+            for (const toolUse of toolUses) {
+                events.push({
+                    timestamp: data.timestamp,
+                    type: 'tool_call',
+                    tool: {
+                        name: normalizeToolName(toolUse.name),
+                        originalName: toolUse.name,
+                        args: toolUse.input || toolUse.args || {},
+                    },
+                    raw: toolUse,
+                });
+            }
+            // Extract thinking blocks
+            const thinking = extractThinking(data);
+            if (thinking) {
+                events.push({
+                    timestamp: data.timestamp,
+                    type: 'thinking',
+                    content: thinking,
+                    raw: data,
+                });
+            }
+        }
+        else if (data.type === 'tool_result' || data.type === 'tool_response') {
+            events.push({
+                timestamp: data.timestamp,
+                type: 'tool_result',
+                tool: {
+                    name: 'unknown',
+                    originalName: data.tool_use_id || 'unknown',
+                    result: data.content || data.output || data.result,
+                    success: !data.is_error && !data.error,
+                },
+                raw: data,
+            });
+        }
+        else if (data.type === 'system' || data.role === 'system') {
+            events.push({
+                timestamp: data.timestamp,
+                type: 'message',
+                role: 'system',
+                content: extractContent(data),
+                raw: data,
+            });
+        }
+        else if (data.type === 'error' || data.error) {
+            events.push({
+                timestamp: data.timestamp,
+                type: 'error',
+                content: data.error?.message || data.message || JSON.stringify(data.error),
+                raw: data,
+            });
+        }
+    }
+    catch {
+        // Skip unparseable lines
+    }
+    return events;
+}
+/**
+ * Get the content array from data, handling nested message format.
+ * Claude Code wraps messages: { type: "assistant", message: { content: [...] } }
+ */
+function getContentArray(data) {
+    // Direct content array
+    if (Array.isArray(data.content)) {
+        return data.content;
+    }
+    // Nested message format (real Claude Code format)
+    const message = data.message;
+    if (message && Array.isArray(message.content)) {
+        return message.content;
+    }
+    return undefined;
+}
+/**
+ * Get string content from data, handling nested message format.
+ */
+function getStringContent(data) {
+    if (typeof data.content === 'string') {
+        return data.content;
+    }
+    const message = data.message;
+    if (message && typeof message.content === 'string') {
+        return message.content;
+    }
+    return undefined;
+}
+/**
+ * Extract text content from various message formats.
+ */
+function extractContent(data) {
+    // Check for direct string content
+    const stringContent = getStringContent(data);
+    if (stringContent) {
+        return stringContent;
+    }
+    // Check for content blocks array
+    const contentArray = getContentArray(data);
+    if (contentArray) {
+        const textBlocks = contentArray.filter((block) => block.type === 'text');
+        if (textBlocks.length > 0) {
+            return textBlocks.map((b) => b.text).join('\n');
+        }
+    }
+    if (typeof data.text === 'string') {
+        return data.text;
+    }
+    // Note: don't check data.message as string since message is an object in Claude Code format
+    return undefined;
+}
+/**
+ * Extract tool_use blocks from assistant messages.
+ */
+function extractToolUses(data) {
+    const toolUses = [];
+    // Check content array (handles both direct and nested message format)
+    const contentArray = getContentArray(data);
+    if (contentArray) {
+        for (const block of contentArray) {
+            const b = block;
+            if (b.type === 'tool_use') {
+                toolUses.push({
+                    name: b.name,
+                    input: b.input,
+                });
+            }
+        }
+    }
+    // Also check for tool_calls array format (OpenAI-style)
+    const toolCalls = data.tool_calls || data.message?.tool_calls;
+    if (Array.isArray(toolCalls)) {
+        for (const call of toolCalls) {
+            const c = call;
+            const func = c.function;
+            toolUses.push({
+                name: (func?.name || c.name),
+                args: func?.arguments
+                    ? JSON.parse(func.arguments)
+                    : (c.arguments || c.input),
+            });
+        }
+    }
+    return toolUses;
+}
+/**
+ * Extract thinking/reasoning content.
+ */
+function extractThinking(data) {
+    const contentArray = getContentArray(data);
+    if (contentArray) {
+        const thinkingBlocks = contentArray.filter((block) => block.type === 'thinking');
+        if (thinkingBlocks.length > 0) {
+            return thinkingBlocks.map((b) => {
+                const block = b;
+                return block.thinking || block.text;
+            }).join('\n');
+        }
+    }
+    return undefined;
+}
+/**
+ * Parse Claude Code JSONL transcript into events.
+ */
+export function parseClaudeCodeTranscript(raw) {
+    const events = [];
+    const errors = [];
+    const lines = raw.split('\n').filter((line) => line.trim());
+    for (const line of lines) {
+        try {
+            const lineEvents = parseClaudeCodeLine(line);
+            events.push(...lineEvents);
+        }
+        catch (e) {
+            errors.push(`Failed to parse line: ${e instanceof Error ? e.message : String(e)}`);
+        }
+    }
+    // Post-process to link tool_results to their tool_calls
+    // and extract additional metadata
+    for (const event of events) {
+        if (event.type === 'tool_call' && event.tool) {
+            const args = event.tool.args || {};
+            // Extract file paths for file operations
+            if (['file_read', 'file_write', 'file_edit'].includes(event.tool.name)) {
+                const path = extractFilePath(args);
+                if (path) {
+                    event.tool.args = { ...args, _extractedPath: path };
+                }
+            }
+            // Extract URLs for web fetches
+            if (event.tool.name === 'web_fetch') {
+                const url = extractUrl(args);
+                if (url) {
+                    event.tool.args = { ...args, _extractedUrl: url };
+                }
+            }
+            // Extract commands for shell operations
+            if (event.tool.name === 'shell') {
+                const command = extractCommand(args);
+                if (command) {
+                    event.tool.args = { ...args, _extractedCommand: command };
+                }
+            }
+        }
+    }
+    return { events, errors };
+}
+//# sourceMappingURL=claude-code.js.map