npm - agent-relay - Versions diffs - 2.3.2 → 2.3.5 - Mend

agent-relay 2.3.2 → 2.3.5

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (334) hide show

package/README.md +1 -1
package/dist/index.cjs +1 -1
package/dist/src/cli/index.js +124 -7
package/dist/src/cli/index.js.map +1 -1
package/package.json +20 -26
package/packages/acp-bridge/package.json +2 -2
package/packages/bridge/package.json +7 -7
package/packages/config/dist/cloud-config.d.ts +1 -1
package/packages/config/dist/cloud-config.d.ts.map +1 -1
package/packages/config/dist/cloud-config.js.map +1 -1
package/packages/config/dist/schemas.d.ts +5 -5
package/packages/config/dist/schemas.js +1 -1
package/packages/config/dist/schemas.js.map +1 -1
package/packages/config/package.json +2 -2
package/packages/config/src/cloud-config.ts +2 -2
package/packages/config/src/schemas.test.ts +48 -0
package/packages/config/src/schemas.ts +1 -1
package/packages/continuity/package.json +2 -2
package/packages/daemon/package.json +12 -12
package/packages/hooks/package.json +4 -4
package/packages/mcp/package.json +5 -5
package/packages/memory/package.json +2 -2
package/packages/policy/package.json +2 -2
package/packages/protocol/package.json +1 -1
package/packages/resiliency/package.json +1 -1
package/packages/sdk/dist/index.d.ts +1 -29
package/packages/sdk/dist/index.d.ts.map +1 -1
package/packages/sdk/dist/index.js +1 -38
package/packages/sdk/dist/index.js.map +1 -1
package/packages/sdk/package.json +4 -25
package/packages/sdk/src/index.ts +1 -69
package/packages/sdk-py/README.md +56 -0
package/packages/sdk-py/pyproject.toml +23 -0
package/packages/sdk-py/src/agent_relay/__init__.py +27 -0
package/packages/sdk-py/src/agent_relay/builder.py +367 -0
package/packages/sdk-py/src/agent_relay/types.py +92 -0
package/packages/sdk-py/tests/__init__.py +0 -0
package/packages/sdk-py/tests/test_builder.py +101 -0
package/packages/sdk-ts/dist/__tests__/facade.test.d.ts +2 -0
package/packages/sdk-ts/dist/__tests__/facade.test.d.ts.map +1 -0
package/packages/sdk-ts/dist/__tests__/facade.test.js +257 -0
package/packages/sdk-ts/dist/__tests__/facade.test.js.map +1 -0
package/packages/sdk-ts/dist/__tests__/unit.test.d.ts +2 -0
package/packages/sdk-ts/dist/__tests__/unit.test.d.ts.map +1 -0
package/packages/sdk-ts/dist/__tests__/unit.test.js +124 -0
package/packages/sdk-ts/dist/__tests__/unit.test.js.map +1 -0
package/packages/sdk-ts/dist/client.d.ts +2 -0
package/packages/sdk-ts/dist/client.d.ts.map +1 -1
package/packages/sdk-ts/dist/client.js +2 -0
package/packages/sdk-ts/dist/client.js.map +1 -1
package/packages/sdk-ts/dist/index.d.ts +1 -0
package/packages/sdk-ts/dist/index.d.ts.map +1 -1
package/packages/sdk-ts/dist/index.js +1 -0
package/packages/sdk-ts/dist/index.js.map +1 -1
package/packages/sdk-ts/dist/protocol.d.ts +1 -0
package/packages/sdk-ts/dist/protocol.d.ts.map +1 -1
package/packages/sdk-ts/dist/relay.d.ts +44 -0
package/packages/sdk-ts/dist/relay.d.ts.map +1 -1
package/packages/sdk-ts/dist/relay.js +89 -11
package/packages/sdk-ts/dist/relay.js.map +1 -1
package/packages/sdk-ts/dist/relaycast.js +2 -2
package/packages/sdk-ts/dist/relaycast.js.map +1 -1
package/packages/sdk-ts/dist/workflows/barrier.d.ts +72 -0
package/packages/sdk-ts/dist/workflows/barrier.d.ts.map +1 -0
package/packages/sdk-ts/dist/workflows/barrier.js +162 -0
package/packages/sdk-ts/dist/workflows/barrier.js.map +1 -0
package/packages/sdk-ts/dist/workflows/builder.d.ts +101 -0
package/packages/sdk-ts/dist/workflows/builder.d.ts.map +1 -0
package/packages/sdk-ts/dist/workflows/builder.js +179 -0
package/packages/sdk-ts/dist/workflows/builder.js.map +1 -0
package/packages/sdk-ts/dist/workflows/cli.d.ts +10 -0
package/packages/sdk-ts/dist/workflows/cli.d.ts.map +1 -0
package/packages/sdk-ts/dist/workflows/cli.js +82 -0
package/packages/sdk-ts/dist/workflows/cli.js.map +1 -0
package/packages/sdk-ts/dist/workflows/coordinator.d.ts +68 -0
package/packages/sdk-ts/dist/workflows/coordinator.d.ts.map +1 -0
package/packages/sdk-ts/dist/workflows/coordinator.js +353 -0
package/packages/sdk-ts/dist/workflows/coordinator.js.map +1 -0
package/packages/sdk-ts/dist/workflows/index.d.ts +10 -0
package/packages/sdk-ts/dist/workflows/index.d.ts.map +1 -0
package/packages/sdk-ts/dist/workflows/index.js +10 -0
package/packages/sdk-ts/dist/workflows/index.js.map +1 -0
package/packages/sdk-ts/dist/workflows/memory-db.d.ts +17 -0
package/packages/sdk-ts/dist/workflows/memory-db.d.ts.map +1 -0
package/packages/sdk-ts/dist/workflows/memory-db.js +33 -0
package/packages/sdk-ts/dist/workflows/memory-db.js.map +1 -0
package/packages/sdk-ts/dist/workflows/run.d.ts +31 -0
package/packages/sdk-ts/dist/workflows/run.d.ts.map +1 -0
package/packages/sdk-ts/dist/workflows/run.js +24 -0
package/packages/sdk-ts/dist/workflows/run.js.map +1 -0
package/packages/sdk-ts/dist/workflows/runner.d.ts +119 -0
package/packages/sdk-ts/dist/workflows/runner.d.ts.map +1 -0
package/packages/sdk-ts/dist/workflows/runner.js +650 -0
package/packages/sdk-ts/dist/workflows/runner.js.map +1 -0
package/packages/sdk-ts/dist/workflows/state.d.ts +77 -0
package/packages/sdk-ts/dist/workflows/state.d.ts.map +1 -0
package/packages/sdk-ts/dist/workflows/state.js +140 -0
package/packages/sdk-ts/dist/workflows/state.js.map +1 -0
package/packages/sdk-ts/dist/workflows/templates.d.ts +47 -0
package/packages/sdk-ts/dist/workflows/templates.d.ts.map +1 -0
package/packages/sdk-ts/dist/workflows/templates.js +395 -0
package/packages/sdk-ts/dist/workflows/templates.js.map +1 -0
package/packages/sdk-ts/dist/workflows/types.d.ts +126 -0
package/packages/sdk-ts/dist/workflows/types.d.ts.map +1 -0
package/packages/sdk-ts/dist/workflows/types.js +8 -0
package/packages/sdk-ts/dist/workflows/types.js.map +1 -0
package/packages/sdk-ts/package.json +9 -3
package/packages/sdk-ts/src/__tests__/error-scenarios.test.ts +682 -0
package/packages/sdk-ts/src/__tests__/facade.test.ts +296 -0
package/packages/sdk-ts/src/__tests__/swarm-coordinator.test.ts +416 -0
package/packages/sdk-ts/src/__tests__/unit.test.ts +152 -0
package/packages/sdk-ts/src/__tests__/workflow-runner.test.ts +333 -0
package/packages/sdk-ts/src/client.ts +4 -0
package/packages/sdk-ts/src/index.ts +1 -0
package/packages/sdk-ts/src/protocol.ts +1 -1
package/packages/sdk-ts/src/relay.ts +112 -11
package/packages/sdk-ts/src/relaycast.ts +2 -2
package/packages/sdk-ts/src/workflows/README.md +450 -0
package/packages/sdk-ts/src/workflows/barrier.ts +254 -0
package/packages/sdk-ts/src/workflows/builder.ts +241 -0
package/packages/sdk-ts/src/workflows/builtin-templates/bug-fix.yaml +75 -0
package/packages/sdk-ts/src/workflows/builtin-templates/code-review.yaml +82 -0
package/packages/sdk-ts/src/workflows/builtin-templates/documentation.yaml +70 -0
package/packages/sdk-ts/src/workflows/builtin-templates/feature-dev.yaml +76 -0
package/packages/sdk-ts/src/workflows/builtin-templates/refactor.yaml +82 -0
package/packages/sdk-ts/src/workflows/builtin-templates/security-audit.yaml +84 -0
package/packages/sdk-ts/src/workflows/cli.ts +93 -0
package/packages/sdk-ts/src/workflows/coordinator.ts +520 -0
package/packages/sdk-ts/src/workflows/index.ts +9 -0
package/packages/sdk-ts/src/workflows/memory-db.ts +39 -0
package/packages/sdk-ts/src/workflows/run.ts +47 -0
package/packages/sdk-ts/src/workflows/runner.ts +873 -0
package/packages/sdk-ts/src/workflows/schema.json +321 -0
package/packages/sdk-ts/src/workflows/state.ts +279 -0
package/packages/sdk-ts/src/workflows/templates.ts +544 -0
package/packages/sdk-ts/src/workflows/types.ts +178 -0
package/packages/sdk-ts/tsconfig.json +6 -1
package/packages/spawner/package.json +1 -1
package/packages/state/package.json +1 -1
package/packages/storage/package.json +2 -2
package/packages/telemetry/package.json +1 -1
package/packages/trajectory/package.json +2 -2
package/packages/user-directory/package.json +2 -2
package/packages/utils/package.json +3 -3
package/packages/wrapper/package.json +5 -6
package/scripts/postinstall.js +106 -2
package/packages/api-types/.trajectories/active/traj_xbsvuzogscey.json +0 -15
package/packages/api-types/.trajectories/index.json +0 -12
package/packages/api-types/dist/index.d.ts +0 -21
package/packages/api-types/dist/index.d.ts.map +0 -1
package/packages/api-types/dist/index.js +0 -22
package/packages/api-types/dist/index.js.map +0 -1
package/packages/api-types/dist/schemas/agent.d.ts +0 -259
package/packages/api-types/dist/schemas/agent.d.ts.map +0 -1
package/packages/api-types/dist/schemas/agent.js +0 -102
package/packages/api-types/dist/schemas/agent.js.map +0 -1
package/packages/api-types/dist/schemas/api.d.ts +0 -290
package/packages/api-types/dist/schemas/api.d.ts.map +0 -1
package/packages/api-types/dist/schemas/api.js +0 -162
package/packages/api-types/dist/schemas/api.js.map +0 -1
package/packages/api-types/dist/schemas/decision.d.ts +0 -230
package/packages/api-types/dist/schemas/decision.d.ts.map +0 -1
package/packages/api-types/dist/schemas/decision.js +0 -104
package/packages/api-types/dist/schemas/decision.js.map +0 -1
package/packages/api-types/dist/schemas/fleet.d.ts +0 -615
package/packages/api-types/dist/schemas/fleet.d.ts.map +0 -1
package/packages/api-types/dist/schemas/fleet.js +0 -71
package/packages/api-types/dist/schemas/fleet.js.map +0 -1
package/packages/api-types/dist/schemas/history.d.ts +0 -180
package/packages/api-types/dist/schemas/history.d.ts.map +0 -1
package/packages/api-types/dist/schemas/history.js +0 -72
package/packages/api-types/dist/schemas/history.js.map +0 -1
package/packages/api-types/dist/schemas/index.d.ts +0 -14
package/packages/api-types/dist/schemas/index.d.ts.map +0 -1
package/packages/api-types/dist/schemas/index.js +0 -22
package/packages/api-types/dist/schemas/index.js.map +0 -1
package/packages/api-types/dist/schemas/message.d.ts +0 -456
package/packages/api-types/dist/schemas/message.d.ts.map +0 -1
package/packages/api-types/dist/schemas/message.js +0 -88
package/packages/api-types/dist/schemas/message.js.map +0 -1
package/packages/api-types/dist/schemas/session.d.ts +0 -60
package/packages/api-types/dist/schemas/session.d.ts.map +0 -1
package/packages/api-types/dist/schemas/session.js +0 -36
package/packages/api-types/dist/schemas/session.js.map +0 -1
package/packages/api-types/dist/schemas/task.d.ts +0 -111
package/packages/api-types/dist/schemas/task.d.ts.map +0 -1
package/packages/api-types/dist/schemas/task.js +0 -64
package/packages/api-types/dist/schemas/task.js.map +0 -1
package/packages/api-types/package.json +0 -61
package/packages/api-types/scripts/generate-openapi.ts +0 -106
package/packages/api-types/src/index.ts +0 -22
package/packages/api-types/src/schemas/agent.test.ts +0 -164
package/packages/api-types/src/schemas/agent.ts +0 -110
package/packages/api-types/src/schemas/api.test.ts +0 -372
package/packages/api-types/src/schemas/api.ts +0 -194
package/packages/api-types/src/schemas/decision.test.ts +0 -324
package/packages/api-types/src/schemas/decision.ts +0 -136
package/packages/api-types/src/schemas/fleet.test.ts +0 -212
package/packages/api-types/src/schemas/fleet.ts +0 -83
package/packages/api-types/src/schemas/history.test.ts +0 -242
package/packages/api-types/src/schemas/history.ts +0 -84
package/packages/api-types/src/schemas/index.ts +0 -148
package/packages/api-types/src/schemas/message.test.ts +0 -192
package/packages/api-types/src/schemas/message.ts +0 -98
package/packages/api-types/src/schemas/session.test.ts +0 -104
package/packages/api-types/src/schemas/session.ts +0 -40
package/packages/api-types/src/schemas/task.test.ts +0 -192
package/packages/api-types/src/schemas/task.ts +0 -78
package/packages/api-types/tsconfig.json +0 -19
package/packages/api-types/vitest.config.ts +0 -9
package/packages/benchmark/README.md +0 -200
package/packages/benchmark/datasets/coding-tasks.yaml +0 -127
package/packages/benchmark/datasets/coordination-tasks.yaml +0 -122
package/packages/benchmark/datasets/quick-test.yaml +0 -20
package/packages/benchmark/dist/benchmark.d.ts +0 -47
package/packages/benchmark/dist/benchmark.d.ts.map +0 -1
package/packages/benchmark/dist/benchmark.js +0 -224
package/packages/benchmark/dist/benchmark.js.map +0 -1
package/packages/benchmark/dist/cli.d.ts +0 -8
package/packages/benchmark/dist/cli.d.ts.map +0 -1
package/packages/benchmark/dist/cli.js +0 -185
package/packages/benchmark/dist/cli.js.map +0 -1
package/packages/benchmark/dist/harbor.d.ts +0 -53
package/packages/benchmark/dist/harbor.d.ts.map +0 -1
package/packages/benchmark/dist/harbor.js +0 -127
package/packages/benchmark/dist/harbor.js.map +0 -1
package/packages/benchmark/dist/index.d.ts +0 -48
package/packages/benchmark/dist/index.d.ts.map +0 -1
package/packages/benchmark/dist/index.js +0 -50
package/packages/benchmark/dist/index.js.map +0 -1
package/packages/benchmark/dist/runners/base.d.ts +0 -63
package/packages/benchmark/dist/runners/base.d.ts.map +0 -1
package/packages/benchmark/dist/runners/base.js +0 -156
package/packages/benchmark/dist/runners/base.js.map +0 -1
package/packages/benchmark/dist/runners/index.d.ts +0 -10
package/packages/benchmark/dist/runners/index.d.ts.map +0 -1
package/packages/benchmark/dist/runners/index.js +0 -10
package/packages/benchmark/dist/runners/index.js.map +0 -1
package/packages/benchmark/dist/runners/single.d.ts +0 -19
package/packages/benchmark/dist/runners/single.d.ts.map +0 -1
package/packages/benchmark/dist/runners/single.js +0 -111
package/packages/benchmark/dist/runners/single.js.map +0 -1
package/packages/benchmark/dist/runners/subagent.d.ts +0 -32
package/packages/benchmark/dist/runners/subagent.d.ts.map +0 -1
package/packages/benchmark/dist/runners/subagent.js +0 -212
package/packages/benchmark/dist/runners/subagent.js.map +0 -1
package/packages/benchmark/dist/runners/swarm.d.ts +0 -36
package/packages/benchmark/dist/runners/swarm.d.ts.map +0 -1
package/packages/benchmark/dist/runners/swarm.js +0 -273
package/packages/benchmark/dist/runners/swarm.js.map +0 -1
package/packages/benchmark/dist/types.d.ts +0 -178
package/packages/benchmark/dist/types.d.ts.map +0 -1
package/packages/benchmark/dist/types.js +0 -16
package/packages/benchmark/dist/types.js.map +0 -1
package/packages/benchmark/package.json +0 -80
package/packages/benchmark/src/benchmark.ts +0 -298
package/packages/benchmark/src/cli.ts +0 -240
package/packages/benchmark/src/harbor.ts +0 -170
package/packages/benchmark/src/index.ts +0 -73
package/packages/benchmark/src/runners/base.ts +0 -205
package/packages/benchmark/src/runners/index.ts +0 -10
package/packages/benchmark/src/runners/single.ts +0 -121
package/packages/benchmark/src/runners/subagent.ts +0 -240
package/packages/benchmark/src/runners/swarm.ts +0 -326
package/packages/benchmark/src/types.ts +0 -205
package/packages/benchmark/tsconfig.json +0 -20
package/packages/cli-tester/README.md +0 -277
package/packages/cli-tester/dist/index.d.ts +0 -21
package/packages/cli-tester/dist/index.d.ts.map +0 -1
package/packages/cli-tester/dist/index.js +0 -21
package/packages/cli-tester/dist/index.js.map +0 -1
package/packages/cli-tester/dist/utils/credential-check.d.ts +0 -56
package/packages/cli-tester/dist/utils/credential-check.d.ts.map +0 -1
package/packages/cli-tester/dist/utils/credential-check.js +0 -230
package/packages/cli-tester/dist/utils/credential-check.js.map +0 -1
package/packages/cli-tester/dist/utils/socket-client.d.ts +0 -76
package/packages/cli-tester/dist/utils/socket-client.d.ts.map +0 -1
package/packages/cli-tester/dist/utils/socket-client.js +0 -153
package/packages/cli-tester/dist/utils/socket-client.js.map +0 -1
package/packages/cli-tester/docker/Dockerfile +0 -61
package/packages/cli-tester/docker/docker-compose.yml +0 -71
package/packages/cli-tester/docker/entrypoint.sh +0 -58
package/packages/cli-tester/package.json +0 -32
package/packages/cli-tester/scripts/clear-auth.sh +0 -101
package/packages/cli-tester/scripts/inject-message.sh +0 -42
package/packages/cli-tester/scripts/start.sh +0 -71
package/packages/cli-tester/scripts/test-cli.sh +0 -56
package/packages/cli-tester/scripts/test-full-spawn.sh +0 -238
package/packages/cli-tester/scripts/test-registration.sh +0 -182
package/packages/cli-tester/scripts/test-setup-flow.sh +0 -202
package/packages/cli-tester/scripts/test-spawn.sh +0 -140
package/packages/cli-tester/scripts/test-with-daemon.sh +0 -247
package/packages/cli-tester/scripts/verify-auth.sh +0 -112
package/packages/cli-tester/src/index.ts +0 -40
package/packages/cli-tester/src/utils/credential-check.ts +0 -284
package/packages/cli-tester/src/utils/socket-client.ts +0 -211
package/packages/cli-tester/tests/credential-check.test.ts +0 -56
package/packages/cli-tester/tsconfig.json +0 -11
package/packages/sdk/dist/browser-client.d.ts +0 -212
package/packages/sdk/dist/browser-client.d.ts.map +0 -1
package/packages/sdk/dist/browser-client.js +0 -750
package/packages/sdk/dist/browser-client.js.map +0 -1
package/packages/sdk/dist/browser-framing.d.ts +0 -46
package/packages/sdk/dist/browser-framing.d.ts.map +0 -1
package/packages/sdk/dist/browser-framing.js +0 -122
package/packages/sdk/dist/browser-framing.js.map +0 -1
package/packages/sdk/dist/standalone.d.ts +0 -89
package/packages/sdk/dist/standalone.d.ts.map +0 -1
package/packages/sdk/dist/standalone.js +0 -131
package/packages/sdk/dist/standalone.js.map +0 -1
package/packages/sdk/dist/transports/index.d.ts +0 -92
package/packages/sdk/dist/transports/index.d.ts.map +0 -1
package/packages/sdk/dist/transports/index.js +0 -129
package/packages/sdk/dist/transports/index.js.map +0 -1
package/packages/sdk/dist/transports/socket-transport.d.ts +0 -30
package/packages/sdk/dist/transports/socket-transport.d.ts.map +0 -1
package/packages/sdk/dist/transports/socket-transport.js +0 -94
package/packages/sdk/dist/transports/socket-transport.js.map +0 -1
package/packages/sdk/dist/transports/types.d.ts +0 -69
package/packages/sdk/dist/transports/types.d.ts.map +0 -1
package/packages/sdk/dist/transports/types.js +0 -10
package/packages/sdk/dist/transports/types.js.map +0 -1
package/packages/sdk/dist/transports/websocket-transport.d.ts +0 -55
package/packages/sdk/dist/transports/websocket-transport.d.ts.map +0 -1
package/packages/sdk/dist/transports/websocket-transport.js +0 -180
package/packages/sdk/dist/transports/websocket-transport.js.map +0 -1
package/packages/sdk/src/browser-client.ts +0 -985
package/packages/sdk/src/browser-framing.test.ts +0 -115
package/packages/sdk/src/browser-framing.ts +0 -150
package/packages/sdk/src/standalone.ts +0 -183
package/packages/sdk/src/transports/index.ts +0 -197
package/packages/sdk/src/transports/socket-transport.ts +0 -115
package/packages/sdk/src/transports/types.ts +0 -77
package/packages/sdk/src/transports/websocket-transport.ts +0 -245

package/packages/benchmark/src/cli.ts DELETED Viewed

@@ -1,240 +0,0 @@
-#!/usr/bin/env node
-/**
- * Benchmark CLI
- *
- * Command-line interface for running agent swarm benchmarks.
- */
-import { Command } from 'commander';
-import { readFileSync } from 'node:fs';
-import { parse as parseYaml } from 'yaml';
-import { ComparisonBenchmark } from './benchmark.js';
-import type {
-  Task,
-  TaskDataset,
-  ConfigurationType,
-  BenchmarkConfig,
-} from './types.js';
-const program = new Command();
-program
-  .name('relay-benchmark')
-  .description('Benchmark agent swarms, sub-agents, and single agents')
-  .version('1.0.0');
-program
-  .command('run')
-  .description('Run a benchmark comparison')
-  .option('-d, --dataset <path>', 'Path to task dataset (YAML or JSON)')
-  .option('-t, --task <id>', 'Run only a specific task by ID')
-  .option(
-    '-c, --config <types>',
-    'Configurations to run (single,subagent,swarm,all)',
-    'all'
-  )
-  .option('--cli <name>', 'CLI to use for agents', 'claude')
-  .option('--cwd <path>', 'Working directory for tasks')
-  .option('-q, --quiet', 'Suppress output', false)
-  .option('--cooldown <ms>', 'Cooldown between runs in ms', '5000')
-  .option('--max-swarm <n>', 'Maximum swarm size', '10')
-  .option('-o, --output <path>', 'Output results to JSON file')
-  .action(async (options) => {
-    try {
-      await runBenchmark(options);
-    } catch (err) {
-      console.error('Error:', (err as Error).message);
-      process.exit(1);
-    }
-  });
-program
-  .command('list')
-  .description('List tasks in a dataset')
-  .argument('<dataset>', 'Path to task dataset')
-  .action((datasetPath) => {
-    const dataset = loadDataset(datasetPath);
-    console.log(`\nDataset: ${dataset.name || 'Unnamed'}`);
-    if (dataset.description) {
-      console.log(`Description: ${dataset.description}`);
-    }
-    console.log(`\nTasks (${dataset.tasks.length}):\n`);
-    for (const task of dataset.tasks) {
-      console.log(`  ${task.id}`);
-      console.log(`    Complexity: ${task.complexity}`);
-      console.log(`    Files: ${task.files.length}`);
-      console.log(`    ${task.description.substring(0, 60)}...`);
-      console.log('');
-    }
-  });
-async function runBenchmark(options: {
-  dataset?: string;
-  task?: string;
-  config: string;
-  cli: string;
-  cwd?: string;
-  quiet: boolean;
-  cooldown: string;
-  maxSwarm: string;
-  output?: string;
-}): Promise<void> {
-  // Parse configurations
-  const configurations = parseConfigurations(options.config);
-  // Build benchmark config
-  const benchmarkConfig: Partial<BenchmarkConfig> = {
-    configurations,
-    cli: options.cli,
-    cwd: options.cwd,
-    quiet: options.quiet,
-    cooldownMs: parseInt(options.cooldown, 10),
-    maxSwarmSize: parseInt(options.maxSwarm, 10),
-  };
-  const benchmark = new ComparisonBenchmark(benchmarkConfig);
-  // Load tasks
-  let tasks: Task[];
-  if (options.dataset) {
-    const dataset = loadDataset(options.dataset);
-    tasks = dataset.tasks;
-    if (options.task) {
-      tasks = tasks.filter((t) => t.id === options.task);
-      if (tasks.length === 0) {
-        throw new Error(`Task not found: ${options.task}`);
-      }
-    }
-  } else if (options.task) {
-    // Create a simple task from command line
-    tasks = [
-      {
-        id: options.task,
-        description: options.task,
-        files: [],
-        expectedOutcome: 'Task completed',
-        complexity: 'medium',
-      },
-    ];
-  } else {
-    throw new Error('Either --dataset or --task is required');
-  }
-  // Run benchmarks
-  const results = [];
-  for (const task of tasks) {
-    if (!options.quiet) {
-      console.log(`\n${'='.repeat(60)}`);
-      console.log(`Running task: ${task.id}`);
-      console.log('='.repeat(60));
-    }
-    const comparison = await benchmark.runComparison(task);
-    if (!options.quiet) {
-      benchmark.printComparison(comparison);
-    }
-    results.push({
-      taskId: task.id,
-      winner: comparison.winner,
-      results: Object.fromEntries(comparison.results),
-      scores: Object.fromEntries(comparison.scores),
-    });
-  }
-  // Output results
-  if (options.output) {
-    const { writeFileSync } = await import('node:fs');
-    writeFileSync(options.output, JSON.stringify(results, null, 2));
-    console.log(`\nResults written to: ${options.output}`);
-  }
-  // Print summary
-  if (!options.quiet && results.length > 1) {
-    printSummary(results);
-  }
-}
-function parseConfigurations(config: string): ConfigurationType[] {
-  if (config === 'all') {
-    return ['single', 'subagent', 'swarm'];
-  }
-  const configs = config.split(',').map((c) => c.trim()) as ConfigurationType[];
-  const valid: ConfigurationType[] = ['single', 'subagent', 'swarm'];
-  for (const c of configs) {
-    if (!valid.includes(c)) {
-      throw new Error(`Invalid configuration: ${c}. Valid: ${valid.join(', ')}`);
-    }
-  }
-  return configs;
-}
-function loadDataset(path: string): TaskDataset {
-  const content = readFileSync(path, 'utf-8');
-  let data: TaskDataset;
-  if (path.endsWith('.yaml') || path.endsWith('.yml')) {
-    data = parseYaml(content) as TaskDataset;
-  } else {
-    data = JSON.parse(content) as TaskDataset;
-  }
-  // Validate and normalize tasks
-  if (!data.tasks || !Array.isArray(data.tasks)) {
-    throw new Error('Dataset must have a "tasks" array');
-  }
-  data.tasks = data.tasks.map((t, i) => ({
-    id: t.id || `task-${i}`,
-    description: t.description || '',
-    files: t.files || [],
-    expectedOutcome: t.expectedOutcome || t.success_criteria || 'Completed',
-    complexity: t.complexity || 'medium',
-    timeoutMs: t.timeoutMs || 300000,
-    tags: t.tags || [],
-  }));
-  return data;
-}
-function printSummary(
-  results: Array<{
-    taskId: string;
-    winner: ConfigurationType;
-    results: Record<string, unknown>;
-    scores: Record<string, unknown>;
-  }>
-): void {
-  console.log('\n' + '='.repeat(60));
-  console.log('BENCHMARK SUMMARY');
-  console.log('='.repeat(60));
-  const wins: Record<ConfigurationType, number> = {
-    single: 0,
-    subagent: 0,
-    swarm: 0,
-  };
-  for (const result of results) {
-    wins[result.winner]++;
-  }
-  console.log('\nWins by configuration:');
-  for (const [config, count] of Object.entries(wins)) {
-    const bar = '█'.repeat(count) + '░'.repeat(results.length - count);
-    console.log(`  ${config.padEnd(10)} ${bar} ${count}/${results.length}`);
-  }
-  const overallWinner = (Object.entries(wins) as [ConfigurationType, number][])
-    .sort((a, b) => b[1] - a[1])[0][0];
-  console.log(`\nOverall winner: ${overallWinner.toUpperCase()}`);
-}
-program.parse();

package/packages/benchmark/src/harbor.ts DELETED Viewed

@@ -1,170 +0,0 @@
-/**
- * Harbor Integration
- *
- * Entry points for Harbor benchmark framework integration.
- * https://github.com/laude-institute/harbor
- */
-import type {
-  Task,
-  TaskComplexity,
-  ConfigurationType,
-  HarborTaskInput,
-  HarborEvaluationOutput,
-  BenchmarkConfig,
-} from './types.js';
-import { ComparisonBenchmark } from './benchmark.js';
-const BENCHMARK_VERSION = '1.0.0';
-/**
- * Convert Harbor task input to internal Task format
- */
-function convertHarborTask(input: HarborTaskInput): Task {
-  return {
-    id: input.id,
-    description: input.description,
-    files: input.files || [],
-    expectedOutcome: input.success_criteria || 'Task completed successfully',
-    complexity: (input.complexity as TaskComplexity) || 'medium',
-    timeoutMs: 300000, // 5 minute default
-    tags: [],
-  };
-}
-/**
- * Main Harbor evaluation entry point
- *
- * This function is called by Harbor to evaluate a task across all configurations.
- *
- * @example Harbor dataset format:
- * ```yaml
- * tasks:
- *   - id: refactor-auth
- *     description: "Refactor authentication to use JWT"
- *     files:
- *       - src/auth/session.ts
- *       - src/auth/middleware.ts
- *     success_criteria: "All tests pass, JWT tokens used"
- *     complexity: medium
- * ```
- *
- * @example Running with Harbor:
- * ```bash
- * harbor run \
- *   --dataset tasks.yaml \
- *   --agent @agent-relay/benchmark/harbor \
- *   --parallel 10
- * ```
- */
-export async function evaluate(
-  input: HarborTaskInput
-): Promise<HarborEvaluationOutput> {
-  const startedAt = Date.now();
-  const task = convertHarborTask(input);
-  const benchmark = new ComparisonBenchmark({
-    configurations: ['single', 'subagent', 'swarm'],
-    cli: 'claude',
-    quiet: true, // Suppress output in Harbor runs
-    cooldownMs: 2000,
-  });
-  const comparison = await benchmark.runComparison(task);
-  const completedAt = Date.now();
-  return {
-    task_id: task.id,
-    configurations: Object.fromEntries(comparison.results) as Record<
-      ConfigurationType,
-      any
-    >,
-    winner: comparison.winner,
-    scores: Object.fromEntries(comparison.scores) as Record<
-      ConfigurationType,
-      any
-    >,
-    metadata: {
-      benchmark_version: BENCHMARK_VERSION,
-      started_at: startedAt,
-      completed_at: completedAt,
-      total_duration_ms: completedAt - startedAt,
-    },
-  };
-}
-/**
- * Run a single configuration (for targeted Harbor evaluations)
- *
- * @example Running single config with Harbor:
- * ```bash
- * harbor run \
- *   --dataset tasks.yaml \
- *   --agent "@agent-relay/benchmark/harbor:evaluateSingle" \
- *   --env-var CONFIG=swarm
- * ```
- */
-export async function evaluateSingle(
-  input: HarborTaskInput & { config?: ConfigurationType }
-): Promise<Record<string, unknown>> {
-  const config = input.config || 'single';
-  const task = convertHarborTask(input);
-  const benchmark = new ComparisonBenchmark({
-    configurations: [config],
-    cli: 'claude',
-    quiet: true,
-    cooldownMs: 0,
-  });
-  const result = await benchmark.runSingle(task, config);
-  return {
-    task_id: task.id,
-    configuration: config,
-    result,
-    success: result.success,
-  };
-}
-/**
- * Evaluate with custom configuration
- */
-export async function evaluateCustom(
-  input: HarborTaskInput,
-  config: Partial<BenchmarkConfig>
-): Promise<HarborEvaluationOutput> {
-  const startedAt = Date.now();
-  const task = convertHarborTask(input);
-  const benchmark = new ComparisonBenchmark({
-    ...config,
-    quiet: true,
-  });
-  const comparison = await benchmark.runComparison(task);
-  const completedAt = Date.now();
-  return {
-    task_id: task.id,
-    configurations: Object.fromEntries(comparison.results) as Record<
-      ConfigurationType,
-      any
-    >,
-    winner: comparison.winner,
-    scores: Object.fromEntries(comparison.scores) as Record<
-      ConfigurationType,
-      any
-    >,
-    metadata: {
-      benchmark_version: BENCHMARK_VERSION,
-      started_at: startedAt,
-      completed_at: completedAt,
-      total_duration_ms: completedAt - startedAt,
-    },
-  };
-}
-// Default export for Harbor
-export default evaluate;

package/packages/benchmark/src/index.ts DELETED Viewed

@@ -1,73 +0,0 @@
-/**
- * @agent-relay/benchmark
- *
- * Performance benchmarking for agent swarms, sub-agents, and single agents.
- *
- * ## Quick Start
- *
- * ```typescript
- * import { ComparisonBenchmark, type Task } from '@agent-relay/benchmark';
- *
- * const task: Task = {
- *   id: 'refactor-auth',
- *   description: 'Refactor authentication to use JWT',
- *   files: ['src/auth/session.ts', 'src/auth/middleware.ts'],
- *   expectedOutcome: 'All tests pass, JWT tokens used',
- *   complexity: 'medium',
- * };
- *
- * const benchmark = new ComparisonBenchmark();
- * const comparison = await benchmark.runComparison(task);
- *
- * console.log(`Winner: ${comparison.winner}`);
- * benchmark.printComparison(comparison);
- * ```
- *
- * ## With Harbor
- *
- * ```bash
- * harbor run \
- *   --dataset tasks.yaml \
- *   --agent @agent-relay/benchmark/harbor \
- *   --parallel 10
- * ```
- *
- * ## CLI Usage
- *
- * ```bash
- * relay-benchmark run --dataset tasks.yaml --config all
- * relay-benchmark run --dataset tasks.yaml --config swarm
- * relay-benchmark list tasks.yaml
- * ```
- */
-// Types
-export type {
-  ConfigurationType,
-  TaskComplexity,
-  Task,
-  RunResult,
-  ComparisonResult,
-  ScoreBreakdown,
-  BenchmarkConfig,
-  RunMetrics,
-  TaskDataset,
-  HarborTaskInput,
-  HarborEvaluationOutput,
-} from './types.js';
-export { DEFAULT_BENCHMARK_CONFIG } from './types.js';
-// Main benchmark class
-export { ComparisonBenchmark, runComparison } from './benchmark.js';
-// Runners
-export {
-  ConfigurationRunner,
-  SingleAgentRunner,
-  SubAgentRunner,
-  SwarmRunner,
-} from './runners/index.js';
-// Harbor integration
-export { evaluate, evaluateSingle, evaluateCustom } from './harbor.js';

package/packages/benchmark/src/runners/base.ts DELETED Viewed

@@ -1,205 +0,0 @@
-/**
- * Base Configuration Runner
- *
- * Abstract base class for benchmark configuration runners.
- */
-import {
-  createRelay,
-  RelayClient,
-  type MetricsResponsePayload,
-  type Relay,
-} from '@agent-relay/sdk';
-import type {
-  ConfigurationType,
-  Task,
-  RunResult,
-  RunMetrics,
-  BenchmarkConfig,
-} from '../types.js';
-import { DEFAULT_BENCHMARK_CONFIG } from '../types.js';
-type AgentMetrics = MetricsResponsePayload['agents'][number] & {
-  tokens?: number;
-  memoryMb?: number;
-};
-/**
- * Abstract base class for configuration runners
- */
-export abstract class ConfigurationRunner {
-  protected relay!: Relay;
-  protected orchestrator!: RelayClient;
-  protected config: BenchmarkConfig;
-  protected metrics: RunMetrics = {
-    messages: 0,
-    latencies: [],
-    startTime: 0,
-    spawnedAgents: [],
-    errors: [],
-  };
-  constructor(config: Partial<BenchmarkConfig> = {}) {
-    this.config = { ...DEFAULT_BENCHMARK_CONFIG, ...config };
-  }
-  /**
-   * Get the configuration type this runner handles
-   */
-  abstract get configurationType(): ConfigurationType;
-  /**
-   * Set up the relay and orchestrator client
-   */
-  async setup(): Promise<void> {
-    this.relay = await createRelay({
-      socketPath: this.config.socketPath,
-      quiet: this.config.quiet,
-      spawnManager: true,
-    });
-    this.orchestrator = await this.relay.client('Orchestrator', {
-      quiet: this.config.quiet,
-    });
-    this.resetMetrics();
-  }
-  /**
-   * Run a task and return the result
-   */
-  abstract run(task: Task): Promise<RunResult>;
-  /**
-   * Clean up resources
-   */
-  async teardown(): Promise<void> {
-    // Release any remaining agents
-    for (const agent of this.metrics.spawnedAgents) {
-      try {
-        await this.orchestrator.release(agent);
-      } catch {
-        // Ignore release errors during cleanup
-      }
-    }
-    await this.relay.stop();
-  }
-  /**
-   * Reset metrics for a new run
-   */
-  protected resetMetrics(): void {
-    this.metrics = {
-      messages: 0,
-      latencies: [],
-      startTime: Date.now(),
-      spawnedAgents: [],
-      errors: [],
-    };
-  }
-  /**
-   * Calculate percentile from an array of values
-   */
-  protected percentile(arr: number[], p: number): number {
-    if (arr.length === 0) return 0;
-    const sorted = [...arr].sort((a, b) => a - b);
-    const idx = Math.ceil((p / 100) * sorted.length) - 1;
-    return sorted[Math.max(0, idx)];
-  }
-  /**
-   * Extract total tokens from metrics response
-   */
-  protected extractTokens(metrics: MetricsResponsePayload): number {
-    const agents = metrics.agents as AgentMetrics[] | undefined;
-    return (
-      agents?.reduce((sum, agent) => sum + (agent.tokens || 0), 0) || 0
-    );
-  }
-  /**
-   * Extract peak memory from metrics response
-   */
-  protected extractMemory(metrics: MetricsResponsePayload): number {
-    const agents = metrics.agents as AgentMetrics[] | undefined;
-    const memoryValues = agents?.map((agent) => {
-      if (agent.memoryMb != null) return agent.memoryMb;
-      if (agent.rssBytes != null) return agent.rssBytes / 1024 / 1024;
-      return 0;
-    });
-    return Math.max(...(memoryValues || [0]));
-  }
-  /**
-   * Build a failed result when setup fails
-   */
-  protected buildFailedResult(
-    task: Task,
-    startTime: number,
-    errors: string[]
-  ): RunResult {
-    const now = Date.now();
-    return {
-      taskId: task.id,
-      configuration: this.configurationType,
-      totalTimeMs: now - startTime,
-      timeToFirstActionMs: 0,
-      messageCount: 0,
-      avgLatencyMs: 0,
-      latencyP50Ms: 0,
-      latencyP99Ms: 0,
-      coordinationRounds: 0,
-      agentCount: 0,
-      totalTokensUsed: 0,
-      peakMemoryMb: 0,
-      success: false,
-      completionRate: 0,
-      errors,
-      startedAt: startTime,
-      completedAt: now,
-    };
-  }
-  /**
-   * Wait for an agent to complete their task
-   */
-  protected waitForCompletion(
-    agentName: string,
-    task: Task,
-    donePrefix = 'DONE:'
-  ): Promise<boolean> {
-    const timeoutMs = task.timeoutMs || 300000;
-    return new Promise((resolve) => {
-      const timeout = setTimeout(() => {
-        this.metrics.errors.push(`Timeout waiting for ${agentName}`);
-        resolve(false);
-      }, timeoutMs);
-      const originalHandler = this.orchestrator.onMessage;
-      this.orchestrator.onMessage = (from, payload, id, meta, originalTo) => {
-        // Call original handler if exists
-        if (originalHandler) {
-          originalHandler(from, payload, id, meta, originalTo);
-        }
-        if (from === agentName && payload.body.startsWith(donePrefix)) {
-          clearTimeout(timeout);
-          resolve(true);
-        }
-      };
-    });
-  }
-  /**
-   * Log a message if not in quiet mode
-   */
-  protected log(message: string): void {
-    if (!this.config.quiet) {
-      console.log(`[${this.configurationType}] ${message}`);
-    }
-  }
-}
-// Re-export the DEFAULT_BENCHMARK_CONFIG
-export { DEFAULT_BENCHMARK_CONFIG } from '../types.js';

package/packages/benchmark/src/runners/index.ts DELETED Viewed

@@ -1,10 +0,0 @@
-/**
- * Benchmark Runners
- *
- * Export all configuration runners.
- */
-export { ConfigurationRunner, DEFAULT_BENCHMARK_CONFIG } from './base.js';
-export { SingleAgentRunner } from './single.js';
-export { SubAgentRunner } from './subagent.js';
-export { SwarmRunner } from './swarm.js';