npm - outcome-cli - Versions diffs - 1.0.0 - Mend

outcome-cli 1.0.0

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (113) hide show

package/README.md +261 -0
package/package.json +95 -0
package/src/agents/README.md +139 -0
package/src/agents/adapters/anthropic.adapter.ts +166 -0
package/src/agents/adapters/dalle.adapter.ts +145 -0
package/src/agents/adapters/gemini.adapter.ts +134 -0
package/src/agents/adapters/imagen.adapter.ts +106 -0
package/src/agents/adapters/nano-banana.adapter.ts +129 -0
package/src/agents/adapters/openai.adapter.ts +165 -0
package/src/agents/adapters/veo.adapter.ts +130 -0
package/src/agents/agent.schema.property.test.ts +379 -0
package/src/agents/agent.schema.test.ts +148 -0
package/src/agents/agent.schema.ts +263 -0
package/src/agents/index.ts +60 -0
package/src/agents/registered-agent.schema.ts +356 -0
package/src/agents/registry.ts +97 -0
package/src/agents/tournament-configs.property.test.ts +266 -0
package/src/cli/README.md +145 -0
package/src/cli/commands/define.ts +79 -0
package/src/cli/commands/list.ts +46 -0
package/src/cli/commands/logs.ts +83 -0
package/src/cli/commands/run.ts +416 -0
package/src/cli/commands/verify.ts +110 -0
package/src/cli/index.ts +81 -0
package/src/config/README.md +128 -0
package/src/config/env.ts +262 -0
package/src/config/index.ts +19 -0
package/src/eval/README.md +318 -0
package/src/eval/ai-judge.test.ts +435 -0
package/src/eval/ai-judge.ts +368 -0
package/src/eval/code-validators.ts +414 -0
package/src/eval/evaluateOutcome.property.test.ts +1174 -0
package/src/eval/evaluateOutcome.ts +591 -0
package/src/eval/immigration-validators.ts +122 -0
package/src/eval/index.ts +90 -0
package/src/eval/judge-cache.ts +402 -0
package/src/eval/tournament-validators.property.test.ts +439 -0
package/src/eval/validators.property.test.ts +1118 -0
package/src/eval/validators.ts +1199 -0
package/src/eval/weighted-scorer.ts +285 -0
package/src/index.ts +17 -0
package/src/league/README.md +188 -0
package/src/league/health-check.ts +353 -0
package/src/league/index.ts +93 -0
package/src/league/killAgent.ts +151 -0
package/src/league/league.test.ts +1151 -0
package/src/league/runLeague.ts +843 -0
package/src/league/scoreAgent.ts +175 -0
package/src/modules/omnibridge/__tests__/.gitkeep +1 -0
package/src/modules/omnibridge/__tests__/auth-tunnel.property.test.ts +524 -0
package/src/modules/omnibridge/__tests__/deterministic-logger.property.test.ts +965 -0
package/src/modules/omnibridge/__tests__/ghost-api.property.test.ts +461 -0
package/src/modules/omnibridge/__tests__/omnibridge-integration.test.ts +542 -0
package/src/modules/omnibridge/__tests__/parallel-executor.property.test.ts +671 -0
package/src/modules/omnibridge/__tests__/semantic-normalizer.property.test.ts +521 -0
package/src/modules/omnibridge/__tests__/semantic-normalizer.test.ts +254 -0
package/src/modules/omnibridge/__tests__/session-vault.property.test.ts +367 -0
package/src/modules/omnibridge/__tests__/shadow-session.property.test.ts +523 -0
package/src/modules/omnibridge/__tests__/triangulation-engine.property.test.ts +292 -0
package/src/modules/omnibridge/__tests__/verification-engine.property.test.ts +769 -0
package/src/modules/omnibridge/api/.gitkeep +1 -0
package/src/modules/omnibridge/api/ghost-api.ts +1087 -0
package/src/modules/omnibridge/auth/.gitkeep +1 -0
package/src/modules/omnibridge/auth/auth-tunnel.ts +843 -0
package/src/modules/omnibridge/auth/session-vault.ts +577 -0
package/src/modules/omnibridge/core/.gitkeep +1 -0
package/src/modules/omnibridge/core/semantic-normalizer.ts +702 -0
package/src/modules/omnibridge/core/triangulation-engine.ts +530 -0
package/src/modules/omnibridge/core/types.ts +610 -0
package/src/modules/omnibridge/execution/.gitkeep +1 -0
package/src/modules/omnibridge/execution/deterministic-logger.ts +629 -0
package/src/modules/omnibridge/execution/parallel-executor.ts +542 -0
package/src/modules/omnibridge/execution/shadow-session.ts +794 -0
package/src/modules/omnibridge/index.ts +212 -0
package/src/modules/omnibridge/omnibridge.ts +510 -0
package/src/modules/omnibridge/verification/.gitkeep +1 -0
package/src/modules/omnibridge/verification/verification-engine.ts +783 -0
package/src/outcomes/README.md +75 -0
package/src/outcomes/acquire-pilot-customer.ts +297 -0
package/src/outcomes/code-delivery-outcomes.ts +89 -0
package/src/outcomes/code-outcomes.ts +256 -0
package/src/outcomes/code_review_battle.test.ts +135 -0
package/src/outcomes/code_review_battle.ts +135 -0
package/src/outcomes/cold_email_battle.ts +97 -0
package/src/outcomes/content_creation_battle.ts +160 -0
package/src/outcomes/f1_stem_opt_compliance.ts +61 -0
package/src/outcomes/index.ts +107 -0
package/src/outcomes/lead_gen_battle.test.ts +113 -0
package/src/outcomes/lead_gen_battle.ts +99 -0
package/src/outcomes/outcome.schema.property.test.ts +229 -0
package/src/outcomes/outcome.schema.ts +187 -0
package/src/outcomes/qualified_sales_interest.ts +118 -0
package/src/outcomes/swarm_planner.property.test.ts +370 -0
package/src/outcomes/swarm_planner.ts +96 -0
package/src/outcomes/web_extraction.ts +234 -0
package/src/runtime/README.md +220 -0
package/src/runtime/agentRunner.test.ts +341 -0
package/src/runtime/agentRunner.ts +746 -0
package/src/runtime/claudeAdapter.ts +232 -0
package/src/runtime/costTracker.ts +123 -0
package/src/runtime/index.ts +34 -0
package/src/runtime/modelAdapter.property.test.ts +305 -0
package/src/runtime/modelAdapter.ts +144 -0
package/src/runtime/openaiAdapter.ts +235 -0
package/src/utils/README.md +122 -0
package/src/utils/command-runner.ts +134 -0
package/src/utils/cost-guard.ts +379 -0
package/src/utils/errors.test.ts +290 -0
package/src/utils/errors.ts +442 -0
package/src/utils/index.ts +37 -0
package/src/utils/logger.test.ts +361 -0
package/src/utils/logger.ts +419 -0
package/src/utils/output-parsers.ts +216 -0

package/src/utils/logger.test.ts ADDED Viewed

@@ -0,0 +1,361 @@
+/**
+ * Logger Tests
+ *
+ * Tests for the structured logging utility including:
+ * - Log entry creation and storage
+ * - Log retrieval and filtering
+ * - CLI formatting
+ * - Property tests for log completeness
+ *
+ * @module utils/logger.test
+ */
+import { describe, it, expect, beforeEach } from 'vitest';
+import * as fc from 'fast-check';
+import {
+  log,
+  getLogs,
+  getAgentLogs,
+  clearLogs,
+  clearAllLogs,
+  getTotalLogCount,
+  formatLogsForCli,
+  logSuccess,
+  logFailure,
+  logPending,
+  type LogEntry,
+  type LogEntryInput,
+  type LogResult,
+} from './logger.js';
+describe('Logger', () => {
+  // Clear logs before each test to ensure isolation
+  beforeEach(() => {
+    clearAllLogs();
+  });
+  describe('log', () => {
+    it('should create a log entry with timestamp', () => {
+      const entry = log({
+        agentId: 'test-agent',
+        outcomeId: 'test-outcome',
+        promptVersion: 'v1.0.0',
+        tokensSpent: 100,
+        result: 'SUCCESS',
+      });
+      expect(entry.agentId).toBe('test-agent');
+      expect(entry.outcomeId).toBe('test-outcome');
+      expect(entry.promptVersion).toBe('v1.0.0');
+      expect(entry.tokensSpent).toBe(100);
+      expect(entry.result).toBe('SUCCESS');
+      expect(entry.timestamp).toBeDefined();
+      expect(new Date(entry.timestamp).getTime()).not.toBeNaN();
+    });
+    it('should store the log entry for retrieval', () => {
+      log({
+        agentId: 'agent-1',
+        outcomeId: 'outcome-1',
+        promptVersion: 'v1.0.0',
+        tokensSpent: 50,
+        result: 'PENDING',
+      });
+      const logs = getLogs('outcome-1');
+      expect(logs).toHaveLength(1);
+      expect(logs[0].agentId).toBe('agent-1');
+    });
+    it('should include failureReason when result is FAILURE', () => {
+      const entry = log({
+        agentId: 'agent-1',
+        outcomeId: 'outcome-1',
+        promptVersion: 'v1.0.0',
+        tokensSpent: 100,
+        result: 'FAILURE',
+        failureReason: 'Company too small',
+      });
+      expect(entry.result).toBe('FAILURE');
+      expect(entry.failureReason).toBe('Company too small');
+    });
+    it('should include metadata when provided', () => {
+      const entry = log({
+        agentId: 'agent-1',
+        outcomeId: 'outcome-1',
+        promptVersion: 'v1.0.0',
+        tokensSpent: 100,
+        result: 'SUCCESS',
+        metadata: { attemptNumber: 3, leadId: 'lead-123' },
+      });
+      expect(entry.metadata).toEqual({ attemptNumber: 3, leadId: 'lead-123' });
+    });
+  });
+  describe('getLogs', () => {
+    it('should return empty array for outcome with no logs', () => {
+      const logs = getLogs('nonexistent-outcome');
+      expect(logs).toEqual([]);
+    });
+    it('should return all logs for an outcome in order', () => {
+      log({ agentId: 'a1', outcomeId: 'o1', promptVersion: 'v1', tokensSpent: 10, result: 'PENDING' });
+      log({ agentId: 'a2', outcomeId: 'o1', promptVersion: 'v1', tokensSpent: 20, result: 'SUCCESS' });
+      log({ agentId: 'a1', outcomeId: 'o1', promptVersion: 'v1', tokensSpent: 30, result: 'FAILURE', failureReason: 'test' });
+      const logs = getLogs('o1');
+      expect(logs).toHaveLength(3);
+      expect(logs[0].agentId).toBe('a1');
+      expect(logs[1].agentId).toBe('a2');
+      expect(logs[2].agentId).toBe('a1');
+    });
+    it('should isolate logs by outcome', () => {
+      log({ agentId: 'a1', outcomeId: 'outcome-A', promptVersion: 'v1', tokensSpent: 10, result: 'SUCCESS' });
+      log({ agentId: 'a1', outcomeId: 'outcome-B', promptVersion: 'v1', tokensSpent: 20, result: 'SUCCESS' });
+      expect(getLogs('outcome-A')).toHaveLength(1);
+      expect(getLogs('outcome-B')).toHaveLength(1);
+    });
+  });
+  describe('getAgentLogs', () => {
+    it('should filter logs by agent ID', () => {
+      log({ agentId: 'agent-1', outcomeId: 'o1', promptVersion: 'v1', tokensSpent: 10, result: 'PENDING' });
+      log({ agentId: 'agent-2', outcomeId: 'o1', promptVersion: 'v1', tokensSpent: 20, result: 'SUCCESS' });
+      log({ agentId: 'agent-1', outcomeId: 'o1', promptVersion: 'v1', tokensSpent: 30, result: 'SUCCESS' });
+      const agent1Logs = getAgentLogs('o1', 'agent-1');
+      expect(agent1Logs).toHaveLength(2);
+      expect(agent1Logs.every(l => l.agentId === 'agent-1')).toBe(true);
+      const agent2Logs = getAgentLogs('o1', 'agent-2');
+      expect(agent2Logs).toHaveLength(1);
+    });
+  });
+  describe('clearLogs', () => {
+    it('should clear logs for specific outcome only', () => {
+      log({ agentId: 'a1', outcomeId: 'o1', promptVersion: 'v1', tokensSpent: 10, result: 'SUCCESS' });
+      log({ agentId: 'a1', outcomeId: 'o2', promptVersion: 'v1', tokensSpent: 20, result: 'SUCCESS' });
+      clearLogs('o1');
+      expect(getLogs('o1')).toHaveLength(0);
+      expect(getLogs('o2')).toHaveLength(1);
+    });
+  });
+  describe('clearAllLogs', () => {
+    it('should clear all logs', () => {
+      log({ agentId: 'a1', outcomeId: 'o1', promptVersion: 'v1', tokensSpent: 10, result: 'SUCCESS' });
+      log({ agentId: 'a1', outcomeId: 'o2', promptVersion: 'v1', tokensSpent: 20, result: 'SUCCESS' });
+      clearAllLogs();
+      expect(getLogs('o1')).toHaveLength(0);
+      expect(getLogs('o2')).toHaveLength(0);
+      expect(getTotalLogCount()).toBe(0);
+    });
+  });
+  describe('getTotalLogCount', () => {
+    it('should return total count across all outcomes', () => {
+      log({ agentId: 'a1', outcomeId: 'o1', promptVersion: 'v1', tokensSpent: 10, result: 'SUCCESS' });
+      log({ agentId: 'a1', outcomeId: 'o1', promptVersion: 'v1', tokensSpent: 20, result: 'SUCCESS' });
+      log({ agentId: 'a1', outcomeId: 'o2', promptVersion: 'v1', tokensSpent: 30, result: 'SUCCESS' });
+      expect(getTotalLogCount()).toBe(3);
+    });
+  });
+  describe('formatLogsForCli', () => {
+    it('should return message for empty logs', () => {
+      const output = formatLogsForCli('empty-outcome');
+      expect(output).toContain('No logs found');
+    });
+    it('should format logs with header and entries', () => {
+      log({ agentId: 'a1', outcomeId: 'o1', promptVersion: 'v1', tokensSpent: 100, result: 'SUCCESS' });
+      log({ agentId: 'a2', outcomeId: 'o1', promptVersion: 'v1', tokensSpent: 200, result: 'FAILURE', failureReason: 'Test failure' });
+      const output = formatLogsForCli('o1');
+      expect(output).toContain('o1');
+      expect(output).toContain('2 entries');
+      expect(output).toContain('a1');
+      expect(output).toContain('a2');
+      expect(output).toContain('SUCCESS');
+      expect(output).toContain('FAILURE');
+      expect(output).toContain('Test failure');
+    });
+  });
+  describe('convenience functions', () => {
+    it('logSuccess should create SUCCESS entry', () => {
+      const entry = logSuccess('agent-1', 'outcome-1', 'v1.0.0', 500);
+      expect(entry.result).toBe('SUCCESS');
+      expect(entry.failureReason).toBeUndefined();
+    });
+    it('logFailure should create FAILURE entry with reason', () => {
+      const entry = logFailure('agent-1', 'outcome-1', 'v1.0.0', 300, 'Test failure');
+      expect(entry.result).toBe('FAILURE');
+      expect(entry.failureReason).toBe('Test failure');
+    });
+    it('logPending should create PENDING entry', () => {
+      const entry = logPending('agent-1', 'outcome-1', 'v1.0.0', 100);
+      expect(entry.result).toBe('PENDING');
+    });
+  });
+});
+describe('Logger Property Tests', () => {
+  beforeEach(() => {
+    clearAllLogs();
+  });
+  /**
+   * **Feature: earnd-bounty-engine, Property 12: Log Entry Completeness**
+   * For any agent attempt, the log entry SHALL contain agentId, outcomeId,
+   * promptVersion, tokensSpent, result, and failureReason (if result is FAILURE).
+   * **Validates: Requirements 6.1**
+   */
+  it('Property 12: Log Entry Completeness', () => {
+    fc.assert(
+      fc.property(
+        fc.record({
+          agentId: fc.string({ minLength: 1 }),
+          outcomeId: fc.string({ minLength: 1 }),
+          promptVersion: fc.string({ minLength: 1 }),
+          tokensSpent: fc.nat(),
+          result: fc.constantFrom('SUCCESS', 'FAILURE', 'PENDING') as fc.Arbitrary<LogResult>,
+          failureReason: fc.option(fc.string({ minLength: 1 }), { nil: undefined }),
+        }),
+        (input) => {
+          clearAllLogs();
+          const entry = log({
+            agentId: input.agentId,
+            outcomeId: input.outcomeId,
+            promptVersion: input.promptVersion,
+            tokensSpent: input.tokensSpent,
+            result: input.result,
+            failureReason: input.failureReason,
+          });
+          // Verify all required fields are present
+          expect(entry.agentId).toBe(input.agentId);
+          expect(entry.outcomeId).toBe(input.outcomeId);
+          expect(entry.promptVersion).toBe(input.promptVersion);
+          expect(entry.tokensSpent).toBe(input.tokensSpent);
+          expect(entry.result).toBe(input.result);
+          expect(entry.timestamp).toBeDefined();
+          expect(typeof entry.timestamp).toBe('string');
+          // Verify timestamp is valid ISO string
+          const parsedTime = new Date(entry.timestamp).getTime();
+          expect(Number.isNaN(parsedTime)).toBe(false);
+          // If failure, reason should be included
+          if (input.result === 'FAILURE' && input.failureReason) {
+            expect(entry.failureReason).toBe(input.failureReason);
+          }
+        }
+      ),
+      { numRuns: 100 }
+    );
+  });
+  /**
+   * **Feature: earnd-bounty-engine, Property 13: Log Persistence**
+   * For any completed agent run with N attempts, querying logs SHALL return
+   * exactly N log entries for that agent.
+   * **Validates: Requirements 6.3**
+   */
+  it('Property 13: Log Persistence', () => {
+    fc.assert(
+      fc.property(
+        fc.nat({ max: 20 }), // Number of attempts (0-20)
+        fc.string({ minLength: 1 }), // agentId
+        fc.string({ minLength: 1 }), // outcomeId
+        (attemptCount, agentId, outcomeId) => {
+          clearAllLogs();
+          // Log N attempts
+          for (let i = 0; i < attemptCount; i++) {
+            log({
+              agentId,
+              outcomeId,
+              promptVersion: `v1.${i}`,
+              tokensSpent: 100 + i * 10,
+              result: i === attemptCount - 1 ? 'SUCCESS' : 'PENDING',
+            });
+          }
+          // Verify exactly N entries exist
+          const logs = getAgentLogs(outcomeId, agentId);
+          expect(logs.length).toBe(attemptCount);
+          // Verify all entries belong to the correct agent
+          for (const log of logs) {
+            expect(log.agentId).toBe(agentId);
+            expect(log.outcomeId).toBe(outcomeId);
+          }
+        }
+      ),
+      { numRuns: 100 }
+    );
+  });
+  /**
+   * Property: Log isolation between outcomes
+   * Logs for different outcomes SHALL be isolated from each other.
+   */
+  it('Property: Log isolation between outcomes', () => {
+    fc.assert(
+      fc.property(
+        fc.string({ minLength: 1 }), // outcomeId1
+        fc.string({ minLength: 1 }), // outcomeId2
+        fc.nat({ max: 10 }), // count1
+        fc.nat({ max: 10 }), // count2
+        (outcomeId1, outcomeId2, count1, count2) => {
+          // Skip if outcomes are the same
+          if (outcomeId1 === outcomeId2) return;
+          clearAllLogs();
+          // Log to first outcome
+          for (let i = 0; i < count1; i++) {
+            log({
+              agentId: `agent-${i}`,
+              outcomeId: outcomeId1,
+              promptVersion: 'v1',
+              tokensSpent: 100,
+              result: 'SUCCESS',
+            });
+          }
+          // Log to second outcome
+          for (let i = 0; i < count2; i++) {
+            log({
+              agentId: `agent-${i}`,
+              outcomeId: outcomeId2,
+              promptVersion: 'v1',
+              tokensSpent: 100,
+              result: 'SUCCESS',
+            });
+          }
+          // Verify isolation
+          expect(getLogs(outcomeId1).length).toBe(count1);
+          expect(getLogs(outcomeId2).length).toBe(count2);
+        }
+      ),
+      { numRuns: 100 }
+    );
+  });
+});