npm - testchimp-runner-core - Versions diffs - 0.0.35 → 0.0.36 - Mend

testchimp-runner-core 0.0.35 → 0.0.36

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (71) hide show

package/package.json +6 -1
package/plandocs/BEFORE_AFTER_VERIFICATION.md +0 -148
package/plandocs/COORDINATE_MODE_DIAGNOSIS.md +0 -144
package/plandocs/CREDIT_CALLBACK_ARCHITECTURE.md +0 -253
package/plandocs/HUMAN_LIKE_IMPROVEMENTS.md +0 -642
package/plandocs/IMPLEMENTATION_STATUS.md +0 -108
package/plandocs/INTEGRATION_COMPLETE.md +0 -322
package/plandocs/MULTI_AGENT_ARCHITECTURE_REVIEW.md +0 -844
package/plandocs/ORCHESTRATOR_MVP_SUMMARY.md +0 -539
package/plandocs/PHASE1_ABSTRACTION_COMPLETE.md +0 -241
package/plandocs/PHASE1_FINAL_STATUS.md +0 -210
package/plandocs/PHASE_1_COMPLETE.md +0 -165
package/plandocs/PHASE_1_SUMMARY.md +0 -184
package/plandocs/PLANNING_SESSION_SUMMARY.md +0 -372
package/plandocs/PROMPT_OPTIMIZATION_ANALYSIS.md +0 -120
package/plandocs/PROMPT_SANITY_CHECK.md +0 -120
package/plandocs/SCRIPT_CLEANUP_FEATURE.md +0 -201
package/plandocs/SCRIPT_GENERATION_ARCHITECTURE.md +0 -364
package/plandocs/SELECTOR_IMPROVEMENTS.md +0 -139
package/plandocs/SESSION_SUMMARY_v0.0.33.md +0 -151
package/plandocs/TROUBLESHOOTING_SESSION.md +0 -72
package/plandocs/VISION_DIAGNOSTICS_IMPROVEMENTS.md +0 -336
package/plandocs/VISUAL_AGENT_EVOLUTION_PLAN.md +0 -396
package/plandocs/WHATS_NEW_v0.0.33.md +0 -183
package/plandocs/exploratory-mode-support-v2.plan.md +0 -953
package/plandocs/exploratory-mode-support.plan.md +0 -928
package/plandocs/journey-id-tracking-addendum.md +0 -227
package/releasenotes/RELEASE_0.0.26.md +0 -165
package/releasenotes/RELEASE_0.0.27.md +0 -236
package/releasenotes/RELEASE_0.0.28.md +0 -286
package/src/auth-config.ts +0 -84
package/src/credit-usage-service.ts +0 -188
package/src/env-loader.ts +0 -103
package/src/execution-service.ts +0 -996
package/src/file-handler.ts +0 -104
package/src/index.ts +0 -432
package/src/llm-facade.ts +0 -821
package/src/llm-provider.ts +0 -53
package/src/model-constants.ts +0 -35
package/src/orchestrator/decision-parser.ts +0 -139
package/src/orchestrator/index.ts +0 -58
package/src/orchestrator/orchestrator-agent.ts +0 -1282
package/src/orchestrator/orchestrator-prompts.ts +0 -786
package/src/orchestrator/page-som-handler.ts +0 -1565
package/src/orchestrator/som-types.ts +0 -188
package/src/orchestrator/tool-registry.ts +0 -184
package/src/orchestrator/tools/check-page-ready.ts +0 -75
package/src/orchestrator/tools/extract-data.ts +0 -92
package/src/orchestrator/tools/index.ts +0 -15
package/src/orchestrator/tools/inspect-page.ts +0 -42
package/src/orchestrator/tools/recall-history.ts +0 -72
package/src/orchestrator/tools/refresh-som-markers.ts +0 -69
package/src/orchestrator/tools/take-screenshot.ts +0 -128
package/src/orchestrator/tools/verify-action-result.ts +0 -159
package/src/orchestrator/tools/view-previous-screenshot.ts +0 -103
package/src/orchestrator/types.ts +0 -291
package/src/playwright-mcp-service.ts +0 -224
package/src/progress-reporter.ts +0 -144
package/src/prompts.ts +0 -842
package/src/providers/backend-proxy-llm-provider.ts +0 -91
package/src/providers/local-llm-provider.ts +0 -38
package/src/scenario-service.ts +0 -252
package/src/scenario-worker-class.ts +0 -1110
package/src/script-utils.ts +0 -203
package/src/types.ts +0 -239
package/src/utils/browser-utils.ts +0 -348
package/src/utils/coordinate-converter.ts +0 -162
package/src/utils/page-info-retry.ts +0 -65
package/src/utils/page-info-utils.ts +0 -285
package/testchimp-runner-core-0.0.35.tgz +0 -0
package/tsconfig.json +0 -19

package/src/llm-provider.ts DELETED Viewed

@@ -1,53 +0,0 @@
-/**
- * LLM Provider Interface
- * Abstraction for LLM calls - allows different implementations (backend proxy, local, etc.)
- */
-/**
- * Labeled image for multi-image LLM requests
- * Used for before/after comparisons or multi-screenshot analysis
- */
-export interface LabeledImage {
-  label: string;      // e.g., "Before", "After", "Screenshot 1"
-  dataUrl: string;    // Base64 data URL (data:image/png;base64,...)
-}
-/**
- * LLM request - camelCase for TypeScript
- */
-export interface LLMRequest {
-  model?: string;
-  systemPrompt?: string;
-  userPrompt?: string;
-  imageUrl?: string;           // For vision models (data URL) - backward compatible, single image
-  images?: LabeledImage[];     // For multi-image requests (e.g., before/after comparison)
-}
-/**
- * LLM response
- */
-export interface LLMResponse {
-  answer: string;
-  usage?: {
-    inputTokens: number;
-    outputTokens: number;
-  };
-}
-/**
- * Abstract LLM provider interface
- * Implementations can call backend proxy, local LLM, or any other service
- */
-export interface LLMProvider {
-  /**
-   * Call LLM with given request
-   * Implementations handle authentication, API calls, retries, etc.
-   */
-  callLLM(request: LLMRequest): Promise<LLMResponse>;
-  /**
-   * Optional: Set logger for LLM provider to log its activities
-   */
-  setLogger?(logger: (message: string, level?: 'log' | 'error' | 'warn') => void): void;
-}

package/src/model-constants.ts DELETED Viewed

@@ -1,35 +0,0 @@
-/**
- * Model constants for LLM interactions
- *
- * Centralized model configuration to make it easy to update models across the codebase.
- */
-/**
- * Default model for complex reasoning tasks:
- * - Command generation (Playwright selectors)
- * - Goal completion checks (critical decisions)
- * - Repair suggestions (complex logic)
- * - Agent orchestration (decision-making)
- */
-export const DEFAULT_MODEL = 'gpt-5-mini';
-/**
- * Simpler model for structured/guided tasks:
- * - Scenario breakdown (structured splitting)
- * - Screenshot need assessment (yes/no decision)
- * - Repair confidence assessment (comparison task)
- * - Test name generation (text formatting)
- * - Hashtag generation (semantic tags)
- * - Script parsing (extract steps)
- * - Final script merging (text concatenation)
- */
-export const DEFAULT_SIMPLER_MODEL = 'gpt-4o-mini';
-/**
- * Vision-capable model for visual diagnostics:
- * - Screenshot analysis
- * - Visual element identification
- * - UI blocker detection
- */
-export const VISION_MODEL = 'gpt-5-mini';

package/src/orchestrator/decision-parser.ts DELETED Viewed

@@ -1,139 +0,0 @@
-/**
- * Decision Parser Utility
- * Parses and validates agent decisions from LLM responses
- */
-import { AgentDecision } from './types';
-import { isSomVerification, isSomCommand } from './som-types';
-export class DecisionParser {
-  private logger?: (message: string, level?: 'log' | 'error' | 'warn') => void;
-  constructor(logger?: (message: string, level?: 'log' | 'error' | 'warn') => void) {
-    this.logger = logger;
-  }
-  /**
-   * Parse agent decision from LLM response
-   */
-  parse(response: string): AgentDecision {
-    try {
-      // Extract JSON from response
-      const jsonMatch = response.match(/\{[\s\S]*\}/);
-      if (!jsonMatch) {
-        this.logger?.(`[DecisionParser] ✗ No JSON found in LLM response`, 'error');
-        this.logger?.(`[DecisionParser] 📄 FULL LLM RESPONSE:\n${response}`, 'error');
-        throw new Error('No JSON found in response');
-      }
-      const parsed = JSON.parse(jsonMatch[0]);
-      // Validate required fields
-      // Accept either "reasoning" or "statusReasoning" (LLMs sometimes only provide one)
-      if (!parsed.status || (!parsed.reasoning && !parsed.statusReasoning)) {
-        this.logger?.(`[DecisionParser] ✗ Missing required fields in parsed JSON`, 'error');
-        this.logger?.(`[DecisionParser] 📄 FULL LLM RESPONSE:\n${response}`, 'error');
-        this.logger?.(`[DecisionParser] 📄 PARSED JSON:\n${JSON.stringify(parsed, null, 2)}`, 'error');
-        this.logger?.(`[DecisionParser] ❌ Has status: ${!!parsed.status}, Has reasoning: ${!!parsed.reasoning}, Has statusReasoning: ${!!parsed.statusReasoning}`, 'error');
-        throw new Error('Missing required fields: status and (reasoning or statusReasoning)');
-      }
-      // Normalize: if reasoning is missing but statusReasoning exists, use statusReasoning as reasoning
-      if (!parsed.reasoning && parsed.statusReasoning) {
-        parsed.reasoning = parsed.statusReasoning;
-      }
-      return parsed as AgentDecision;
-    } catch (error: any) {
-      this.logger?.(`[DecisionParser] ✗ Failed to parse agent decision: ${error.message}`, 'error');
-      // Only log full response if not already logged above
-      if (!error.message.includes('Missing required fields') && !error.message.includes('No JSON found')) {
-        this.logger?.(`[DecisionParser] 📄 FULL LLM RESPONSE:\n${response}`, 'error');
-      }
-      // Return fallback
-      return {
-        status: 'stuck',
-        statusReasoning: 'Failed to parse agent response',
-        reasoning: `Parse error: ${error.message}`
-      };
-    }
-  }
-  /**
-   * Log agent decision for debugging
-   */
-  log(decision: AgentDecision, iteration: number): void {
-    this.logger?.(`[Orchestrator] 💭 REASONING: ${decision.reasoning}`);
-    if (decision.selfReflection) {
-      this.logger?.(`[Orchestrator] 🧠 SELF-REFLECTION:`);
-      this.logger?.(`[Orchestrator]    Next: ${decision.selfReflection.guidanceForNext}`);
-      if (decision.selfReflection.detectingLoop) {
-        this.logger?.(`[Orchestrator]    🔄 LOOP DETECTED: ${decision.selfReflection.loopReasoning}`, 'warn');
-      }
-    }
-    if (decision.toolCalls && decision.toolCalls.length > 0) {
-      this.logger?.(`[Orchestrator] 🔧 TOOLS: ${decision.toolCalls.map(t => t.name).join(', ')}`);
-      if (decision.toolReasoning) {
-        this.logger?.(`[Orchestrator] 📋 Why: ${decision.toolReasoning}`);
-      }
-    }
-    if (decision.blockerDetected) {
-      this.logger?.(`[Orchestrator] 🚧 BLOCKER: ${decision.blockerDetected.description}`, 'warn');
-      this.logger?.(`[Orchestrator] 🧹 Clearing with ${decision.blockerDetected.clearingCommands.length} command(s)`);
-    }
-    if (decision.stepReEvaluation?.detected) {
-      this.logger?.(`[Orchestrator] 🔍 STEP RE-EVALUATION: ${decision.stepReEvaluation.issue}`, 'warn');
-      this.logger?.(`[Orchestrator] 📝 Explanation: ${decision.stepReEvaluation.explanation}`);
-    }
-    if (decision.commands && decision.commands.length > 0) {
-      this.logger?.(`[Orchestrator] 📝 COMMANDS (${decision.commands.length}):`);
-      decision.commands.slice(0, 3).forEach((cmd: any, i) => {
-        // Handle string commands (standard mode), SomCommand, and SomVerification objects
-        if (typeof cmd === 'string') {
-          this.logger?.(`[Orchestrator]    ${i + 1}. ${cmd.substring(0, 80)}...`);
-        } else if (isSomVerification(cmd)) {
-          const ref = cmd.elementRef || cmd.selector || 'unknown';
-          this.logger?.(`[Orchestrator]    ${i + 1}. [VERIFY] ${cmd.verificationType} on ${ref}: ${cmd.expected}`);
-        } else if (isSomCommand(cmd)) {
-          this.logger?.(`[Orchestrator]    ${i + 1}. [ACTION] ${cmd.action} on ${cmd.elementRef || 'coord'}`);
-        } else {
-          this.logger?.(`[Orchestrator]    ${i + 1}. ${JSON.stringify(cmd).substring(0, 80)}...`);
-        }
-      });
-      if (decision.commands.length > 3) {
-        this.logger?.(`[Orchestrator]    ... and ${decision.commands.length - 3} more`);
-      }
-      if (decision.commandReasoning) {
-        this.logger?.(`[Orchestrator] 💡 Why: ${decision.commandReasoning}`);
-      }
-    }
-    // Log meta-learning suggestions with clear demarcations
-    if (decision.debugInfo?.suggestedPromptUpdates) {
-      this.logger?.(``, 'warn');
-      this.logger?.(`═══════════════════════════════════════════════════════════════`, 'warn');
-      this.logger?.(`[Orchestrator] 🧠 META-LEARNING SUGGESTION FROM AGENT`, 'warn');
-      this.logger?.(`═══════════════════════════════════════════════════════════════`, 'warn');
-      this.logger?.(``, 'warn');
-      this.logger?.(`SUGGESTED PROMPT UPDATE:`, 'warn');
-      this.logger?.(`  ${decision.debugInfo.suggestedPromptUpdates}`, 'warn');
-      this.logger?.(``, 'warn');
-      if (decision.debugInfo.reasoning) {
-        this.logger?.(`REASONING:`, 'warn');
-        this.logger?.(`  ${decision.debugInfo.reasoning}`, 'warn');
-        this.logger?.(``, 'warn');
-      }
-      this.logger?.(`═══════════════════════════════════════════════════════════════`, 'warn');
-      this.logger?.(``, 'warn');
-    }
-  }
-}

package/src/orchestrator/index.ts DELETED Viewed

@@ -1,58 +0,0 @@
-/**
- * Orchestrator Module Exports
- */
-// Core orchestrator
-export { OrchestratorAgent } from './orchestrator-agent';
-// SoM (Set-of-Marks) handler
-export { PageSoMHandler } from './page-som-handler';
-// Tool system
-export { ToolRegistry, Tool, ToolParameter, ToolExecutionContext } from './tool-registry';
-// 8 information-gathering tools (state changes via Playwright commands)
-export {
-  TakeScreenshotTool,
-  ViewPreviousScreenshotTool,
-  RefreshSomMarkersTool,
-  RecallHistoryTool,
-  InspectPageTool,
-  CheckPageReadyTool,
-  ExtractDataTool,
-  VerifyActionResultTool
-} from './tools';
-// Types
-export {
-  AgentConfig,
-  AgentContext,
-  AgentDecision,
-  JourneyMemory,
-  MemoryStep,
-  OrchestratorStepResult,
-  SelfReflection,
-  ToolCall,
-  ToolResult,
-  ExplorationMode,
-  DEFAULT_AGENT_CONFIG
-} from './types';
-// SoM Types
-export {
-  SomCommand,
-  SomElement,
-  SemanticCommandResult,
-  CommandRunStatus,
-  CommandAttempt,
-  DomMutation,
-  InteractionAction,
-  Coordinate,
-  TypedSelector,
-  SomVerification,
-  VerificationType,
-  SomCommandOrVerification,
-  isSomVerification,
-  isSomCommand
-} from './som-types';