npm - @zimezone/z-command - Versions diffs - 1.1.1 → 1.1.4 - Mend

@zimezone/z-command 1.1.1 → 1.1.4

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (288) hide show

package/README.md +13 -1
package/dist/cli.js +1 -1
package/dist/commands/init.d.ts.map +1 -1
package/dist/commands/init.js +42 -10
package/dist/commands/init.js.map +1 -1
package/dist/platforms.d.ts.map +1 -1
package/dist/platforms.js +11 -1
package/dist/platforms.js.map +1 -1
package/dist/types.d.ts +2 -0
package/dist/types.d.ts.map +1 -1
package/package.json +8 -3
package/templates.zip +0 -0
package/templates/agents/accessibility-expert.agent.md +0 -56
package/templates/agents/ai-engineer.agent.md +0 -61
package/templates/agents/angular-architect.agent.md +0 -49
package/templates/agents/api-designer.agent.md +0 -40
package/templates/agents/api-documenter.agent.md +0 -161
package/templates/agents/architect-review.agent.md +0 -146
package/templates/agents/arm-cortex-expert.agent.md +0 -288
package/templates/agents/azure-infra-engineer.agent.md +0 -57
package/templates/agents/backend-architect.agent.md +0 -309
package/templates/agents/backend-developer.agent.md +0 -61
package/templates/agents/backend-security-coder.agent.md +0 -152
package/templates/agents/bash-pro.agent.md +0 -285
package/templates/agents/blockchain-developer.agent.md +0 -57
package/templates/agents/build-engineer.agent.md +0 -56
package/templates/agents/business-analyst.agent.md +0 -47
package/templates/agents/c-pro.agent.md +0 -35
package/templates/agents/c4-code.agent.md +0 -320
package/templates/agents/c4-component.agent.md +0 -227
package/templates/agents/c4-container.agent.md +0 -248
package/templates/agents/c4-context.agent.md +0 -235
package/templates/agents/cli-developer.agent.md +0 -57
package/templates/agents/cloud-architect.agent.md +0 -56
package/templates/agents/code-architect.agent.md +0 -63
package/templates/agents/code-reviewer.agent.md +0 -49
package/templates/agents/competitive-analyst.agent.md +0 -48
package/templates/agents/conductor-validator.agent.md +0 -245
package/templates/agents/context-manager.agent.md +0 -55
package/templates/agents/cpp-pro.agent.md +0 -59
package/templates/agents/csharp-developer.agent.md +0 -57
package/templates/agents/csharp-pro.agent.md +0 -38
package/templates/agents/customer-support.agent.md +0 -148
package/templates/agents/data-engineer.agent.md +0 -55
package/templates/agents/data-researcher.agent.md +0 -55
package/templates/agents/data-scientist.agent.md +0 -56
package/templates/agents/database-admin.agent.md +0 -142
package/templates/agents/database-administrator.agent.md +0 -50
package/templates/agents/database-architect.agent.md +0 -238
package/templates/agents/database-optimizer.agent.md +0 -144
package/templates/agents/debugger.agent.md +0 -30
package/templates/agents/deployment-engineer.agent.md +0 -0
package/templates/agents/devops-engineer.agent.md +0 -59
package/templates/agents/devops-troubleshooter.agent.md +0 -138
package/templates/agents/django-developer.agent.md +0 -50
package/templates/agents/django-pro.agent.md +0 -159
package/templates/agents/docs-architect.agent.md +0 -77
package/templates/agents/documentation-engineer.agent.md +0 -57
package/templates/agents/dotnet-architect.agent.md +0 -175
package/templates/agents/dx-optimizer.agent.md +0 -63
package/templates/agents/electron-pro.agent.md +0 -56
package/templates/agents/elixir-pro.agent.md +0 -38
package/templates/agents/embedded-systems.agent.md +0 -55
package/templates/agents/error-detective.agent.md +0 -32
package/templates/agents/event-sourcing-architect.agent.md +0 -42
package/templates/agents/fastapi-pro.agent.md +0 -171
package/templates/agents/fintech-engineer.agent.md +0 -57
package/templates/agents/firmware-analyst.agent.md +0 -330
package/templates/agents/flutter-expert.agent.md +0 -50
package/templates/agents/frontend-developer.agent.md +0 -59
package/templates/agents/frontend-security-coder.agent.md +0 -149
package/templates/agents/fullstack-developer.agent.md +0 -46
package/templates/agents/git-workflow-manager.agent.md +0 -57
package/templates/agents/golang-pro.agent.md +0 -50
package/templates/agents/graphql-architect.agent.md +0 -48
package/templates/agents/haskell-pro.agent.md +0 -37
package/templates/agents/hr-pro.agent.md +0 -105
package/templates/agents/incident-responder.agent.md +0 -190
package/templates/agents/ios-developer.agent.md +0 -198
package/templates/agents/iot-engineer.agent.md +0 -56
package/templates/agents/java-architect.agent.md +0 -48
package/templates/agents/java-pro.agent.md +0 -156
package/templates/agents/javascript-pro.agent.md +0 -35
package/templates/agents/julia-pro.agent.md +0 -187
package/templates/agents/kotlin-specialist.agent.md +0 -50
package/templates/agents/laravel-specialist.agent.md +0 -50
package/templates/agents/legacy-modernizer.agent.md +0 -56
package/templates/agents/legal-advisor.agent.md +0 -49
package/templates/agents/llm-architect.agent.md +0 -58
package/templates/agents/malware-analyst.agent.md +0 -272
package/templates/agents/mcp-developer.agent.md +0 -54
package/templates/agents/mermaid-expert.agent.md +0 -39
package/templates/agents/microservices-architect.agent.md +0 -47
package/templates/agents/minecraft-bukkit-pro.agent.md +0 -104
package/templates/agents/ml-engineer.agent.md +0 -56
package/templates/agents/mlops-engineer.agent.md +0 -56
package/templates/agents/mobile-developer.agent.md +0 -45
package/templates/agents/mobile-security-coder.agent.md +0 -163
package/templates/agents/monorepo-architect.agent.md +0 -44
package/templates/agents/multi-agent-coordinator.agent.md +0 -55
package/templates/agents/network-engineer.agent.md +0 -57
package/templates/agents/nextjs-developer.agent.md +0 -48
package/templates/agents/nlp-engineer.agent.md +0 -58
package/templates/agents/observability-engineer.agent.md +0 -228
package/templates/agents/payment-integration.agent.md +0 -56
package/templates/agents/performance-engineer.agent.md +0 -167
package/templates/agents/performance-optimizer.agent.md +0 -57
package/templates/agents/php-pro.agent.md +0 -43
package/templates/agents/platform-engineer.agent.md +0 -57
package/templates/agents/posix-shell-pro.agent.md +0 -284
package/templates/agents/postgres-pro.agent.md +0 -58
package/templates/agents/product-manager.agent.md +0 -55
package/templates/agents/project-manager.agent.md +0 -57
package/templates/agents/prompt-engineer.agent.md +0 -58
package/templates/agents/python-pro.agent.md +0 -48
package/templates/agents/quant-analyst.agent.md +0 -32
package/templates/agents/rails-expert.agent.md +0 -50
package/templates/agents/react-specialist.agent.md +0 -49
package/templates/agents/refactoring-specialist.agent.md +0 -56
package/templates/agents/reference-builder.agent.md +0 -167
package/templates/agents/research-analyst.agent.md +0 -63
package/templates/agents/reverse-engineer.agent.md +0 -202
package/templates/agents/risk-manager.agent.md +0 -41
package/templates/agents/ruby-pro.agent.md +0 -35
package/templates/agents/rust-pro.agent.md +0 -156
package/templates/agents/sales-automator.agent.md +0 -35
package/templates/agents/scala-pro.agent.md +0 -60
package/templates/agents/scrum-master.agent.md +0 -54
package/templates/agents/search-specialist.agent.md +0 -59
package/templates/agents/security-analyst.agent.md +0 -57
package/templates/agents/security-auditor.agent.md +0 -138
package/templates/agents/security-engineer.agent.md +0 -57
package/templates/agents/seo-authority-builder.agent.md +0 -116
package/templates/agents/seo-cannibalization-detector.agent.md +0 -103
package/templates/agents/seo-content-auditor.agent.md +0 -63
package/templates/agents/seo-content-planner.agent.md +0 -88
package/templates/agents/seo-content-refresher.agent.md +0 -98
package/templates/agents/seo-content-writer.agent.md +0 -76
package/templates/agents/seo-keyword-strategist.agent.md +0 -75
package/templates/agents/seo-meta-optimizer.agent.md +0 -72
package/templates/agents/seo-snippet-hunter.agent.md +0 -94
package/templates/agents/seo-specialist.agent.md +0 -57
package/templates/agents/seo-structure-architect.agent.md +0 -88
package/templates/agents/service-mesh-expert.agent.md +0 -41
package/templates/agents/sql-pro.agent.md +0 -146
package/templates/agents/sre-engineer.agent.md +0 -58
package/templates/agents/swift-expert.agent.md +0 -49
package/templates/agents/task-distributor.agent.md +0 -47
package/templates/agents/tdd-orchestrator.agent.md +0 -183
package/templates/agents/technical-writer.agent.md +0 -48
package/templates/agents/temporal-python-pro.agent.md +0 -349
package/templates/agents/terraform-engineer.agent.md +0 -57
package/templates/agents/terraform-specialist.agent.md +0 -137
package/templates/agents/test-automator.agent.md +0 -203
package/templates/agents/test-engineer.agent.md +0 -55
package/templates/agents/threat-modeling-expert.agent.md +0 -44
package/templates/agents/trend-analyst.agent.md +0 -47
package/templates/agents/tutorial-engineer.agent.md +0 -118
package/templates/agents/typescript-pro.agent.md +0 -48
package/templates/agents/ui-designer.agent.md +0 -48
package/templates/agents/ui-ux-designer.agent.md +0 -188
package/templates/agents/ui-visual-validator.agent.md +0 -192
package/templates/agents/ux-researcher.agent.md +0 -48
package/templates/agents/vector-database-engineer.agent.md +0 -43
package/templates/agents/vue-expert.agent.md +0 -48
package/templates/agents/websocket-engineer.agent.md +0 -49
package/templates/agents/workflow-orchestrator.agent.md +0 -48
package/templates/skills/angular-migration/SKILL.md +0 -410
package/templates/skills/api-design-principles/SKILL.md +0 -528
package/templates/skills/api-design-principles/assets/api-design-checklist.md +0 -155
package/templates/skills/api-design-principles/assets/rest-api-template.py +0 -182
package/templates/skills/api-design-principles/references/graphql-schema-design.md +0 -583
package/templates/skills/api-design-principles/references/rest-best-practices.md +0 -408
package/templates/skills/architecture-decision-records/SKILL.md +0 -428
package/templates/skills/architecture-patterns/SKILL.md +0 -494
package/templates/skills/async-python-patterns/SKILL.md +0 -694
package/templates/skills/auth-implementation-patterns/SKILL.md +0 -634
package/templates/skills/changelog-automation/SKILL.md +0 -552
package/templates/skills/code-review/SKILL.md +0 -62
package/templates/skills/code-review-excellence/SKILL.md +0 -520
package/templates/skills/competitive-landscape/SKILL.md +0 -479
package/templates/skills/context-driven-development/SKILL.md +0 -385
package/templates/skills/cost-optimization/SKILL.md +0 -274
package/templates/skills/cqrs-implementation/SKILL.md +0 -554
package/templates/skills/data-quality-frameworks/SKILL.md +0 -587
package/templates/skills/data-storytelling/SKILL.md +0 -453
package/templates/skills/database-migration/SKILL.md +0 -424
package/templates/skills/dbt-transformation-patterns/SKILL.md +0 -561
package/templates/skills/debugging-strategies/SKILL.md +0 -527
package/templates/skills/defi-protocol-templates/SKILL.md +0 -454
package/templates/skills/dependency-upgrade/SKILL.md +0 -409
package/templates/skills/deployment-pipeline-design/SKILL.md +0 -359
package/templates/skills/distributed-tracing/SKILL.md +0 -438
package/templates/skills/dotnet-backend-patterns/SKILL.md +0 -815
package/templates/skills/dotnet-backend-patterns/assets/repository-template.cs +0 -523
package/templates/skills/dotnet-backend-patterns/assets/service-template.cs +0 -336
package/templates/skills/dotnet-backend-patterns/references/dapper-patterns.md +0 -544
package/templates/skills/dotnet-backend-patterns/references/ef-core-best-practices.md +0 -355
package/templates/skills/e2e-testing-patterns/SKILL.md +0 -547
package/templates/skills/employment-contract-templates/SKILL.md +0 -507
package/templates/skills/error-handling-patterns/SKILL.md +0 -636
package/templates/skills/event-store-design/SKILL.md +0 -437
package/templates/skills/fastapi-templates/SKILL.md +0 -567
package/templates/skills/git-advanced-workflows/SKILL.md +0 -400
package/templates/skills/github-actions-templates/SKILL.md +0 -333
package/templates/skills/go-concurrency-patterns/SKILL.md +0 -655
package/templates/skills/grafana-dashboards/SKILL.md +0 -369
package/templates/skills/helm-chart-scaffolding/SKILL.md +0 -544
package/templates/skills/helm-chart-scaffolding/assets/Chart.yaml.template +0 -42
package/templates/skills/helm-chart-scaffolding/assets/values.yaml.template +0 -185
package/templates/skills/helm-chart-scaffolding/references/chart-structure.md +0 -500
package/templates/skills/helm-chart-scaffolding/scripts/validate-chart.sh +0 -244
package/templates/skills/javascript-testing-patterns/SKILL.md +0 -1025
package/templates/skills/langchain-architecture/SKILL.md +0 -338
package/templates/skills/llm-evaluation/SKILL.md +0 -471
package/templates/skills/microservices-patterns/SKILL.md +0 -595
package/templates/skills/modern-javascript-patterns/SKILL.md +0 -911
package/templates/skills/monorepo-management/SKILL.md +0 -622
package/templates/skills/nextjs-app-router-patterns/SKILL.md +0 -544
package/templates/skills/nodejs-backend-patterns/SKILL.md +0 -1020
package/templates/skills/nx-workspace-patterns/SKILL.md +0 -452
package/templates/skills/openapi-spec-generation/SKILL.md +0 -1028
package/templates/skills/paypal-integration/SKILL.md +0 -467
package/templates/skills/pci-compliance/SKILL.md +0 -466
package/templates/skills/postgresql/SKILL.md +0 -204
package/templates/skills/projection-patterns/SKILL.md +0 -490
package/templates/skills/prometheus-configuration/SKILL.md +0 -392
package/templates/skills/prompt-engineering-patterns/SKILL.md +0 -201
package/templates/skills/prompt-engineering-patterns/assets/few-shot-examples.json +0 -106
package/templates/skills/prompt-engineering-patterns/assets/prompt-template-library.md +0 -246
package/templates/skills/prompt-engineering-patterns/references/chain-of-thought.md +0 -399
package/templates/skills/prompt-engineering-patterns/references/few-shot-learning.md +0 -369
package/templates/skills/prompt-engineering-patterns/references/prompt-optimization.md +0 -414
package/templates/skills/prompt-engineering-patterns/references/prompt-templates.md +0 -470
package/templates/skills/prompt-engineering-patterns/references/system-prompts.md +0 -189
package/templates/skills/prompt-engineering-patterns/scripts/optimize-prompt.py +0 -279
package/templates/skills/python-packaging/SKILL.md +0 -870
package/templates/skills/python-performance-optimization/SKILL.md +0 -869
package/templates/skills/python-testing-patterns/SKILL.md +0 -907
package/templates/skills/rag-implementation/SKILL.md +0 -403
package/templates/skills/react-modernization/SKILL.md +0 -513
package/templates/skills/react-native-architecture/SKILL.md +0 -671
package/templates/skills/react-state-management/SKILL.md +0 -429
package/templates/skills/risk-metrics-calculation/SKILL.md +0 -555
package/templates/skills/rust-async-patterns/SKILL.md +0 -517
package/templates/skills/secrets-management/SKILL.md +0 -346
package/templates/skills/security-requirement-extraction/SKILL.md +0 -677
package/templates/skills/security-review/SKILL.md +0 -78
package/templates/skills/shellcheck-configuration/SKILL.md +0 -454
package/templates/skills/similarity-search-patterns/SKILL.md +0 -558
package/templates/skills/slo-implementation/SKILL.md +0 -329
package/templates/skills/sql-optimization-patterns/SKILL.md +0 -493
package/templates/skills/stripe-integration/SKILL.md +0 -442
package/templates/skills/systematic-debugging/SKILL.md +0 -57
package/templates/skills/tailwind-design-system/SKILL.md +0 -666
package/templates/skills/temporal-python-testing/SKILL.md +0 -158
package/templates/skills/temporal-python-testing/resources/integration-testing.md +0 -455
package/templates/skills/temporal-python-testing/resources/local-setup.md +0 -553
package/templates/skills/temporal-python-testing/resources/replay-testing.md +0 -462
package/templates/skills/temporal-python-testing/resources/unit-testing.md +0 -328
package/templates/skills/terraform-module-library/SKILL.md +0 -249
package/templates/skills/terraform-module-library/references/aws-modules.md +0 -63
package/templates/skills/test-driven-development/SKILL.md +0 -46
package/templates/skills/threat-mitigation-mapping/SKILL.md +0 -745
package/templates/skills/track-management/SKILL.md +0 -593
package/templates/skills/typescript-advanced-types/SKILL.md +0 -717
package/templates/skills/ui-ux-pro-max/SKILL.md +0 -352
package/templates/skills/ui-ux-pro-max/data/charts.csv +0 -26
package/templates/skills/ui-ux-pro-max/data/colors.csv +0 -97
package/templates/skills/ui-ux-pro-max/data/icons.csv +0 -101
package/templates/skills/ui-ux-pro-max/data/landing.csv +0 -31
package/templates/skills/ui-ux-pro-max/data/products.csv +0 -97
package/templates/skills/ui-ux-pro-max/data/prompts.csv +0 -24
package/templates/skills/ui-ux-pro-max/data/react-performance.csv +0 -45
package/templates/skills/ui-ux-pro-max/data/styles.csv +0 -59
package/templates/skills/ui-ux-pro-max/data/typography.csv +0 -58
package/templates/skills/ui-ux-pro-max/data/ui-reasoning.csv +0 -101
package/templates/skills/ui-ux-pro-max/data/ux-guidelines.csv +0 -100
package/templates/skills/ui-ux-pro-max/data/web-interface.csv +0 -31
package/templates/skills/ui-ux-pro-max/scripts/core.py +0 -258
package/templates/skills/ui-ux-pro-max/scripts/design_system.py +0 -547
package/templates/skills/ui-ux-pro-max/scripts/search.py +0 -76
package/templates/skills/uv-package-manager/SKILL.md +0 -831
package/templates/skills/vector-index-tuning/SKILL.md +0 -521
package/templates/skills/wcag-audit-patterns/SKILL.md +0 -555
package/templates/skills/workflow-orchestration-patterns/SKILL.md +0 -316
package/templates/skills/workflow-patterns/SKILL.md +0 -623
package/templates/skills/writing-plans/SKILL.md +0 -64

package/templates/skills/prompt-engineering-patterns/references/prompt-optimization.md DELETED Viewed

@@ -1,414 +0,0 @@
-# Prompt Optimization Guide
-## Systematic Refinement Process
-### 1. Baseline Establishment
-```python
-def establish_baseline(prompt, test_cases):
-    results = {
-        'accuracy': 0,
-        'avg_tokens': 0,
-        'avg_latency': 0,
-        'success_rate': 0
-    }
-    for test_case in test_cases:
-        response = llm.complete(prompt.format(**test_case['input']))
-        results['accuracy'] += evaluate_accuracy(response, test_case['expected'])
-        results['avg_tokens'] += count_tokens(response)
-        results['avg_latency'] += measure_latency(response)
-        results['success_rate'] += is_valid_response(response)
-    # Average across test cases
-    n = len(test_cases)
-    return {k: v/n for k, v in results.items()}
-```
-### 2. Iterative Refinement Workflow
-```
-Initial Prompt → Test → Analyze Failures → Refine → Test → Repeat
-```
-```python
-class PromptOptimizer:
-    def __init__(self, initial_prompt, test_suite):
-        self.prompt = initial_prompt
-        self.test_suite = test_suite
-        self.history = []
-    def optimize(self, max_iterations=10):
-        for i in range(max_iterations):
-            # Test current prompt
-            results = self.evaluate_prompt(self.prompt)
-            self.history.append({
-                'iteration': i,
-                'prompt': self.prompt,
-                'results': results
-            })
-            # Stop if good enough
-            if results['accuracy'] > 0.95:
-                break
-            # Analyze failures
-            failures = self.analyze_failures(results)
-            # Generate refinement suggestions
-            refinements = self.generate_refinements(failures)
-            # Apply best refinement
-            self.prompt = self.select_best_refinement(refinements)
-        return self.get_best_prompt()
-```
-### 3. A/B Testing Framework
-```python
-class PromptABTest:
-    def __init__(self, variant_a, variant_b):
-        self.variant_a = variant_a
-        self.variant_b = variant_b
-    def run_test(self, test_queries, metrics=['accuracy', 'latency']):
-        results = {
-            'A': {m: [] for m in metrics},
-            'B': {m: [] for m in metrics}
-        }
-        for query in test_queries:
-            # Randomly assign variant (50/50 split)
-            variant = 'A' if random.random() < 0.5 else 'B'
-            prompt = self.variant_a if variant == 'A' else self.variant_b
-            response, metrics_data = self.execute_with_metrics(
-                prompt.format(query=query['input'])
-            )
-            for metric in metrics:
-                results[variant][metric].append(metrics_data[metric])
-        return self.analyze_results(results)
-    def analyze_results(self, results):
-        from scipy import stats
-        analysis = {}
-        for metric in results['A'].keys():
-            a_values = results['A'][metric]
-            b_values = results['B'][metric]
-            # Statistical significance test
-            t_stat, p_value = stats.ttest_ind(a_values, b_values)
-            analysis[metric] = {
-                'A_mean': np.mean(a_values),
-                'B_mean': np.mean(b_values),
-                'improvement': (np.mean(b_values) - np.mean(a_values)) / np.mean(a_values),
-                'statistically_significant': p_value < 0.05,
-                'p_value': p_value,
-                'winner': 'B' if np.mean(b_values) > np.mean(a_values) else 'A'
-            }
-        return analysis
-```
-## Optimization Strategies
-### Token Reduction
-```python
-def optimize_for_tokens(prompt):
-    optimizations = [
-        # Remove redundant phrases
-        ('in order to', 'to'),
-        ('due to the fact that', 'because'),
-        ('at this point in time', 'now'),
-        # Consolidate instructions
-        ('First, ...\\nThen, ...\\nFinally, ...', 'Steps: 1) ... 2) ... 3) ...'),
-        # Use abbreviations (after first definition)
-        ('Natural Language Processing (NLP)', 'NLP'),
-        # Remove filler words
-        (' actually ', ' '),
-        (' basically ', ' '),
-        (' really ', ' ')
-    ]
-    optimized = prompt
-    for old, new in optimizations:
-        optimized = optimized.replace(old, new)
-    return optimized
-```
-### Latency Reduction
-```python
-def optimize_for_latency(prompt):
-    strategies = {
-        'shorter_prompt': reduce_token_count(prompt),
-        'streaming': enable_streaming_response(prompt),
-        'caching': add_cacheable_prefix(prompt),
-        'early_stopping': add_stop_sequences(prompt)
-    }
-    # Test each strategy
-    best_strategy = None
-    best_latency = float('inf')
-    for name, modified_prompt in strategies.items():
-        latency = measure_average_latency(modified_prompt)
-        if latency < best_latency:
-            best_latency = latency
-            best_strategy = modified_prompt
-    return best_strategy
-```
-### Accuracy Improvement
-```python
-def improve_accuracy(prompt, failure_cases):
-    improvements = []
-    # Add constraints for common failures
-    if has_format_errors(failure_cases):
-        improvements.append("Output must be valid JSON with no additional text.")
-    # Add examples for edge cases
-    edge_cases = identify_edge_cases(failure_cases)
-    if edge_cases:
-        improvements.append(f"Examples of edge cases:\\n{format_examples(edge_cases)}")
-    # Add verification step
-    if has_logical_errors(failure_cases):
-        improvements.append("Before responding, verify your answer is logically consistent.")
-    # Strengthen instructions
-    if has_ambiguity_errors(failure_cases):
-        improvements.append(clarify_ambiguous_instructions(prompt))
-    return integrate_improvements(prompt, improvements)
-```
-## Performance Metrics
-### Core Metrics
-```python
-class PromptMetrics:
-    @staticmethod
-    def accuracy(responses, ground_truth):
-        return sum(r == gt for r, gt in zip(responses, ground_truth)) / len(responses)
-    @staticmethod
-    def consistency(responses):
-        # Measure how often identical inputs produce identical outputs
-        from collections import defaultdict
-        input_responses = defaultdict(list)
-        for inp, resp in responses:
-            input_responses[inp].append(resp)
-        consistency_scores = []
-        for inp, resps in input_responses.items():
-            if len(resps) > 1:
-                # Percentage of responses that match the most common response
-                most_common_count = Counter(resps).most_common(1)[0][1]
-                consistency_scores.append(most_common_count / len(resps))
-        return np.mean(consistency_scores) if consistency_scores else 1.0
-    @staticmethod
-    def token_efficiency(prompt, responses):
-        avg_prompt_tokens = np.mean([count_tokens(prompt.format(**r['input'])) for r in responses])
-        avg_response_tokens = np.mean([count_tokens(r['output']) for r in responses])
-        return avg_prompt_tokens + avg_response_tokens
-    @staticmethod
-    def latency_p95(latencies):
-        return np.percentile(latencies, 95)
-```
-### Automated Evaluation
-```python
-def evaluate_prompt_comprehensively(prompt, test_suite):
-    results = {
-        'accuracy': [],
-        'consistency': [],
-        'latency': [],
-        'tokens': [],
-        'success_rate': []
-    }
-    # Run each test case multiple times for consistency measurement
-    for test_case in test_suite:
-        runs = []
-        for _ in range(3):  # 3 runs per test case
-            start = time.time()
-            response = llm.complete(prompt.format(**test_case['input']))
-            latency = time.time() - start
-            runs.append(response)
-            results['latency'].append(latency)
-            results['tokens'].append(count_tokens(prompt) + count_tokens(response))
-        # Accuracy (best of 3 runs)
-        accuracies = [evaluate_accuracy(r, test_case['expected']) for r in runs]
-        results['accuracy'].append(max(accuracies))
-        # Consistency (how similar are the 3 runs?)
-        results['consistency'].append(calculate_similarity(runs))
-        # Success rate (all runs successful?)
-        results['success_rate'].append(all(is_valid(r) for r in runs))
-    return {
-        'avg_accuracy': np.mean(results['accuracy']),
-        'avg_consistency': np.mean(results['consistency']),
-        'p95_latency': np.percentile(results['latency'], 95),
-        'avg_tokens': np.mean(results['tokens']),
-        'success_rate': np.mean(results['success_rate'])
-    }
-```
-## Failure Analysis
-### Categorizing Failures
-```python
-class FailureAnalyzer:
-    def categorize_failures(self, test_results):
-        categories = {
-            'format_errors': [],
-            'factual_errors': [],
-            'logic_errors': [],
-            'incomplete_responses': [],
-            'hallucinations': [],
-            'off_topic': []
-        }
-        for result in test_results:
-            if not result['success']:
-                category = self.determine_failure_type(
-                    result['response'],
-                    result['expected']
-                )
-                categories[category].append(result)
-        return categories
-    def generate_fixes(self, categorized_failures):
-        fixes = []
-        if categorized_failures['format_errors']:
-            fixes.append({
-                'issue': 'Format errors',
-                'fix': 'Add explicit format examples and constraints',
-                'priority': 'high'
-            })
-        if categorized_failures['hallucinations']:
-            fixes.append({
-                'issue': 'Hallucinations',
-                'fix': 'Add grounding instruction: "Base your answer only on provided context"',
-                'priority': 'critical'
-            })
-        if categorized_failures['incomplete_responses']:
-            fixes.append({
-                'issue': 'Incomplete responses',
-                'fix': 'Add: "Ensure your response fully addresses all parts of the question"',
-                'priority': 'medium'
-            })
-        return fixes
-```
-## Versioning and Rollback
-### Prompt Version Control
-```python
-class PromptVersionControl:
-    def __init__(self, storage_path):
-        self.storage = storage_path
-        self.versions = []
-    def save_version(self, prompt, metadata):
-        version = {
-            'id': len(self.versions),
-            'prompt': prompt,
-            'timestamp': datetime.now(),
-            'metrics': metadata.get('metrics', {}),
-            'description': metadata.get('description', ''),
-            'parent_id': metadata.get('parent_id')
-        }
-        self.versions.append(version)
-        self.persist()
-        return version['id']
-    def rollback(self, version_id):
-        if version_id < len(self.versions):
-            return self.versions[version_id]['prompt']
-        raise ValueError(f"Version {version_id} not found")
-    def compare_versions(self, v1_id, v2_id):
-        v1 = self.versions[v1_id]
-        v2 = self.versions[v2_id]
-        return {
-            'diff': generate_diff(v1['prompt'], v2['prompt']),
-            'metrics_comparison': {
-                metric: {
-                    'v1': v1['metrics'].get(metric),
-                    'v2': v2['metrics'].get(metric'),
-                    'change': v2['metrics'].get(metric, 0) - v1['metrics'].get(metric, 0)
-                }
-                for metric in set(v1['metrics'].keys()) | set(v2['metrics'].keys())
-            }
-        }
-```
-## Best Practices
-1. **Establish Baseline**: Always measure initial performance
-2. **Change One Thing**: Isolate variables for clear attribution
-3. **Test Thoroughly**: Use diverse, representative test cases
-4. **Track Metrics**: Log all experiments and results
-5. **Validate Significance**: Use statistical tests for A/B comparisons
-6. **Document Changes**: Keep detailed notes on what and why
-7. **Version Everything**: Enable rollback to previous versions
-8. **Monitor Production**: Continuously evaluate deployed prompts
-## Common Optimization Patterns
-### Pattern 1: Add Structure
-```
-Before: "Analyze this text"
-After: "Analyze this text for:\n1. Main topic\n2. Key arguments\n3. Conclusion"
-```
-### Pattern 2: Add Examples
-```
-Before: "Extract entities"
-After: "Extract entities\\n\\nExample:\\nText: Apple released iPhone\\nEntities: {company: Apple, product: iPhone}"
-```
-### Pattern 3: Add Constraints
-```
-Before: "Summarize this"
-After: "Summarize in exactly 3 bullet points, 15 words each"
-```
-### Pattern 4: Add Verification
-```
-Before: "Calculate..."
-After: "Calculate... Then verify your calculation is correct before responding."
-```
-## Tools and Utilities
-- Prompt diff tools for version comparison
-- Automated test runners
-- Metric dashboards
-- A/B testing frameworks
-- Token counting utilities
-- Latency profilers