npm - conectese - Versions diffs - 0.1.14 - Mend

conectese 0.1.14

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (260) hide show

package/README.md +265 -0
package/_conectese/.conectese-version +1 -0
package/_conectese/config/playwright.config.json +11 -0
package/_conectese/core/architect.agent.yaml +110 -0
package/_conectese/core/best-practices/_catalog.yaml +116 -0
package/_conectese/core/best-practices/blog-post.md +132 -0
package/_conectese/core/best-practices/blog-seo.md +127 -0
package/_conectese/core/best-practices/copywriting.md +426 -0
package/_conectese/core/best-practices/data-analysis.md +401 -0
package/_conectese/core/best-practices/email-newsletter.md +118 -0
package/_conectese/core/best-practices/email-sales.md +110 -0
package/_conectese/core/best-practices/image-design.md +348 -0
package/_conectese/core/best-practices/instagram-feed.md +235 -0
package/_conectese/core/best-practices/instagram-reels.md +112 -0
package/_conectese/core/best-practices/instagram-stories.md +107 -0
package/_conectese/core/best-practices/linkedin-article.md +116 -0
package/_conectese/core/best-practices/linkedin-post.md +121 -0
package/_conectese/core/best-practices/researching.md +349 -0
package/_conectese/core/best-practices/review.md +269 -0
package/_conectese/core/best-practices/social-networks-publishing.md +294 -0
package/_conectese/core/best-practices/strategist.md +344 -0
package/_conectese/core/best-practices/technical-writing.md +365 -0
package/_conectese/core/best-practices/twitter-post.md +105 -0
package/_conectese/core/best-practices/twitter-thread.md +122 -0
package/_conectese/core/best-practices/whatsapp-broadcast.md +107 -0
package/_conectese/core/best-practices/youtube-script.md +122 -0
package/_conectese/core/best-practices/youtube-shorts.md +112 -0
package/_conectese/core/prompts/build.prompt.md +547 -0
package/_conectese/core/prompts/design.prompt.md +469 -0
package/_conectese/core/prompts/discovery.prompt.md +269 -0
package/_conectese/core/prompts/sherlock-instagram.md +123 -0
package/_conectese/core/prompts/sherlock-linkedin.md +73 -0
package/_conectese/core/prompts/sherlock-shared.md +684 -0
package/_conectese/core/prompts/sherlock-twitter.md +78 -0
package/_conectese/core/prompts/sherlock-youtube.md +85 -0
package/_conectese/core/runner.pipeline.md +535 -0
package/_conectese/core/skills.engine.md +381 -0
package/agents/data-extractor/AGENT.md +13 -0
package/agents/direito-adaneiro/AGENT.md +18 -0
package/agents/direito-administrativo/AGENT.md +18 -0
package/agents/direito-aeroporta-rio/AGENT.md +18 -0
package/agents/direito-agra-rio/AGENT.md +18 -0
package/agents/direito-ambiental/AGENT.md +18 -0
package/agents/direito-banca-rio/AGENT.md +18 -0
package/agents/direito-civil/AGENT.md +18 -0
package/agents/direito-constitcional/AGENT.md +18 -0
package/agents/direito-da-crianc-a-e-do-adolescente-eca/AGENT.md +18 -0
package/agents/direito-da-propriedade-intelectal/AGENT.md +18 -0
package/agents/direito-de-ami-lia/AGENT.md +18 -0
package/agents/direito-de-tra-nsito/AGENT.md +18 -0
package/agents/direito-desportivo/AGENT.md +18 -0
package/agents/direito-digital/AGENT.md +18 -0
package/agents/direito-do-consmidor/AGENT.md +18 -0
package/agents/direito-do-trabalho/AGENT.md +18 -0
package/agents/direito-econo-mico/AGENT.md +18 -0
package/agents/direito-eleitoral/AGENT.md +18 -0
package/agents/direito-empresarial/AGENT.md +18 -0
package/agents/direito-imobilia-rio/AGENT.md +18 -0
package/agents/direito-inanceiro/AGENT.md +18 -0
package/agents/direito-internacional/AGENT.md +18 -0
package/agents/direito-mari-timo/AGENT.md +18 -0
package/agents/direito-me-dico-e-da-sa-de/AGENT.md +18 -0
package/agents/direito-militar/AGENT.md +18 -0
package/agents/direito-ndia-rio/AGENT.md +18 -0
package/agents/direito-notarial-e-registral/AGENT.md +18 -0
package/agents/direito-penal/AGENT.md +18 -0
package/agents/direito-previdencia-rio/AGENT.md +18 -0
package/agents/direito-processal-civil/AGENT.md +18 -0
package/agents/direito-processal-do-trabalho/AGENT.md +18 -0
package/agents/direito-processal-militar/AGENT.md +18 -0
package/agents/direito-processal-penal/AGENT.md +18 -0
package/agents/direito-rbani-stico/AGENT.md +18 -0
package/agents/direito-secrita-rio/AGENT.md +18 -0
package/agents/direito-sindical/AGENT.md +18 -0
package/agents/direito-societa-rio/AGENT.md +18 -0
package/agents/direito-tribta-rio/AGENT.md +18 -0
package/agents/direitos-hmanos/AGENT.md +18 -0
package/agents/legal-analyst/AGENT.md +16 -0
package/agents/legal-synthesizer/AGENT.md +13 -0
package/agents/lgpd-anonymizer/AGENT.md +14 -0
package/agents/lgpd-restorer/AGENT.md +14 -0
package/agents/task-router/AGENT.md +13 -0
package/bin/conectese.js +73 -0
package/dashboard/index.html +12 -0
package/dashboard/package-lock.json +1971 -0
package/dashboard/package.json +28 -0
package/dashboard/public/assets/avatars/Female1_1wave.png +0 -0
package/dashboard/public/assets/avatars/Female1_2wave.png +0 -0
package/dashboard/public/assets/avatars/Female1_blink.png +0 -0
package/dashboard/public/assets/avatars/Female1_talk.png +0 -0
package/dashboard/public/assets/avatars/Female2_1wave.png +0 -0
package/dashboard/public/assets/avatars/Female2_2wave.png +0 -0
package/dashboard/public/assets/avatars/Female2_blink.png +0 -0
package/dashboard/public/assets/avatars/Female2_talk.png +0 -0
package/dashboard/public/assets/avatars/Female3_blink.png +0 -0
package/dashboard/public/assets/avatars/Female3_talk.png +0 -0
package/dashboard/public/assets/avatars/Female3_wave.png +0 -0
package/dashboard/public/assets/avatars/Female4_blink.png +0 -0
package/dashboard/public/assets/avatars/Female4_talk.png +0 -0
package/dashboard/public/assets/avatars/Female4_wave.png +0 -0
package/dashboard/public/assets/avatars/Female5_blink.png +0 -0
package/dashboard/public/assets/avatars/Female5_talk.png +0 -0
package/dashboard/public/assets/avatars/Female5_wave.png +0 -0
package/dashboard/public/assets/avatars/Female6_blink.png +0 -0
package/dashboard/public/assets/avatars/Female6_talk.png +0 -0
package/dashboard/public/assets/avatars/Female6_wave.png +0 -0
package/dashboard/public/assets/avatars/Male1_1wave.png +0 -0
package/dashboard/public/assets/avatars/Male1_2wave.png +0 -0
package/dashboard/public/assets/avatars/Male1_blink.png +0 -0
package/dashboard/public/assets/avatars/Male1_talk.png +0 -0
package/dashboard/public/assets/avatars/Male2_1wave.png +0 -0
package/dashboard/public/assets/avatars/Male2_2wave.png +0 -0
package/dashboard/public/assets/avatars/Male2_blink.png +0 -0
package/dashboard/public/assets/avatars/Male2_talk.png +0 -0
package/dashboard/public/assets/avatars/Male3_blink.png +0 -0
package/dashboard/public/assets/avatars/Male3_talk.png +0 -0
package/dashboard/public/assets/avatars/Male3_wave.png +0 -0
package/dashboard/public/assets/avatars/Male4_blink.png +0 -0
package/dashboard/public/assets/avatars/Male4_talk.png +0 -0
package/dashboard/public/assets/avatars/Male4_wave.png +0 -0
package/dashboard/public/assets/desks/desktop_set_black_down.png +0 -0
package/dashboard/public/assets/desks/desktop_set_black_down_coding-1.png +0 -0
package/dashboard/public/assets/desks/desktop_set_black_down_coding.png +0 -0
package/dashboard/public/assets/desks/desktop_set_black_up.png +0 -0
package/dashboard/public/assets/desks/desktop_set_white_down.png +0 -0
package/dashboard/public/assets/desks/desktop_set_white_down_coding-1.png +0 -0
package/dashboard/public/assets/desks/desktop_set_white_down_coding.png +0 -0
package/dashboard/public/assets/desks/desktop_set_white_up.png +0 -0
package/dashboard/public/assets/furniture/armchair_tan.png +0 -0
package/dashboard/public/assets/furniture/armchair_tan_down.png +0 -0
package/dashboard/public/assets/furniture/backpack_blue.png +0 -0
package/dashboard/public/assets/furniture/backpack_red.png +0 -0
package/dashboard/public/assets/furniture/blinds.png +0 -0
package/dashboard/public/assets/furniture/blinds_large_closed_white.png +0 -0
package/dashboard/public/assets/furniture/bookshelf.png +0 -0
package/dashboard/public/assets/furniture/bookshelf_purple_tall.png +0 -0
package/dashboard/public/assets/furniture/bulletin_board.png +0 -0
package/dashboard/public/assets/furniture/clock.png +0 -0
package/dashboard/public/assets/furniture/coffee_mug.png +0 -0
package/dashboard/public/assets/furniture/coffee_mug_blue.png +0 -0
package/dashboard/public/assets/furniture/coffee_table.png +0 -0
package/dashboard/public/assets/furniture/coffeepot_right.png +0 -0
package/dashboard/public/assets/furniture/coffeetable_black_horizontal.png +0 -0
package/dashboard/public/assets/furniture/couch.png +0 -0
package/dashboard/public/assets/furniture/couch_tan_down.png +0 -0
package/dashboard/public/assets/furniture/cushion_blue.png +0 -0
package/dashboard/public/assets/furniture/cushion_tan.png +0 -0
package/dashboard/public/assets/furniture/desk_wood.png +0 -0
package/dashboard/public/assets/furniture/fancy_rug.png +0 -0
package/dashboard/public/assets/furniture/fancy_rug_wide.png +0 -0
package/dashboard/public/assets/furniture/flowers1.png +0 -0
package/dashboard/public/assets/furniture/flowers2.png +0 -0
package/dashboard/public/assets/furniture/lamp_tan.png +0 -0
package/dashboard/public/assets/furniture/lantern.png +0 -0
package/dashboard/public/assets/furniture/monstera.png +0 -0
package/dashboard/public/assets/furniture/monstera_small.png +0 -0
package/dashboard/public/assets/furniture/picture_frame.png +0 -0
package/dashboard/public/assets/furniture/plant1.png +0 -0
package/dashboard/public/assets/furniture/plant2.png +0 -0
package/dashboard/public/assets/furniture/plant3.png +0 -0
package/dashboard/public/assets/furniture/plant_poof.png +0 -0
package/dashboard/public/assets/furniture/plant_spindly.png +0 -0
package/dashboard/public/assets/furniture/poster_blue.png +0 -0
package/dashboard/public/assets/furniture/rug.png +0 -0
package/dashboard/public/assets/furniture/succulent_blue.png +0 -0
package/dashboard/public/assets/furniture/succulent_green.png +0 -0
package/dashboard/public/assets/furniture/treasurechest_closed_gold.png +0 -0
package/dashboard/public/assets/furniture/water_cooler_better.png +0 -0
package/dashboard/public/assets/furniture/whiteboard.png +0 -0
package/dashboard/public/assets/furniture/whiteboard_stand_graph.png +0 -0
package/dashboard/public/assets/furniture/window_blinds_open.png +0 -0
package/dashboard/src/App.tsx +46 -0
package/dashboard/src/components/SquadCard.tsx +47 -0
package/dashboard/src/components/SquadSelector.tsx +61 -0
package/dashboard/src/components/StatusBadge.tsx +32 -0
package/dashboard/src/components/StatusBar.tsx +97 -0
package/dashboard/src/hooks/useSquadSocket.ts +135 -0
package/dashboard/src/lib/formatTime.ts +16 -0
package/dashboard/src/lib/normalizeState.ts +25 -0
package/dashboard/src/main.tsx +10 -0
package/dashboard/src/office/AgentSprite.ts +241 -0
package/dashboard/src/office/OfficeScene.ts +153 -0
package/dashboard/src/office/PhaserGame.tsx +80 -0
package/dashboard/src/office/RoomBuilder.ts +190 -0
package/dashboard/src/office/assetKeys.ts +150 -0
package/dashboard/src/office/palette.ts +32 -0
package/dashboard/src/plugin/squadWatcher.ts +233 -0
package/dashboard/src/store/useSquadStore.ts +56 -0
package/dashboard/src/styles/globals.css +36 -0
package/dashboard/src/types/state.ts +63 -0
package/dashboard/src/vite-env.d.ts +1 -0
package/dashboard/test-results/.last-run.json +4 -0
package/dashboard/tsconfig.json +24 -0
package/dashboard/tsconfig.tsbuildinfo +1 -0
package/dashboard/vite.config.ts +13 -0
package/package.json +53 -0
package/skills/README.md +63 -0
package/skills/apify/SKILL.md +55 -0
package/skills/blotato/SKILL.md +63 -0
package/skills/canva/SKILL.md +60 -0
package/skills/conectese-agent-creator/SKILL.md +192 -0
package/skills/conectese-skill-creator/SKILL.md +407 -0
package/skills/conectese-skill-creator/agents/analyzer.md +274 -0
package/skills/conectese-skill-creator/agents/comparator.md +202 -0
package/skills/conectese-skill-creator/agents/grader.md +223 -0
package/skills/conectese-skill-creator/assets/eval_review.html +146 -0
package/skills/conectese-skill-creator/eval-viewer/generate_review.py +471 -0
package/skills/conectese-skill-creator/eval-viewer/viewer.html +1325 -0
package/skills/conectese-skill-creator/references/schemas.md +430 -0
package/skills/conectese-skill-creator/references/skill-format.md +235 -0
package/skills/conectese-skill-creator/scripts/__init__.py +0 -0
package/skills/conectese-skill-creator/scripts/aggregate_benchmark.py +401 -0
package/skills/conectese-skill-creator/scripts/quick_validate.py +103 -0
package/skills/conectese-skill-creator/scripts/run_eval.py +310 -0
package/skills/conectese-skill-creator/scripts/utils.py +47 -0
package/skills/image-ai-generator/SKILL.md +124 -0
package/skills/image-ai-generator/scripts/generate.py +175 -0
package/skills/image-creator/SKILL.md +155 -0
package/skills/image-fetcher/SKILL.md +91 -0
package/skills/instagram-publisher/SKILL.md +119 -0
package/skills/instagram-publisher/scripts/publish.js +165 -0
package/skills/resend/SKILL.md +80 -0
package/skills/template-designer/SKILL.md +201 -0
package/skills/template-designer/base-templates/model-a.html +27 -0
package/skills/template-designer/base-templates/model-b.html +31 -0
package/skills/template-designer/base-templates/model-c.html +42 -0
package/src/agents-cli.js +158 -0
package/src/agents.js +134 -0
package/src/i18n.js +48 -0
package/src/init.js +341 -0
package/src/locales/en.json +73 -0
package/src/locales/es.json +72 -0
package/src/locales/pt-BR.json +72 -0
package/src/logger.js +38 -0
package/src/prompt.js +46 -0
package/src/readme/README.md +119 -0
package/src/runs.js +90 -0
package/src/skills-cli.js +157 -0
package/src/skills.js +146 -0
package/src/update.js +169 -0
package/templates/_conectese/.conectese-version +1 -0
package/templates/_conectese/_investigations/.gitkeep +0 -0
package/templates/ide-templates/antigravity/.agent/rules/conectese.md +55 -0
package/templates/ide-templates/antigravity/.agent/workflows/conectese.md +102 -0
package/templates/ide-templates/claude-code/.claude/skills/conectese/SKILL.md +182 -0
package/templates/ide-templates/claude-code/.mcp.json +8 -0
package/templates/ide-templates/claude-code/CLAUDE.md +43 -0
package/templates/ide-templates/codex/.agents/skills/conectese/SKILL.md +6 -0
package/templates/ide-templates/codex/AGENTS.md +105 -0
package/templates/ide-templates/cursor/.cursor/commands/conectese.md +9 -0
package/templates/ide-templates/cursor/.cursor/mcp.json +8 -0
package/templates/ide-templates/cursor/.cursor/rules/conectese.mdc +48 -0
package/templates/ide-templates/cursor/.cursorignore +3 -0
package/templates/ide-templates/opencode/.opencode/commands/conectese.md +9 -0
package/templates/ide-templates/opencode/AGENTS.md +105 -0
package/templates/ide-templates/vscode-copilot/.github/prompts/conectese.prompt.md +201 -0
package/templates/ide-templates/vscode-copilot/.vscode/mcp.json +8 -0
package/templates/ide-templates/vscode-copilot/.vscode/settings.json +3 -0
package/templates/package.json +8 -0
package/templates/squads/.gitkeep +0 -0

package/skills/conectese-skill-creator/scripts/aggregate_benchmark.py ADDED Viewed

@@ -0,0 +1,401 @@
+#!/usr/bin/env python3
+"""
+Aggregate individual run results into benchmark summary statistics.
+Reads grading.json files from run directories and produces:
+- run_summary with mean, stddev, min, max for each metric
+- delta between with_skill and without_skill configurations
+Usage:
+    python aggregate_benchmark.py <benchmark_dir>
+Example:
+    python aggregate_benchmark.py benchmarks/2026-01-15T10-30-00/
+The script supports two directory layouts:
+    Workspace layout (from skill-creator iterations):
+    <benchmark_dir>/
+    └── eval-N/
+        ├── with_skill/
+        │   ├── run-1/grading.json
+        │   └── run-2/grading.json
+        └── without_skill/
+            ├── run-1/grading.json
+            └── run-2/grading.json
+    Legacy layout (with runs/ subdirectory):
+    <benchmark_dir>/
+    └── runs/
+        └── eval-N/
+            ├── with_skill/
+            │   └── run-1/grading.json
+            └── without_skill/
+                └── run-1/grading.json
+"""
+import argparse
+import json
+import math
+import sys
+from datetime import datetime, timezone
+from pathlib import Path
+def calculate_stats(values: list[float]) -> dict:
+    """Calculate mean, stddev, min, max for a list of values."""
+    if not values:
+        return {"mean": 0.0, "stddev": 0.0, "min": 0.0, "max": 0.0}
+    n = len(values)
+    mean = sum(values) / n
+    if n > 1:
+        variance = sum((x - mean) ** 2 for x in values) / (n - 1)
+        stddev = math.sqrt(variance)
+    else:
+        stddev = 0.0
+    return {
+        "mean": round(mean, 4),
+        "stddev": round(stddev, 4),
+        "min": round(min(values), 4),
+        "max": round(max(values), 4)
+    }
+def load_run_results(benchmark_dir: Path) -> dict:
+    """
+    Load all run results from a benchmark directory.
+    Returns dict keyed by config name (e.g. "with_skill"/"without_skill",
+    or "new_skill"/"old_skill"), each containing a list of run results.
+    """
+    # Support both layouts: eval dirs directly under benchmark_dir, or under runs/
+    runs_dir = benchmark_dir / "runs"
+    if runs_dir.exists():
+        search_dir = runs_dir
+    elif list(benchmark_dir.glob("eval-*")):
+        search_dir = benchmark_dir
+    else:
+        print(f"No eval directories found in {benchmark_dir} or {benchmark_dir / 'runs'}")
+        return {}
+    results: dict[str, list] = {}
+    for eval_idx, eval_dir in enumerate(sorted(search_dir.glob("eval-*"))):
+        metadata_path = eval_dir / "eval_metadata.json"
+        if metadata_path.exists():
+            try:
+                with open(metadata_path) as mf:
+                    eval_id = json.load(mf).get("eval_id", eval_idx)
+            except (json.JSONDecodeError, OSError):
+                eval_id = eval_idx
+        else:
+            try:
+                eval_id = int(eval_dir.name.split("-")[1])
+            except ValueError:
+                eval_id = eval_idx
+        # Discover config directories dynamically rather than hardcoding names
+        for config_dir in sorted(eval_dir.iterdir()):
+            if not config_dir.is_dir():
+                continue
+            # Skip non-config directories (inputs, outputs, etc.)
+            if not list(config_dir.glob("run-*")):
+                continue
+            config = config_dir.name
+            if config not in results:
+                results[config] = []
+            for run_dir in sorted(config_dir.glob("run-*")):
+                run_number = int(run_dir.name.split("-")[1])
+                grading_file = run_dir / "grading.json"
+                if not grading_file.exists():
+                    print(f"Warning: grading.json not found in {run_dir}")
+                    continue
+                try:
+                    with open(grading_file) as f:
+                        grading = json.load(f)
+                except json.JSONDecodeError as e:
+                    print(f"Warning: Invalid JSON in {grading_file}: {e}")
+                    continue
+                # Extract metrics
+                result = {
+                    "eval_id": eval_id,
+                    "run_number": run_number,
+                    "pass_rate": grading.get("summary", {}).get("pass_rate", 0.0),
+                    "passed": grading.get("summary", {}).get("passed", 0),
+                    "failed": grading.get("summary", {}).get("failed", 0),
+                    "total": grading.get("summary", {}).get("total", 0),
+                }
+                # Extract timing — check grading.json first, then sibling timing.json
+                timing = grading.get("timing", {})
+                result["time_seconds"] = timing.get("total_duration_seconds", 0.0)
+                timing_file = run_dir / "timing.json"
+                if result["time_seconds"] == 0.0 and timing_file.exists():
+                    try:
+                        with open(timing_file) as tf:
+                            timing_data = json.load(tf)
+                        result["time_seconds"] = timing_data.get("total_duration_seconds", 0.0)
+                        result["tokens"] = timing_data.get("total_tokens", 0)
+                    except json.JSONDecodeError:
+                        pass
+                # Extract metrics if available
+                metrics = grading.get("execution_metrics", {})
+                result["tool_calls"] = metrics.get("total_tool_calls", 0)
+                if not result.get("tokens"):
+                    result["tokens"] = metrics.get("output_chars", 0)
+                result["errors"] = metrics.get("errors_encountered", 0)
+                # Extract expectations — viewer requires fields: text, passed, evidence
+                raw_expectations = grading.get("expectations", [])
+                for exp in raw_expectations:
+                    if "text" not in exp or "passed" not in exp:
+                        print(f"Warning: expectation in {grading_file} missing required fields (text, passed, evidence): {exp}")
+                result["expectations"] = raw_expectations
+                # Extract notes from user_notes_summary
+                notes_summary = grading.get("user_notes_summary", {})
+                notes = []
+                notes.extend(notes_summary.get("uncertainties", []))
+                notes.extend(notes_summary.get("needs_review", []))
+                notes.extend(notes_summary.get("workarounds", []))
+                result["notes"] = notes
+                results[config].append(result)
+    return results
+def aggregate_results(results: dict) -> dict:
+    """
+    Aggregate run results into summary statistics.
+    Returns run_summary with stats for each configuration and delta.
+    """
+    run_summary = {}
+    configs = list(results.keys())
+    for config in configs:
+        runs = results.get(config, [])
+        if not runs:
+            run_summary[config] = {
+                "pass_rate": {"mean": 0.0, "stddev": 0.0, "min": 0.0, "max": 0.0},
+                "time_seconds": {"mean": 0.0, "stddev": 0.0, "min": 0.0, "max": 0.0},
+                "tokens": {"mean": 0, "stddev": 0, "min": 0, "max": 0}
+            }
+            continue
+        pass_rates = [r["pass_rate"] for r in runs]
+        times = [r["time_seconds"] for r in runs]
+        tokens = [r.get("tokens", 0) for r in runs]
+        run_summary[config] = {
+            "pass_rate": calculate_stats(pass_rates),
+            "time_seconds": calculate_stats(times),
+            "tokens": calculate_stats(tokens)
+        }
+    # Calculate delta between the first two configs (if two exist)
+    if len(configs) >= 2:
+        primary = run_summary.get(configs[0], {})
+        baseline = run_summary.get(configs[1], {})
+    else:
+        primary = run_summary.get(configs[0], {}) if configs else {}
+        baseline = {}
+    delta_pass_rate = primary.get("pass_rate", {}).get("mean", 0) - baseline.get("pass_rate", {}).get("mean", 0)
+    delta_time = primary.get("time_seconds", {}).get("mean", 0) - baseline.get("time_seconds", {}).get("mean", 0)
+    delta_tokens = primary.get("tokens", {}).get("mean", 0) - baseline.get("tokens", {}).get("mean", 0)
+    run_summary["delta"] = {
+        "pass_rate": f"{delta_pass_rate:+.2f}",
+        "time_seconds": f"{delta_time:+.1f}",
+        "tokens": f"{delta_tokens:+.0f}"
+    }
+    return run_summary
+def generate_benchmark(benchmark_dir: Path, skill_name: str = "", skill_path: str = "") -> dict:
+    """
+    Generate complete benchmark.json from run results.
+    """
+    results = load_run_results(benchmark_dir)
+    run_summary = aggregate_results(results)
+    # Build runs array for benchmark.json
+    runs = []
+    for config in results:
+        for result in results[config]:
+            runs.append({
+                "eval_id": result["eval_id"],
+                "configuration": config,
+                "run_number": result["run_number"],
+                "result": {
+                    "pass_rate": result["pass_rate"],
+                    "passed": result["passed"],
+                    "failed": result["failed"],
+                    "total": result["total"],
+                    "time_seconds": result["time_seconds"],
+                    "tokens": result.get("tokens", 0),
+                    "tool_calls": result.get("tool_calls", 0),
+                    "errors": result.get("errors", 0)
+                },
+                "expectations": result["expectations"],
+                "notes": result["notes"]
+            })
+    # Determine eval IDs from results
+    eval_ids = sorted(set(
+        r["eval_id"]
+        for config in results.values()
+        for r in config
+    ))
+    benchmark = {
+        "metadata": {
+            "skill_name": skill_name or "<skill-name>",
+            "skill_path": skill_path or "<path/to/skill>",
+            "executor_model": "<model-name>",
+            "analyzer_model": "<model-name>",
+            "timestamp": datetime.now(timezone.utc).strftime("%Y-%m-%dT%H:%M:%SZ"),
+            "evals_run": eval_ids,
+            "runs_per_configuration": 3
+        },
+        "runs": runs,
+        "run_summary": run_summary,
+        "notes": []  # To be filled by analyzer
+    }
+    return benchmark
+def generate_markdown(benchmark: dict) -> str:
+    """Generate human-readable benchmark.md from benchmark data."""
+    metadata = benchmark["metadata"]
+    run_summary = benchmark["run_summary"]
+    # Determine config names (excluding "delta")
+    configs = [k for k in run_summary if k != "delta"]
+    config_a = configs[0] if len(configs) >= 1 else "config_a"
+    config_b = configs[1] if len(configs) >= 2 else "config_b"
+    label_a = config_a.replace("_", " ").title()
+    label_b = config_b.replace("_", " ").title()
+    lines = [
+        f"# Skill Benchmark: {metadata['skill_name']}",
+        "",
+        f"**Model**: {metadata['executor_model']}",
+        f"**Date**: {metadata['timestamp']}",
+        f"**Evals**: {', '.join(map(str, metadata['evals_run']))} ({metadata['runs_per_configuration']} runs each per configuration)",
+        "",
+        "## Summary",
+        "",
+        f"| Metric | {label_a} | {label_b} | Delta |",
+        "|--------|------------|---------------|-------|",
+    ]
+    a_summary = run_summary.get(config_a, {})
+    b_summary = run_summary.get(config_b, {})
+    delta = run_summary.get("delta", {})
+    # Format pass rate
+    a_pr = a_summary.get("pass_rate", {})
+    b_pr = b_summary.get("pass_rate", {})
+    lines.append(f"| Pass Rate | {a_pr.get('mean', 0)*100:.0f}% ± {a_pr.get('stddev', 0)*100:.0f}% | {b_pr.get('mean', 0)*100:.0f}% ± {b_pr.get('stddev', 0)*100:.0f}% | {delta.get('pass_rate', '—')} |")
+    # Format time
+    a_time = a_summary.get("time_seconds", {})
+    b_time = b_summary.get("time_seconds", {})
+    lines.append(f"| Time | {a_time.get('mean', 0):.1f}s ± {a_time.get('stddev', 0):.1f}s | {b_time.get('mean', 0):.1f}s ± {b_time.get('stddev', 0):.1f}s | {delta.get('time_seconds', '—')}s |")
+    # Format tokens
+    a_tokens = a_summary.get("tokens", {})
+    b_tokens = b_summary.get("tokens", {})
+    lines.append(f"| Tokens | {a_tokens.get('mean', 0):.0f} ± {a_tokens.get('stddev', 0):.0f} | {b_tokens.get('mean', 0):.0f} ± {b_tokens.get('stddev', 0):.0f} | {delta.get('tokens', '—')} |")
+    # Notes section
+    if benchmark.get("notes"):
+        lines.extend([
+            "",
+            "## Notes",
+            ""
+        ])
+        for note in benchmark["notes"]:
+            lines.append(f"- {note}")
+    return "\n".join(lines)
+def main():
+    parser = argparse.ArgumentParser(
+        description="Aggregate benchmark run results into summary statistics"
+    )
+    parser.add_argument(
+        "benchmark_dir",
+        type=Path,
+        help="Path to the benchmark directory"
+    )
+    parser.add_argument(
+        "--skill-name",
+        default="",
+        help="Name of the skill being benchmarked"
+    )
+    parser.add_argument(
+        "--skill-path",
+        default="",
+        help="Path to the skill being benchmarked"
+    )
+    parser.add_argument(
+        "--output", "-o",
+        type=Path,
+        help="Output path for benchmark.json (default: <benchmark_dir>/benchmark.json)"
+    )
+    args = parser.parse_args()
+    if not args.benchmark_dir.exists():
+        print(f"Directory not found: {args.benchmark_dir}")
+        sys.exit(1)
+    # Generate benchmark
+    benchmark = generate_benchmark(args.benchmark_dir, args.skill_name, args.skill_path)
+    # Determine output paths
+    output_json = args.output or (args.benchmark_dir / "benchmark.json")
+    output_md = output_json.with_suffix(".md")
+    # Write benchmark.json
+    with open(output_json, "w") as f:
+        json.dump(benchmark, f, indent=2)
+    print(f"Generated: {output_json}")
+    # Write benchmark.md
+    markdown = generate_markdown(benchmark)
+    with open(output_md, "w") as f:
+        f.write(markdown)
+    print(f"Generated: {output_md}")
+    # Print summary
+    run_summary = benchmark["run_summary"]
+    configs = [k for k in run_summary if k != "delta"]
+    delta = run_summary.get("delta", {})
+    print(f"\nSummary:")
+    for config in configs:
+        pr = run_summary[config]["pass_rate"]["mean"]
+        label = config.replace("_", " ").title()
+        print(f"  {label}: {pr*100:.1f}% pass rate")
+    print(f"  Delta:         {delta.get('pass_rate', '—')}")
+if __name__ == "__main__":
+    main()

package/skills/conectese-skill-creator/scripts/quick_validate.py ADDED Viewed

@@ -0,0 +1,103 @@
+#!/usr/bin/env python3
+"""
+Quick validation script for skills - minimal version
+"""
+import sys
+import os
+import re
+import yaml
+from pathlib import Path
+def validate_skill(skill_path):
+    """Basic validation of a skill"""
+    skill_path = Path(skill_path)
+    # Check SKILL.md exists
+    skill_md = skill_path / 'SKILL.md'
+    if not skill_md.exists():
+        return False, "SKILL.md not found"
+    # Read and validate frontmatter
+    content = skill_md.read_text()
+    if not content.startswith('---'):
+        return False, "No YAML frontmatter found"
+    # Extract frontmatter
+    match = re.match(r'^---\n(.*?)\n---', content, re.DOTALL)
+    if not match:
+        return False, "Invalid frontmatter format"
+    frontmatter_text = match.group(1)
+    # Parse YAML frontmatter
+    try:
+        frontmatter = yaml.safe_load(frontmatter_text)
+        if not isinstance(frontmatter, dict):
+            return False, "Frontmatter must be a YAML dictionary"
+    except yaml.YAMLError as e:
+        return False, f"Invalid YAML in frontmatter: {e}"
+    # Define allowed properties
+    ALLOWED_PROPERTIES = {'name', 'description', 'license', 'allowed-tools', 'metadata', 'compatibility'}
+    # Check for unexpected properties (excluding nested keys under metadata)
+    unexpected_keys = set(frontmatter.keys()) - ALLOWED_PROPERTIES
+    if unexpected_keys:
+        return False, (
+            f"Unexpected key(s) in SKILL.md frontmatter: {', '.join(sorted(unexpected_keys))}. "
+            f"Allowed properties are: {', '.join(sorted(ALLOWED_PROPERTIES))}"
+        )
+    # Check required fields
+    if 'name' not in frontmatter:
+        return False, "Missing 'name' in frontmatter"
+    if 'description' not in frontmatter:
+        return False, "Missing 'description' in frontmatter"
+    # Extract name for validation
+    name = frontmatter.get('name', '')
+    if not isinstance(name, str):
+        return False, f"Name must be a string, got {type(name).__name__}"
+    name = name.strip()
+    if name:
+        # Check naming convention (kebab-case: lowercase with hyphens)
+        if not re.match(r'^[a-z0-9-]+$', name):
+            return False, f"Name '{name}' should be kebab-case (lowercase letters, digits, and hyphens only)"
+        if name.startswith('-') or name.endswith('-') or '--' in name:
+            return False, f"Name '{name}' cannot start/end with hyphen or contain consecutive hyphens"
+        # Check name length (max 64 characters per spec)
+        if len(name) > 64:
+            return False, f"Name is too long ({len(name)} characters). Maximum is 64 characters."
+    # Extract and validate description
+    description = frontmatter.get('description', '')
+    if not isinstance(description, str):
+        return False, f"Description must be a string, got {type(description).__name__}"
+    description = description.strip()
+    if description:
+        # Check for angle brackets
+        if '<' in description or '>' in description:
+            return False, "Description cannot contain angle brackets (< or >)"
+        # Check description length (max 1024 characters per spec)
+        if len(description) > 1024:
+            return False, f"Description is too long ({len(description)} characters). Maximum is 1024 characters."
+    # Validate compatibility field if present (optional)
+    compatibility = frontmatter.get('compatibility', '')
+    if compatibility:
+        if not isinstance(compatibility, str):
+            return False, f"Compatibility must be a string, got {type(compatibility).__name__}"
+        if len(compatibility) > 500:
+            return False, f"Compatibility is too long ({len(compatibility)} characters). Maximum is 500 characters."
+    return True, "Skill is valid!"
+if __name__ == "__main__":
+    if len(sys.argv) != 2:
+        print("Usage: python quick_validate.py <skill_directory>")
+        sys.exit(1)
+    valid, message = validate_skill(sys.argv[1])
+    print(message)
+    sys.exit(0 if valid else 1)