npm - @heyai-rules/pilo-masterkit - Versions diffs - 1.2.2 → 3.1.0 - Mend

@heyai-rules/pilo-masterkit 1.2.2 → 3.1.0

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (594) hide show

package/.agent/agents/architect.md +211 -211
package/.agent/agents/build-error-resolver.md +114 -114
package/.agent/agents/chief-of-staff.md +151 -151
package/.agent/agents/code-reviewer.md +237 -237
package/.agent/agents/cpp-build-resolver.md +90 -90
package/.agent/agents/cpp-reviewer.md +72 -72
package/.agent/agents/csharp-reviewer.md +101 -0
package/.agent/agents/dart-build-resolver.md +201 -0
package/.agent/agents/database-reviewer.md +91 -91
package/.agent/agents/doc-updater.md +107 -107
package/.agent/agents/docs-lookup.md +68 -68
package/.agent/agents/e2e-runner.md +107 -107
package/.agent/agents/flutter-reviewer.md +243 -243
package/.agent/agents/gan-evaluator.md +209 -0
package/.agent/agents/gan-generator.md +131 -0
package/.agent/agents/gan-planner.md +99 -0
package/.agent/agents/go-build-resolver.md +94 -94
package/.agent/agents/go-reviewer.md +76 -76
package/.agent/agents/harness-optimizer.md +35 -35
package/.agent/agents/healthcare-reviewer.md +83 -0
package/.agent/agents/java-build-resolver.md +153 -153
package/.agent/agents/java-reviewer.md +92 -92
package/.agent/agents/kotlin-build-resolver.md +118 -118
package/.agent/agents/kotlin-reviewer.md +159 -159
package/.agent/agents/loop-operator.md +36 -36
package/.agent/agents/opensource-forker.md +198 -0
package/.agent/agents/opensource-packager.md +249 -0
package/.agent/agents/opensource-sanitizer.md +188 -0
package/.agent/agents/performance-optimizer.md +392 -133
package/.agent/agents/personas/athena-agent/agent.json +10 -0
package/.agent/agents/personas/athena-agent/athena-backend-logic-architecture-profile.md +189 -0
package/.agent/agents/personas/athena-agent/context-files/agents.md +55 -0
package/.agent/agents/personas/athena-agent/context-files/identity.md +23 -0
package/.agent/agents/personas/athena-agent/context-files/soul.md +51 -0
package/.agent/agents/personas/athena-agent/context-files/user-predefined.md +15 -0
package/.agent/agents/personas/athena-agent/user-context-files/system/bootstrap.md +37 -0
package/.agent/agents/personas/athena-agent/user-context-files/system/user.md +45 -0
package/.agent/agents/personas/da-vinci-agent/agent.json +10 -0
package/.agent/agents/personas/da-vinci-agent/context-files/agents.md +55 -0
package/.agent/agents/personas/da-vinci-agent/context-files/identity.md +23 -0
package/.agent/agents/personas/da-vinci-agent/context-files/soul.md +51 -0
package/.agent/agents/personas/da-vinci-agent/context-files/user-predefined.md +15 -0
package/.agent/agents/personas/da-vinci-agent/da-vinci-frontend-ui-ux-design-profile.md +189 -0
package/.agent/agents/personas/da-vinci-agent/user-context-files/system/bootstrap.md +37 -0
package/.agent/agents/personas/da-vinci-agent/user-context-files/system/user.md +45 -0
package/.agent/agents/personas/duong-tang-agent/agent.json +10 -0
package/.agent/agents/personas/duong-tang-agent/context-files/agents.md +55 -0
package/.agent/agents/personas/duong-tang-agent/context-files/identity.md +23 -0
package/.agent/agents/personas/duong-tang-agent/context-files/soul.md +51 -0
package/.agent/agents/personas/duong-tang-agent/context-files/user-predefined.md +15 -0
package/.agent/agents/personas/duong-tang-agent/tang-monk-quality-testing-documentation-profile.md +189 -0
package/.agent/agents/personas/duong-tang-agent/user-context-files/system/bootstrap.md +37 -0
package/.agent/agents/personas/duong-tang-agent/user-context-files/system/user.md +45 -0
package/.agent/agents/personas/gia-cat-luong-agent/agent.json +10 -0
package/.agent/agents/personas/gia-cat-luong-agent/context-files/agents.md +55 -0
package/.agent/agents/personas/gia-cat-luong-agent/context-files/identity.md +23 -0
package/.agent/agents/personas/gia-cat-luong-agent/context-files/soul.md +51 -0
package/.agent/agents/personas/gia-cat-luong-agent/context-files/user-predefined.md +15 -0
package/.agent/agents/personas/gia-cat-luong-agent/kongming-research-strategy-analysis-profile.md +189 -0
package/.agent/agents/personas/gia-cat-luong-agent/user-context-files/system/bootstrap.md +37 -0
package/.agent/agents/personas/gia-cat-luong-agent/user-context-files/system/user.md +45 -0
package/.agent/agents/personas/mihata-agent/agent.json +10 -0
package/.agent/agents/personas/mihata-agent/context-files/agents.md +55 -0
package/.agent/agents/personas/mihata-agent/context-files/identity.md +23 -0
package/.agent/agents/personas/mihata-agent/context-files/soul.md +51 -0
package/.agent/agents/personas/mihata-agent/context-files/user-predefined.md +15 -0
package/.agent/agents/personas/mihata-agent/mihata-multi-agent-orchestration-profile.md +189 -0
package/.agent/agents/personas/mihata-agent/user-context-files/system/bootstrap.md +37 -0
package/.agent/agents/personas/mihata-agent/user-context-files/system/user.md +45 -0
package/.agent/agents/personas/tesla-agent/agent.json +10 -0
package/.agent/agents/personas/tesla-agent/context-files/agents.md +55 -0
package/.agent/agents/personas/tesla-agent/context-files/identity.md +23 -0
package/.agent/agents/personas/tesla-agent/context-files/soul.md +51 -0
package/.agent/agents/personas/tesla-agent/context-files/user-predefined.md +15 -0
package/.agent/agents/personas/tesla-agent/tesla-fullstack-system-optimization-profile.md +189 -0
package/.agent/agents/personas/tesla-agent/user-context-files/system/bootstrap.md +37 -0
package/.agent/agents/personas/tesla-agent/user-context-files/system/user.md +45 -0
package/.agent/agents/personas/tu-ma-y-agent/agent.json +10 -0
package/.agent/agents/personas/tu-ma-y-agent/context-files/agents.md +55 -0
package/.agent/agents/personas/tu-ma-y-agent/context-files/identity.md +23 -0
package/.agent/agents/personas/tu-ma-y-agent/context-files/soul.md +51 -0
package/.agent/agents/personas/tu-ma-y-agent/context-files/user-predefined.md +15 -0
package/.agent/agents/personas/tu-ma-y-agent/simayi-feasibility-risk-control-profile.md +189 -0
package/.agent/agents/personas/tu-ma-y-agent/user-context-files/system/bootstrap.md +37 -0
package/.agent/agents/personas/tu-ma-y-agent/user-context-files/system/user.md +45 -0
package/.agent/agents/personas/venti-agent/agent.json +10 -0
package/.agent/agents/personas/venti-agent/context-files/agents.md +55 -0
package/.agent/agents/personas/venti-agent/context-files/identity.md +23 -0
package/.agent/agents/personas/venti-agent/context-files/soul.md +51 -0
package/.agent/agents/personas/venti-agent/context-files/user-predefined.md +15 -0
package/.agent/agents/personas/venti-agent/user-context-files/system/bootstrap.md +37 -0
package/.agent/agents/personas/venti-agent/user-context-files/system/user.md +45 -0
package/.agent/agents/personas/venti-agent/venti-learning-communication-mentoring-profile.md +189 -0
package/.agent/agents/planner.md +212 -212
package/.agent/agents/python-reviewer.md +98 -98
package/.agent/agents/pytorch-build-resolver.md +120 -120
package/.agent/agents/refactor-cleaner.md +85 -85
package/.agent/agents/rust-build-resolver.md +148 -148
package/.agent/agents/rust-reviewer.md +94 -94
package/.agent/agents/security-reviewer.md +108 -108
package/.agent/agents/tdd-guide.md +91 -91
package/.agent/agents/typescript-reviewer.md +112 -112
package/.agent/contexts/dev.md +20 -0
package/.agent/contexts/research.md +26 -0
package/.agent/contexts/review.md +22 -0
package/.agent/hooks/hooks.json +395 -0
package/.agent/hooks/readme.md +222 -0
package/.agent/mcp-configs/mcp-servers.json +181 -0
package/.agent/rules/common/agents.md +50 -0
package/.agent/rules/common/code-review.md +124 -0
package/.agent/rules/common/coding-style.md +48 -0
package/.agent/rules/common/development-workflow.md +44 -0
package/.agent/rules/common/git-workflow.md +24 -0
package/.agent/rules/common/hooks.md +30 -0
package/.agent/rules/common/patterns.md +31 -0
package/.agent/rules/common/performance.md +55 -0
package/.agent/rules/common/security.md +29 -0
package/.agent/rules/common/testing.md +29 -0
package/.agent/rules/cpp/coding-style.md +44 -0
package/.agent/rules/cpp/hooks.md +39 -0
package/.agent/rules/cpp/patterns.md +51 -0
package/.agent/rules/cpp/security.md +51 -0
package/.agent/rules/cpp/testing.md +44 -0
package/.agent/rules/csharp/coding-style.md +72 -0
package/.agent/rules/csharp/hooks.md +25 -0
package/.agent/rules/csharp/patterns.md +50 -0
package/.agent/rules/csharp/security.md +58 -0
package/.agent/rules/csharp/testing.md +46 -0
package/.agent/rules/dart/coding-style.md +159 -0
package/.agent/rules/dart/hooks.md +66 -0
package/.agent/rules/dart/patterns.md +261 -0
package/.agent/rules/dart/security.md +135 -0
package/.agent/rules/dart/testing.md +215 -0
package/.agent/rules/golang/coding-style.md +32 -0
package/.agent/rules/golang/hooks.md +17 -0
package/.agent/rules/golang/patterns.md +45 -0
package/.agent/rules/golang/security.md +34 -0
package/.agent/rules/golang/testing.md +31 -0
package/.agent/rules/java/coding-style.md +114 -0
package/.agent/rules/java/hooks.md +18 -0
package/.agent/rules/java/patterns.md +146 -0
package/.agent/rules/java/security.md +100 -0
package/.agent/rules/java/testing.md +131 -0
package/.agent/rules/kotlin/coding-style.md +86 -0
package/.agent/rules/kotlin/hooks.md +17 -0
package/.agent/rules/kotlin/patterns.md +146 -0
package/.agent/rules/kotlin/security.md +82 -0
package/.agent/rules/kotlin/testing.md +128 -0
package/.agent/rules/perl/coding-style.md +46 -0
package/.agent/rules/perl/hooks.md +22 -0
package/.agent/rules/perl/patterns.md +76 -0
package/.agent/rules/perl/security.md +69 -0
package/.agent/rules/perl/testing.md +54 -0
package/.agent/rules/php/coding-style.md +40 -0
package/.agent/rules/php/hooks.md +24 -0
package/.agent/rules/php/patterns.md +33 -0
package/.agent/rules/php/security.md +37 -0
package/.agent/rules/php/testing.md +39 -0
package/.agent/rules/python/coding-style.md +42 -0
package/.agent/rules/python/hooks.md +19 -0
package/.agent/rules/python/patterns.md +39 -0
package/.agent/rules/python/security.md +30 -0
package/.agent/rules/python/testing.md +38 -0
package/.agent/rules/readme.md +111 -0
package/.agent/rules/rust/coding-style.md +151 -0
package/.agent/rules/rust/hooks.md +16 -0
package/.agent/rules/rust/patterns.md +168 -0
package/.agent/rules/rust/security.md +141 -0
package/.agent/rules/rust/testing.md +154 -0
package/.agent/rules/swift/coding-style.md +47 -0
package/.agent/rules/swift/hooks.md +20 -0
package/.agent/rules/swift/patterns.md +66 -0
package/.agent/rules/swift/security.md +33 -0
package/.agent/rules/swift/testing.md +45 -0
package/.agent/rules/typescript/coding-style.md +199 -0
package/.agent/rules/typescript/hooks.md +22 -0
package/.agent/rules/typescript/patterns.md +52 -0
package/.agent/rules/typescript/security.md +28 -0
package/.agent/rules/typescript/testing.md +18 -0
package/.agent/rules/web/coding-style.md +96 -0
package/.agent/rules/web/design-quality.md +63 -0
package/.agent/rules/web/hooks.md +120 -0
package/.agent/rules/web/patterns.md +79 -0
package/.agent/rules/web/performance.md +64 -0
package/.agent/rules/web/security.md +57 -0
package/.agent/rules/web/testing.md +55 -0
package/.agent/rules/zh/agents.md +50 -0
package/.agent/rules/zh/code-review.md +124 -0
package/.agent/rules/zh/coding-style.md +48 -0
package/.agent/rules/zh/development-workflow.md +44 -0
package/.agent/rules/zh/git-workflow.md +24 -0
package/.agent/rules/zh/hooks.md +30 -0
package/.agent/rules/zh/patterns.md +31 -0
package/.agent/rules/zh/performance.md +55 -0
package/.agent/rules/zh/readme.md +108 -0
package/.agent/rules/zh/security.md +29 -0
package/.agent/rules/zh/testing.md +29 -0
package/.agent/skills/agent-eval/SKILL.md +145 -0
package/.agent/skills/agent-harness-construction/SKILL.md +73 -0
package/.agent/skills/agent-payment-x402/SKILL.md +178 -0
package/.agent/skills/agentic-engineering/SKILL.md +63 -0
package/.agent/skills/ai-first-engineering/SKILL.md +51 -0
package/.agent/skills/ai-regression-testing/SKILL.md +385 -0
package/.agent/skills/android-clean-architecture/SKILL.md +339 -0
package/.agent/skills/api-design/SKILL.md +523 -0
package/.agent/skills/architecture-decision-records/SKILL.md +179 -0
package/.agent/skills/article-writing/SKILL.md +79 -0
package/.agent/skills/autonomous-agent-harness/SKILL.md +267 -0
package/.agent/skills/autonomous-loops/SKILL.md +610 -0
package/.agent/skills/backend-patterns/SKILL.md +598 -0
package/.agent/skills/benchmark/SKILL.md +93 -0
package/.agent/skills/blueprint/SKILL.md +105 -0
package/.agent/skills/brand-voice/SKILL.md +97 -0
package/.agent/skills/brand-voice/references/voice-profile-schema.md +55 -0
package/.agent/skills/browser-qa/SKILL.md +87 -0
package/.agent/skills/bun-runtime/SKILL.md +84 -0
package/.agent/skills/canary-watch/SKILL.md +99 -0
package/.agent/skills/carrier-relationship-management/SKILL.md +212 -0
package/.agent/skills/ck/SKILL.md +147 -0
package/.agent/skills/ck/commands/forget.mjs +44 -0
package/.agent/skills/ck/commands/info.mjs +24 -0
package/.agent/skills/ck/commands/init.mjs +143 -0
package/.agent/skills/ck/commands/list.mjs +40 -0
package/.agent/skills/ck/commands/migrate.mjs +202 -0
package/.agent/skills/ck/commands/resume.mjs +36 -0
package/.agent/skills/ck/commands/save.mjs +210 -0
package/.agent/skills/ck/commands/shared.mjs +387 -0
package/.agent/skills/ck/hooks/session-start.mjs +224 -0
package/.agent/skills/claude-api/SKILL.md +337 -0
package/.agent/skills/claude-devfleet/SKILL.md +103 -0
package/.agent/skills/click-path-audit/SKILL.md +244 -0
package/.agent/skills/clickhouse-io/SKILL.md +439 -0
package/.agent/skills/codebase-onboarding/SKILL.md +233 -0
package/.agent/skills/coding-standards/SKILL.md +530 -0
package/.agent/skills/compose-multiplatform-patterns/SKILL.md +299 -0
package/.agent/skills/configure-ecc/SKILL.md +367 -0
package/.agent/skills/connections-optimizer/SKILL.md +189 -0
package/.agent/skills/content-engine/SKILL.md +131 -0
package/.agent/skills/content-hash-cache-pattern/SKILL.md +161 -0
package/.agent/skills/context-budget/SKILL.md +135 -0
package/.agent/skills/continuous-agent-loop/SKILL.md +45 -0
package/.agent/skills/continuous-learning/SKILL.md +119 -0
package/.agent/skills/continuous-learning/config.json +18 -0
package/.agent/skills/continuous-learning/evaluate-session.sh +69 -0
package/.agent/skills/continuous-learning-v2/SKILL.md +365 -0
package/.agent/skills/continuous-learning-v2/agents/observer-loop.sh +271 -0
package/.agent/skills/continuous-learning-v2/agents/observer.md +198 -0
package/.agent/skills/continuous-learning-v2/agents/session-guardian.sh +150 -0
package/.agent/skills/continuous-learning-v2/agents/start-observer.sh +244 -0
package/.agent/skills/continuous-learning-v2/config.json +8 -0
package/.agent/skills/continuous-learning-v2/hooks/observe.sh +428 -0
package/.agent/skills/continuous-learning-v2/scripts/detect-project.sh +228 -0
package/.agent/skills/continuous-learning-v2/scripts/instinct-cli.py +1426 -0
package/.agent/skills/continuous-learning-v2/scripts/test-parse-instinct.py +984 -0
package/.agent/skills/cost-aware-llm-pipeline/SKILL.md +183 -0
package/.agent/skills/cpp-coding-standards/SKILL.md +723 -0
package/.agent/skills/cpp-testing/SKILL.md +324 -0
package/.agent/skills/crosspost/SKILL.md +111 -0
package/.agent/skills/csharp-testing/SKILL.md +321 -0
package/.agent/skills/customer-billing-ops/SKILL.md +140 -0
package/.agent/skills/customs-trade-compliance/SKILL.md +263 -0
package/.agent/skills/dart-flutter-patterns/SKILL.md +563 -0
package/.agent/skills/data-scraper-agent/SKILL.md +764 -0
package/.agent/skills/database-migrations/SKILL.md +429 -0
package/.agent/skills/deep-research/SKILL.md +155 -0
package/.agent/skills/deployment-patterns/SKILL.md +427 -0
package/.agent/skills/design-system/SKILL.md +82 -0
package/.agent/skills/django-patterns/SKILL.md +734 -0
package/.agent/skills/django-security/SKILL.md +593 -0
package/.agent/skills/django-tdd/SKILL.md +729 -0
package/.agent/skills/django-verification/SKILL.md +469 -0
package/.agent/skills/dmux-workflows/SKILL.md +191 -0
package/.agent/skills/docker-patterns/SKILL.md +364 -0
package/.agent/skills/documentation-lookup/SKILL.md +90 -0
package/.agent/skills/dotnet-patterns/SKILL.md +321 -0
package/.agent/skills/e2e-testing/SKILL.md +326 -0
package/.agent/skills/energy-procurement/SKILL.md +228 -0
package/.agent/skills/enterprise-agent-ops/SKILL.md +50 -0
package/.agent/skills/eval-harness/SKILL.md +270 -0
package/.agent/skills/exa-search/SKILL.md +103 -0
package/.agent/skills/fal-ai-media/SKILL.md +284 -0
package/.agent/skills/flutter-dart-code-review/SKILL.md +435 -0
package/.agent/skills/foundation-models-on-device/SKILL.md +243 -0
package/.agent/skills/frontend-patterns/SKILL.md +642 -0
package/.agent/skills/frontend-slides/SKILL.md +184 -0
package/.agent/skills/frontend-slides/style-presets.md +330 -0
package/.agent/skills/gan-style-harness/SKILL.md +278 -0
package/.agent/skills/git-workflow/SKILL.md +715 -0
package/.agent/skills/golang-patterns/SKILL.md +674 -0
package/.agent/skills/golang-testing/SKILL.md +720 -0
package/.agent/skills/google-workspace-ops/SKILL.md +95 -0
package/.agent/skills/healthcare-cdss-patterns/SKILL.md +245 -0
package/.agent/skills/healthcare-emr-patterns/SKILL.md +159 -0
package/.agent/skills/healthcare-eval-harness/SKILL.md +207 -0
package/.agent/skills/healthcare-phi-compliance/SKILL.md +145 -0
package/.agent/skills/hexagonal-architecture/SKILL.md +276 -0
package/.agent/skills/inventory-demand-planning/SKILL.md +247 -0
package/.agent/skills/investor-materials/SKILL.md +96 -0
package/.agent/skills/investor-outreach/SKILL.md +91 -0
package/.agent/skills/iterative-retrieval/SKILL.md +211 -0
package/.agent/skills/java-coding-standards/SKILL.md +147 -0
package/.agent/skills/jira-integration/SKILL.md +293 -0
package/.agent/skills/jpa-patterns/SKILL.md +151 -0
package/.agent/skills/kotlin-coroutines-flows/SKILL.md +284 -0
package/.agent/skills/kotlin-exposed-patterns/SKILL.md +719 -0
package/.agent/skills/kotlin-ktor-patterns/SKILL.md +689 -0
package/.agent/skills/kotlin-patterns/SKILL.md +711 -0
package/.agent/skills/kotlin-testing/SKILL.md +824 -0
package/.agent/skills/laravel-patterns/SKILL.md +415 -0
package/.agent/skills/laravel-plugin-discovery/SKILL.md +229 -0
package/.agent/skills/laravel-security/SKILL.md +285 -0
package/.agent/skills/laravel-tdd/SKILL.md +283 -0
package/.agent/skills/laravel-verification/SKILL.md +179 -0
package/.agent/skills/lead-intelligence/SKILL.md +321 -0
package/.agent/skills/lead-intelligence/agents/enrichment-agent.md +85 -0
package/.agent/skills/lead-intelligence/agents/mutual-mapper.md +75 -0
package/.agent/skills/lead-intelligence/agents/outreach-drafter.md +98 -0
package/.agent/skills/lead-intelligence/agents/signal-scorer.md +60 -0
package/.agent/skills/liquid-glass-design/SKILL.md +279 -0
package/.agent/skills/logistics-exception-management/SKILL.md +222 -0
package/.agent/skills/manim-video/SKILL.md +89 -0
package/.agent/skills/manim-video/assets/network-graph-scene.py +52 -0
package/.agent/skills/market-research/SKILL.md +75 -0
package/.agent/skills/mcp-builder/SKILL.md +173 -113
package/.agent/skills/mcp-builder/license.txt +202 -0
package/.agent/skills/mcp-builder/reference/evaluation.md +602 -0
package/.agent/skills/mcp-builder/reference/mcp-best-practices.md +249 -0
package/.agent/skills/mcp-builder/reference/node-mcp-server.md +970 -0
package/.agent/skills/mcp-builder/reference/python-mcp-server.md +719 -0
package/.agent/skills/mcp-builder/scripts/connections.py +151 -0
package/.agent/skills/mcp-builder/scripts/evaluation.py +373 -0
package/.agent/skills/mcp-builder/scripts/example-evaluation.xml +22 -0
package/.agent/skills/mcp-builder/scripts/requirements.txt +2 -0
package/.agent/skills/mcp-server-patterns/SKILL.md +67 -0
package/.agent/skills/nanoclaw-repl/SKILL.md +33 -0
package/.agent/skills/nestjs-patterns/SKILL.md +230 -0
package/.agent/skills/nextjs-turbopack/SKILL.md +44 -0
package/.agent/skills/nutrient-document-processing/SKILL.md +167 -0
package/.agent/skills/nuxt4-patterns/SKILL.md +100 -0
package/.agent/skills/openclaw-persona-forge/SKILL.md +296 -0
package/.agent/skills/openclaw-persona-forge/gacha.py +224 -0
package/.agent/skills/openclaw-persona-forge/gacha.sh +5 -0
package/.agent/skills/openclaw-persona-forge/references/avatar-style.md +124 -0
package/.agent/skills/openclaw-persona-forge/references/boundary-rules.md +53 -0
package/.agent/skills/openclaw-persona-forge/references/error-handling.md +53 -0
package/.agent/skills/openclaw-persona-forge/references/identity-tension.md +48 -0
package/.agent/skills/openclaw-persona-forge/references/naming-system.md +39 -0
package/.agent/skills/openclaw-persona-forge/references/output-template.md +166 -0
package/.agent/skills/opensource-pipeline/SKILL.md +255 -0
package/.agent/skills/perl-patterns/SKILL.md +504 -0
package/.agent/skills/perl-security/SKILL.md +503 -0
package/.agent/skills/perl-testing/SKILL.md +475 -0
package/.agent/skills/plankton-code-quality/SKILL.md +236 -0
package/.agent/skills/postgres-patterns/SKILL.md +147 -0
package/.agent/skills/product-lens/SKILL.md +85 -0
package/.agent/skills/production-scheduling/SKILL.md +238 -0
package/.agent/skills/project-flow-ops/SKILL.md +111 -0
package/.agent/skills/project-guidelines-example/SKILL.md +349 -0
package/.agent/skills/prompt-optimizer/SKILL.md +397 -0
package/.agent/skills/python-patterns/SKILL.md +622 -313
package/.agent/skills/python-testing/SKILL.md +816 -0
package/.agent/skills/pytorch-patterns/SKILL.md +396 -0
package/.agent/skills/quality-nonconformance/SKILL.md +260 -0
package/.agent/skills/ralphinho-rfc-pipeline/SKILL.md +67 -0
package/.agent/skills/regex-vs-llm-structured-text/SKILL.md +220 -0
package/.agent/skills/remotion-video-creation/SKILL.md +43 -0
package/.agent/skills/remotion-video-creation/rules/3d.md +86 -0
package/.agent/skills/remotion-video-creation/rules/animations.md +29 -0
package/.agent/skills/remotion-video-creation/rules/assets/charts-bar-chart.tsx +173 -0
package/.agent/skills/remotion-video-creation/rules/assets/text-animations-typewriter.tsx +100 -0
package/.agent/skills/remotion-video-creation/rules/assets/text-animations-word-highlight.tsx +108 -0
package/.agent/skills/remotion-video-creation/rules/assets.md +78 -0
package/.agent/skills/remotion-video-creation/rules/audio.md +172 -0
package/.agent/skills/remotion-video-creation/rules/calculate-metadata.md +104 -0
package/.agent/skills/remotion-video-creation/rules/can-decode.md +75 -0
package/.agent/skills/remotion-video-creation/rules/charts.md +58 -0
package/.agent/skills/remotion-video-creation/rules/compositions.md +146 -0
package/.agent/skills/remotion-video-creation/rules/display-captions.md +126 -0
package/.agent/skills/remotion-video-creation/rules/extract-frames.md +229 -0
package/.agent/skills/remotion-video-creation/rules/fonts.md +152 -0
package/.agent/skills/remotion-video-creation/rules/get-audio-duration.md +58 -0
package/.agent/skills/remotion-video-creation/rules/get-video-dimensions.md +68 -0
package/.agent/skills/remotion-video-creation/rules/get-video-duration.md +58 -0
package/.agent/skills/remotion-video-creation/rules/gifs.md +138 -0
package/.agent/skills/remotion-video-creation/rules/images.md +130 -0
package/.agent/skills/remotion-video-creation/rules/import-srt-captions.md +67 -0
package/.agent/skills/remotion-video-creation/rules/lottie.md +67 -0
package/.agent/skills/remotion-video-creation/rules/measuring-dom-nodes.md +34 -0
package/.agent/skills/remotion-video-creation/rules/measuring-text.md +143 -0
package/.agent/skills/remotion-video-creation/rules/sequencing.md +106 -0
package/.agent/skills/remotion-video-creation/rules/tailwind.md +11 -0
package/.agent/skills/remotion-video-creation/rules/text-animations.md +20 -0
package/.agent/skills/remotion-video-creation/rules/timing.md +179 -0
package/.agent/skills/remotion-video-creation/rules/transcribe-captions.md +19 -0
package/.agent/skills/remotion-video-creation/rules/transitions.md +122 -0
package/.agent/skills/remotion-video-creation/rules/trimming.md +52 -0
package/.agent/skills/remotion-video-creation/rules/videos.md +171 -0
package/.agent/skills/repo-scan/SKILL.md +78 -0
package/.agent/skills/returns-reverse-logistics/SKILL.md +240 -0
package/.agent/skills/rules-distill/SKILL.md +264 -0
package/.agent/skills/rules-distill/scripts/scan-rules.sh +58 -0
package/.agent/skills/rules-distill/scripts/scan-skills.sh +129 -0
package/.agent/skills/rust-patterns/SKILL.md +499 -0
package/.agent/skills/rust-testing/SKILL.md +500 -0
package/.agent/skills/safety-guard/SKILL.md +75 -0
package/.agent/skills/santa-method/SKILL.md +306 -0
package/.agent/skills/search-first/SKILL.md +161 -0
package/.agent/skills/security-review/SKILL.md +495 -0
package/.agent/skills/security-review/cloud-infrastructure-security.md +361 -0
package/.agent/skills/security-scan/SKILL.md +165 -0
package/.agent/skills/skill-comply/SKILL.md +58 -0
package/.agent/skills/skill-comply/fixtures/compliant-trace.jsonl +5 -0
package/.agent/skills/skill-comply/fixtures/noncompliant-trace.jsonl +3 -0
package/.agent/skills/skill-comply/fixtures/tdd-spec.yaml +44 -0
package/.agent/skills/skill-comply/prompts/classifier.md +24 -0
package/.agent/skills/skill-comply/prompts/scenario-generator.md +62 -0
package/.agent/skills/skill-comply/prompts/spec-generator.md +42 -0
package/.agent/skills/skill-comply/pyproject.toml +15 -0
package/.agent/skills/skill-comply/scripts/classifier.py +85 -0
package/.agent/skills/skill-comply/scripts/grader.py +122 -0
package/.agent/skills/skill-comply/scripts/init.py +0 -0
package/.agent/skills/skill-comply/scripts/parser.py +107 -0
package/.agent/skills/skill-comply/scripts/report.py +170 -0
package/.agent/skills/skill-comply/scripts/run.py +127 -0
package/.agent/skills/skill-comply/scripts/runner.py +161 -0
package/.agent/skills/skill-comply/scripts/scenario-generator.py +70 -0
package/.agent/skills/skill-comply/scripts/spec-generator.py +72 -0
package/.agent/skills/skill-comply/scripts/utils.py +13 -0
package/.agent/skills/skill-comply/tests/test-grader.py +137 -0
package/.agent/skills/skill-comply/tests/test-parser.py +90 -0
package/.agent/skills/skill-creator/SKILL.md +485 -0
package/.agent/skills/skill-creator/agents/analyzer.md +274 -0
package/.agent/skills/skill-creator/agents/comparator.md +202 -0
package/.agent/skills/skill-creator/agents/grader.md +223 -0
package/.agent/skills/skill-creator/assets/eval-review.html +146 -0
package/.agent/skills/skill-creator/eval-viewer/generate-review.py +471 -0
package/.agent/skills/skill-creator/eval-viewer/viewer.html +1325 -0
package/.agent/skills/skill-creator/license.txt +202 -0
package/.agent/skills/skill-creator/references/schemas.md +430 -0
package/.agent/skills/skill-creator/scripts/aggregate-benchmark.py +401 -0
package/.agent/skills/skill-creator/scripts/generate-report.py +326 -0
package/.agent/skills/skill-creator/scripts/improve-description.py +247 -0
package/.agent/skills/skill-creator/scripts/init.py +0 -0
package/.agent/skills/skill-creator/scripts/package-skill.py +136 -0
package/.agent/skills/skill-creator/scripts/quick-validate.py +103 -0
package/.agent/skills/skill-creator/scripts/run-eval.py +310 -0
package/.agent/skills/skill-creator/scripts/run-loop.py +328 -0
package/.agent/skills/skill-creator/scripts/utils.py +47 -0
package/.agent/skills/skill-stocktake/SKILL.md +193 -0
package/.agent/skills/skill-stocktake/scripts/quick-diff.sh +87 -0
package/.agent/skills/skill-stocktake/scripts/save-results.sh +56 -0
package/.agent/skills/skill-stocktake/scripts/scan.sh +170 -0
package/.agent/skills/social-graph-ranker/SKILL.md +154 -0
package/.agent/skills/springboot-patterns/SKILL.md +314 -0
package/.agent/skills/springboot-security/SKILL.md +272 -0
package/.agent/skills/springboot-tdd/SKILL.md +158 -0
package/.agent/skills/springboot-verification/SKILL.md +231 -0
package/.agent/skills/strategic-compact/SKILL.md +131 -0
package/.agent/skills/strategic-compact/suggest-compact.sh +54 -0
package/.agent/skills/swift-actor-persistence/SKILL.md +143 -0
package/.agent/skills/swift-concurrency-6-2/SKILL.md +216 -0
package/.agent/skills/swift-protocol-di-testing/SKILL.md +190 -0
package/.agent/skills/swiftui-patterns/SKILL.md +259 -0
package/.agent/skills/tdd-workflow/SKILL.md +412 -98
package/.agent/skills/team-builder/SKILL.md +168 -0
package/.agent/skills/token-budget-advisor/SKILL.md +133 -0
package/.agent/skills/ui-demo/SKILL.md +465 -0
package/.agent/skills/ui-ux-pro-max/data/charts.csv +26 -26
package/.agent/skills/ui-ux-pro-max/data/colors.csv +97 -97
package/.agent/skills/ui-ux-pro-max/data/landing.csv +28 -28
package/.agent/skills/ui-ux-pro-max/data/products.csv +96 -96
package/.agent/skills/ui-ux-pro-max/data/stacks/flutter.csv +53 -53
package/.agent/skills/ui-ux-pro-max/data/stacks/html-tailwind.csv +56 -56
package/.agent/skills/ui-ux-pro-max/data/stacks/nextjs.csv +53 -53
package/.agent/skills/ui-ux-pro-max/data/stacks/react-native.csv +52 -52
package/.agent/skills/ui-ux-pro-max/data/stacks/react.csv +54 -54
package/.agent/skills/ui-ux-pro-max/data/stacks/svelte.csv +54 -54
package/.agent/skills/ui-ux-pro-max/data/stacks/swiftui.csv +51 -51
package/.agent/skills/ui-ux-pro-max/data/stacks/vue.csv +50 -50
package/.agent/skills/ui-ux-pro-max/data/styles.csv +68 -68
package/.agent/skills/ui-ux-pro-max/data/ux-guidelines.csv +99 -99
package/.agent/skills/ui-ux-pro-max/scripts/search.py +114 -114
package/.agent/skills/verification-loop/SKILL.md +126 -0
package/.agent/skills/video-editing/SKILL.md +310 -0
package/.agent/skills/videodb/SKILL.md +374 -0
package/.agent/skills/videodb/reference/api-reference.md +550 -0
package/.agent/skills/videodb/reference/capture-reference.md +407 -0
package/.agent/skills/videodb/reference/capture.md +101 -0
package/.agent/skills/videodb/reference/editor.md +443 -0
package/.agent/skills/videodb/reference/generative.md +331 -0
package/.agent/skills/videodb/reference/rtstream-reference.md +564 -0
package/.agent/skills/videodb/reference/rtstream.md +65 -0
package/.agent/skills/videodb/reference/search.md +230 -0
package/.agent/skills/videodb/reference/streaming.md +406 -0
package/.agent/skills/videodb/reference/use-cases.md +118 -0
package/.agent/skills/videodb/scripts/ws-listener.py +282 -0
package/.agent/skills/visa-doc-translate/SKILL.md +117 -0
package/.agent/skills/visa-doc-translate/readme.md +86 -0
package/.agent/skills/workspace-surface-audit/SKILL.md +125 -0
package/.agent/skills/x-api/SKILL.md +230 -0
package/.agent/tasks/two-track-merge-contract.md +29 -0
package/.agent/workflows/aside.md +164 -164
package/.agent/workflows/build-fix.md +62 -62
package/.agent/workflows/checkpoint.md +74 -74
package/.agent/workflows/claw.md +23 -51
package/.agent/workflows/clean-memory.md +34 -0
package/.agent/workflows/code-review.md +289 -40
package/.agent/workflows/context-budget.md +23 -29
package/.agent/workflows/cpp-build.md +173 -173
package/.agent/workflows/cpp-review.md +132 -132
package/.agent/workflows/cpp-test.md +251 -251
package/.agent/workflows/devfleet.md +23 -92
package/.agent/workflows/docs.md +23 -31
package/.agent/workflows/e2e.md +268 -365
package/.agent/workflows/eval.md +23 -120
package/.agent/workflows/evolve.md +178 -178
package/.agent/workflows/flutter-build.md +164 -0
package/.agent/workflows/flutter-review.md +116 -0
package/.agent/workflows/flutter-test.md +144 -0
package/.agent/workflows/gan-build.md +99 -0
package/.agent/workflows/gan-design.md +35 -0
package/.agent/workflows/go-build.md +183 -183
package/.agent/workflows/go-review.md +148 -148
package/.agent/workflows/go-test.md +268 -268
package/.agent/workflows/gradle-build.md +70 -70
package/.agent/workflows/harness-audit.md +73 -71
package/.agent/workflows/instinct-export.md +66 -66
package/.agent/workflows/instinct-import.md +114 -114
package/.agent/workflows/instinct-status.md +59 -59
package/.agent/workflows/jira.md +106 -0
package/.agent/workflows/kotlin-build.md +174 -174
package/.agent/workflows/kotlin-review.md +140 -140
package/.agent/workflows/kotlin-test.md +312 -312
package/.agent/workflows/learn-eval.md +116 -116
package/.agent/workflows/learn.md +70 -70
package/.agent/workflows/loop-start.md +32 -32
package/.agent/workflows/loop-status.md +24 -24
package/.agent/workflows/model-route.md +26 -26
package/.agent/workflows/multi-backend.md +158 -158
package/.agent/workflows/multi-execute.md +315 -315
package/.agent/workflows/multi-frontend.md +158 -158
package/.agent/workflows/multi-plan.md +268 -268
package/.agent/workflows/multi-workflow.md +191 -191
package/.agent/workflows/orchestrate.md +135 -231
package/.agent/workflows/plan.md +117 -115
package/.agent/workflows/pm2.md +272 -272
package/.agent/workflows/projects.md +39 -39
package/.agent/workflows/promote.md +41 -41
package/.agent/workflows/prompt-optimize.md +23 -38
package/.agent/workflows/prp-commit.md +112 -0
package/.agent/workflows/prp-implement.md +385 -0
package/.agent/workflows/prp-plan.md +502 -0
package/.agent/workflows/prp-pr.md +184 -0
package/.agent/workflows/prp-prd.md +447 -0
package/.agent/workflows/prune.md +31 -31
package/.agent/workflows/python-review.md +297 -297
package/.agent/workflows/quality-gate.md +29 -29
package/.agent/workflows/refactor-clean.md +80 -80
package/.agent/workflows/resume-session.md +156 -156
package/.agent/workflows/rules-distill.md +20 -11
package/.agent/workflows/rust-build.md +187 -187
package/.agent/workflows/rust-review.md +142 -142
package/.agent/workflows/rust-test.md +308 -308
package/.agent/workflows/santa-loop.md +175 -0
package/.agent/workflows/save-session.md +275 -275
package/.agent/workflows/sessions.md +333 -333
package/.agent/workflows/setup-pm.md +80 -80
package/.agent/workflows/skill-create.md +174 -174
package/.agent/workflows/skill-health.md +54 -54
package/.agent/workflows/tdd.md +231 -328
package/.agent/workflows/test-coverage.md +69 -69
package/.agent/workflows/update-codemaps.md +72 -72
package/.agent/workflows/update-docs.md +84 -84
package/.agent/workflows/verify.md +23 -59
package/LICENSE +176 -176
package/README.md +28 -20
package/RELEASE.md +32 -36
package/package.json +87 -79
package/scripts/release-check.js +55 -55
package/src/bin/cli.js +399 -53
package/src/lib/installer.js +360 -114
package/src/lib/manifests/stacks.js +122 -0
package/src/lib/slash-commands.js +28 -0
package/src/templates/claude/CLAUDE.en.md +42 -0
package/src/templates/claude/CLAUDE.md +42 -0
package/src/templates/claude/CLAUDE.vi.md +42 -0
package/src/templates/codex/AGENTS.en.md +40 -0
package/src/templates/codex/AGENTS.md +40 -0
package/src/templates/codex/AGENTS.vi.md +40 -0
package/src/templates/cursor/pilo-masterkit.mdc +20 -0
package/src/templates/gemini/GEMINI.en.md +56 -0
package/src/templates/gemini/GEMINI.md +56 -0
package/src/templates/gemini/GEMINI.vi.md +56 -0
package/src/templates/github/copilot-instructions.md +16 -0

package/.agent/skills/skill-creator/scripts/aggregate-benchmark.py ADDED Viewed

@@ -0,0 +1,401 @@
+#!/usr/bin/env python3
+"""
+Aggregate individual run results into benchmark summary statistics.
+Reads grading.json files from run directories and produces:
+- run_summary with mean, stddev, min, max for each metric
+- delta between with_skill and without_skill configurations
+Usage:
+    python aggregate_benchmark.py <benchmark_dir>
+Example:
+    python aggregate_benchmark.py benchmarks/2026-01-15T10-30-00/
+The script supports two directory layouts:
+    Workspace layout (from skill-creator iterations):
+    <benchmark_dir>/
+    └── eval-N/
+        ├── with_skill/
+        │   ├── run-1/grading.json
+        │   └── run-2/grading.json
+        └── without_skill/
+            ├── run-1/grading.json
+            └── run-2/grading.json
+    Legacy layout (with runs/ subdirectory):
+    <benchmark_dir>/
+    └── runs/
+        └── eval-N/
+            ├── with_skill/
+            │   └── run-1/grading.json
+            └── without_skill/
+                └── run-1/grading.json
+"""
+import argparse
+import json
+import math
+import sys
+from datetime import datetime, timezone
+from pathlib import Path
+def calculate_stats(values: list[float]) -> dict:
+    """Calculate mean, stddev, min, max for a list of values."""
+    if not values:
+        return {"mean": 0.0, "stddev": 0.0, "min": 0.0, "max": 0.0}
+    n = len(values)
+    mean = sum(values) / n
+    if n > 1:
+        variance = sum((x - mean) ** 2 for x in values) / (n - 1)
+        stddev = math.sqrt(variance)
+    else:
+        stddev = 0.0
+    return {
+        "mean": round(mean, 4),
+        "stddev": round(stddev, 4),
+        "min": round(min(values), 4),
+        "max": round(max(values), 4)
+    }
+def load_run_results(benchmark_dir: Path) -> dict:
+    """
+    Load all run results from a benchmark directory.
+    Returns dict keyed by config name (e.g. "with_skill"/"without_skill",
+    or "new_skill"/"old_skill"), each containing a list of run results.
+    """
+    # Support both layouts: eval dirs directly under benchmark_dir, or under runs/
+    runs_dir = benchmark_dir / "runs"
+    if runs_dir.exists():
+        search_dir = runs_dir
+    elif list(benchmark_dir.glob("eval-*")):
+        search_dir = benchmark_dir
+    else:
+        print(f"No eval directories found in {benchmark_dir} or {benchmark_dir / 'runs'}")
+        return {}
+    results: dict[str, list] = {}
+    for eval_idx, eval_dir in enumerate(sorted(search_dir.glob("eval-*"))):
+        metadata_path = eval_dir / "eval_metadata.json"
+        if metadata_path.exists():
+            try:
+                with open(metadata_path) as mf:
+                    eval_id = json.load(mf).get("eval_id", eval_idx)
+            except (json.JSONDecodeError, OSError):
+                eval_id = eval_idx
+        else:
+            try:
+                eval_id = int(eval_dir.name.split("-")[1])
+            except ValueError:
+                eval_id = eval_idx
+        # Discover config directories dynamically rather than hardcoding names
+        for config_dir in sorted(eval_dir.iterdir()):
+            if not config_dir.is_dir():
+                continue
+            # Skip non-config directories (inputs, outputs, etc.)
+            if not list(config_dir.glob("run-*")):
+                continue
+            config = config_dir.name
+            if config not in results:
+                results[config] = []
+            for run_dir in sorted(config_dir.glob("run-*")):
+                run_number = int(run_dir.name.split("-")[1])
+                grading_file = run_dir / "grading.json"
+                if not grading_file.exists():
+                    print(f"Warning: grading.json not found in {run_dir}")
+                    continue
+                try:
+                    with open(grading_file) as f:
+                        grading = json.load(f)
+                except json.JSONDecodeError as e:
+                    print(f"Warning: Invalid JSON in {grading_file}: {e}")
+                    continue
+                # Extract metrics
+                result = {
+                    "eval_id": eval_id,
+                    "run_number": run_number,
+                    "pass_rate": grading.get("summary", {}).get("pass_rate", 0.0),
+                    "passed": grading.get("summary", {}).get("passed", 0),
+                    "failed": grading.get("summary", {}).get("failed", 0),
+                    "total": grading.get("summary", {}).get("total", 0),
+                }
+                # Extract timing — check grading.json first, then sibling timing.json
+                timing = grading.get("timing", {})
+                result["time_seconds"] = timing.get("total_duration_seconds", 0.0)
+                timing_file = run_dir / "timing.json"
+                if result["time_seconds"] == 0.0 and timing_file.exists():
+                    try:
+                        with open(timing_file) as tf:
+                            timing_data = json.load(tf)
+                        result["time_seconds"] = timing_data.get("total_duration_seconds", 0.0)
+                        result["tokens"] = timing_data.get("total_tokens", 0)
+                    except json.JSONDecodeError:
+                        pass
+                # Extract metrics if available
+                metrics = grading.get("execution_metrics", {})
+                result["tool_calls"] = metrics.get("total_tool_calls", 0)
+                if not result.get("tokens"):
+                    result["tokens"] = metrics.get("output_chars", 0)
+                result["errors"] = metrics.get("errors_encountered", 0)
+                # Extract expectations — viewer requires fields: text, passed, evidence
+                raw_expectations = grading.get("expectations", [])
+                for exp in raw_expectations:
+                    if "text" not in exp or "passed" not in exp:
+                        print(f"Warning: expectation in {grading_file} missing required fields (text, passed, evidence): {exp}")
+                result["expectations"] = raw_expectations
+                # Extract notes from user_notes_summary
+                notes_summary = grading.get("user_notes_summary", {})
+                notes = []
+                notes.extend(notes_summary.get("uncertainties", []))
+                notes.extend(notes_summary.get("needs_review", []))
+                notes.extend(notes_summary.get("workarounds", []))
+                result["notes"] = notes
+                results[config].append(result)
+    return results
+def aggregate_results(results: dict) -> dict:
+    """
+    Aggregate run results into summary statistics.
+    Returns run_summary with stats for each configuration and delta.
+    """
+    run_summary = {}
+    configs = list(results.keys())
+    for config in configs:
+        runs = results.get(config, [])
+        if not runs:
+            run_summary[config] = {
+                "pass_rate": {"mean": 0.0, "stddev": 0.0, "min": 0.0, "max": 0.0},
+                "time_seconds": {"mean": 0.0, "stddev": 0.0, "min": 0.0, "max": 0.0},
+                "tokens": {"mean": 0, "stddev": 0, "min": 0, "max": 0}
+            }
+            continue
+        pass_rates = [r["pass_rate"] for r in runs]
+        times = [r["time_seconds"] for r in runs]
+        tokens = [r.get("tokens", 0) for r in runs]
+        run_summary[config] = {
+            "pass_rate": calculate_stats(pass_rates),
+            "time_seconds": calculate_stats(times),
+            "tokens": calculate_stats(tokens)
+        }
+    # Calculate delta between the first two configs (if two exist)
+    if len(configs) >= 2:
+        primary = run_summary.get(configs[0], {})
+        baseline = run_summary.get(configs[1], {})
+    else:
+        primary = run_summary.get(configs[0], {}) if configs else {}
+        baseline = {}
+    delta_pass_rate = primary.get("pass_rate", {}).get("mean", 0) - baseline.get("pass_rate", {}).get("mean", 0)
+    delta_time = primary.get("time_seconds", {}).get("mean", 0) - baseline.get("time_seconds", {}).get("mean", 0)
+    delta_tokens = primary.get("tokens", {}).get("mean", 0) - baseline.get("tokens", {}).get("mean", 0)
+    run_summary["delta"] = {
+        "pass_rate": f"{delta_pass_rate:+.2f}",
+        "time_seconds": f"{delta_time:+.1f}",
+        "tokens": f"{delta_tokens:+.0f}"
+    }
+    return run_summary
+def generate_benchmark(benchmark_dir: Path, skill_name: str = "", skill_path: str = "") -> dict:
+    """
+    Generate complete benchmark.json from run results.
+    """
+    results = load_run_results(benchmark_dir)
+    run_summary = aggregate_results(results)
+    # Build runs array for benchmark.json
+    runs = []
+    for config in results:
+        for result in results[config]:
+            runs.append({
+                "eval_id": result["eval_id"],
+                "configuration": config,
+                "run_number": result["run_number"],
+                "result": {
+                    "pass_rate": result["pass_rate"],
+                    "passed": result["passed"],
+                    "failed": result["failed"],
+                    "total": result["total"],
+                    "time_seconds": result["time_seconds"],
+                    "tokens": result.get("tokens", 0),
+                    "tool_calls": result.get("tool_calls", 0),
+                    "errors": result.get("errors", 0)
+                },
+                "expectations": result["expectations"],
+                "notes": result["notes"]
+            })
+    # Determine eval IDs from results
+    eval_ids = sorted(set(
+        r["eval_id"]
+        for config in results.values()
+        for r in config
+    ))
+    benchmark = {
+        "metadata": {
+            "skill_name": skill_name or "<skill-name>",
+            "skill_path": skill_path or "<path/to/skill>",
+            "executor_model": "<model-name>",
+            "analyzer_model": "<model-name>",
+            "timestamp": datetime.now(timezone.utc).strftime("%Y-%m-%dT%H:%M:%SZ"),
+            "evals_run": eval_ids,
+            "runs_per_configuration": 3
+        },
+        "runs": runs,
+        "run_summary": run_summary,
+        "notes": []  # To be filled by analyzer
+    }
+    return benchmark
+def generate_markdown(benchmark: dict) -> str:
+    """Generate human-readable benchmark.md from benchmark data."""
+    metadata = benchmark["metadata"]
+    run_summary = benchmark["run_summary"]
+    # Determine config names (excluding "delta")
+    configs = [k for k in run_summary if k != "delta"]
+    config_a = configs[0] if len(configs) >= 1 else "config_a"
+    config_b = configs[1] if len(configs) >= 2 else "config_b"
+    label_a = config_a.replace("_", " ").title()
+    label_b = config_b.replace("_", " ").title()
+    lines = [
+        f"# Skill Benchmark: {metadata['skill_name']}",
+        "",
+        f"**Model**: {metadata['executor_model']}",
+        f"**Date**: {metadata['timestamp']}",
+        f"**Evals**: {', '.join(map(str, metadata['evals_run']))} ({metadata['runs_per_configuration']} runs each per configuration)",
+        "",
+        "## Summary",
+        "",
+        f"| Metric | {label_a} | {label_b} | Delta |",
+        "|--------|------------|---------------|-------|",
+    ]
+    a_summary = run_summary.get(config_a, {})
+    b_summary = run_summary.get(config_b, {})
+    delta = run_summary.get("delta", {})
+    # Format pass rate
+    a_pr = a_summary.get("pass_rate", {})
+    b_pr = b_summary.get("pass_rate", {})
+    lines.append(f"| Pass Rate | {a_pr.get('mean', 0)*100:.0f}% ± {a_pr.get('stddev', 0)*100:.0f}% | {b_pr.get('mean', 0)*100:.0f}% ± {b_pr.get('stddev', 0)*100:.0f}% | {delta.get('pass_rate', '—')} |")
+    # Format time
+    a_time = a_summary.get("time_seconds", {})
+    b_time = b_summary.get("time_seconds", {})
+    lines.append(f"| Time | {a_time.get('mean', 0):.1f}s ± {a_time.get('stddev', 0):.1f}s | {b_time.get('mean', 0):.1f}s ± {b_time.get('stddev', 0):.1f}s | {delta.get('time_seconds', '—')}s |")
+    # Format tokens
+    a_tokens = a_summary.get("tokens", {})
+    b_tokens = b_summary.get("tokens", {})
+    lines.append(f"| Tokens | {a_tokens.get('mean', 0):.0f} ± {a_tokens.get('stddev', 0):.0f} | {b_tokens.get('mean', 0):.0f} ± {b_tokens.get('stddev', 0):.0f} | {delta.get('tokens', '—')} |")
+    # Notes section
+    if benchmark.get("notes"):
+        lines.extend([
+            "",
+            "## Notes",
+            ""
+        ])
+        for note in benchmark["notes"]:
+            lines.append(f"- {note}")
+    return "\n".join(lines)
+def main():
+    parser = argparse.ArgumentParser(
+        description="Aggregate benchmark run results into summary statistics"
+    )
+    parser.add_argument(
+        "benchmark_dir",
+        type=Path,
+        help="Path to the benchmark directory"
+    )
+    parser.add_argument(
+        "--skill-name",
+        default="",
+        help="Name of the skill being benchmarked"
+    )
+    parser.add_argument(
+        "--skill-path",
+        default="",
+        help="Path to the skill being benchmarked"
+    )
+    parser.add_argument(
+        "--output", "-o",
+        type=Path,
+        help="Output path for benchmark.json (default: <benchmark_dir>/benchmark.json)"
+    )
+    args = parser.parse_args()
+    if not args.benchmark_dir.exists():
+        print(f"Directory not found: {args.benchmark_dir}")
+        sys.exit(1)
+    # Generate benchmark
+    benchmark = generate_benchmark(args.benchmark_dir, args.skill_name, args.skill_path)
+    # Determine output paths
+    output_json = args.output or (args.benchmark_dir / "benchmark.json")
+    output_md = output_json.with_suffix(".md")
+    # Write benchmark.json
+    with open(output_json, "w") as f:
+        json.dump(benchmark, f, indent=2)
+    print(f"Generated: {output_json}")
+    # Write benchmark.md
+    markdown = generate_markdown(benchmark)
+    with open(output_md, "w") as f:
+        f.write(markdown)
+    print(f"Generated: {output_md}")
+    # Print summary
+    run_summary = benchmark["run_summary"]
+    configs = [k for k in run_summary if k != "delta"]
+    delta = run_summary.get("delta", {})
+    print(f"\nSummary:")
+    for config in configs:
+        pr = run_summary[config]["pass_rate"]["mean"]
+        label = config.replace("_", " ").title()
+        print(f"  {label}: {pr*100:.1f}% pass rate")
+    print(f"  Delta:         {delta.get('pass_rate', '—')}")
+if __name__ == "__main__":
+    main()