npm - @wooojin/forgen - Versions diffs - 0.4.0 → 0.4.3 - Mend

@wooojin/forgen 0.4.0 → 0.4.3

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (187) hide show

package/.claude-plugin/plugin.json +5 -5
package/CHANGELOG.md +194 -15
package/CONTRIBUTING.md +2 -2
package/README.ja.md +74 -9
package/README.ko.md +77 -12
package/README.md +127 -25
package/README.zh.md +43 -9
package/assets/README.md +86 -0
package/assets/architecture.svg +100 -0
package/assets/banner.png +0 -0
package/assets/banner.svg +53 -0
package/assets/demo/01-install.gif +0 -0
package/assets/demo/01-install.tape +54 -0
package/assets/demo/02-compound-learning.gif +0 -0
package/assets/demo/02-compound-learning.tape +50 -0
package/assets/demo/03-forge-personalization.gif +0 -0
package/assets/demo/03-forge-personalization.tape +64 -0
package/assets/demo/before-after.gif +0 -0
package/assets/demo/before-after.tape +98 -0
package/assets/demo-preview.svg +96 -0
package/assets/icon.png +0 -0
package/{hooks → assets/shared}/hook-registry.json +2 -1
package/dist/checks/conclusion-verification-ratio.d.ts +37 -0
package/dist/checks/conclusion-verification-ratio.js +86 -0
package/dist/checks/fact-vs-agreement.d.ts +47 -0
package/dist/checks/fact-vs-agreement.js +92 -0
package/dist/checks/self-score-deflation.d.ts +38 -0
package/dist/checks/self-score-deflation.js +108 -0
package/dist/cli.js +98 -6
package/dist/core/auto-compound-runner.js +137 -49
package/dist/core/behavior-classifier.d.ts +28 -0
package/dist/core/behavior-classifier.js +46 -0
package/dist/core/dashboard.d.ts +7 -0
package/dist/core/dashboard.js +41 -2
package/dist/core/doctor.js +118 -5
package/dist/core/extraction-notice.d.ts +18 -0
package/dist/core/extraction-notice.js +64 -0
package/dist/core/git-stats.d.ts +36 -0
package/dist/core/git-stats.js +79 -0
package/dist/core/harness.d.ts +1 -1
package/dist/core/harness.js +27 -20
package/dist/core/host-detect.d.ts +42 -0
package/dist/core/host-detect.js +68 -0
package/dist/core/init-cli.d.ts +26 -0
package/dist/core/init-cli.js +104 -0
package/dist/core/init.js +17 -0
package/dist/core/inspect-cli.js +1 -2
package/dist/core/installer.js +2 -2
package/dist/core/migrate-cli.d.ts +11 -0
package/dist/core/migrate-cli.js +53 -0
package/dist/core/migrate-evidence-host.d.ts +36 -0
package/dist/core/migrate-evidence-host.js +49 -0
package/dist/core/paths.d.ts +8 -1
package/dist/core/paths.js +11 -2
package/dist/core/recall-cli.d.ts +26 -0
package/dist/core/recall-cli.js +125 -0
package/dist/core/recall-reference-detector.d.ts +43 -0
package/dist/core/recall-reference-detector.js +65 -0
package/dist/core/settings-injector.js +4 -2
package/dist/core/spawn.d.ts +1 -1
package/dist/core/spawn.js +4 -11
package/dist/core/stats-cli.d.ts +21 -0
package/dist/core/stats-cli.js +133 -10
package/dist/core/trust-layer-intent.d.ts +35 -0
package/dist/core/trust-layer-intent.js +30 -0
package/dist/core/types.d.ts +1 -1
package/dist/core/uninstall.js +2 -1
package/dist/engine/compound-cli.js +1 -0
package/dist/engine/compound-export.js +8 -3
package/dist/engine/compound-extractor.js +7 -9
package/dist/engine/learn-cli.js +5 -6
package/dist/engine/lifecycle/bypass-detector.d.ts +6 -1
package/dist/engine/lifecycle/bypass-detector.js +57 -5
package/dist/engine/lifecycle/lifecycle-cli.js +4 -4
package/dist/engine/lifecycle/meta-reclassifier.js +3 -3
package/dist/engine/lifecycle/orchestrator.js +2 -2
package/dist/engine/lifecycle/signals.js +6 -6
package/dist/engine/meta-learning/session-quality-scorer.d.ts +1 -6
package/dist/engine/meta-learning/session-quality-scorer.js +2 -21
package/dist/engine/skill-promoter.js +3 -6
package/dist/fgx.js +2 -1
package/dist/forge/evidence-processor.js +12 -0
package/dist/forge/onboarding.d.ts +3 -2
package/dist/forge/onboarding.js +3 -2
package/dist/hooks/context-guard.js +1 -1
package/dist/hooks/dangerous-patterns.json +3 -3
package/dist/hooks/db-guard.js +21 -5
package/dist/hooks/forge-loop-progress.d.ts +9 -0
package/dist/hooks/forge-loop-progress.js +38 -0
package/dist/hooks/hook-registry.js +1 -1
package/dist/hooks/hooks-generator.d.ts +15 -1
package/dist/hooks/hooks-generator.js +18 -16
package/dist/hooks/intent-classifier.js +1 -1
package/dist/hooks/keyword-detector.js +2 -2
package/dist/hooks/notepad-injector.js +1 -1
package/dist/hooks/permission-handler.js +1 -1
package/dist/hooks/post-tool-failure.js +1 -1
package/dist/hooks/post-tool-use.d.ts +7 -1
package/dist/hooks/post-tool-use.js +50 -23
package/dist/hooks/pre-compact.js +2 -2
package/dist/hooks/pre-tool-use.d.ts +7 -0
package/dist/hooks/pre-tool-use.js +28 -10
package/dist/hooks/rate-limiter.js +3 -3
package/dist/hooks/secret-filter.js +1 -1
package/dist/hooks/session-recovery.js +12 -1
package/dist/hooks/shared/blocking-allowlist.d.ts +28 -0
package/dist/hooks/shared/blocking-allowlist.js +38 -0
package/dist/hooks/shared/command-parser.d.ts +44 -0
package/dist/hooks/shared/command-parser.js +50 -0
package/dist/hooks/shared/forge-loop-state.d.ts +36 -0
package/dist/hooks/shared/forge-loop-state.js +116 -0
package/dist/hooks/shared/hook-response.d.ts +30 -2
package/dist/hooks/shared/hook-response.js +61 -3
package/dist/hooks/skill-injector.js +2 -2
package/dist/hooks/slop-detector.js +2 -2
package/dist/hooks/solution-injector.d.ts +9 -0
package/dist/hooks/solution-injector.js +48 -5
package/dist/hooks/stop-guard.js +152 -13
package/dist/hooks/subagent-tracker.js +1 -1
package/dist/host/capabilities-claude.d.ts +8 -0
package/dist/host/capabilities-claude.js +46 -0
package/dist/host/capabilities-codex.d.ts +11 -0
package/dist/host/capabilities-codex.js +50 -0
package/dist/host/capabilities-registry.d.ts +11 -0
package/dist/host/capabilities-registry.js +30 -0
package/dist/host/codex-adapter.d.ts +8 -5
package/dist/host/codex-adapter.js +10 -82
package/dist/host/codex-output-parser.d.ts +39 -0
package/dist/host/codex-output-parser.js +75 -0
package/dist/host/exec-host.d.ts +54 -0
package/dist/host/exec-host.js +92 -0
package/dist/host/host-runtime.d.ts +37 -0
package/dist/host/host-runtime.js +51 -0
package/dist/host/install-claude.d.ts +35 -0
package/dist/host/install-claude.js +238 -0
package/dist/host/install-codex.d.ts +44 -0
package/dist/host/install-codex.js +276 -0
package/dist/host/install-orchestrator.d.ts +34 -0
package/dist/host/install-orchestrator.js +126 -0
package/dist/host/invoke-agent.d.ts +27 -0
package/dist/host/invoke-agent.js +115 -0
package/dist/host/parity-harness.d.ts +62 -0
package/dist/host/parity-harness.js +283 -0
package/dist/host/projection.d.ts +35 -0
package/dist/host/projection.js +126 -0
package/dist/i18n/index.js +3 -5
package/dist/mcp/server.js +11 -0
package/dist/mcp/tools.js +47 -0
package/dist/services/session.d.ts +6 -3
package/dist/services/session.js +33 -4
package/dist/store/evidence-store.d.ts +1 -0
package/dist/store/evidence-store.js +45 -3
package/dist/store/host-mismatch.d.ts +42 -0
package/dist/store/host-mismatch.js +65 -0
package/dist/store/implicit-feedback-store.d.ts +59 -0
package/dist/store/implicit-feedback-store.js +153 -0
package/dist/store/profile-store.d.ts +29 -0
package/dist/store/profile-store.js +53 -0
package/dist/store/rule-store.js +8 -0
package/dist/store/types.d.ts +13 -0
package/hooks/hooks.json +6 -1
package/package.json +7 -5
package/plugin.json +4 -4
package/scripts/postinstall.js +100 -25
/package/{agents → assets/claude/agents}/analyst.md +0 -0
/package/{agents → assets/claude/agents}/architect.md +0 -0
/package/{agents → assets/claude/agents}/code-reviewer.md +0 -0
/package/{agents → assets/claude/agents}/critic.md +0 -0
/package/{agents → assets/claude/agents}/debugger.md +0 -0
/package/{agents → assets/claude/agents}/designer.md +0 -0
/package/{agents → assets/claude/agents}/executor.md +0 -0
/package/{agents → assets/claude/agents}/explore.md +0 -0
/package/{agents → assets/claude/agents}/git-master.md +0 -0
/package/{agents → assets/claude/agents}/planner.md +0 -0
/package/{agents → assets/claude/agents}/solution-evolver.md +0 -0
/package/{agents → assets/claude/agents}/test-engineer.md +0 -0
/package/{agents → assets/claude/agents}/verifier.md +0 -0
/package/{commands → assets/claude/commands}/architecture-decision.md +0 -0
/package/{commands → assets/claude/commands}/calibrate.md +0 -0
/package/{commands → assets/claude/commands}/code-review.md +0 -0
/package/{commands → assets/claude/commands}/compound.md +0 -0
/package/{commands → assets/claude/commands}/deep-interview.md +0 -0
/package/{commands → assets/claude/commands}/docker.md +0 -0
/package/{commands → assets/claude/commands}/forge-loop.md +0 -0
/package/{commands → assets/claude/commands}/learn.md +0 -0
/package/{commands → assets/claude/commands}/retro.md +0 -0
/package/{commands → assets/claude/commands}/ship.md +0 -0

package/assets/demo/02-compound-learning.tape ADDED Viewed

@@ -0,0 +1,50 @@
+# forgen — Compound Learning Demo
+# Shows: Claude using accumulated knowledge → auto-compound extracting patterns
+Output assets/demo/02-compound-learning.gif
+Set Shell "zsh"
+Set FontFamily "JetBrains Mono"
+Set FontSize 15
+Set Width 1200
+Set Height 700
+Set Padding 20
+Set Theme "Catppuccin Mocha"
+Set TypingSpeed 35ms
+Set WindowBar Colorful
+Set BorderRadius 10
+Set Margin 20
+Set MarginFill "#1e1e2e"
+Hide
+Type "cd /tmp/forgen-demo && clear"
+Enter
+Sleep 1s
+Show
+# Step 1: Ask Claude about TDD — compound should inject knowledge
+Type "claude -p 'tdd 방식으로 isPrime 함수 만들어줘' --allowedTools Bash,Write,Edit"
+Sleep 500ms
+Enter
+Sleep 15s
+# Step 2: Show compound solutions matched
+Type "# Compound matched starter-tdd-red-green-refactor"
+Enter
+Sleep 2s
+# Step 3: Search compound knowledge via MCP
+Type "claude -p 'compound-search MCP 도구로 typescript를 검색해줘'"
+Sleep 500ms
+Enter
+Sleep 10s
+# Step 4: Show accumulated solutions
+Type "ls ~/.compound/me/solutions/ | wc -l"
+Sleep 500ms
+Enter
+Sleep 1s
+Type "# Knowledge grows with every session"
+Enter
+Sleep 3s

package/assets/demo/03-forge-personalization.gif ADDED Viewed

Binary file

package/assets/demo/03-forge-personalization.tape ADDED Viewed

@@ -0,0 +1,64 @@
+# forgen — Forge Personalization Demo
+# Shows: forge interview → profile generated → personalized config
+Output assets/demo/03-forge-personalization.gif
+Set Shell "zsh"
+Set FontFamily "JetBrains Mono"
+Set FontSize 15
+Set Width 1200
+Set Height 700
+Set Padding 20
+Set Theme "Catppuccin Mocha"
+Set TypingSpeed 35ms
+Set WindowBar Colorful
+Set BorderRadius 10
+Set Margin 20
+Set MarginFill "#1e1e2e"
+Hide
+Type "cd /tmp/forgen-demo && clear"
+Enter
+Sleep 1s
+Show
+# Step 1: Start forge
+Type "forgen forge"
+Sleep 500ms
+Enter
+Sleep 3s
+# Answer questions (simulated — quality-focused developer)
+Type "2"
+Enter
+Sleep 2s
+Type "1"
+Enter
+Sleep 2s
+Type "2"
+Enter
+Sleep 2s
+Type "1"
+Enter
+Sleep 2s
+Type "2"
+Enter
+Sleep 2s
+# Wait for profile generation
+Sleep 5s
+# Step 2: Show generated rules
+Type "cat .claude/rules/forge-quality.md | head -15"
+Sleep 500ms
+Enter
+Sleep 3s
+# Step 3: Show that Claude behavior is now personalized
+Type "# Claude is now tuned to YOUR coding style"
+Enter
+Sleep 3s

package/assets/demo/before-after.gif ADDED Viewed

Binary file

package/assets/demo/before-after.tape ADDED Viewed

@@ -0,0 +1,98 @@
+# forgen — Same Tool, Different Developer
+# Shows how forge adapts Claude to YOUR coding style
+Output assets/demo/before-after.gif
+Set Shell "zsh"
+Set FontFamily "JetBrains Mono"
+Set FontSize 14
+Set Width 1200
+Set Height 750
+Set Padding 20
+Set Theme "Catppuccin Mocha"
+Set TypingSpeed 25ms
+Set WindowBar Colorful
+Set BorderRadius 10
+Set Margin 20
+Set MarginFill "#1e1e2e"
+# ═══════════════════════════════════════
+# Developer A: Senior — wants terse, severity-only
+# ═══════════════════════════════════════
+Hide
+Type `TMPDIR=$(mktemp -d) && cd "$TMPDIR" && git init -q && git config user.email "t@t" && git config user.name "T" && mkdir -p .claude/rules && cat > .claude/rules/forge-communication.md << 'EOF'`
+Enter
+Type "# Forgen Forge — Communication Style (terse profile)"
+Enter
+Type "- Keep responses under 3 sentences unless showing code"
+Enter
+Type "- No preamble or trailing summary"
+Enter
+Type "- For code review: use [SEVERITY] format only"
+Enter
+Type "EOF"
+Enter
+Type "clear"
+Enter
+Sleep 1s
+Show
+Type "echo '  Developer A: Senior engineer — prefers terse, severity-only'"
+Enter
+Sleep 2s
+Type "cat .claude/rules/forge-communication.md"
+Enter
+Sleep 3s
+Type@20ms `claude -p "이 코드를 리뷰해줘: function add(a, b) { let result = a + b; return result; } 파일은 만들지 마."`
+Sleep 500ms
+Enter
+Sleep 20s
+Sleep 5s
+# ═══════════════════════════════════════
+# Developer B: Junior — wants explanations & examples
+# ═══════════════════════════════════════
+Hide
+Type `TMPDIR2=$(mktemp -d) && cd "$TMPDIR2" && git init -q && git config user.email "t@t" && git config user.name "T" && mkdir -p .claude/rules && cat > .claude/rules/forge-communication.md << 'EOF'`
+Enter
+Type "# Forgen Forge — Communication Style (educational profile)"
+Enter
+Type "- Explain reasoning and trade-offs for every suggestion"
+Enter
+Type "- Include examples showing what could go wrong"
+Enter
+Type "- Teach concepts — explain the why not just the what"
+Enter
+Type "EOF"
+Enter
+Type "clear"
+Enter
+Sleep 1s
+Show
+Type ""
+Enter
+Type "echo '  Developer B: Junior engineer — wants explanations & examples'"
+Enter
+Sleep 2s
+Type "cat .claude/rules/forge-communication.md"
+Enter
+Sleep 3s
+Type@20ms `claude -p "이 코드를 리뷰해줘: function add(a, b) { let result = a + b; return result; } 파일은 만들지 마."`
+Sleep 500ms
+Enter
+Sleep 25s
+Sleep 3s
+Type ""
+Enter
+Type "echo '  Same question. Same tool. Different developer. ⚡'"
+Enter
+Sleep 5s

package/assets/demo-preview.svg ADDED Viewed

@@ -0,0 +1,96 @@
+<svg xmlns="http://www.w3.org/2000/svg" width="800" height="340" viewBox="0 0 800 340">
+  <style>
+    .term { font-family: 'JetBrains Mono', 'Fira Code', 'Cascadia Code', 'SF Mono', monospace; font-size: 13px; }
+    .prompt { fill: #a6e3a1; }
+    .cmd { fill: #cdd6f4; }
+    .tag { fill: #89b4fa; }
+    .haiku { fill: #f9e2af; }
+    .sonnet { fill: #a6e3a1; }
+    .opus { fill: #cba6f7; }
+    .dim { fill: #6c7086; }
+    .box { fill: #a6e3a1; }
+    @keyframes typeIn { from { opacity: 0; } to { opacity: 1; } }
+    @keyframes fadeIn { 0% { opacity: 0; } 100% { opacity: 1; } }
+    @keyframes blink { 0%, 100% { opacity: 0.8; } 50% { opacity: 0; } }
+    .line1 { animation: typeIn 0.1s 0.3s both; }
+    .line2 { animation: fadeIn 0.2s 0.8s both; }
+    .line3 { animation: fadeIn 0.2s 1.1s both; }
+    .line4 { animation: fadeIn 0.2s 1.4s both; }
+    .line5 { animation: fadeIn 0.2s 1.7s both; }
+    .line6 { animation: fadeIn 0.2s 2.0s both; }
+    .line7 { animation: fadeIn 0.3s 2.5s both; }
+    .cursor { animation: blink 1s 2.8s infinite; }
+  </style>
+  <!-- Terminal window -->
+  <rect width="800" height="340" rx="10" ry="10" fill="#1e1e2e"/>
+  <rect width="800" height="36" rx="10" ry="10" fill="#313244"/>
+  <rect y="26" width="800" height="10" fill="#313244"/>
+  <!-- Traffic lights -->
+  <circle cx="20" cy="18" r="6" fill="#f38ba8"/>
+  <circle cx="40" cy="18" r="6" fill="#f9e2af"/>
+  <circle cx="60" cy="18" r="6" fill="#a6e3a1"/>
+  <text x="400" y="23" text-anchor="middle" class="term" font-size="12" fill="#6c7086">forgen — terminal</text>
+  <!-- Line 1: command -->
+  <g class="line1">
+    <text x="24" y="68" class="term prompt">$</text>
+    <text x="40" y="68" class="term cmd">forgen</text>
+  </g>
+  <!-- Line 2: philosophy -->
+  <g class="line2">
+    <text x="24" y="96" class="term tag">[forgen]</text>
+    <text x="96" y="96" class="term cmd">Philosophy: </text>
+    <text x="194" y="96" class="term" fill="#f9e2af">my-engineering</text>
+    <text x="310" y="96" class="term dim"> (global)</text>
+  </g>
+  <!-- Line 3: scope -->
+  <g class="line3">
+    <text x="24" y="120" class="term tag">[forgen]</text>
+    <text x="96" y="120" class="term cmd">Scope: Me(5) │ 3 rules, 2 solutions</text>
+  </g>
+  <!-- Line 4: routing -->
+  <g class="line4">
+    <text x="24" y="144" class="term tag">[forgen]</text>
+    <text x="96" y="144" class="term cmd">Routing: </text>
+    <text x="172" y="144" class="term haiku">haiku:3</text>
+    <text x="232" y="144" class="term dim"> │ </text>
+    <text x="256" y="144" class="term sonnet">sonnet:5</text>
+    <text x="324" y="144" class="term dim"> │ </text>
+    <text x="348" y="144" class="term opus">opus:4</text>
+  </g>
+  <!-- Line 5: pack -->
+  <g class="line5">
+    <text x="24" y="168" class="term tag">[forgen]</text>
+    <text x="96" y="168" class="term cmd">Pack: backend v1.0.0 (5 rules, 3 solutions)</text>
+  </g>
+  <!-- Line 6: launching -->
+  <g class="line6">
+    <text x="24" y="192" class="term tag">[forgen]</text>
+    <text x="96" y="192" class="term cmd">Starting Claude Code...</text>
+  </g>
+  <!-- Separator -->
+  <g class="line7">
+    <line x1="24" y1="212" x2="776" y2="212" stroke="#313244" stroke-width="1"/>
+    <!-- Claude Code box -->
+    <text x="24" y="236" class="term dim">╭──────────────────────────────────────────────────╮</text>
+    <text x="24" y="256" class="term dim">│</text>
+    <text x="40" y="256" class="term box"> ✓ Claude Code (philosophy-driven mode)</text>
+    <text x="430" y="256" class="term dim">│</text>
+    <text x="24" y="276" class="term dim">│</text>
+    <text x="40" y="276" class="term" fill="#cdd6f4">   19 agents │ 19 skills │ 18 hooks loaded</text>
+    <text x="430" y="276" class="term dim">│</text>
+    <text x="24" y="296" class="term dim">╰──────────────────────────────────────────────────╯</text>
+    <!-- Blinking cursor -->
+    <rect x="24" y="310" width="8" height="16" fill="#cdd6f4" class="cursor"/>
+  </g>
+</svg>

package/assets/icon.png ADDED Viewed

Binary file

package/{hooks → assets/shared}/hook-registry.json RENAMED Viewed

@@ -18,5 +18,6 @@
   { "name": "subagent-tracker-stop",  "tier": "workflow",      "event": "SubagentStop",       "matcher": "*",          "script": "hooks/subagent-tracker.js stop",  "timeout": 2, "compoundCritical": false },
   { "name": "post-tool-failure",      "tier": "workflow",      "event": "PostToolUseFailure", "matcher": "*",          "script": "hooks/post-tool-failure.js",      "timeout": 3, "compoundCritical": false },
   { "name": "solution-injector",     "tier": "compound-core", "event": "UserPromptSubmit",   "matcher": "*",          "script": "hooks/solution-injector.js",      "timeout": 5, "compoundCritical": true  },
-  { "name": "skill-injector",        "tier": "compound-core", "event": "UserPromptSubmit",   "matcher": "*",          "script": "hooks/skill-injector.js",         "timeout": 5, "compoundCritical": true  }
+  { "name": "skill-injector",        "tier": "compound-core", "event": "UserPromptSubmit",   "matcher": "*",          "script": "hooks/skill-injector.js",         "timeout": 5, "compoundCritical": true  },
+  { "name": "forge-loop-progress",   "tier": "compound-core", "event": "UserPromptSubmit",   "matcher": "*",          "script": "hooks/forge-loop-progress.js",    "timeout": 2, "compoundCritical": false }
 ]

package/dist/checks/conclusion-verification-ratio.d.ts ADDED Viewed

@@ -0,0 +1,37 @@
+/**
+ * Forgen v0.4.1 — TEST-3: 결론 vs 검증 비율 가드
+ *
+ * Claude 응답 텍스트에서 **결론 키워드** 와 **검증 키워드** 빈도 비율을 측정.
+ * 결론 / 검증 > 3 이면 "결론을 쏟아내지만 검증이 부족한" 합의-기반 완료 선언
+ * 패턴 — stop-guard 에서 block.
+ *
+ * 배경 (RC3): v0.4.0 self-interview 에서 "통과했다 / 완료됐다" 같은 결론이
+ *   한 응답에 5~8회 반복되지만 "테스트 실행했나 / 증거가 뭔가" 관련 표현은
+ *   0회인 케이스 반복 관찰. TEST-1 이 "측정 도구 호출 0건" 을 봤다면, TEST-3
+ *   은 같은 문제를 **텍스트-내부** 비율로 잡는다 (도구 호출이 있어도 서술이
+ *   결론-편향이면 감지).
+ *
+ * 순수 함수 — Stop hook 이 `block_message` 로 주입할 수 있도록 reason 문자열을
+ * 직접 반환.
+ */
+export interface RatioCheckInput {
+    text: string;
+    /** 비율 임계값. 기본 3 (결론이 검증의 3배 넘으면 block). */
+    threshold?: number;
+    /**
+     * 결론/검증 둘 다 합쳐 이 개수 미만이면 판정 보류 (sparse text).
+     * 기본 4 — 짧은 1-2줄 응답에 오탐 방지.
+     */
+    minTotal?: number;
+}
+export interface RatioCheckResult {
+    /** true = 결론 편향 감지 — block 후보. */
+    block: boolean;
+    conclusionCount: number;
+    verificationCount: number;
+    /** 검증이 0이면 Infinity, 아니면 결론/검증. */
+    ratio: number;
+    /** block 시 stop-guard block_message 로 주입할 사람-읽기 문장. */
+    reason: string;
+}
+export declare function checkConclusionVerificationRatio(input: RatioCheckInput): RatioCheckResult;

package/dist/checks/conclusion-verification-ratio.js ADDED Viewed

@@ -0,0 +1,86 @@
+/**
+ * Forgen v0.4.1 — TEST-3: 결론 vs 검증 비율 가드
+ *
+ * Claude 응답 텍스트에서 **결론 키워드** 와 **검증 키워드** 빈도 비율을 측정.
+ * 결론 / 검증 > 3 이면 "결론을 쏟아내지만 검증이 부족한" 합의-기반 완료 선언
+ * 패턴 — stop-guard 에서 block.
+ *
+ * 배경 (RC3): v0.4.0 self-interview 에서 "통과했다 / 완료됐다" 같은 결론이
+ *   한 응답에 5~8회 반복되지만 "테스트 실행했나 / 증거가 뭔가" 관련 표현은
+ *   0회인 케이스 반복 관찰. TEST-1 이 "측정 도구 호출 0건" 을 봤다면, TEST-3
+ *   은 같은 문제를 **텍스트-내부** 비율로 잡는다 (도구 호출이 있어도 서술이
+ *   결론-편향이면 감지).
+ *
+ * 순수 함수 — Stop hook 이 `block_message` 로 주입할 수 있도록 reason 문자열을
+ * 직접 반환.
+ */
+/** 결론 키워드 — 상태를 단정적으로 선언하는 어휘. */
+const CONCLUSION_PATTERNS = [
+    /\b(pass(es|ed)?|passing)\b/gi,
+    /\b(done|ready|shipped|finished|complete)\b/gi,
+    /\bLGTM\b/g,
+    /\bconfirmed\b/gi,
+    /\bverified\b/gi,
+    /\bvalidated\b/gi,
+    /(통과(했|됐|함|합니다))/g,
+    /(완료(했|됐|됨|됐습니다))/g,
+    /(성공(했|했습니다|적))/g,
+    /(동작(합니다|함|한다))/g,
+];
+/** 검증 키워드 — 측정/확인/실행 행위를 서술하는 어휘. */
+const VERIFICATION_PATTERNS = [
+    /\b(test(s|ed|ing)?|tested)\b/gi,
+    /\b(verify|verifying|verification)\b/gi,
+    /\b(check(ed|ing)?)\b/gi,
+    /\b(run|ran|running)\b/gi,
+    /\b(measure(d|ment)?)\b/gi,
+    /\bevidence\b/gi,
+    /증거/g,
+    /테스트/g,
+    /확인/g,
+    /검증/g,
+    /실행/g,
+    /측정/g,
+];
+function countMatches(text, patterns) {
+    let n = 0;
+    for (const p of patterns) {
+        const m = text.match(p);
+        if (m)
+            n += m.length;
+    }
+    return n;
+}
+export function checkConclusionVerificationRatio(input) {
+    const threshold = input.threshold ?? 3;
+    const minTotal = input.minTotal ?? 4;
+    const conclusionCount = countMatches(input.text, CONCLUSION_PATTERNS);
+    const verificationCount = countMatches(input.text, VERIFICATION_PATTERNS);
+    const total = conclusionCount + verificationCount;
+    const ratio = verificationCount === 0
+        ? (conclusionCount === 0 ? 0 : Infinity)
+        : conclusionCount / verificationCount;
+    // sparse text → 판정 보류
+    if (total < minTotal) {
+        return {
+            block: false,
+            conclusionCount,
+            verificationCount,
+            ratio,
+            reason: '',
+        };
+    }
+    // 결론이 전혀 없으면 비율 자체가 의미 없음
+    if (conclusionCount === 0) {
+        return { block: false, conclusionCount, verificationCount, ratio, reason: '' };
+    }
+    const block = ratio > threshold;
+    let reason = '';
+    if (block) {
+        reason =
+            verificationCount === 0
+                ? `결론 ${conclusionCount}건 vs 검증 0건. 완료 선언 전에 실제 실행/측정 증거 (npm test, curl, Read 결과 등) 를 턴에 포함시켜 재응답.`
+                : `결론/검증 비율 ${ratio.toFixed(1)} (${conclusionCount}/${verificationCount}) > ${threshold}. 결론에 비해 검증 서술이 적음 — 증거(실행 결과/측정값) 를 추가하여 재응답.`;
+    }
+    return { block, conclusionCount, verificationCount, ratio, reason };
+}

package/dist/checks/fact-vs-agreement.d.ts ADDED Viewed

@@ -0,0 +1,47 @@
+/**
+ * Forgen v0.4.1 — TEST-1: 사실 vs 합의 가드
+ *
+ * 목적: Claude 가 "동작합니다 / 통과했습니다 / 검증됐습니다" 같은 **사실 주장**을
+ *   내놓을 때, 그 턴(또는 최근 N턴)에 실제 측정/검증을 수행한 도구 호출이 있었는가?
+ *   측정 없이 합의(agreement)만으로 사실로 변환된다면 alert.
+ *
+ * 배경 (RC1): v0.4.0 릴리즈 직전 self-assessment 에서 점수가 조금씩 올라가는데
+ *   측정 도구 호출은 0건인 케이스가 반복. 메타 점수 인플레이션 (TEST-2 / US-13)
+ *   의 직전 단계. 여기서는 alert 레벨까지만 — block 은 TEST-2 에서.
+ *
+ * 순수 함수 설계: I/O 없이 텍스트 + 측정 신호 메타데이터만 받아 판정.
+ *   Stop hook / session scorer / CLI 어느 쪽에서도 호출 가능.
+ */
+/** TEST-1 판정 입력. */
+export interface FactCheckInput {
+    /** Claude 의 최근 턴 응답 텍스트. */
+    text: string;
+    /**
+     * 최근 N 턴에서 실행된 도구 이름 목록 (중복 OK). 없으면 빈 배열.
+     * 호출지가 0턴/전체 세션 등 윈도우를 결정한다.
+     */
+    recentTools: string[];
+    /**
+     * optional: 측정으로 간주할 최소 tool count. 기본 1.
+     * 빌드/테스트같은 확정 측정 1회면 충분하다고 간주.
+     */
+    minMeasurements?: number;
+}
+export interface FactCheckResult {
+    /** true = 측정 없는 사실-주장 감지, alert 필요. */
+    alert: boolean;
+    /** 매칭된 사실-주장 키워드 (최대 3개). */
+    factAssertions: string[];
+    /** 감지된 합의/추측 신호 (최대 3개). */
+    agreementSofteners: string[];
+    /** 관찰된 측정성 도구 호출 수. */
+    measurementCount: number;
+    /** 호출지가 surface 하기 좋은 사람-읽기 이유. */
+    reason: string;
+}
+/**
+ * 핵심 판정 — 텍스트에 사실-주장이 있고 측정 도구가 없으면 alert.
+ * 측정이 있거나 사실-주장이 없으면 alert=false.
+ * 합의 softener 는 참고용 — softener 많을수록 reason 에 경고 추가.
+ */
+export declare function checkFactVsAgreement(input: FactCheckInput): FactCheckResult;

package/dist/checks/fact-vs-agreement.js ADDED Viewed

@@ -0,0 +1,92 @@
+/**
+ * Forgen v0.4.1 — TEST-1: 사실 vs 합의 가드
+ *
+ * 목적: Claude 가 "동작합니다 / 통과했습니다 / 검증됐습니다" 같은 **사실 주장**을
+ *   내놓을 때, 그 턴(또는 최근 N턴)에 실제 측정/검증을 수행한 도구 호출이 있었는가?
+ *   측정 없이 합의(agreement)만으로 사실로 변환된다면 alert.
+ *
+ * 배경 (RC1): v0.4.0 릴리즈 직전 self-assessment 에서 점수가 조금씩 올라가는데
+ *   측정 도구 호출은 0건인 케이스가 반복. 메타 점수 인플레이션 (TEST-2 / US-13)
+ *   의 직전 단계. 여기서는 alert 레벨까지만 — block 은 TEST-2 에서.
+ *
+ * 순수 함수 설계: I/O 없이 텍스트 + 측정 신호 메타데이터만 받아 판정.
+ *   Stop hook / session scorer / CLI 어느 쪽에서도 호출 가능.
+ */
+/**
+ * 측정성 도구 — 실행 결과가 사실 주장을 뒷받침할 수 있는 카테고리.
+ *
+ * v0.4.1 coverage fix: TEST-2 와 같은 논리로, Read/Edit/Write/Grep/Glob 은 파일
+ * 내용 확인/수정이지 "통과/검증/완료" 같은 실 실행 주장을 뒷받침 못 함. 오직
+ * Bash (실 실행) + NotebookEdit (실행 결과) 만 strong measurement.
+ *
+ * 이전 넓은 집합은 신규 사용자 시나리오 (buyer-day1 R4) 에서 Claude 가 Read
+ * 한 번만 해도 alert 회피 → TEST-1 본 의도 훼손.
+ */
+const MEASUREMENT_TOOL_CATEGORIES = new Set([
+    'Bash',
+    'NotebookEdit',
+]);
+/** 사실-주장 키워드 — "측정됐다/검증됐다" 류 강한 확정 언어. */
+const FACT_ASSERTION_PATTERNS = [
+    /\b(pass(es|ed)?|passing)\b/i,
+    /\bverified\b/i,
+    /\bconfirmed\b/i,
+    /\bvalidated\b/i,
+    /\ball tests? pass/i,
+    /(통과(했|됐|함|합니다))/,
+    /(검증(됐|했|됨|완료))/,
+    /(동작(합니다|함|한다))/,
+    /(성공(했|했습니다|적))/,
+    /(완료(했|됐|됨|됐습니다))/,
+];
+/** 합의/추측 표현 — 측정 없이 확언으로 가는 다리. 이 패턴이 많으면 합의→사실 전환 위험. */
+const AGREEMENT_SOFTENERS = [
+    /\b(should|would|might)\s+(work|pass)/i,
+    /\blikely\b/i,
+    /\bprobably\b/i,
+    /(생각합니다|생각함|생각해|봅니다|예상(합니다|돼))/,
+    /(그럴\s*것\s*같|맞을\s*것\s*같)/,
+];
+function findMatches(text, patterns, max = 3) {
+    const out = [];
+    for (const p of patterns) {
+        if (out.length >= max)
+            break;
+        const m = text.match(p);
+        if (m)
+            out.push(m[0]);
+    }
+    return out;
+}
+/**
+ * 핵심 판정 — 텍스트에 사실-주장이 있고 측정 도구가 없으면 alert.
+ * 측정이 있거나 사실-주장이 없으면 alert=false.
+ * 합의 softener 는 참고용 — softener 많을수록 reason 에 경고 추가.
+ */
+export function checkFactVsAgreement(input) {
+    const { text, recentTools } = input;
+    const minMeasurements = input.minMeasurements ?? 1;
+    const factAssertions = findMatches(text, FACT_ASSERTION_PATTERNS);
+    const agreementSofteners = findMatches(text, AGREEMENT_SOFTENERS);
+    const measurementCount = recentTools.filter((t) => MEASUREMENT_TOOL_CATEGORIES.has(t)).length;
+    const hasFactAssertion = factAssertions.length > 0;
+    const measurementMissing = measurementCount < minMeasurements;
+    const alert = hasFactAssertion && measurementMissing;
+    let reason = '';
+    if (alert) {
+        const parts = [];
+        parts.push(`사실-주장 키워드 ${factAssertions.length}건 감지 ("${factAssertions.join('", "')}")`);
+        parts.push(`그러나 최근 측정 도구 호출 ${measurementCount}회 (< ${minMeasurements})`);
+        if (agreementSofteners.length > 0) {
+            parts.push(`합의성 표현 ${agreementSofteners.length}건 (${agreementSofteners.join(', ')})`);
+        }
+        reason = parts.join('. ');
+    }
+    return {
+        alert,
+        factAssertions,
+        agreementSofteners,
+        measurementCount,
+        reason,
+    };
+}

package/dist/checks/self-score-deflation.d.ts ADDED Viewed

@@ -0,0 +1,38 @@
+/**
+ * Forgen v0.4.1 — TEST-2: 자가 점수 인플레이션 가드
+ *
+ * Claude 가 자신의 작업 품질/확신도/완성도를 **숫자**로 상향 선언하면서 해당
+ * 턴(또는 세션)에 측정 도구 호출이 0 건이면 block. TEST-1 (사실 vs 합의) 보다
+ * 강한 신호 — 구체적 숫자 인플레이션은 합의-기반 자기-아부(sycophancy)의
+ * 가장 또렷한 표식.
+ *
+ * 배경 (RC2): v0.4.0 self-interview 에서 "8/10", "신뢰도 90%", "0.85 → 0.95"
+ *   같은 자가 점수가 턴마다 올라갔지만 `npm test` / `curl` / `Read` 등 실제
+ *   측정 호출은 0건. TEST-1 이 서술체 사실 주장을 잡았다면, TEST-2 는 **숫자**
+ *   점수의 인플레이션에 초점을 맞춘다.
+ *
+ * 순수 함수 — Stop hook block 경로에 붙는다.
+ */
+export interface SelfScoreCheckInput {
+    text: string;
+    /** 이번 턴(또는 윈도우) 내 실행된 도구 이름 목록. */
+    recentTools: string[];
+    /** score delta 임계 — 이 이상의 증가를 인플레이션으로 간주. 기본 0 (모든 상승). */
+    minDelta?: number;
+    /** 측정 도구 최소 호출 수 — 기본 1. */
+    minMeasurements?: number;
+}
+export interface SelfScoreCheckResult {
+    /** true = 자가 점수 인플레이션 감지 (측정 없이 숫자 증가 선언). block 대상. */
+    block: boolean;
+    /** 매칭된 점수 표현 raw 스트링 (최대 3개). */
+    scoreSignals: string[];
+    /** 감지된 positive delta 목록 (from → to). */
+    deltas: Array<{
+        from: number;
+        to: number;
+    }>;
+    measurementCount: number;
+    reason: string;
+}
+export declare function checkSelfScoreInflation(input: SelfScoreCheckInput): SelfScoreCheckResult;