npm - @heytherevibin/skillforge - Versions diffs - 0.7.0 → 0.10.0 - Mend

@heytherevibin/skillforge 0.7.0 → 0.10.0

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (35) hide show

package/CHANGELOG.md +29 -0
package/CONTRIBUTING.md +30 -19
package/README.md +248 -198
package/RELEASING.md +19 -7
package/SECURITY.md +61 -13
package/STRATEGY.md +40 -14
package/bin/cli.js +112 -5
package/ci/bundle-gate.json +4 -0
package/lib/host-setup.js +312 -0
package/lib/templates/claude-code-skillforge-global.md +19 -0
package/lib/templates/cursor-skillforge-global.md +16 -0
package/package.json +3 -2
package/python/app/eval_cli.py +133 -0
package/python/app/feedback_meta.py +96 -0
package/python/app/health_cli.py +160 -0
package/python/app/main.py +502 -26
package/python/app/materialize.py +72 -4
package/python/app/mcp_contract.py +13 -1
package/python/app/mcp_server.py +344 -25
package/python/app/route_cli.py +32 -13
package/python/app/route_eval_harness.py +98 -0
package/python/app/route_policies.py +243 -0
package/python/app/route_quality.py +99 -0
package/python/app/routing_signals.py +155 -0
package/python/app/weights_cli.py +152 -0
package/python/fixtures/route_eval/smoke.json +18 -0
package/python/requirements.txt +1 -0
package/python/tests/test_feedback_weights.py +77 -0
package/python/tests/test_materialize.py +51 -0
package/python/tests/test_mcp_contract.py +117 -0
package/python/tests/test_route_eval_harness.py +45 -0
package/python/tests/test_route_policies.py +115 -0
package/python/tests/test_route_quality.py +120 -0
package/python/tests/test_routing_overlay.py +55 -0
package/python/tests/test_routing_signals.py +112 -0

package/python/app/main.py CHANGED Viewed

@@ -8,7 +8,6 @@ Live usage: `skillforge events --watch` (terminal).
 """
 from __future__ import annotations
-import asyncio
 import json
 import os
 import sqlite3
@@ -33,6 +32,23 @@ from app.project_index import (
     retrieve_project_context_items,
 )
 from app.redaction import redaction_enabled, redact_secret_patterns, sanitize_context_items
+from app.feedback_meta import build_feedback_effect
+from app.route_policies import (
+    build_routing_overlay_payload,
+    load_route_policies_config,
+    merge_policy_includes,
+    merge_project_notes_into_route_query,
+    parse_routing_overlay,
+)
+from app.route_quality import build_route_quality, coerce_route_float
+from app.routing_signals import (
+    build_route_query_text,
+    host_pick_shortlist_lines,
+    keyword_overlap_scores,
+    normalize_minmax,
+    skill_routing_card,
+    tokenize_skills_query,
+)
 # ---------- Config (env-driven so the Node wrapper controls paths) ----------
 BUNDLED_SKILLS = Path(os.getenv("SKILLFORGE_BUNDLED_SKILLS", "./skills"))
@@ -47,7 +63,7 @@ ROUTER_MODEL = os.getenv("SKILLFORGE_ROUTER_MODEL", "claude-haiku-4-5-20251001")
 TOP_K_CANDIDATES = int(os.getenv("SKILLFORGE_TOP_K", "15"))
 MAX_ACTIVE_SKILLS = int(os.getenv("SKILLFORGE_MAX_ACTIVE", "7"))
 REROUTE_THRESHOLD = float(os.getenv("SKILLFORGE_REROUTE_THRESHOLD", "0.4"))
-# "" | "full" | "embedding" — embedding skips Haiku and takes top skills from the shortlist only.
+# "" | "full" | "embedding" | "host" — embedding skips Haiku; host skips in-process pick (MCP must pass picked_names).
 SKILLFORGE_ROUTER_MODE = os.getenv("SKILLFORGE_ROUTER_MODE", "").strip().lower()
 # chunks: RAG-style line-bounded chunks from picked skills. full_body: inject entire SKILL.md per pick (legacy).
 SKILLFORGE_CONTEXT_MODE = os.getenv("SKILLFORGE_CONTEXT_MODE", "chunks").strip().lower()
@@ -60,6 +76,21 @@ FUSION_FULL_BODY_PREVIEW_CHARS = max(400, int(os.getenv("SKILLFORGE_FUSION_FULL_
 CONTEXT_OVERHEAD_SKILL = 48
 CONTEXT_OVERHEAD_FILE = 56
+ROUTER_HYBRID_MODE = os.getenv("SKILLFORGE_ROUTER_HYBRID", "off").strip().lower()
+ROUTER_HYBRID_ALPHA = max(0.0, min(1.0, float(os.getenv("SKILLFORGE_ROUTER_HYBRID_ALPHA", "0.72"))))
+ROUTER_PROMPT_HISTORY_MSGS = max(1, int(os.getenv("SKILLFORGE_ROUTER_PROMPT_HISTORY_MSGS", "8")))
+ROUTER_PROMPT_HISTORY_CHARS = max(80, int(os.getenv("SKILLFORGE_ROUTER_PROMPT_HISTORY_CHARS", "360")))
+ROUTER_CATALOG_PREVIEW_CHARS = max(80, int(os.getenv("SKILLFORGE_ROUTER_CATALOG_PREVIEW_CHARS", "280")))
+HAIKU_RERANK_MAX = max(3, int(os.getenv("SKILLFORGE_HAIKU_RERANK_MAX", str(TOP_K_CANDIDATES))))
+def _hybrid_mode_active(mode: str) -> bool:
+    return mode not in ("", "off", "0", "false", "no")
+def _env_truthy(name: str, default: str = "0") -> bool:
+    return os.getenv(name, default).strip().lower() not in ("0", "false", "no", "")
 def _context_budget_unified() -> int:
     raw = os.getenv("SKILLFORGE_CONTEXT_BUDGET_CHARS", "").strip()
@@ -83,6 +114,12 @@ def build_router_and_skills(
     if mode == "embedding":
         anthropic = None
         router_note = "embedding-only (SKILLFORGE_ROUTER_MODE=embedding)"
+    elif mode == "host":
+        anthropic = None
+        router_note = (
+            "host-pick (SKILLFORGE_ROUTER_MODE=host): no in-process router LLM; "
+            "first route_skills call returns a shortlist — call again with picked_names"
+        )
     elif mode == "full":
         if key:
             anthropic = AsyncAnthropic()
@@ -123,6 +160,8 @@ class Skill:
     source: str  # "bundled" | "user"
     disabled: bool = False
     embedding: np.ndarray | None = None
+    triggers: str = ""
+    anti_triggers: str = ""
 def parse_skill_md(path: Path, source: str) -> Skill | None:
@@ -138,6 +177,8 @@ def parse_skill_md(path: Path, source: str) -> Skill | None:
     name = path.parent.name
     title = name.replace("-", " ").title()
     description = ""
+    triggers = ""
+    anti_triggers = ""
     body = text
     if text.startswith("---"):
         end = text.find("---", 3)
@@ -167,6 +208,10 @@ def parse_skill_md(path: Path, source: str) -> Skill | None:
                         title = v
                     elif k == "description":
                         description = v
+                    elif k in ("triggers", "trigger"):
+                        triggers = v
+                    elif k in ("anti_triggers", "anti-triggers"):
+                        anti_triggers = v
                 i += 1
     if not description:
         for chunk in body.split("\n\n"):
@@ -174,7 +219,15 @@ def parse_skill_md(path: Path, source: str) -> Skill | None:
             if chunk and not chunk.startswith("#"):
                 description = chunk[:500]
                 break
-    return Skill(name=name, title=title, description=description, body=body, source=source)
+    return Skill(
+        name=name,
+        title=title,
+        description=description,
+        body=body,
+        source=source,
+        triggers=triggers,
+        anti_triggers=anti_triggers,
+    )
 def load_all_skills() -> list[Skill]:
@@ -325,8 +378,26 @@ class Router:
             "full_body",
         ) else "chunks"
         self._by_name: dict[str, Skill] = {s.name: s for s in skills}
-        texts = [f"{s.title}: {s.description}" for s in skills]
-        print(f"[skillforge] Embedding {len(skills)} skills (summary)...", file=sys.stderr)
+        self._hybrid_mode = ROUTER_HYBRID_MODE
+        self._hybrid_alpha = ROUTER_HYBRID_ALPHA
+        self._routing_cards = [skill_routing_card(s) for s in skills]
+        self._bm25 = None
+        if self._hybrid_mode == "bm25" and skills:
+            try:
+                from rank_bm25 import BM25Okapi
+                toks = [tokenize_skills_query(c) for c in self._routing_cards]
+                if any(toks):
+                    self._bm25 = BM25Okapi(toks)
+            except ImportError:
+                print(
+                    "[skillforge] SKILLFORGE_ROUTER_HYBRID=bm25 but rank-bm25 is not installed; "
+                    "using keyword overlap for sparse signal.",
+                    file=sys.stderr,
+                )
+        texts = self._routing_cards
+        print(f"[skillforge] Embedding {len(skills)} skills (summary cards)...", file=sys.stderr)
         embeddings = embed_model.encode(texts, show_progress_bar=False, convert_to_numpy=True)
         for s, e in zip(skills, embeddings):
             s.embedding = e / np.linalg.norm(e)
@@ -355,32 +426,138 @@ class Router:
                 self._chunk_embeddings = ce
             print(
                 f"[skillforge] Ready. {len(skills)} skills; chunk matrix {self._chunk_embeddings.shape}; "
-                f"context_mode={self.context_mode}",
+                f"context_mode={self.context_mode}; router_hybrid={self._hybrid_mode}",
                 file=sys.stderr,
             )
         else:
             print(
                 f"[skillforge] Ready. {len(skills)} skills, matrix shape: {self.matrix.shape}; "
-                f"context_mode={self.context_mode}",
+                f"context_mode={self.context_mode}; router_hybrid={self._hybrid_mode}",
                 file=sys.stderr,
             )
-    def shortlist(self, prompt, con, k=TOP_K_CANDIDATES, user_id=""):
-        if len(self.skills) == 0:
-            return []
-        q = self.embed_model.encode(prompt, convert_to_numpy=True)
-        q = q / np.linalg.norm(q)
-        sims = self.matrix @ q
-        biased = sims.copy()
+    def _sparse_scores(self, route_query: str) -> np.ndarray:
+        if not _hybrid_mode_active(self._hybrid_mode):
+            return np.zeros(len(self.skills), dtype=np.float64)
+        if self._hybrid_mode == "keyword":
+            return keyword_overlap_scores(route_query, self._routing_cards)
+        if self._hybrid_mode == "bm25":
+            if self._bm25 is not None:
+                q = tokenize_skills_query(route_query)
+                if not q:
+                    return np.zeros(len(self.skills), dtype=np.float64)
+                return np.asarray(self._bm25.get_scores(q), dtype=np.float64)
+            return keyword_overlap_scores(route_query, self._routing_cards)
+        return keyword_overlap_scores(route_query, self._routing_cards)
+    def _base_routing_scores(self, route_query: str, q: np.ndarray) -> tuple[np.ndarray, np.ndarray]:
+        """Dense cosine similarities and fused ranking scores (or dense-only if hybrid off)."""
+        sims = (self.matrix @ q).flatten()
+        if not _hybrid_mode_active(self._hybrid_mode):
+            return sims, sims
+        sparse = self._sparse_scores(route_query)
+        d_norm = normalize_minmax(sims)
+        s_norm = normalize_minmax(sparse)
+        fused = self._hybrid_alpha * d_norm + (1.0 - self._hybrid_alpha) * s_norm
+        return sims, fused
+    def _bias_with_learning_and_overlay(
+        self,
+        con: sqlite3.Connection,
+        biased: np.ndarray,
+        user_id: str,
+        *,
+        exclude_skills: frozenset[str] | None = None,
+        routing_boosts: dict[str, float] | None = None,
+    ) -> None:
+        excl = exclude_skills or frozenset()
+        boosts = routing_boosts or {}
         for i, s in enumerate(self.skills):
             w, disabled = get_skill_weight(con, s.name, user_id=user_id)
-            if disabled:
+            if disabled or s.name in excl:
                 biased[i] = -999.0
             else:
                 biased[i] += w
+                extra = boosts.get(s.name)
+                if extra is not None:
+                    biased[i] += float(extra)
+    def shortlist(
+        self,
+        route_query,
+        con,
+        k=TOP_K_CANDIDATES,
+        user_id="",
+        *,
+        exclude_skills: frozenset[str] | None = None,
+        routing_boosts: dict[str, float] | None = None,
+    ):
+        if len(self.skills) == 0:
+            return []
+        q = self.embed_model.encode(route_query, convert_to_numpy=True)
+        q = q / np.linalg.norm(q)
+        sims, rank_scores = self._base_routing_scores(route_query, q)
+        biased = rank_scores.copy()
+        self._bias_with_learning_and_overlay(
+            con,
+            biased,
+            user_id,
+            exclude_skills=exclude_skills,
+            routing_boosts=routing_boosts,
+        )
         top_idx = np.argsort(-biased)[:k]
         return [(self.skills[i], float(sims[i])) for i in top_idx if biased[i] > -100]
+    def shortlist_with_facets(
+        self,
+        route_query: str,
+        con: sqlite3.Connection,
+        *,
+        k: int | None = None,
+        user_id: str = "",
+        exclude_skills: frozenset[str] | None = None,
+        routing_boosts: dict[str, float] | None = None,
+    ) -> list[dict[str, Any]]:
+        """Embedding shortlist with cosine sim, learned weight, and routing score (no LLM)."""
+        limit = k if k is not None else TOP_K_CANDIDATES
+        if len(self.skills) == 0:
+            return []
+        q = self.embed_model.encode(route_query, convert_to_numpy=True)
+        q = q / np.linalg.norm(q)
+        sims, rank_scores = self._base_routing_scores(route_query, q)
+        sparse_full = (
+            self._sparse_scores(route_query) if _hybrid_mode_active(self._hybrid_mode) else np.zeros(
+                len(self.skills), dtype=np.float64
+            )
+        )
+        biased = rank_scores.copy()
+        self._bias_with_learning_and_overlay(
+            con,
+            biased,
+            user_id,
+            exclude_skills=exclude_skills,
+            routing_boosts=routing_boosts,
+        )
+        top_idx = np.argsort(-biased)[:limit]
+        out: list[dict[str, Any]] = []
+        for i in top_idx:
+            if biased[i] <= -100:
+                continue
+            s = self.skills[i]
+            w, _dis = get_skill_weight(con, s.name, user_id=user_id)
+            out.append({
+                "name": s.name,
+                "title": s.title,
+                "description_preview": (s.description or "")[:280],
+                "cosine_similarity": round(float(sims[i]), 6),
+                "sparse_signal": round(float(sparse_full[i]), 6),
+                "learned_weight": round(float(w), 4),
+                "routing_score": round(float(biased[i]), 6),
+                "source": s.source,
+                "router_hybrid": self._hybrid_mode,
+            })
+        return out
     def build_context_items(
         self,
         prompt: str,
@@ -551,6 +728,77 @@ class Router:
             rel_out.append(float(rel[i]))
         return items, np.stack(em_rows), np.asarray(rel_out, dtype=np.float32)
+    async def rerank_candidates_haiku(
+        self,
+        route_query: str,
+        conversation: list | None,
+        candidates: list[tuple[Skill, float]],
+    ) -> list[tuple[Skill, float]]:
+        if (
+            not candidates
+            or self.anthropic is None
+            or not _env_truthy("SKILLFORGE_HAIKU_RERANK", "0")
+        ):
+            return candidates
+        cap = max(3, min(HAIKU_RERANK_MAX, len(candidates)))
+        head = candidates[:cap]
+        tail = candidates[cap:]
+        by_name = {s.name: (s, sc) for s, sc in head}
+        lines: list[str] = []
+        for idx, (s, _sc) in enumerate(head, start=1):
+            card = skill_routing_card(s)
+            preview = card[:220].replace("\n", " ")
+            lines.append(f"{idx}. {s.name} — {preview}")
+        hist = ""
+        if conversation:
+            msgs = conversation[-ROUTER_PROMPT_HISTORY_MSGS:]
+            parts: list[str] = []
+            for m in msgs:
+                if not isinstance(m, dict):
+                    continue
+                role = str(m.get("role") or "user")
+                c = str(m.get("content") or "").strip()
+                if not c:
+                    continue
+                parts.append(f"{role}: {c[:ROUTER_PROMPT_HISTORY_CHARS]}")
+            if parts:
+                hist = "\n\nConversation (recent):\n" + "\n".join(parts)
+        sys = (
+            "You reorder skill candidates by relevance to the user's task. "
+            "Output ONLY JSON: {\"order\": [\"skill_name\", ...]} with each candidate "
+            "skill name appearing exactly once, best match first. No extra keys."
+        )
+        user = (
+            f"Routing focus:\n{route_query}{hist}\n\nCandidates:\n" + "\n".join(lines)
+        )
+        try:
+            rerank_model = os.getenv("SKILLFORGE_HAIKU_RERANK_MODEL", "").strip() or ROUTER_MODEL
+            resp = await self.anthropic.messages.create(
+                model=rerank_model,
+                max_tokens=500,
+                system=sys,
+                messages=[{"role": "user", "content": user}],
+            )
+            text = resp.content[0].text.strip()
+            if text.startswith("```"):
+                text = text.split("```")[1]
+                if text.startswith("json"):
+                    text = text[4:]
+            data = json.loads(text.strip())
+            order = data.get("order") or []
+            ordered: list[tuple[Skill, float]] = []
+            seen: set[str] = set()
+            for n in order:
+                if isinstance(n, str) and n in by_name and n not in seen:
+                    ordered.append(by_name[n])
+                    seen.add(n)
+            for s, sc in head:
+                if s.name not in seen:
+                    ordered.append((s, sc))
+            return ordered + tail
+        except Exception:
+            return candidates
     def pick_final_embedding_only(self, candidates):
         """Pick up to MAX_ACTIVE_SKILLS from the shortlist order (similarity + weights). No LLM call."""
         if not candidates:
@@ -560,26 +808,46 @@ class Router:
             "embedding-only: top candidates by similarity and learned weights"
         )
-    async def pick_final(self, prompt, conversation, candidates):
+    async def pick_final(
+        self,
+        prompt,
+        conversation,
+        candidates,
+        route_query: str | None = None,
+    ):
+        rq = (route_query if route_query is not None else prompt) or ""
         if self.anthropic is None:
             return self.pick_final_embedding_only(candidates)
         if not candidates:
             return [], "no candidates available"
         catalog = "\n".join(
-            f"- {s.name}: {s.description[:200]}" for s, _ in candidates
+            f"- {s.name}: {skill_routing_card(s)[:ROUTER_CATALOG_PREVIEW_CHARS]}"
+            for s, _ in candidates
         )
         recent = ""
         if conversation:
-            recent = "\n\nRecent conversation:\n" + "\n".join(
-                f"{m['role']}: {m['content'][:200]}" for m in conversation[-4:]
-            )
+            msgs = conversation[-ROUTER_PROMPT_HISTORY_MSGS:]
+            parts: list[str] = []
+            for m in msgs:
+                if not isinstance(m, dict):
+                    continue
+                role = str(m.get("role") or "user")
+                c = str(m.get("content") or "").strip()
+                if not c:
+                    continue
+                parts.append(f"{role}: {c[:ROUTER_PROMPT_HISTORY_CHARS]}")
+            if parts:
+                recent = "\n\nRecent conversation:\n" + "\n".join(parts)
         sys = (
             "You are a skill router. Given a user prompt and a candidate list of skills, "
             f"pick 0 to {MAX_ACTIVE_SKILLS} skills that would genuinely help answer this prompt. "
             "Be ruthless — only include a skill if it directly applies. Empty list is valid. "
             'Respond ONLY in JSON: {"skills": ["name1","name2"], "reasoning": "one sentence"}'
         )
-        user = f"User prompt:\n{prompt}{recent}\n\nCandidate skills:\n{catalog}"
+        user = (
+            f"User prompt:\n{prompt}\n\nRouting context (retrieval query):\n{rq}{recent}"
+            f"\n\nCandidate skills:\n{catalog}"
+        )
         try:
             resp = await self.anthropic.messages.create(
                 model=ROUTER_MODEL,
@@ -626,6 +894,26 @@ def format_context_items_markdown(context_items: list[dict[str, Any]]) -> str:
     return "\n".join(blocks)
+def normalize_host_picked_names(
+    raw: list[str] | None,
+    by_name: dict[str, Skill],
+    cap: int,
+) -> list[str]:
+    """Dedupe, order-stable, cap length; only catalog names."""
+    out: list[str] = []
+    seen: set[str] = set()
+    for item in raw or []:
+        if not isinstance(item, str):
+            continue
+        n = item.strip()
+        if n in by_name and n not in seen:
+            out.append(n)
+            seen.add(n)
+        if len(out) >= cap:
+            break
+    return out
 async def run_route_turn(
     con: sqlite3.Connection,
     router: Router,
@@ -636,15 +924,165 @@ async def run_route_turn(
     *,
     project_root: str | None = None,
     include_project_rag: bool = False,
+    picked_names_from_host: list[str] | None = None,
+    picked_names_from_host_supplied: bool = False,
 ) -> dict[str, Any]:
     """Shared routing + session + telemetry for MCP route_skills and ``skillforge route``.
-    Updates sessions, skill usage stats, and writes a route row to events.
+    ``SKILLFORGE_ROUTER_MODE=host`` without ``picked_names`` returns a tight shortlist only (no ``uses``,
+    no skill chunks). Pass ``picked_names`` on the next call to finalize context.
+    When ``picked_names_from_host_supplied`` is True, skips rerank/Haiku and uses the supplied names
+    (after validation) in any router mode.
     """
     sid = session_id or str(uuid.uuid4())
     t0 = time.time()
-    candidates = router.shortlist(prompt, con, user_id=user_id)
-    picked_names, reasoning = await router.pick_final(prompt, conversation, candidates)
+    route_query = build_route_query_text(prompt, conversation)
+    pr = (project_root or "").strip()
+    policies_cfg = load_route_policies_config(pr or None)
+    overlay_audit: list[dict[str, Any]] = []
+    exclude_skills, routing_boosts, project_notes_raw = parse_routing_overlay(
+        policies_cfg,
+        by_name=router._by_name,
+        audit_out=overlay_audit,
+    )
+    route_query = merge_project_notes_into_route_query(route_query, project_notes_raw, pr)
+    notes_effective = bool(project_notes_raw.strip() and pr)
+    routing_overlay_meta = build_routing_overlay_payload(
+        project_root=pr,
+        exclude_skills=exclude_skills,
+        routing_boosts=routing_boosts,
+        project_notes_applied=notes_effective,
+        project_notes_len=len(project_notes_raw) if project_notes_raw else 0,
+        audit=overlay_audit,
+    )
+    rules_list_early = policies_cfg.get("rules") if isinstance(policies_cfg.get("rules"), list) else []
+    rules_n = len(rules_list_early)
+    host_router = SKILLFORGE_ROUTER_MODE == "host"
+    if host_router and not picked_names_from_host_supplied:
+        k = max(3, min(TOP_K_CANDIDATES, int(os.getenv("SKILLFORGE_HOST_PICK_MAX", "12"))))
+        facets = router.shortlist_with_facets(
+            route_query,
+            con,
+            k=k,
+            user_id=user_id,
+            exclude_skills=exclude_skills,
+            routing_boosts=routing_boosts,
+        )
+        candidates = [
+            (router._by_name[nm], coerce_route_float(f.get("cosine_similarity")))
+            for f in facets
+            if (nm := f.get("name")) in router._by_name
+        ]
+        md, rows = host_pick_shortlist_lines(
+            prompt=prompt,
+            route_query=route_query,
+            facet_rows=facets,
+            max_candidates=k,
+        )
+        route_ms = (time.time() - t0) * 1000
+        safe_prompt_snip = prompt[:300]
+        if redaction_enabled():
+            safe_prompt_snip, _ = redact_secret_patterns(prompt[:300])
+        route_quality = build_route_quality(
+            facet_list=facets,
+            router_mode=SKILLFORGE_ROUTER_MODE or "auto",
+            router_hybrid=router._hybrid_mode,
+            picked_names=[],
+            rerouted=False,
+            change=0.0,
+            policy_rules_loaded=rules_n,
+            policy_audit=[],
+            host_picked=False,
+            host_shortlist_only=True,
+            haiku_rerank_applied=False,
+            pick_path="host_shortlist",
+        )
+        feedback_effect = build_feedback_effect(con, [], user_id=user_id)
+        event = {
+            "type": "host_shortlist",
+            "session_id": sid,
+            "user_id": user_id,
+            "prompt": safe_prompt_snip,
+            "candidates": [{"name": s.name, "score": sc} for s, sc in candidates[:15]],
+            "picked": [],
+            "reasoning": "host_pick_shortlist",
+            "route_ms": round(route_ms, 1),
+            "ts": time.time(),
+            "host_pick_candidates": rows,
+            "policy": {"rules_loaded": rules_n, "audit": []},
+            "route_quality": route_quality,
+            "feedback_effect": feedback_effect,
+        }
+        if routing_overlay_meta is not None:
+            event["routing_overlay"] = routing_overlay_meta
+        log_event(con, sid, "host_shortlist", event, user_id=user_id)
+        con.commit()
+        ret_host: dict[str, Any] = {
+            "session_id": sid,
+            "picked_names": [],
+            "reasoning": (
+                "host_pick_shortlist — choose names from the list; call route_skills again "
+                "with picked_names (reuse session_id if you use sessions)."
+            ),
+            "candidates": candidates,
+            "route_ms": route_ms,
+            "rerouted": False,
+            "change": 0.0,
+            "event": event,
+            "context_items": [],
+            "host_pick_shortlist": True,
+            "host_pick_markdown": md,
+            "host_pick_candidates": rows,
+            "route_query": route_query,
+            "route_quality": route_quality,
+            "feedback_effect": feedback_effect,
+        }
+        if routing_overlay_meta is not None:
+            ret_host["routing_overlay"] = routing_overlay_meta
+        return ret_host
+    facet_list = router.shortlist_with_facets(
+        route_query,
+        con,
+        k=TOP_K_CANDIDATES,
+        user_id=user_id,
+        exclude_skills=exclude_skills,
+        routing_boosts=routing_boosts,
+    )
+    candidates = [
+        (router._by_name[nm], coerce_route_float(f.get("cosine_similarity")))
+        for f in facet_list
+        if (nm := f.get("name")) in router._by_name
+    ]
+    haiku_rerank_applied = False
+    if picked_names_from_host_supplied:
+        picked_names = normalize_host_picked_names(
+            picked_names_from_host, router._by_name, MAX_ACTIVE_SKILLS
+        )
+        reasoning = "host-picked: MCP picked_names"
+    else:
+        names_before = [s.name for s, _ in candidates]
+        rerank_eligible = bool(
+            candidates and router.anthropic is not None and _env_truthy("SKILLFORGE_HAIKU_RERANK", "0")
+        )
+        candidates = await router.rerank_candidates_haiku(route_query, conversation, candidates)
+        names_after = [s.name for s, _ in candidates]
+        haiku_rerank_applied = rerank_eligible and names_before != names_after
+        picked_names, reasoning = await router.pick_final(
+            prompt, conversation, candidates, route_query=route_query
+        )
+    picked_names, policy_audit = merge_policy_includes(
+        prompt,
+        picked_names,
+        policies_cfg,
+        router._by_name,
+        con,
+        user_id,
+        max_active=MAX_ACTIVE_SKILLS,
+    )
     route_ms = (time.time() - t0) * 1000
     prev_active: set[str] = set()
@@ -658,7 +1096,6 @@ async def run_route_turn(
     change = jaccard_change(prev_active, set(picked_names))
     rerouted = change >= REROUTE_THRESHOLD and bool(prev_active)
-    pr = (project_root or "").strip()
     want_fusion = CONTEXT_FUSION and include_project_rag and bool(pr)
     context_fusion: dict[str, Any] | None = None
     context_items: list[dict[str, Any]] = []
@@ -751,6 +1188,29 @@ async def run_route_turn(
     project_rag_items_count = sum(1 for c in context_items if c.get("path"))
+    if picked_names_from_host_supplied:
+        pick_path = "host_picked"
+    elif router.anthropic is None or SKILLFORGE_ROUTER_MODE == "embedding":
+        pick_path = "embedding_top"
+    else:
+        pick_path = "haiku_pick"
+    rules_list = policies_cfg.get("rules") if isinstance(policies_cfg.get("rules"), list) else []
+    route_quality = build_route_quality(
+        facet_list=facet_list,
+        router_mode=SKILLFORGE_ROUTER_MODE or "auto",
+        router_hybrid=router._hybrid_mode,
+        picked_names=picked_names,
+        rerouted=rerouted,
+        change=change,
+        policy_rules_loaded=len(rules_list),
+        policy_audit=policy_audit,
+        host_picked=picked_names_from_host_supplied,
+        host_shortlist_only=False,
+        haiku_rerank_applied=haiku_rerank_applied,
+        pick_path=pick_path,
+    )
     reasoning_out = reasoning
     safe_prompt_snip = prompt[:300]
     context_redaction_stats: dict[str, Any] = {"enabled": False, "secret_hits": 0, "path_hits": 0}
@@ -770,6 +1230,8 @@ async def run_route_turn(
     for n in picked_names:
         update_skill_stat(con, n, "uses", 1, user_id=user_id)
+    feedback_effect = build_feedback_effect(con, picked_names, user_id=user_id)
     event = {
         "type": "route",
         "session_id": sid,
@@ -788,6 +1250,10 @@ async def run_route_turn(
         "include_project_rag": bool(include_project_rag and pr),
         "context_fusion": context_fusion,
         "context_redaction": context_redaction_stats,
+        "policy": {
+            "rules_loaded": len(policies_cfg.get("rules") or []) if isinstance(policies_cfg.get("rules"), list) else 0,
+            "audit": policy_audit,
+        },
         "chunk_sources_preview": [
             {
                 "skill": c.get("skill"),
@@ -798,9 +1264,14 @@ async def run_route_turn(
             }
             for c in context_items[:24]
         ],
+        "host_picked": bool(picked_names_from_host_supplied),
+        "route_quality": route_quality,
+        "feedback_effect": feedback_effect,
     }
+    if routing_overlay_meta is not None:
+        event["routing_overlay"] = routing_overlay_meta
     log_event(con, sid, "route", event, user_id=user_id)
-    return {
+    ret_main: dict[str, Any] = {
         "session_id": sid,
         "picked_names": picked_names,
         "reasoning": reasoning_out,
@@ -810,4 +1281,9 @@ async def run_route_turn(
         "change": change,
         "event": event,
         "context_items": context_items,
+        "route_quality": route_quality,
+        "feedback_effect": feedback_effect,
     }
+    if routing_overlay_meta is not None:
+        ret_main["routing_overlay"] = routing_overlay_meta
+    return ret_main