npm - nexo-brain - Versions diffs - 7.9.13 → 7.9.15 - Mend

nexo-brain 7.9.13 → 7.9.15

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (17) hide show

package/README.md +1 -1
package/package.json +1 -1
package/src/cognitive/_core.py +6 -4
package/src/db/_protocol.py +10 -1
package/src/db/_schema.py +9 -0
package/src/doctor/providers/runtime.py +22 -4
package/src/local_model_manifest.json +113 -0
package/src/local_models.py +247 -0
package/src/migrate_embeddings.py +6 -6
package/src/model_warmup.py +20 -23
package/src/paths.py +9 -0
package/src/plugins/cortex.py +267 -34
package/src/plugins/protocol.py +125 -47
package/src/resonance_map.py +2 -0
package/src/scripts/nexo-daily-self-audit.py +44 -0
package/src/scripts/nexo-learning-housekeep.py +2 -2
package/templates/core-prompts/cortex-decision-critic.md +24 -0

package/src/plugins/cortex.py CHANGED Viewed

@@ -23,6 +23,7 @@ from datetime import datetime, timedelta
 from pathlib import Path
 from db import VALID_IMPACT_LEVELS, VALID_TASK_TYPES, validate_impact_level, validate_task_type
+from db._semantic_similarity import hybrid_similarity_score
 def _get_db():
@@ -89,6 +90,10 @@ STOP_WORDS = {
 }
 HISTORICAL_OUTCOME_MIN_RESOLVED = 2
 HISTORICAL_OUTCOME_LOOKBACK = 12
+SEMANTIC_HISTORY_LOOKBACK = 24
+SEMANTIC_HISTORY_MATCH_THRESHOLD = 0.58
+CRITIQUE_TOP_CANDIDATES = 3
+CRITIQUE_MAX_MARGIN = 0.45
 def _term_hits(text: str, terms: set[str]) -> int:
@@ -279,50 +284,80 @@ def _constraint_penalty(text: str, constraints: list[str]) -> tuple[float, list[
 def _history_signal(text: str, *, area: str = "", goal: str = "") -> dict:
     conn = _get_db()
-    tokens = _tokenize(" ".join(part for part in [text, area, goal] if part), limit=6)
-    if not tokens:
+    query_text = " ".join(part for part in [text, area, goal] if part).strip()
+    if not query_text:
         return {"positive": 0.0, "negative": 0.0, "matched_decisions": 0, "matched_outcomes": 0}
-    decision_positive = 0
-    decision_negative = 0
+    def _keyword_extractor(value: str) -> list[str]:
+        return _tokenize(value, limit=8)
+    decision_positive = 0.0
+    decision_negative = 0.0
     matched_decisions = 0
-    for token in tokens[:3]:
+    if conn.execute("SELECT 1 FROM sqlite_master WHERE type='table' AND name='decisions'").fetchone():
         rows = conn.execute(
-            """SELECT outcome FROM decisions
-               WHERE lower(decision) LIKE ? OR lower(alternatives) LIKE ? OR lower(based_on) LIKE ?
-               ORDER BY created_at DESC LIMIT 6""",
-            tuple(f"%{token}%" for _ in range(3)),
+            """SELECT decision, alternatives, based_on, outcome
+               FROM decisions
+               ORDER BY created_at DESC LIMIT ?""",
+            (SEMANTIC_HISTORY_LOOKBACK,),
         ).fetchall()
         for row in rows:
+            candidate_text = " ".join(
+                str(row[key] or "")
+                for key in ("decision", "alternatives", "based_on")
+            ).strip()
+            similarity = hybrid_similarity_score(
+                query_text,
+                candidate_text,
+                keyword_extractor=_keyword_extractor,
+                strong_semantic_threshold=0.82,
+                moderate_semantic_threshold=0.74,
+                moderate_keyword_floor=0.12,
+            )
+            if similarity < SEMANTIC_HISTORY_MATCH_THRESHOLD:
+                continue
             matched_decisions += 1
             outcome = (row["outcome"] or "").lower()
             if _contains_any(outcome, NEGATIVE_OUTCOME_TERMS):
-                decision_negative += 1
+                decision_negative += min(1.0, similarity)
             elif _contains_any(outcome, POSITIVE_OUTCOME_TERMS):
-                decision_positive += 1
+                decision_positive += min(1.0, similarity)
-    outcome_positive = 0
-    outcome_negative = 0
+    outcome_positive = 0.0
+    outcome_negative = 0.0
     matched_outcomes = 0
     if conn.execute("SELECT 1 FROM sqlite_master WHERE type='table' AND name='outcomes'").fetchone():
-        for token in tokens[:3]:
-            rows = conn.execute(
-                """SELECT status FROM outcomes
-                   WHERE lower(description) LIKE ? OR lower(expected_result) LIKE ? OR lower(action_type) LIKE ?
-                   ORDER BY created_at DESC LIMIT 6""",
-                tuple(f"%{token}%" for _ in range(3)),
-            ).fetchall()
-            for row in rows:
-                matched_outcomes += 1
-                status = (row["status"] or "").lower()
-                if status == "met":
-                    outcome_positive += 1
-                elif status in {"missed", "expired"}:
-                    outcome_negative += 1
+        rows = conn.execute(
+            """SELECT description, expected_result, action_type, status
+               FROM outcomes
+               ORDER BY created_at DESC LIMIT ?""",
+            (SEMANTIC_HISTORY_LOOKBACK,),
+        ).fetchall()
+        for row in rows:
+            candidate_text = " ".join(
+                str(row[key] or "")
+                for key in ("description", "expected_result", "action_type")
+            ).strip()
+            similarity = hybrid_similarity_score(
+                query_text,
+                candidate_text,
+                keyword_extractor=_keyword_extractor,
+                strong_semantic_threshold=0.82,
+                moderate_semantic_threshold=0.74,
+                moderate_keyword_floor=0.12,
+            )
+            if similarity < SEMANTIC_HISTORY_MATCH_THRESHOLD:
+                continue
+            matched_outcomes += 1
+            status = (row["status"] or "").lower()
+            if status == "met":
+                outcome_positive += min(1.0, similarity)
+            elif status in {"missed", "expired"}:
+                outcome_negative += min(1.0, similarity)
     return {
-        "positive": min(2.5, (decision_positive * 0.4) + (outcome_positive * 0.5)),
-        "negative": min(3.0, (decision_negative * 0.6) + (outcome_negative * 0.7)),
+        "positive": round(min(2.5, (decision_positive * 0.9) + (outcome_positive * 1.0)), 2),
+        "negative": round(min(3.0, (decision_negative * 1.1) + (outcome_negative * 1.2)), 2),
         "matched_decisions": matched_decisions,
         "matched_outcomes": matched_outcomes,
     }
@@ -702,6 +737,172 @@ def _format_decision_summary(recommended: dict, alternatives_scored: list[dict])
     return f"Recomendada por el mejor balance entre impacto, éxito, riesgo y huella somática; {notes}."
+def _parse_json_object_response(raw: str) -> dict:
+    text = (raw or "").strip()
+    if not text:
+        return {}
+    try:
+        parsed = json.loads(text)
+        return parsed if isinstance(parsed, dict) else {}
+    except json.JSONDecodeError:
+        match = re.search(r"\{.*\}", text, re.DOTALL)
+        if not match:
+            return {}
+        try:
+            parsed = json.loads(match.group(0))
+            return parsed if isinstance(parsed, dict) else {}
+        except json.JSONDecodeError:
+            return {}
+def _critique_tier(
+    *,
+    impact_level: str,
+    scored: list[dict],
+    constraints: list[str],
+    evidence_refs: list[str],
+) -> str:
+    if impact_level != "critical":
+        return "alto"
+    gap = 99.0
+    if len(scored) > 1:
+        gap = scored[0]["total_score"] - scored[1]["total_score"]
+    if gap <= CRITIQUE_MAX_MARGIN or len(constraints) >= 3 or len(evidence_refs) <= 1:
+        return "maximo"
+    return "alto"
+def _run_llm_critique(
+    *,
+    goal: str,
+    task_type: str,
+    impact_level: str,
+    area: str,
+    context_hint: str,
+    constraints: list[str],
+    evidence_refs: list[str],
+    goal_profile: dict,
+    scored: list[dict],
+) -> dict:
+    if impact_level not in {"high", "critical"} or len(scored) < 2:
+        return {"active": False}
+    try:
+        from call_model_raw import call_model_raw, ClassifierUnavailableError
+        from core_prompts import render_core_prompt
+        from operator_language import append_operator_language_contract
+    except Exception as exc:
+        return {"active": True, "ok": False, "error": f"critic_unavailable:{exc}"}
+    tier = _critique_tier(
+        impact_level=impact_level,
+        scored=scored,
+        constraints=constraints,
+        evidence_refs=evidence_refs,
+    )
+    payload = {
+        "goal": goal,
+        "task_type": task_type,
+        "impact_level": impact_level,
+        "area": area,
+        "context_hint": context_hint,
+        "constraints": constraints,
+        "evidence_refs": evidence_refs,
+        "goal_profile": {
+            "profile_id": goal_profile.get("profile_id", ""),
+            "profile_name": goal_profile.get("profile_name", ""),
+            "goal_labels": goal_profile.get("goal_labels", []),
+            "weights": goal_profile.get("weights", {}),
+        },
+        "heuristic_recommendation": scored[0]["name"],
+        "candidates": [
+            {
+                "name": item["name"],
+                "impact": item["impact"],
+                "success_probability": item["success_probability"],
+                "risk_level": item["risk_level"],
+                "somatic_penalty": item["somatic_penalty"],
+                "total_score": item["total_score"],
+                "notes": item.get("notes") or [],
+                "historical_signal": item.get("historical_signal") or {},
+                "pattern_learning_signal": item.get("pattern_learning_signal") or {},
+            }
+            for item in scored[:CRITIQUE_TOP_CANDIDATES]
+        ],
+    }
+    prompt = render_core_prompt(
+        "cortex-decision-critic",
+        payload_json=json.dumps(payload, ensure_ascii=False, indent=2),
+    )
+    prompt = append_operator_language_contract(prompt)
+    try:
+        raw = call_model_raw(
+            prompt,
+            caller="cortex_decision_critic",
+            tier=tier,
+            system=render_core_prompt("json-object-only"),
+            max_tokens=500,
+            temperature=0.0,
+            stop_sequences=[],
+            timeout=20.0,
+        )
+    except ClassifierUnavailableError as exc:
+        return {"active": True, "ok": False, "tier": tier, "error": str(exc)}
+    parsed = _parse_json_object_response(raw)
+    candidate_names = [item["name"] for item in scored]
+    recommended_choice = str(parsed.get("recommended_choice") or "").strip()
+    if recommended_choice not in candidate_names:
+        return {
+            "active": True,
+            "ok": False,
+            "tier": tier,
+            "error": "invalid_recommended_choice",
+            "raw_response": raw[:1200],
+        }
+    ranking = parsed.get("confirmed_ranking")
+    clean_ranking: list[str] = []
+    if isinstance(ranking, list):
+        for item in ranking:
+            name = str(item or "").strip()
+            if name in candidate_names and name not in clean_ranking:
+                clean_ranking.append(name)
+    for name in candidate_names:
+        if name not in clean_ranking:
+            clean_ranking.append(name)
+    try:
+        confidence = float(parsed.get("confidence"))
+    except (TypeError, ValueError):
+        confidence = 0.0
+    confidence = max(0.0, min(1.0, confidence))
+    risk_flags = parsed.get("risk_flags")
+    if not isinstance(risk_flags, list):
+        risk_flags = []
+    reasoning_summary = str(parsed.get("reasoning_summary") or "").strip()
+    disagreement = bool(parsed.get("disagreement_with_heuristic"))
+    return {
+        "active": True,
+        "ok": True,
+        "tier": tier,
+        "recommended_choice": recommended_choice,
+        "confirmed_ranking": clean_ranking,
+        "confidence": round(confidence, 3),
+        "risk_flags": [str(item).strip() for item in risk_flags if str(item).strip()][:5],
+        "reasoning_summary": reasoning_summary,
+        "disagreement_with_heuristic": disagreement or (recommended_choice != scored[0]["name"]),
+    }
+def _reorder_scores_by_names(scored: list[dict], ranking: list[str]) -> list[dict]:
+    order = {name: idx for idx, name in enumerate(ranking)}
+    return sorted(
+        scored,
+        key=lambda item: (order.get(item["name"], len(order)), -item["total_score"]),
+    )
 def handle_cortex_check(
     goal: str,
     task_type: str = "answer",
@@ -858,6 +1059,7 @@ def handle_cortex_decide(
     linked_outcome_id: int = 0,
     goal_profile_id: str = "",
     goal_id: str = "",
+    auto_create_outcome: bool = False,
 ) -> str:
     """Evaluate concrete alternatives for a high-impact task using the existing Cortex."""
     clean_goal = (goal or "").strip()
@@ -927,16 +1129,39 @@ def handle_cortex_decide(
         for item in parsed_alternatives
     ]
     scored.sort(key=lambda item: item["total_score"], reverse=True)
-    recommended = scored[0]
-    reasoning = _format_decision_summary(recommended, scored)
+    heuristic_recommended = scored[0]
+    heuristic_reasoning = _format_decision_summary(heuristic_recommended, scored)
+    critique = _run_llm_critique(
+        goal=clean_goal,
+        task_type=clean_type,
+        impact_level=clean_level,
+        area=area.strip(),
+        context_hint=context_hint.strip(),
+        constraints=parsed_constraints,
+        evidence_refs=parsed_evidence,
+        goal_profile=resolved_goal_profile,
+        scored=scored,
+    )
+    decision_mode = "heuristic"
+    if critique.get("ok"):
+        scored = _reorder_scores_by_names(scored, critique.get("confirmed_ranking") or [])
+        recommended = next(
+            (item for item in scored if item["name"] == critique["recommended_choice"]),
+            heuristic_recommended,
+        )
+        reasoning = (critique.get("reasoning_summary") or "").strip() or heuristic_reasoning
+        decision_mode = "heuristic_plus_llm"
+    else:
+        recommended = heuristic_recommended
+        reasoning = heuristic_reasoning
     resolved_outcome_id = _resolve_linked_outcome_id(
         linked_outcome_id=linked_outcome_id,
         task_id=task_id,
     )
-    # Auto-create outcome when none exists, so cortex decisions
-    # get verified by outcome-checker and close the feedback loop.
-    if resolved_outcome_id is None and clean_goal and task_id:
+    # Outcome auto-creation is opt-in so analytics can distinguish
+    # persisted decisions from explicitly tracked outcomes.
+    if auto_create_outcome and resolved_outcome_id is None and clean_goal and task_id:
         try:
             from db import create_outcome
@@ -974,6 +1199,10 @@ def handle_cortex_decide(
             goal_profile_id=resolved_goal_profile.get("profile_id", ""),
             goal_profile_labels=resolved_goal_profile.get("goal_labels", []),
             goal_profile_weights=resolved_goal_profile.get("weights", {}),
+            heuristic_choice=heuristic_recommended["name"],
+            heuristic_reasoning=heuristic_reasoning,
+            critique_payload=critique,
+            decision_mode=decision_mode,
             selected_choice=recommended["name"],
             selection_reason=reasoning,
             selection_source="recommended",
@@ -997,6 +1226,10 @@ def handle_cortex_decide(
             "impact_level": clean_level,
             "recommendation": recommended["name"],
             "reasoning": reasoning,
+            "heuristic_recommendation": heuristic_recommended["name"],
+            "heuristic_reasoning": heuristic_reasoning,
+            "decision_mode": decision_mode,
+            "critique": critique,
             "selected_choice": record.get("selected_choice"),
             "selection_source": record.get("selection_source"),
             "linked_outcome_id": record.get("linked_outcome_id"),

package/src/plugins/protocol.py CHANGED Viewed

@@ -898,6 +898,46 @@ def _auto_capture_learning(task: dict, task_id: str, effective_files: list[str],
     )
+def _append_debt_ref(debts: list[dict], debt: dict, *, debt_type: str, severity: str):
+    debt_id = debt.get("id")
+    if debt_id and any(item.get("id") == debt_id for item in debts):
+        return
+    debts.append(
+        {
+            "id": debt_id,
+            "debt_type": debt_type,
+            "severity": severity,
+        }
+    )
+def _ensure_open_debt(
+    session_id: str,
+    task_id: str,
+    debt_type: str,
+    *,
+    severity: str,
+    evidence: str,
+    debts: list[dict],
+) -> dict:
+    existing = list_protocol_debts(
+        status="open",
+        task_id=task_id,
+        session_id="" if task_id else session_id,
+        debt_type=debt_type,
+        limit=1,
+    )
+    debt = existing[0] if existing else create_protocol_debt(
+        session_id,
+        debt_type,
+        severity=severity,
+        task_id=task_id,
+        evidence=evidence,
+    )
+    _append_debt_ref(debts, debt, debt_type=debt_type, severity=severity)
+    return debt
 def _record_debt(session_id: str, task_id: str, debt_type: str, *, severity: str, evidence: str, debts: list[dict]):
     debt = create_protocol_debt(
         session_id,
@@ -906,13 +946,7 @@ def _record_debt(session_id: str, task_id: str, debt_type: str, *, severity: str
         task_id=task_id,
         evidence=evidence,
     )
-    debts.append(
-        {
-            "id": debt.get("id"),
-            "debt_type": debt_type,
-            "severity": severity,
-        }
-    )
+    _append_debt_ref(debts, debt, debt_type=debt_type, severity=severity)
 def handle_confidence_check(
@@ -1336,10 +1370,10 @@ def handle_task_close(
         high_stakes=bool(task.get("response_high_stakes")),
     )
-    # ── Evidence enforcement: reject 'done' without proof in strict mode ──
-    # Fase 2 R03 extension: "evidence" must not be empty, nor <50 chars, nor
-    # a single filler word like "done" / "listo" / "ok". Trivial evidence is
-    # rejected in strict mode and logged as protocol debt in any other mode.
+    # ── Evidence enforcement: reject 'done' without proof ──
+    # G1 hardening: "done" is no longer allowed to degrade into a debt-only
+    # close when verify evidence is missing. Keep the task open, open/dedupe
+    # the debt, and force the caller to provide real proof before closing.
     if task.get("must_verify") and clean_outcome == "done":
         is_trivial, trivial_reason = _is_trivial_evidence(clean_evidence)
         if not is_trivial:
@@ -1349,39 +1383,7 @@ def handle_task_close(
                 resolution="Verification evidence supplied during task_close",
             )
         else:
-            protocol_strictness = get_protocol_strictness()
-            if protocol_strictness == "strict":
-                if trivial_reason == "empty":
-                    err = "Cannot close task as 'done' without evidence."
-                    hint = (
-                        "Provide the `evidence` parameter with verifiable proof: "
-                        "test output, curl response, screenshot path, or real "
-                        "command output."
-                    )
-                else:
-                    err = (
-                        "Cannot close task as 'done' with trivial evidence "
-                        f"({trivial_reason})."
-                    )
-                    hint = (
-                        f"Evidence must be substantive: >= {R03_MIN_EVIDENCE_CHARS} "
-                        "characters AND not a single filler word. Attach real "
-                        "proof — test output excerpt, curl response, DB row, "
-                        "screenshot path, or command stdout."
-                    )
-                return json.dumps(
-                    {
-                        "ok": False,
-                        "error": err,
-                        "hint": hint,
-                        "task_id": task_id,
-                        "protocol_strictness": protocol_strictness,
-                        "evidence_quality_reason": trivial_reason,
-                    },
-                    ensure_ascii=False,
-                    indent=2,
-                )
-            _record_debt(
+            debt = _ensure_open_debt(
                 task["session_id"],
                 task_id,
                 "claimed_done_without_evidence",
@@ -1393,6 +1395,39 @@ def handle_task_close(
                 ),
                 debts=debts_created,
             )
+            if trivial_reason == "empty":
+                err = "Cannot close task as 'done' without evidence."
+                hint = (
+                    "Provide the `evidence` parameter with verifiable proof: "
+                    "test output, curl response, screenshot path, or real "
+                    "command output."
+                )
+            else:
+                err = (
+                    "Cannot close task as 'done' with trivial evidence "
+                    f"({trivial_reason})."
+                )
+                hint = (
+                    f"Evidence must be substantive: >= {R03_MIN_EVIDENCE_CHARS} "
+                    "characters AND not a single filler word. Attach real "
+                    "proof — test output excerpt, curl response, DB row, "
+                    "screenshot path, or command stdout."
+                )
+            return json.dumps(
+                {
+                    "ok": False,
+                    "error": err,
+                    "hint": hint,
+                    "task_id": task_id,
+                    "blocked_by": "g1_verify",
+                    "debt_id": debt.get("id"),
+                    "debt_type": "claimed_done_without_evidence",
+                    "evidence_quality_reason": trivial_reason,
+                    "protocol_strictness": get_protocol_strictness(),
+                },
+                ensure_ascii=False,
+                indent=2,
+            )
     # ── Release checklist: require channel alignment evidence for release tasks ──
     is_release = _is_release_task(
@@ -1430,7 +1465,7 @@ def handle_task_close(
                 (clean_change_verify or clean_evidence)[:500],
             )
             if "error" in change:
-                _record_debt(
+                debt = _ensure_open_debt(
                     task["session_id"],
                     task_id,
                     "missing_change_log",
@@ -1438,6 +1473,21 @@ def handle_task_close(
                     evidence=f"change_log failed: {change['error']}",
                     debts=debts_created,
                 )
+                if clean_outcome == "done":
+                    return json.dumps(
+                        {
+                            "ok": False,
+                            "error": "Cannot close task as 'done' because change_log creation failed.",
+                            "hint": "Capture the changed files and create the change log successfully before closing as done.",
+                            "task_id": task_id,
+                            "blocked_by": "g1_change_log",
+                            "debt_id": debt.get("id"),
+                            "debt_type": "missing_change_log",
+                            "change_log_error": change.get("error"),
+                        },
+                        ensure_ascii=False,
+                        indent=2,
+                    )
             else:
                 change_log_id = change.get("id")
                 resolve_protocol_debts(
@@ -1446,7 +1496,7 @@ def handle_task_close(
                     resolution="Change log created by nexo_task_close",
                 )
         else:
-            _record_debt(
+            debt = _ensure_open_debt(
                 task["session_id"],
                 task_id,
                 "missing_change_log",
@@ -1454,6 +1504,20 @@ def handle_task_close(
                 evidence="Task required change_log but no changed files were supplied or recorded.",
                 debts=debts_created,
             )
+            if clean_outcome == "done":
+                return json.dumps(
+                    {
+                        "ok": False,
+                        "error": "Cannot close task as 'done' without changed files for the required change_log.",
+                        "hint": "Pass `files_changed` (or open the task with files) so nexo_task_close can persist the change log before closing as done.",
+                        "task_id": task_id,
+                        "blocked_by": "g1_change_log",
+                        "debt_id": debt.get("id"),
+                        "debt_type": "missing_change_log",
+                    },
+                    ensure_ascii=False,
+                    indent=2,
+                )
     if correction:
         if (learning_title or "").strip() and (learning_content or "").strip():
@@ -1564,7 +1628,7 @@ def handle_task_close(
                 resolution="High-stakes action task has a persisted Cortex evaluation.",
             )
         else:
-            _record_debt(
+            debt = _ensure_open_debt(
                 task["session_id"],
                 task_id,
                 "missing_cortex_evaluation",
@@ -1572,6 +1636,20 @@ def handle_task_close(
                 evidence="High-stakes action task closed without nexo_cortex_decide / persisted evaluation.",
                 debts=debts_created,
             )
+            if clean_outcome == "done":
+                return json.dumps(
+                    {
+                        "ok": False,
+                        "error": "Cannot close high-stakes action task as 'done' without a persisted cortex evaluation.",
+                        "hint": "Run `nexo_cortex_decide(...)` for this task and then close it again with the final evidence.",
+                        "task_id": task_id,
+                        "blocked_by": "g1_cortex",
+                        "debt_id": debt.get("id"),
+                        "debt_type": "missing_cortex_evaluation",
+                    },
+                    ensure_ascii=False,
+                    indent=2,
+                )
     if task.get("guard_has_blocking") and not files_changed_list:
         open_task_debts = list_protocol_debts(status="open", task_id=task_id, limit=200)

package/src/resonance_map.py CHANGED Viewed

@@ -219,6 +219,8 @@ SYSTEM_OWNED_CALLERS: dict[str, str] = {
     "learning_validator":               "medio",
     "outcome_checker":                  "medio",
     "check_context":                    "medio",
+    "semantic_reasoner":                "muy_bajo",
+    "cortex_decision_critic":           "alto",
     # ---- Agent orchestration ----------------------------------------------
     "agent_run/generic":                "alto",