npm - @miller-tech/uap - Versions diffs - 1.34.0 → 1.36.0 - Mend

@miller-tech/uap 1.34.0 → 1.36.0

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (17) hide show

package/README.md +1 -1
package/dist/.tsbuildinfo +1 -1
package/dist/cli/tool-calls.js +4 -4
package/dist/cli/tool-calls.js.map +1 -1
package/dist/delivery/index.d.ts +1 -1
package/dist/delivery/index.d.ts.map +1 -1
package/dist/delivery/index.js +1 -1
package/dist/delivery/index.js.map +1 -1
package/dist/delivery/spec-imports.d.ts +30 -6
package/dist/delivery/spec-imports.d.ts.map +1 -1
package/dist/delivery/spec-imports.js +213 -11
package/dist/delivery/spec-imports.js.map +1 -1
package/package.json +1 -1
package/tools/agents/config/thinking.gbnf +25 -0
package/tools/agents/scripts/anthropic_proxy.py +60 -0
package/tools/agents/scripts/qwen_tool_call_wrapper.py +1 -1
package/tools/agents/scripts/tool_call_wrapper.py +1 -1

package/tools/agents/scripts/anthropic_proxy.py CHANGED Viewed

@@ -443,6 +443,23 @@ PROXY_TOOL_CALL_GRAMMAR_PATH = os.path.abspath(
         os.path.join(os.path.dirname(__file__), "..", "config", "tool-call.gbnf"),
     )
 )
+# Structured thinking grammar — forces a compact <think> header on non-tool
+# reasoning turns so downstream verifiers can parse the model's framing.
+# Default off (opt-in) because it changes output shape.
+PROXY_THINKING_GRAMMAR = os.environ.get(
+    "PROXY_THINKING_GRAMMAR", "off"
+).lower() not in {
+    "0",
+    "false",
+    "off",
+    "no",
+}
+PROXY_THINKING_GRAMMAR_PATH = os.path.abspath(
+    os.environ.get(
+        "PROXY_THINKING_GRAMMAR_PATH",
+        os.path.join(os.path.dirname(__file__), "..", "config", "thinking.gbnf"),
+    )
+)
 PROXY_MODEL_PROFILE_HEADER = os.environ.get(
     "PROXY_MODEL_PROFILE_HEADER", "x-uap-model-profile"
 )
@@ -534,6 +551,41 @@ def _load_tool_call_grammar(path: str) -> str:
 TOOL_CALL_GBNF = _load_tool_call_grammar(PROXY_TOOL_CALL_GRAMMAR_PATH)
 TOOL_CALL_GRAMMAR_TOOLS_COMPATIBLE = True
+def _load_thinking_grammar(path: str) -> str:
+    if not PROXY_THINKING_GRAMMAR:
+        return ""
+    try:
+        with open(path, "r", encoding="utf-8") as fh:
+            return fh.read().strip()
+    except OSError as exc:
+        logger.warning(
+            "Thinking grammar disabled: failed to read %s (%s)",
+            path,
+            exc,
+        )
+        return ""
+THINKING_GBNF = _load_thinking_grammar(PROXY_THINKING_GRAMMAR_PATH)
+def _apply_thinking_grammar(request_body: dict) -> None:
+    """Apply the structured-thinking GBNF grammar to non-tool turns.
+    Only fires when PROXY_THINKING_GRAMMAR is on, the grammar loaded
+    successfully, the request has no tools, and no upstream grammar was
+    already set (tool-call grammar takes precedence on tool turns).
+    """
+    if not PROXY_THINKING_GRAMMAR or not THINKING_GBNF:
+        return
+    if request_body.get("tools"):
+        return
+    if request_body.get("grammar"):
+        return
+    request_body["grammar"] = THINKING_GBNF
 def _resolve_passthrough_models() -> list[str]:
     raw = ANTHROPIC_PASSTHROUGH_MODELS.strip()
     if not raw:
@@ -2079,6 +2131,12 @@ async def lifespan(app: FastAPI):
         TOOL_CALL_GRAMMAR_TOOLS_COMPATIBLE,
         PROXY_TOOL_CALL_GRAMMAR_PATH,
     )
+    logger.info(
+        "Thinking grammar: enabled=%s loaded=%s path=%s",
+        PROXY_THINKING_GRAMMAR,
+        bool(THINKING_GBNF),
+        PROXY_THINKING_GRAMMAR_PATH,
+    )
     logger.info(
         "Timeouts: read=%ds generation=%ds slot_hang=%ds",
         int(PROXY_READ_TIMEOUT),
@@ -3910,6 +3968,8 @@ def build_openai_request(
     # pre-narrowing toolset so it can restore a dropped write tool.
     _maybe_inject_recon_convergence(openai_body, monitor, full_openai_tools)
+    _apply_thinking_grammar(openai_body)
     return openai_body

package/tools/agents/scripts/qwen_tool_call_wrapper.py CHANGED Viewed

@@ -46,7 +46,7 @@ logging.basicConfig(
 )
 logger = logging.getLogger("qwen35_tool_call")
-DEFAULT_LLM_SERVER = "http://192.168.1.165:4000"
+DEFAULT_LLM_SERVER = "http://127.0.0.1:4000"
 def _normalize_base_url(url: str) -> str:

package/tools/agents/scripts/tool_call_wrapper.py CHANGED Viewed

@@ -64,7 +64,7 @@ logger = logging.getLogger("uap_tool_call")
 # ── Model Profiles ──────────────────────────────────────────────────────────
-DEFAULT_LLM_SERVER = "http://192.168.1.165:4000"
+DEFAULT_LLM_SERVER = "http://127.0.0.1:4000"
 def _normalize_base_url(url: str) -> str: