npm - @miller-tech/uap - Versions diffs - 1.4.3 → 1.5.2 - Mend

@miller-tech/uap 1.4.3 → 1.5.2

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (105) hide show

package/dist/benchmarks/agents/naive-agent.d.ts.map +1 -1
package/dist/benchmarks/agents/naive-agent.js +1 -1
package/dist/benchmarks/agents/naive-agent.js.map +1 -1
package/dist/benchmarks/agents/uap-agent.d.ts.map +1 -1
package/dist/benchmarks/agents/uap-agent.js +1 -1
package/dist/benchmarks/agents/uap-agent.js.map +1 -1
package/dist/benchmarks/improved-benchmark.d.ts.map +1 -1
package/dist/benchmarks/improved-benchmark.js +3 -3
package/dist/benchmarks/improved-benchmark.js.map +1 -1
package/dist/benchmarks/model-integration.js +1 -1
package/dist/benchmarks/model-integration.js.map +1 -1
package/dist/benchmarks/multi-turn-agent.d.ts.map +1 -1
package/dist/benchmarks/multi-turn-agent.js +3 -3
package/dist/benchmarks/multi-turn-agent.js.map +1 -1
package/dist/bin/cli.js +4 -0
package/dist/bin/cli.js.map +1 -1
package/dist/bin/llama-server-optimize.js +1 -1
package/dist/bin/llama-server-optimize.js.map +1 -1
package/dist/cli/dashboard.js +1 -1
package/dist/cli/dashboard.js.map +1 -1
package/dist/cli/model.d.ts.map +1 -1
package/dist/cli/model.js +222 -1
package/dist/cli/model.js.map +1 -1
package/dist/cli/policy.d.ts +16 -0
package/dist/cli/policy.d.ts.map +1 -0
package/dist/cli/policy.js +159 -0
package/dist/cli/policy.js.map +1 -0
package/dist/cli/rtk.js +2 -2
package/dist/cli/rtk.js.map +1 -1
package/dist/cli/uap.js +2 -2
package/dist/cli/uap.js.map +1 -1
package/dist/cli/update.d.ts.map +1 -1
package/dist/cli/update.js +7 -10
package/dist/cli/update.js.map +1 -1
package/dist/cli/worktree.d.ts +1 -1
package/dist/cli/worktree.d.ts.map +1 -1
package/dist/cli/worktree.js +77 -1
package/dist/cli/worktree.js.map +1 -1
package/dist/coordination/deploy-batcher.d.ts.map +1 -1
package/dist/coordination/deploy-batcher.js +3 -2
package/dist/coordination/deploy-batcher.js.map +1 -1
package/dist/mcp-router/executor/client.d.ts +2 -0
package/dist/mcp-router/executor/client.d.ts.map +1 -1
package/dist/mcp-router/executor/client.js +21 -1
package/dist/mcp-router/executor/client.js.map +1 -1
package/dist/mcp-router/output-compressor.js +1 -1
package/dist/mcp-router/output-compressor.js.map +1 -1
package/dist/mcp-router/server.d.ts.map +1 -1
package/dist/mcp-router/server.js +116 -31
package/dist/mcp-router/server.js.map +1 -1
package/dist/mcp-router/tools/execute.d.ts.map +1 -1
package/dist/mcp-router/tools/execute.js +3 -1
package/dist/mcp-router/tools/execute.js.map +1 -1
package/dist/memory/adaptive-context.d.ts.map +1 -1
package/dist/memory/adaptive-context.js +2 -0
package/dist/memory/adaptive-context.js.map +1 -1
package/dist/memory/backends/factory.d.ts.map +1 -1
package/dist/memory/backends/factory.js +2 -2
package/dist/memory/backends/factory.js.map +1 -1
package/dist/memory/backends/github.d.ts.map +1 -1
package/dist/memory/backends/github.js +1 -1
package/dist/memory/backends/github.js.map +1 -1
package/dist/memory/dynamic-retrieval.d.ts.map +1 -1
package/dist/memory/dynamic-retrieval.js +4 -2
package/dist/memory/dynamic-retrieval.js.map +1 -1
package/dist/memory/embeddings.d.ts.map +1 -1
package/dist/memory/embeddings.js +12 -2
package/dist/memory/embeddings.js.map +1 -1
package/dist/memory/knowledge-graph.js +12 -12
package/dist/memory/knowledge-graph.js.map +1 -1
package/dist/models/analytics.js +8 -8
package/dist/models/analytics.js.map +1 -1
package/dist/models/router.d.ts +1 -0
package/dist/models/router.d.ts.map +1 -1
package/dist/models/router.js +13 -0
package/dist/models/router.js.map +1 -1
package/dist/models/types.d.ts +1 -1
package/dist/models/types.d.ts.map +1 -1
package/dist/policies/database-manager.d.ts +5 -0
package/dist/policies/database-manager.d.ts.map +1 -1
package/dist/policies/database-manager.js +20 -0
package/dist/policies/database-manager.js.map +1 -1
package/dist/policies/policy-gate.d.ts +16 -0
package/dist/policies/policy-gate.d.ts.map +1 -1
package/dist/policies/policy-gate.js +88 -2
package/dist/policies/policy-gate.js.map +1 -1
package/dist/policies/policy-memory.d.ts +1 -0
package/dist/policies/policy-memory.d.ts.map +1 -1
package/dist/policies/policy-memory.js +33 -4
package/dist/policies/policy-memory.js.map +1 -1
package/dist/policies/policy-tools.d.ts.map +1 -1
package/dist/policies/policy-tools.js +2 -1
package/dist/policies/policy-tools.js.map +1 -1
package/dist/policies/schemas/policy.d.ts +3 -3
package/dist/policies/schemas/policy.js +1 -1
package/dist/policies/schemas/policy.js.map +1 -1
package/dist/tasks/service.js +1 -1
package/dist/tasks/service.js.map +1 -1
package/docs/MODEL_ROUTING_IMPLEMENTATION_SUMMARY.md +281 -0
package/docs/MODEL_ROUTING_OPTIMIZATION_PLAN.md +320 -0
package/docs/POLICY_GATE_IMPLEMENTATION.md +245 -0
package/package.json +4 -1
package/templates/hooks/session-start.sh +36 -6
package/tools/agents/scripts/tool-choice-proxy.cjs +29 -33
package/tools/agents/scripts/tool_call_wrapper.py +14 -5

package/tools/agents/scripts/tool-choice-proxy.cjs CHANGED Viewed

@@ -52,8 +52,6 @@ const MAX_OUTPUT_HISTORY = 10;
 let consecutiveIdenticalOutputs = 0;
 // --- Option 6: Semantic dedup ---
-const recentCommandPrefixes = [];
-const MAX_CMD_HISTORY = 10;
 function simpleHash(s) {
   let h = 0;
@@ -127,7 +125,10 @@ const server = http.createServer((req, res) => {
           console.log(`[proxy] #${n} SOFT BUDGET: tool_choice=auto`);
         } else if (parsed.tools && parsed.tools.length > 0) {
           const original = parsed.tool_choice;
-          parsed.tool_choice = FORCE_TOOL_CHOICE;
+          // Only override string values, preserve object structures (per-tool choice)
+          if (typeof parsed.tool_choice === 'string') {
+            parsed.tool_choice = FORCE_TOOL_CHOICE;
+          }
           toolForceCount++;
         }
@@ -233,43 +234,38 @@ const server = http.createServer((req, res) => {
         res.writeHead(proxyRes.statusCode || 200, proxyRes.headers);
         // === Track response for output-diff detection ===
-        const responseChunks = [];
+        // Use incremental hashing to avoid buffering the entire response body.
+        // Previously the proxy accumulated all chunks in memory and re-parsed
+        // the full response just to compute a hash — doubling memory usage.
+        let runningHash = 0;
+        const isChatEndpoint = req.url && req.url.includes('/chat/completions');
         proxyRes.on('data', (chunk) => {
-          responseChunks.push(chunk);
           res.write(chunk);
+          // Compute hash incrementally from each chunk
+          if (isChatEndpoint) {
+            const s = chunk.toString();
+            for (let i = 0; i < Math.min(s.length, 2000); i++) {
+              runningHash = ((runningHash << 5) - runningHash + s.charCodeAt(i)) | 0;
+            }
+          }
         });
         proxyRes.on('end', () => {
           res.end();
           // Track output hash for diff detection
-          if (req.url && req.url.includes('/chat/completions')) {
-            const responseBody = Buffer.concat(responseChunks).toString();
-            try {
-              const respParsed = JSON.parse(responseBody);
-              const content = respParsed?.choices?.[0]?.message?.content || '';
-              const toolCalls = respParsed?.choices?.[0]?.message?.tool_calls || [];
-              // Hash the response content + tool call args
-              const hashInput =
-                content + toolCalls.map((tc) => tc?.function?.arguments || '').join('');
-              if (hashInput.length > 0) {
-                const hash = simpleHash(hashInput);
-                if (
-                  recentOutputHashes.length > 0 &&
-                  recentOutputHashes[recentOutputHashes.length - 1] === hash
-                ) {
-                  consecutiveIdenticalOutputs++;
-                } else {
-                  consecutiveIdenticalOutputs = 0;
-                }
-                recentOutputHashes.push(hash);
-                if (recentOutputHashes.length > MAX_OUTPUT_HISTORY) {
-                  recentOutputHashes.shift();
-                }
-              }
-            } catch (e) {
-              // Ignore parse errors on response
+          if (isChatEndpoint && runningHash !== 0) {
+            if (
+              recentOutputHashes.length > 0 &&
+              recentOutputHashes[recentOutputHashes.length - 1] === runningHash
+            ) {
+              consecutiveIdenticalOutputs++;
+            } else {
+              consecutiveIdenticalOutputs = 0;
+            }
+            recentOutputHashes.push(runningHash);
+            if (recentOutputHashes.length > MAX_OUTPUT_HISTORY) {
+              recentOutputHashes.shift();
             }
           }
         });

package/tools/agents/scripts/tool_call_wrapper.py CHANGED Viewed

@@ -83,7 +83,7 @@ MODEL_PROFILES: Dict[str, Dict[str, Any]] = {
         "dynamic_temp_floor": 0.2,
     },
     "qwen35": {
-        "temperature": 0.6,
+        "temperature": 0.3,
         "top_p": 0.9,
         "presence_penalty": 0.0,
         "max_tokens": 4096,
@@ -105,7 +105,7 @@ MODEL_PROFILES: Dict[str, Dict[str, Any]] = {
             "CRITICAL: You MUST emit ALL tool calls in a SINGLE response. "
             "Each tool call must be a separate <tool_call>...</tool_call> block. "
             "Do NOT call one tool and wait - emit ALL tool calls together NOW. "
-            "If asked to do 3 things, you must produce 3 tool calls in one response."
+            "You must produce all required tool calls in one response."
         ),
     },
     "llama": {
@@ -206,7 +206,7 @@ class ToolCallClient:
         "max_tokens": 4096,
         "enable_thinking": False,
         "max_retries": 3,
-        "backoff_factor": 2.0,
+        "backoff_factor": 1.0,
         "base_url": "http://127.0.0.1:8080/v1",
         "api_key": "not-needed",
         "model": "default",
@@ -337,8 +337,12 @@ class ToolCallClient:
         # Make a copy of messages to avoid modifying original
         current_messages = [msg.copy() for msg in messages]
-        # Strategy 2: Inject multi-tool system prompt
-        if self.config.get("batch_tool_calls") and len(tools) > 1:
+        # Strategy 2: Inject multi-tool system prompt (only when multiple tool calls expected)
+        if (
+            self.config.get("batch_tool_calls")
+            and expected_tool_calls
+            and expected_tool_calls > 1
+        ):
             batch_prompt = self.config.get(
                 "batch_system_prompt", DEFAULT_BATCH_SYSTEM_PROMPT
             )
@@ -402,6 +406,11 @@ class ToolCallClient:
                             "enable_thinking": self.config.get("enable_thinking", False)
                         }
                     }
+                    # Version check: llama.cpp >= 3761 supports chat_template_kwargs
+                    # Older versions will ignore unknown extra_body keys
+                    logger.debug(
+                        f"Sending chat_template_kwargs with enable_thinking={self.config.get('enable_thinking', False)}"
+                    )
                 logger.debug(
                     f"Attempt {attempt + 1}/{max_retries}: "