npm - ultimate-pi - Versions diffs - 0.2.7 → 0.3.1 - Mend

ultimate-pi 0.2.7 → 0.3.1

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (53) hide show

package/.agents/skills/harness-eval/SKILL.md +1 -1
package/.agents/skills/harness-governor/SKILL.md +2 -2
package/.agents/skills/harness-spec/SKILL.md +1 -1
package/.pi/PACKAGING.md +3 -2
package/.pi/extensions/custom-header.ts +0 -17
package/.pi/extensions/pi-model-router-harness.ts +42 -0
package/.pi/extensions/policy-gate.ts +18 -0
package/.pi/extensions/provider-payload-sanitize.ts +66 -0
package/.pi/extensions/sentrux-rules-sync.ts +0 -18
package/.pi/harness/README.md +3 -2
package/.pi/harness/docs/adrs/0004-defer-ci-agent-smoke.md +1 -1
package/.pi/harness/docs/adrs/0006-sentrux-dual-layer.md +1 -1
package/.pi/harness/docs/adrs/0009-sentrux-rules-lifecycle.md +2 -2
package/.pi/harness/evals/smoke/README.md +1 -1
package/.pi/harness/evolution/README.md +1 -1
package/.pi/harness/evolution/chaos-drill.md +1 -1
package/.pi/prompts/harness-setup.md +42 -35
package/.pi/scripts/README.md +25 -9
package/.pi/scripts/harness-cli-verify.sh +4 -2
package/.pi/scripts/harness-seed-project-contracts.mjs +49 -0
package/.pi/scripts/harness-sync-model-router.mjs +84 -0
package/.pi/scripts/harness-verify.mjs +5 -3
package/.pi/scripts/sentrux-rules-sync.mjs +2 -2
package/.pi/scripts/vendor-sync-pi-model-router.sh +47 -0
package/.pi/settings.example.json +0 -1
package/.sentrux/rules.toml +1 -1
package/AGENTS.md +1 -1
package/CHANGELOG.md +62 -0
package/README.md +1 -1
package/THIRD_PARTY_NOTICES.md +8 -0
package/biome.json +2 -1
package/package.json +9 -10
package/vendor/pi-model-router/.prettierignore +4 -0
package/vendor/pi-model-router/.prettierrc +5 -0
package/vendor/pi-model-router/AGENTS.md +39 -0
package/vendor/pi-model-router/LICENSE +21 -0
package/vendor/pi-model-router/README.md +99 -0
package/vendor/pi-model-router/UPSTREAM_PIN.md +8 -0
package/vendor/pi-model-router/docs/ARCHITECTURE.md +54 -0
package/vendor/pi-model-router/extensions/commands.ts +720 -0
package/vendor/pi-model-router/extensions/config.ts +348 -0
package/vendor/pi-model-router/extensions/constants.ts +1 -0
package/vendor/pi-model-router/extensions/index.ts +457 -0
package/vendor/pi-model-router/extensions/provider.ts +529 -0
package/vendor/pi-model-router/extensions/routing.ts +416 -0
package/vendor/pi-model-router/extensions/state.ts +49 -0
package/vendor/pi-model-router/extensions/types.ts +86 -0
package/vendor/pi-model-router/extensions/ui.ts +130 -0
package/vendor/pi-model-router/model-router.example.json +48 -0
package/vendor/pi-model-router/package.json +48 -0
package/vendor/pi-model-router/tsconfig.json +16 -0
package/.pi/extensions/model-router-bootstrap.ts +0 -174
package/.sentrux/.harness-rules-meta.json +0 -5

package/vendor/pi-model-router/extensions/provider.ts ADDED Viewed

@@ -0,0 +1,529 @@
+import {
+  createAssistantMessageEventStream,
+  streamSimple,
+  type Api,
+  type AssistantMessage,
+  type AssistantMessageEventStream,
+  type Context,
+  type Model,
+  type SimpleStreamOptions,
+  type Message,
+} from '@mariozechner/pi-ai';
+import type {
+  ExtensionAPI,
+  ExtensionContext,
+} from '@mariozechner/pi-coding-agent';
+import type {
+  RouterConfig,
+  RoutingDecision,
+  RouterTier,
+  RouterPinByProfile,
+  RouterThinkingByProfile,
+} from './types.js';
+import { profileNames, parseCanonicalModelRef, ROUTER_TIERS } from './config.js';
+import {
+  phaseForTier,
+  buildRoutingDecision,
+  decideRouting,
+  runClassifier,
+  extractTextFromContent,
+  hasImageAttachment,
+} from './routing.js';
+export const createErrorMessage = (
+  model: Model<Api>,
+  message: string,
+): AssistantMessage => {
+  return {
+    role: 'assistant',
+    content: [],
+    api: model.api,
+    provider: model.provider,
+    model: model.id,
+    usage: {
+      input: 0,
+      output: 0,
+      cacheRead: 0,
+      cacheWrite: 0,
+      totalTokens: 0,
+      cost: { input: 0, output: 0, cacheRead: 0, cacheWrite: 0, total: 0 },
+    },
+    stopReason: 'error',
+    errorMessage: message,
+    timestamp: Date.now(),
+  };
+};
+/**
+ * Heuristic token estimator (conservative: 3 characters per token)
+ */
+const estimateTokens = (text: string): number => Math.ceil(text.length / 3);
+/**
+ * Truncate context to fit within a target token limit by removing oldest messages.
+ * Always preserves the first system message and the latest user message.
+ */
+const truncateContext = (context: Context, limit: number): Context => {
+  const messages = [...context.messages];
+  if (messages.length <= 1) return context;
+  const getSystemTokens = () =>
+    context.systemPrompt ? estimateTokens(context.systemPrompt) : 0;
+  // Initial estimate
+  const totalTokens =
+    getSystemTokens() +
+    messages.reduce(
+      (sum, m) => sum + estimateTokens(extractTextFromContent(m.content)),
+      0,
+    );
+  if (totalTokens <= limit) return context;
+  const latestMessage = messages.pop();
+  if (!latestMessage) return context;
+  // Remove oldest until it fits
+  while (messages.length > 0) {
+    const currentTokens =
+      getSystemTokens() +
+      estimateTokens(extractTextFromContent(latestMessage.content)) +
+      messages.reduce(
+        (sum, m) => sum + estimateTokens(extractTextFromContent(m.content)),
+        0,
+      );
+    if (currentTokens <= limit) break;
+    messages.shift(); // Remove oldest
+  }
+  const finalMessages: Message[] = [];
+  finalMessages.push(...messages);
+  finalMessages.push(latestMessage);
+  return { ...context, messages: finalMessages };
+};
+const supportsReasoning = (
+  profile: RouterConfig['profiles'][string],
+  modelRegistry: ExtensionContext['modelRegistry'] | undefined,
+): boolean => {
+  if (!modelRegistry) return false;
+  for (const tier of ROUTER_TIERS) {
+    try {
+      const { provider, modelId } = parseCanonicalModelRef(profile[tier].model);
+      if (modelRegistry.find(provider, modelId)?.reasoning) {
+        return true;
+      }
+    } catch (_error) {
+      // ignore invalid model refs here; config normalization handles warnings
+    }
+  }
+  return false;
+};
+export const registerRouterProvider = (
+  pi: ExtensionAPI,
+  state: {
+    lastRegisteredModels: string;
+    readonly currentConfig: RouterConfig;
+    readonly currentModelRegistry:
+      | ExtensionContext['modelRegistry']
+      | undefined;
+    readonly lastExtensionContext: ExtensionContext | undefined;
+    selectedProfile: string;
+    routerEnabled: boolean;
+    lastDecision: RoutingDecision | undefined;
+    readonly thinkingByProfile: RouterThinkingByProfile;
+    readonly pinnedTierByProfile: RouterPinByProfile;
+    accumulatedCost: number;
+  },
+  actions: {
+    persistState: () => void;
+    recordDebugDecision: (decision: RoutingDecision) => void;
+    getThinkingOverride: (profileName: string, tier: RouterTier) => any;
+    updateStatus: (ctx: ExtensionContext) => void;
+  },
+) => {
+  const profileList = profileNames(state.currentConfig);
+  // Map profiles to their capacities
+  const modelDefinitions = profileList.map((name) => {
+    const profile = state.currentConfig.profiles[name];
+    let contextWindow = 1_000_000;
+    let maxTokens = 64_000;
+    if (state.currentModelRegistry) {
+      for (const tier of ROUTER_TIERS) {
+        try {
+          const { provider, modelId } = parseCanonicalModelRef(
+            profile[tier].model,
+          );
+          const tierModel = state.currentModelRegistry.find(provider, modelId);
+          if (tierModel) {
+            if (tier === 'high') {
+              contextWindow = tierModel.contextWindow ?? contextWindow;
+              maxTokens = tierModel.maxTokens ?? maxTokens;
+            }
+          }
+        } catch (_error) {
+          // ignore
+        }
+      }
+    }
+    return {
+      id: name,
+      name: `Router ${name}`,
+      reasoning: supportsReasoning(profile, state.currentModelRegistry),
+      input: ['text', 'image'] as ('text' | 'image')[],
+      cost: { input: 0, output: 0, cacheRead: 0, cacheWrite: 0 },
+      contextWindow,
+      maxTokens,
+    };
+  });
+  const modelsKey = modelDefinitions
+    .map((m) => `${m.id}:${m.contextWindow}:${m.maxTokens}:${m.reasoning}`)
+    .join(',');
+  if (state.lastRegisteredModels === modelsKey) return;
+  pi.registerProvider('router', {
+    baseUrl: 'router://local',
+    apiKey: 'pi-model-router',
+    api: 'router-local-api',
+    models: modelDefinitions,
+    streamSimple(
+      model: Model<Api>,
+      context: Context,
+      options?: SimpleStreamOptions,
+    ): AssistantMessageEventStream {
+      const stream = createAssistantMessageEventStream();
+      (async () => {
+        try {
+          if (!state.currentModelRegistry) {
+            throw new Error(
+              'Router provider not initialized yet. Wait for session_start and retry.',
+            );
+          }
+          const profile = state.currentConfig.profiles[model.id];
+          if (!profile) {
+            throw new Error(`Unknown router profile: ${model.id}`);
+          }
+          state.selectedProfile = model.id;
+          state.routerEnabled = true;
+          const pinnedTier = state.pinnedTierByProfile[model.id];
+          const isBudgetExceeded =
+            state.currentConfig.maxSessionBudget !== undefined &&
+            state.accumulatedCost >= state.currentConfig.maxSessionBudget;
+          let decision: RoutingDecision = decideRouting(
+            context,
+            model.id,
+            profile,
+            state.lastDecision,
+            pinnedTier,
+            state.thinkingByProfile[model.id],
+            state.currentConfig.phaseBias,
+            state.currentConfig.rules,
+            isBudgetExceeded,
+          );
+          // Optional Context Trigger Upgrade
+          if (
+            state.currentConfig.largeContextThreshold &&
+            decision.tier !== 'high' &&
+            state.lastExtensionContext
+          ) {
+            try {
+              const usage = await state.lastExtensionContext.getContextUsage();
+              if (
+                usage?.tokens &&
+                usage.tokens > state.currentConfig.largeContextThreshold
+              ) {
+                decision = buildRoutingDecision(
+                  model.id,
+                  profile,
+                  'high',
+                  'planning',
+                  `Context usage (${usage.tokens}) exceeds threshold (${state.currentConfig.largeContextThreshold}). Forced high tier.`,
+                  state.thinkingByProfile[model.id],
+                  false,
+                );
+                decision.isContextTriggered = true;
+              }
+            } catch (e) {
+              // ignore
+            }
+          }
+          // Classifier Override
+          if (
+            state.currentConfig.classifierModel &&
+            !pinnedTier &&
+            !decision.isContextTriggered &&
+            !decision.isRuleMatched
+          ) {
+            const classifierResult = await runClassifier(
+              state.currentConfig.classifierModel,
+              state.currentModelRegistry,
+              context,
+              state.lastDecision?.phase,
+            );
+            if (classifierResult) {
+              decision = buildRoutingDecision(
+                model.id,
+                profile,
+                classifierResult.tier,
+                phaseForTier(classifierResult.tier),
+                `Classifier: ${classifierResult.reasoning}`,
+                state.thinkingByProfile[model.id],
+                true,
+              );
+              if (isBudgetExceeded && decision.tier === 'high') {
+                decision.tier = 'medium';
+                decision.phase = 'implementation';
+                decision.reasoning = `Budget exceeded. Downgraded classifier decision to medium. (Original: ${decision.reasoning})`;
+                decision.isBudgetForced = true;
+              }
+            }
+          }
+          const lastMessage = context.messages[context.messages.length - 1];
+          const previousDecision = state.lastDecision;
+          const isGoogleThinkingToolContinuation =
+            lastMessage?.role === 'toolResult' &&
+            previousDecision?.profile === model.id &&
+            previousDecision.targetProvider === 'google' &&
+            previousDecision.thinking !== 'off' &&
+            decision.targetProvider === 'google' &&
+            decision.thinking !== 'off' &&
+            previousDecision.targetLabel !== decision.targetLabel;
+          if (isGoogleThinkingToolContinuation) {
+            decision = {
+              ...decision,
+              tier: previousDecision!.tier,
+              phase: previousDecision!.phase,
+              targetProvider: previousDecision!.targetProvider,
+              targetModelId: previousDecision!.targetModelId,
+              targetLabel: previousDecision!.targetLabel,
+              thinking: previousDecision!.thinking,
+              reasoning:
+                `Preserved ${previousDecision!.targetLabel} for a Google tool-result continuation ` +
+                `to avoid thought-signature replay errors. (Original: ${decision.reasoning})`,
+            };
+          }
+          const imageAttached = hasImageAttachment(context);
+          if (imageAttached) {
+            const checkModelSupportsImage = (modelRef: string) => {
+              try {
+                const { provider, modelId } = parseCanonicalModelRef(modelRef);
+                const m = state.currentModelRegistry?.find(provider, modelId);
+                return m?.input?.includes('image') ?? false;
+              } catch {
+                return false;
+              }
+            };
+            const tierModels = [
+              decision.targetLabel,
+              ...(profile[decision.tier].fallbacks ?? []),
+            ];
+            if (!tierModels.some(checkModelSupportsImage)) {
+              const tiersToTry: RouterTier[] =
+                decision.tier === 'low'
+                  ? ['medium', 'high']
+                  : decision.tier === 'medium'
+                    ? ['high']
+                    : [];
+              let foundTier: RouterTier | undefined;
+              for (const t of tiersToTry) {
+                const tModels = [
+                  profile[t].model,
+                  ...(profile[t].fallbacks ?? []),
+                ];
+                if (tModels.some(checkModelSupportsImage)) {
+                  foundTier = t;
+                  break;
+                }
+              }
+              if (foundTier) {
+                decision = buildRoutingDecision(
+                  model.id,
+                  profile,
+                  foundTier,
+                  phaseForTier(foundTier),
+                  `Forced ${foundTier} tier because the originally routed ${decision.tier} tier does not support image attachments.`,
+                  state.thinkingByProfile[model.id],
+                  false,
+                );
+              }
+            }
+          }
+          state.lastDecision = decision;
+          actions.recordDebugDecision(decision);
+          if (state.lastExtensionContext) {
+            actions.updateStatus(state.lastExtensionContext);
+          }
+          let modelsToTry = [
+            decision.targetLabel,
+            ...(profile[decision.tier].fallbacks ?? []),
+          ];
+          if (imageAttached) {
+            modelsToTry = modelsToTry.filter((modelRef) => {
+              try {
+                const { provider, modelId } = parseCanonicalModelRef(modelRef);
+                const m = state.currentModelRegistry?.find(provider, modelId);
+                return m?.input?.includes('image') ?? false;
+              } catch {
+                return false;
+              }
+            });
+            if (modelsToTry.length === 0) {
+              modelsToTry = [decision.targetLabel];
+            }
+          }
+          let lastError: any;
+          let success = false;
+          for (let i = 0; i < modelsToTry.length; i++) {
+            const modelRef = modelsToTry[i];
+            const { provider: targetProvider, modelId: targetModelId } =
+              parseCanonicalModelRef(modelRef);
+            if (targetProvider === 'router') continue;
+            const targetModel = state.currentModelRegistry.find(
+              targetProvider,
+              targetModelId,
+            );
+            if (!targetModel) {
+              lastError = new Error(
+                `Routed model not found: ${targetProvider}/${targetModelId}`,
+              );
+              continue;
+            }
+            const auth =
+              await state.currentModelRegistry.getApiKeyAndHeaders(targetModel);
+            if (!auth.ok || !auth.apiKey) {
+              lastError = new Error(
+                auth.ok
+                  ? `No API key for routed model: ${targetProvider}/${targetModelId}`
+                  : `Auth failed for routed model: ${targetProvider}/${targetModelId}: ${auth.error}`,
+              );
+              continue;
+            }
+            const apiKey = auth.apiKey;
+            const headers = auth.headers;
+            try {
+              // HONESTY CHECK & AUTO-TRUNCATION
+              // If the picked model has a smaller context than what we reported, truncate now.
+              let effectiveContext = context;
+              const targetLimit = targetModel.contextWindow || 128_000;
+              if (targetLimit < model.contextWindow!) {
+                effectiveContext = truncateContext(context, targetLimit);
+              }
+              const thinkingOverride = actions.getThinkingOverride(
+                model.id,
+                decision.tier,
+              );
+              const delegatedReasoning =
+                targetModel.reasoning &&
+                (thinkingOverride ?? decision.thinking) !== 'off'
+                  ? (thinkingOverride ?? decision.thinking)
+                  : undefined;
+              if (state.lastExtensionContext) {
+                if (delegatedReasoning) {
+                  state.lastExtensionContext.ui.setHiddenThinkingLabel?.(
+                    `Thinking (${targetProvider}/${targetModelId})...`,
+                  );
+                } else {
+                  state.lastExtensionContext.ui.setHiddenThinkingLabel?.();
+                }
+              }
+              const delegatedStream = streamSimple(
+                targetModel,
+                effectiveContext,
+                {
+                  ...options,
+                  apiKey,
+                  headers,
+                  ...(delegatedReasoning
+                    ? { reasoning: delegatedReasoning }
+                    : {}),
+                },
+              );
+              let contentReceived = false;
+              for await (const event of delegatedStream) {
+                if (event.type === 'done') {
+                  const cost = event.message.usage?.cost?.total ?? 0;
+                  state.accumulatedCost += cost;
+                }
+                if (event.type === 'error' && !contentReceived) {
+                  throw new Error(
+                    (event as any).error?.errorMessage ||
+                      'Model failed before sending content.',
+                  );
+                }
+                const isContent =
+                  event.type === 'text_delta' ||
+                  event.type === 'thinking_delta' ||
+                  event.type === 'toolcall_delta' ||
+                  event.type === 'toolcall_end';
+                if (isContent) contentReceived = true;
+                stream.push(event);
+              }
+              success = true;
+              if (i > 0) decision.isFallback = true;
+              break;
+            } catch (err) {
+              lastError = err;
+            }
+          }
+          if (!success) {
+            throw (
+              lastError ||
+              new Error('Failed to delegate to any model in the chain.')
+            );
+          }
+          stream.end();
+        } catch (error) {
+          stream.push({
+            type: 'error',
+            reason: 'error',
+            error: createErrorMessage(
+              model,
+              error instanceof Error ? error.message : String(error),
+            ),
+          });
+          stream.end();
+        } finally {
+          actions.persistState();
+        }
+      })();
+      return stream;
+    },
+  });
+  state.lastRegisteredModels = modelsKey;
+};