npm - aigetwey - Versions diffs - 1.0.1 - Mend

aigetwey 1.0.1

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (216) hide show

package/CHANGELOG.md +84 -0
package/LICENSE +21 -0
package/README.md +302 -0
package/assets/logo.svg +8 -0
package/assets/screenshot.png +0 -0
package/assets/wordmark.svg +9 -0
package/config.example.yaml +56 -0
package/dashboard/.env.example +12 -0
package/dashboard/next-env.d.ts +6 -0
package/dashboard/next.config.ts +12 -0
package/dashboard/package-lock.json +1771 -0
package/dashboard/package.json +29 -0
package/dashboard/postcss.config.mjs +5 -0
package/dashboard/src/app/(console)/combos/page.tsx +10 -0
package/dashboard/src/app/(console)/config/page.tsx +5 -0
package/dashboard/src/app/(console)/console/page.tsx +92 -0
package/dashboard/src/app/(console)/endpoint/page.tsx +5 -0
package/dashboard/src/app/(console)/layout.tsx +17 -0
package/dashboard/src/app/(console)/page.tsx +8 -0
package/dashboard/src/app/(console)/providers/[id]/page.tsx +6 -0
package/dashboard/src/app/(console)/providers/page.tsx +5 -0
package/dashboard/src/app/(console)/quota/page.tsx +5 -0
package/dashboard/src/app/(console)/tools/[id]/page.tsx +6 -0
package/dashboard/src/app/(console)/tools/page.tsx +5 -0
package/dashboard/src/app/(console)/usage/page.tsx +24 -0
package/dashboard/src/app/api/cli-detect/[tool]/route.ts +253 -0
package/dashboard/src/app/api/gw/[...path]/route.ts +89 -0
package/dashboard/src/app/api/login/route.ts +30 -0
package/dashboard/src/app/api/logout/route.ts +9 -0
package/dashboard/src/app/api/password/route.ts +34 -0
package/dashboard/src/app/globals.css +340 -0
package/dashboard/src/app/icon.svg +8 -0
package/dashboard/src/app/layout.tsx +28 -0
package/dashboard/src/app/login/page.tsx +60 -0
package/dashboard/src/components/AreaChart.tsx +115 -0
package/dashboard/src/components/Badge.tsx +32 -0
package/dashboard/src/components/Button.tsx +60 -0
package/dashboard/src/components/CapacityBadges.tsx +40 -0
package/dashboard/src/components/Checkbox.tsx +40 -0
package/dashboard/src/components/CliToolConfig.tsx +63 -0
package/dashboard/src/components/ConfigEditor.tsx +199 -0
package/dashboard/src/components/ConfirmModal.tsx +36 -0
package/dashboard/src/components/CooldownTimer.tsx +42 -0
package/dashboard/src/components/EndpointView.tsx +439 -0
package/dashboard/src/components/Icon.tsx +25 -0
package/dashboard/src/components/KeyReveal.tsx +78 -0
package/dashboard/src/components/Lamp.tsx +8 -0
package/dashboard/src/components/LogTable.tsx +223 -0
package/dashboard/src/components/LogoutButton.tsx +20 -0
package/dashboard/src/components/ModelPicker.tsx +121 -0
package/dashboard/src/components/ModelSelectModal.tsx +126 -0
package/dashboard/src/components/PasswordEditor.tsx +86 -0
package/dashboard/src/components/PricingEditor.tsx +171 -0
package/dashboard/src/components/ProviderDetail.tsx +566 -0
package/dashboard/src/components/ProviderManager.tsx +311 -0
package/dashboard/src/components/QuotaView.tsx +78 -0
package/dashboard/src/components/Rail.tsx +82 -0
package/dashboard/src/components/RichCard.tsx +46 -0
package/dashboard/src/components/RoutingView.tsx +329 -0
package/dashboard/src/components/ThemeProvider.tsx +36 -0
package/dashboard/src/components/ToastProvider.tsx +58 -0
package/dashboard/src/components/ToolDetail.tsx +475 -0
package/dashboard/src/components/TopBar.tsx +128 -0
package/dashboard/src/components/UsageView.tsx +151 -0
package/dashboard/src/components/ui.tsx +54 -0
package/dashboard/src/lib/capabilities.ts +318 -0
package/dashboard/src/lib/cliTools.ts +120 -0
package/dashboard/src/lib/client.ts +190 -0
package/dashboard/src/lib/gateway.ts +269 -0
package/dashboard/src/lib/session.ts +71 -0
package/dashboard/src/middleware.ts +37 -0
package/dashboard/tsconfig.json +21 -0
package/dist/adapters/anthropic.js +289 -0
package/dist/adapters/anthropic.js.map +1 -0
package/dist/adapters/gemini.js +268 -0
package/dist/adapters/gemini.js.map +1 -0
package/dist/adapters/index.js +8 -0
package/dist/adapters/index.js.map +1 -0
package/dist/adapters/openai.js +13 -0
package/dist/adapters/openai.js.map +1 -0
package/dist/cli/tray/autostart.js +152 -0
package/dist/cli/tray/autostart.js.map +1 -0
package/dist/cli/tray/icon.js +4 -0
package/dist/cli/tray/icon.js.map +1 -0
package/dist/cli/tray/tray.js +141 -0
package/dist/cli/tray/tray.js.map +1 -0
package/dist/cli/tray/trayRuntime.js +91 -0
package/dist/cli/tray/trayRuntime.js.map +1 -0
package/dist/cli.js +361 -0
package/dist/cli.js.map +1 -0
package/dist/config.js +728 -0
package/dist/config.js.map +1 -0
package/dist/core/authStore.js +78 -0
package/dist/core/authStore.js.map +1 -0
package/dist/core/canonical.js +9 -0
package/dist/core/canonical.js.map +1 -0
package/dist/core/console-buffer.js +25 -0
package/dist/core/console-buffer.js.map +1 -0
package/dist/core/fallback.js +62 -0
package/dist/core/fallback.js.map +1 -0
package/dist/core/handler.js +174 -0
package/dist/core/handler.js.map +1 -0
package/dist/core/keypool.js +105 -0
package/dist/core/keypool.js.map +1 -0
package/dist/core/quota.js +165 -0
package/dist/core/quota.js.map +1 -0
package/dist/core/state.js +52 -0
package/dist/core/state.js.map +1 -0
package/dist/db.js +193 -0
package/dist/db.js.map +1 -0
package/dist/headroom/compress.js +44 -0
package/dist/headroom/compress.js.map +1 -0
package/dist/headroom/detect.js +108 -0
package/dist/headroom/detect.js.map +1 -0
package/dist/headroom/process.js +158 -0
package/dist/headroom/process.js.map +1 -0
package/dist/inject/caveman.js +30 -0
package/dist/inject/caveman.js.map +1 -0
package/dist/inject/index.js +24 -0
package/dist/inject/index.js.map +1 -0
package/dist/inject/ponytail.js +19 -0
package/dist/inject/ponytail.js.map +1 -0
package/dist/middleware/auth.js +66 -0
package/dist/middleware/auth.js.map +1 -0
package/dist/providers/capabilities.js +246 -0
package/dist/providers/capabilities.js.map +1 -0
package/dist/providers/free.js +43 -0
package/dist/providers/free.js.map +1 -0
package/dist/providers/pricing.js +224 -0
package/dist/providers/pricing.js.map +1 -0
package/dist/providers/vertex.js +97 -0
package/dist/providers/vertex.js.map +1 -0
package/dist/routes/admin.js +622 -0
package/dist/routes/admin.js.map +1 -0
package/dist/routes/health.js +4 -0
package/dist/routes/health.js.map +1 -0
package/dist/routes/index.js +12 -0
package/dist/routes/index.js.map +1 -0
package/dist/routes/v1.js +75 -0
package/dist/routes/v1.js.map +1 -0
package/dist/rtk/detect.js +50 -0
package/dist/rtk/detect.js.map +1 -0
package/dist/rtk/filters.js +85 -0
package/dist/rtk/filters.js.map +1 -0
package/dist/rtk/index.js +39 -0
package/dist/rtk/index.js.map +1 -0
package/dist/server.js +100 -0
package/dist/server.js.map +1 -0
package/dist/stream/anthropic-stream.js +239 -0
package/dist/stream/anthropic-stream.js.map +1 -0
package/dist/stream/chunk.js +7 -0
package/dist/stream/chunk.js.map +1 -0
package/dist/stream/gemini-stream.js +135 -0
package/dist/stream/gemini-stream.js.map +1 -0
package/dist/stream/index.js +12 -0
package/dist/stream/index.js.map +1 -0
package/dist/stream/openai-stream.js +34 -0
package/dist/stream/openai-stream.js.map +1 -0
package/dist/stream/sse.js +64 -0
package/dist/stream/sse.js.map +1 -0
package/dist/translator/thinking.js +70 -0
package/dist/translator/thinking.js.map +1 -0
package/dist/translator/thinkingUnified.js +322 -0
package/dist/translator/thinkingUnified.js.map +1 -0
package/dist/upstream/client.js +120 -0
package/dist/upstream/client.js.map +1 -0
package/package.json +76 -0
package/run.sh +27 -0
package/src/adapters/anthropic.ts +377 -0
package/src/adapters/gemini.ts +341 -0
package/src/adapters/index.ts +17 -0
package/src/adapters/openai.ts +22 -0
package/src/cli/tray/autostart.ts +133 -0
package/src/cli/tray/icon.ts +4 -0
package/src/cli/tray/tray.ts +156 -0
package/src/cli/tray/trayRuntime.ts +90 -0
package/src/cli.ts +379 -0
package/src/config.ts +777 -0
package/src/core/authStore.ts +86 -0
package/src/core/canonical.ts +93 -0
package/src/core/console-buffer.ts +39 -0
package/src/core/fallback.ts +116 -0
package/src/core/handler.ts +236 -0
package/src/core/keypool.ts +152 -0
package/src/core/quota.ts +214 -0
package/src/core/state.ts +65 -0
package/src/db.ts +280 -0
package/src/headroom/compress.ts +78 -0
package/src/headroom/detect.ts +119 -0
package/src/headroom/process.ts +166 -0
package/src/inject/caveman.ts +35 -0
package/src/inject/index.ts +46 -0
package/src/inject/ponytail.ts +31 -0
package/src/middleware/auth.ts +76 -0
package/src/providers/capabilities.ts +297 -0
package/src/providers/free.ts +53 -0
package/src/providers/pricing.ts +261 -0
package/src/providers/vertex.ts +117 -0
package/src/routes/admin.ts +716 -0
package/src/routes/health.ts +5 -0
package/src/routes/index.ts +24 -0
package/src/routes/v1.ts +87 -0
package/src/rtk/detect.ts +55 -0
package/src/rtk/filters.ts +94 -0
package/src/rtk/index.ts +58 -0
package/src/server.ts +108 -0
package/src/stream/anthropic-stream.ts +310 -0
package/src/stream/chunk.ts +46 -0
package/src/stream/gemini-stream.ts +158 -0
package/src/stream/index.ts +23 -0
package/src/stream/openai-stream.ts +41 -0
package/src/stream/sse.ts +72 -0
package/src/translator/thinking.ts +64 -0
package/src/translator/thinkingUnified.ts +319 -0
package/src/upstream/client.ts +155 -0
package/tsconfig.json +20 -0

package/src/translator/thinking.ts ADDED Viewed

@@ -0,0 +1,64 @@
+/**
+ * Concern: reasoning_effort ↔ provider-native thinking config.
+ * Central source of truth for level↔budget maps (web-standard values).
+ * Provider-specific application lives in thinkingUnified.ts; this file is maps-only.
+ *
+ * Implemented for aigetwey so
+ * aigetwey normalizes thinking identically.
+ */
+/** Discrete effort levels, ordered low→high. */
+export const EFFORT_LEVELS = ["minimal", "low", "medium", "high", "xhigh", "max"] as const;
+/** Web-standard level → budget_tokens (Anthropic/Gemini docs). */
+export const LEVEL_TO_BUDGET: Record<string, number> = {
+  none: 0,
+  minimal: 512,
+  low: 1024,
+  medium: 8192,
+  high: 24576,
+  xhigh: 32768,
+  max: 128000,
+};
+/**
+ * Returns budget_tokens for an effort level, or undefined if unknown.
+ * 0 means "no thinking"; undefined means "effort not recognized".
+ */
+export function effortToBudget(effort: string | undefined | null): number | undefined {
+  if (!effort) return undefined;
+  return LEVEL_TO_BUDGET[String(effort).toLowerCase()];
+}
+/**
+ * OpenAI reasoning_effort → Gemini thinkingLevel (gemini-3 enum: minimal|low|medium|high).
+ * Gemini 3 cannot fully disable thinking; "none"/"off" map to "minimal".
+ */
+export function effortToThinkingLevel(effort: string): string {
+  const e = String(effort).toLowerCase().trim();
+  if (e === "none" || e === "off") return "minimal";
+  if (e === "xhigh" || e === "max") return "high";
+  return e;
+}
+/**
+ * Numeric budget → nearest discrete level (reverse map via thresholds).
+ * Returns null when budget <= 0 (no reasoning).
+ */
+export function budgetToLevel(budget: number): string | null {
+  const b = Number(budget);
+  if (!b || b <= 0) return null;
+  if (b <= 768) return "minimal";
+  if (b <= 4096) return "low";
+  if (b <= 16384) return "medium";
+  if (b <= 28672) return "high";
+  return "xhigh";
+}
+/** Gemini thinkingBudget (numeric) → OpenAI reasoning_effort (antigravity reverse map). */
+export function budgetToEffort(budget: number): string | null {
+  if (!budget || budget <= 0) return null;
+  if (budget <= 2048) return "low";
+  if (budget <= 16384) return "medium";
+  return "high";
+}

package/src/translator/thinkingUnified.ts ADDED Viewed

@@ -0,0 +1,319 @@
+/**
+ * Unified thinking normalization: extract client intent → apply provider-native format.
+ * Config-driven: thinking format/limits come from capabilities.ts, never hardcoded
+ * per-model here.
+ *
+ * aigetwey's own implementation. The one
+ * adaptation for aigetwey: there is no provider registry carrying a thinkingFormat,
+ * so resolveFormat relies on the capabilities table + the wire format alone, and
+ * FORMAT_TO_NATIVE also maps aigetwey's "anthropic" wire format. See
+ *
+ */
+import { getCapabilitiesForModel, type Caps } from "../providers/capabilities.js";
+import { LEVEL_TO_BUDGET, budgetToLevel, effortToBudget } from "./thinking.js";
+export interface ThinkingConfig {
+  mode: "none" | "auto" | "budget" | "level";
+  budget?: number;
+  level?: string;
+}
+type Body = Record<string, any>;
+// Map a target wire-format to its native thinking format (when capability has none).
+const FORMAT_TO_NATIVE: Record<string, string> = {
+  openai: "openai",
+  "openai-responses": "openai",
+  "openai-response": "openai",
+  codex: "openai",
+  claude: "claude-budget",
+  anthropic: "claude-budget",
+  gemini: "gemini-budget",
+  "gemini-cli": "gemini-budget",
+  vertex: "gemini-budget",
+  antigravity: "gemini-budget",
+  kiro: "kiro",
+};
+/**
+ * Parse model-name suffix "model(value)" → { cleanModel, override }.
+ * value: level name (high) | number (8192) | auto | none. null override when absent.
+ */
+export function parseSuffix(model: string): { cleanModel: string; override: ThinkingConfig | null } {
+  if (typeof model !== "string") return { cleanModel: model, override: null };
+  const m = model.match(/^(.*)\(([^()]+)\)\s*$/);
+  if (!m) return { cleanModel: model, override: null };
+  const cleanModel = m[1]!.trim();
+  const raw = m[2]!.trim().toLowerCase();
+  if (raw === "none" || raw === "off") return { cleanModel, override: { mode: "none" } };
+  if (raw === "auto") return { cleanModel, override: { mode: "auto" } };
+  if (/^\d+$/.test(raw)) return { cleanModel, override: { mode: "budget", budget: Number(raw) } };
+  if (LEVEL_TO_BUDGET[raw] !== undefined) return { cleanModel, override: { mode: "level", level: raw } };
+  return { cleanModel, override: null };
+}
+/**
+ * Extract unified thinking intent from a request body (post-translation, mixed shapes).
+ * Returns { mode, budget?, level? } or null when no thinking intent present.
+ */
+export function extractThinking(body: Body | null | undefined): ThinkingConfig | null {
+  if (!body || typeof body !== "object") return null;
+  // Claude output_config.effort (explicit) — priority over adaptive thinking
+  const oc = body.output_config?.effort;
+  if (typeof oc === "string" && oc) {
+    const e = oc.toLowerCase();
+    if (e === "none" || e === "off") return { mode: "none" };
+    if (e === "auto") return { mode: "auto" };
+    return { mode: "level", level: e };
+  }
+  // Claude shape
+  const t = body.thinking;
+  if (t && typeof t === "object") {
+    if (t.type === "disabled") return { mode: "none" };
+    if (t.type === "adaptive" || t.type === "enabled") {
+      const budget = Number(t.budget_tokens);
+      if (Number.isFinite(budget) && budget > 0) return { mode: "budget", budget };
+      return { mode: "auto" };
+    }
+  }
+  // OpenAI chat / Responses shape
+  const effort = body.reasoning_effort ?? (typeof body.reasoning === "object" ? body.reasoning?.effort : null);
+  if (typeof effort === "string" && effort) {
+    const e = effort.toLowerCase();
+    if (e === "none" || e === "off") return { mode: "none" };
+    if (e === "auto") return { mode: "auto" };
+    return { mode: "level", level: e };
+  }
+  // Gemini shape (top-level, generationConfig, or request envelope)
+  const tc = body.thinkingConfig || body.generationConfig?.thinkingConfig || body.request?.generationConfig?.thinkingConfig;
+  if (tc && typeof tc === "object") {
+    if (typeof tc.thinkingLevel === "string") return { mode: "level", level: tc.thinkingLevel.toLowerCase() };
+    const tb = Number(tc.thinkingBudget);
+    if (Number.isFinite(tb)) {
+      if (tb === 0) return { mode: "none" };
+      if (tb < 0) return { mode: "auto" };
+      return { mode: "budget", budget: tb };
+    }
+  }
+  // Qwen shape
+  if (body.enable_thinking === false) return { mode: "none" };
+  if (body.enable_thinking === true) {
+    const tb = Number(body.thinking_budget);
+    if (Number.isFinite(tb) && tb > 0) return { mode: "budget", budget: tb };
+    return { mode: "auto" };
+  }
+  return null;
+}
+/**
+ * Capture thinking intent from a body. Alias of extractThinking, named for clarity
+ * at the call-site where intent is snapshotted before format translation.
+ */
+export const captureThinking = extractThinking;
+// Resolve thinking format: capability > derive(targetFormat).
+function resolveFormat(targetFormat: string, model: string, provider: string | null): string {
+  const caps = getCapabilitiesForModel(provider, model);
+  if (caps.thinkingFormat) return caps.thinkingFormat;
+  return FORMAT_TO_NATIVE[targetFormat] || "openai";
+}
+// Convert unified config to a budget number (for budget-based formats).
+function toBudget(cfg: ThinkingConfig, range: Caps["thinkingRange"]): number | undefined {
+  let budget: number | undefined;
+  if (cfg.mode === "budget") budget = cfg.budget;
+  else if (cfg.mode === "level") budget = effortToBudget(cfg.level);
+  else if (cfg.mode === "auto") return -1;
+  if (!Number.isFinite(budget)) return undefined;
+  if (range) {
+    if (range.min != null && budget! < range.min) budget = range.min;
+    if (range.max != null && budget! > range.max) budget = range.max;
+  }
+  return budget;
+}
+// Convert unified config to a discrete level string.
+function toLevel(cfg: ThinkingConfig): string | null {
+  if (cfg.mode === "level") return cfg.level ?? null;
+  if (cfg.mode === "budget") return budgetToLevel(cfg.budget ?? 0) || "medium";
+  if (cfg.mode === "auto") return "auto";
+  return null;
+}
+// Gemini nests thinkingConfig under generationConfig.
+function setGeminiThinking(body: Body, tc: Record<string, unknown>): void {
+  const gc = body.request?.generationConfig
+    ? body.request.generationConfig
+    : body.generationConfig && typeof body.generationConfig === "object"
+      ? body.generationConfig
+      : (body.generationConfig = {});
+  gc.thinkingConfig = tc;
+}
+// Strip every known thinking field from a body (used before re-applying / when unsupported).
+function stripAll(body: Body): void {
+  delete body.thinking;
+  delete body.reasoning_effort;
+  delete body.reasoning;
+  delete body.thinkingConfig;
+  delete body.enable_thinking;
+  delete body.thinking_budget;
+  delete body.output_config;
+  if (body.generationConfig) delete body.generationConfig.thinkingConfig;
+  if (body.request?.generationConfig) delete body.request.generationConfig.thinkingConfig;
+}
+// Apply unified thinking config to body in the resolved provider-native format.
+function applyFormat(fmt: string, body: Body, cfg: ThinkingConfig, caps: Caps): void {
+  const none = cfg.mode === "none";
+  const canDisable = caps.thinkingCanDisable !== false;
+  // Model cannot disable thinking → clamp "none" to minimal effort instead.
+  const eff: ThinkingConfig = none && !canDisable ? { mode: "level", level: "minimal" } : cfg;
+  switch (fmt) {
+    case "openai": {
+      if (none && canDisable) {
+        body.reasoning_effort = "none";
+        break;
+      }
+      const level = toLevel(eff);
+      if (level) body.reasoning_effort = level === "xhigh" || level === "max" ? "high" : level;
+      break;
+    }
+    case "claude-adaptive": {
+      if (none && canDisable) {
+        body.thinking = { type: "disabled" };
+        break;
+      }
+      const level = toLevel(eff);
+      body.output_config = { effort: level === "xhigh" ? "high" : level };
+      break;
+    }
+    case "claude-budget": {
+      if (none && canDisable) {
+        body.thinking = { type: "disabled" };
+        break;
+      }
+      const budget = toBudget(eff, caps.thinkingRange);
+      body.thinking = budget === -1 ? { type: "enabled" } : { type: "enabled", budget_tokens: budget || 8192 };
+      break;
+    }
+    case "gemini-level": {
+      const level = none ? "minimal" : toLevel(eff) || "high";
+      setGeminiThinking(body, { thinkingLevel: level, includeThoughts: level !== "minimal" });
+      break;
+    }
+    case "gemini-budget": {
+      if (none && canDisable) {
+        setGeminiThinking(body, { thinkingBudget: 0, includeThoughts: false });
+        break;
+      }
+      const budget = toBudget(eff, caps.thinkingRange);
+      setGeminiThinking(body, { thinkingBudget: budget ?? -1, includeThoughts: true });
+      break;
+    }
+    case "zai": {
+      // Z.ai ignores thinking.disabled → must use enable_thinking:false to turn off.
+      if (none && canDisable) {
+        body.enable_thinking = false;
+        delete body.thinking;
+        break;
+      }
+      body.thinking = { type: "enabled" };
+      break;
+    }
+    case "qwen": {
+      if (none && canDisable) {
+        body.enable_thinking = false;
+        break;
+      }
+      body.enable_thinking = true;
+      const budget = toBudget(eff, caps.thinkingRange);
+      if (Number.isFinite(budget) && budget! > 0) body.thinking_budget = budget;
+      break;
+    }
+    case "deepseek": {
+      if (none && canDisable) {
+        body.thinking = { type: "disabled" };
+        break;
+      }
+      body.thinking = { type: "enabled" };
+      // DeepSeek: low/medium→high, xhigh/max→max.
+      const level = toLevel(eff);
+      body.reasoning_effort = level === "xhigh" || level === "max" ? "max" : "high";
+      break;
+    }
+    case "kimi": {
+      if (none && canDisable) {
+        body.thinking = { type: "disabled" };
+        break;
+      }
+      const level = toLevel(eff);
+      if (level) body.reasoning_effort = level === "max" ? "high" : level;
+      break;
+    }
+    case "minimax": {
+      // M3 adaptive; M2.x cannot disable (handled via canDisable clamp).
+      body.thinking = { type: none && canDisable ? "disabled" : "adaptive" };
+      break;
+    }
+    case "hunyuan": {
+      if (none && canDisable) {
+        body.thinking = { type: "disabled" };
+        break;
+      }
+      const budget = toBudget(eff, caps.thinkingRange);
+      body.thinking = budget === -1 ? { type: "enabled" } : { type: "enabled", budget_tokens: budget || 8192 };
+      break;
+    }
+    case "step": {
+      if (none && canDisable) break;
+      const level = toLevel(eff);
+      if (level) body.reasoning_effort = level === "xhigh" || level === "max" ? "high" : level;
+      break;
+    }
+    case "kiro":
+      // Kiro thinking handled via system-tag injection elsewhere; no body field here.
+      break;
+    default:
+      break;
+  }
+}
+/**
+ * Public entry: normalize thinking for the resolved target format.
+ * Mutates and returns body. No-op when model has no reasoning capability.
+ * `intent` is a pre-captured config (from captureThinking on the original body);
+ * falls back to extracting from the current body when omitted.
+ */
+export function applyThinking(
+  targetFormat: string,
+  model: string,
+  body: Body,
+  provider: string | null = null,
+  intent: ThinkingConfig | null | undefined = undefined,
+): Body {
+  if (!body || typeof body !== "object") return body;
+  const { cleanModel, override } = parseSuffix(model);
+  const cfg = override || intent || extractThinking(body);
+  const caps = getCapabilitiesForModel(provider, cleanModel);
+  // Model cannot reason → strip any stray thinking fields.
+  if (!caps.reasoning) {
+    stripAll(body);
+    return body;
+  }
+  if (!cfg) return body;
+  const fmt = resolveFormat(targetFormat, cleanModel, provider);
+  stripAll(body);
+  applyFormat(fmt, body, cfg, caps);
+  return body;
+}

package/src/upstream/client.ts ADDED Viewed

@@ -0,0 +1,155 @@
+/**
+ * Upstream provider client. Translates a canonical request into the provider's
+ * native format, calls it, and returns either a parsed canonical response
+ * (non-stream) or the raw byte stream (stream — consumed in Phase 3).
+ */
+import { request } from "undici";
+import type { Provider } from "../config.js";
+import type { CanonicalRequest, CanonicalResponse } from "../core/canonical.js";
+import { adapterFor } from "../adapters/index.js";
+import { applyThinking, type ThinkingConfig } from "../translator/thinkingUnified.js";
+export interface UpstreamError extends Error {
+  status?: number;
+  body?: string;
+  /** true if trying a different key/provider might succeed */
+  retryable?: boolean;
+}
+/**
+ * Retryable = an availability problem another key/provider could clear: rate
+ * limits (429), server errors (5xx), network/timeout (no status). Non-retryable
+ * = the request itself is bad (400/401/403/404/422) — falling back just wastes
+ * time and spams other providers.
+ */
+function classifyRetryable(status: number | undefined): boolean {
+  if (status === undefined) return true; // network error / timeout / abort
+  if (status === 429) return true;
+  if (status >= 500) return true;
+  return false;
+}
+function buildHeaders(provider: Provider, key: string | undefined): Record<string, string> {
+  const headers: Record<string, string> = {
+    "content-type": "application/json",
+    ...(provider.headers ?? {}),
+  };
+  if (provider.format === "anthropic") {
+    if (key) headers["x-api-key"] = key;
+    headers["anthropic-version"] ??= "2023-06-01";
+  } else if (provider.format === "gemini") {
+    if (key) headers["x-goog-api-key"] = key;
+  } else {
+    if (key) headers["authorization"] = `Bearer ${key}`;
+  }
+  return headers;
+}
+/**
+ * OpenAI/Anthropic use a fixed path on base_url; Gemini puts the model and
+ * stream mode in the path (:generateContent | :streamGenerateContent?alt=sse).
+ */
+function buildUrl(provider: Provider, model: string, stream: boolean): string {
+  const base = provider.base_url.replace(/\/$/, "");
+  if (provider.format === "gemini") {
+    const method = stream ? "streamGenerateContent?alt=sse" : "generateContent";
+    return `${base}/models/${encodeURIComponent(model)}:${method}`;
+  }
+  return base + (provider.format === "anthropic" ? "/messages" : "/chat/completions");
+}
+function buildBody(
+  provider: Provider,
+  req: CanonicalRequest,
+  model: string,
+  stream: boolean,
+  thinkingIntent?: ThinkingConfig | null,
+): unknown {
+  const adapter = adapterFor(provider.format);
+  const upstreamReq: CanonicalRequest = { ...req, model, stream };
+  const out = adapter.requestFromCanonical(upstreamReq) as Record<string, unknown>;
+  // Normalize thinking into THIS provider's native format, keyed by the upstream
+  // model's capabilities. No-op for non-reasoning models. Runs per-attempt so each
+  // provider in a fallback chain gets the right shape.
+  applyThinking(provider.format, model, out, provider.id, thinkingIntent);
+  return out;
+}
+export interface NonStreamResult {
+  stream: false;
+  response: CanonicalResponse;
+}
+export interface StreamResult {
+  stream: true;
+  body: AsyncIterable<Uint8Array>;
+}
+export async function callUpstream(
+  provider: Provider,
+  req: CanonicalRequest,
+  model: string,
+  opts: { stream: boolean; key?: string; signal?: AbortSignal; thinkingIntent?: ThinkingConfig | null },
+): Promise<NonStreamResult | StreamResult> {
+  const url = buildUrl(provider, model, opts.stream);
+  const headers = buildHeaders(provider, opts.key);
+  const body = buildBody(provider, req, model, opts.stream, opts.thinkingIntent);
+  let res;
+  try {
+    res = await request(url, {
+      method: "POST",
+      headers,
+      body: JSON.stringify(body),
+      signal: opts.signal,
+      // providers can be slow to first byte on long generations
+      headersTimeout: 600_000,
+      bodyTimeout: 600_000,
+    });
+  } catch (e) {
+    const err = new Error(`upstream ${provider.id} request failed: ${(e as Error).message}`) as UpstreamError;
+    err.retryable = true;
+    throw err;
+  }
+  if (res.statusCode >= 400) {
+    const text = await res.body.text();
+    const err = new Error(`upstream ${provider.id} returned ${res.statusCode}`) as UpstreamError;
+    err.status = res.statusCode;
+    err.body = text;
+    err.retryable = classifyRetryable(res.statusCode);
+    throw err;
+  }
+  if (opts.stream) return { stream: true, body: res.body };
+  const json = await res.body.json();
+  const adapter = adapterFor(provider.format);
+  return { stream: false, response: adapter.responseToCanonical(json) };
+}
+export interface PingResult {
+  reachable: boolean;
+  status?: number;
+  ok: boolean; // 2xx — endpoint + key both good
+  error?: string;
+}
+/**
+ * Lightweight connectivity check: GET {base}/models with the provider's auth.
+ * Any HTTP status means the host is reachable; 2xx means the key is accepted.
+ * Never throws — returns a structured result for the dashboard.
+ */
+export async function pingProvider(provider: Provider, key: string | undefined): Promise<PingResult> {
+  const base = provider.base_url.replace(/\/$/, "");
+  const url = `${base}/models`;
+  const headers = buildHeaders(provider, key);
+  try {
+    const res = await request(url, { method: "GET", headers, headersTimeout: 10_000, bodyTimeout: 10_000 });
+    await res.body.dump();
+    return { reachable: true, status: res.statusCode, ok: res.statusCode >= 200 && res.statusCode < 300 };
+  } catch (e) {
+    return { reachable: false, ok: false, error: (e as Error).message };
+  }
+}
+export { buildHeaders, buildUrl };

package/tsconfig.json ADDED Viewed

@@ -0,0 +1,20 @@
+{
+  "compilerOptions": {
+    "target": "ES2022",
+    "module": "NodeNext",
+    "moduleResolution": "NodeNext",
+    "lib": ["ES2022"],
+    "outDir": "dist",
+    "rootDir": "src",
+    "strict": true,
+    "noUncheckedIndexedAccess": true,
+    "esModuleInterop": true,
+    "skipLibCheck": true,
+    "forceConsistentCasingInFileNames": true,
+    "declaration": false,
+    "sourceMap": true,
+    "resolveJsonModule": true
+  },
+  "include": ["src/**/*.ts"],
+  "exclude": ["node_modules", "dist", "tests"]
+}