npm - @tyvm/knowhow - Versions diffs - 0.0.105 → 0.0.107 - Mend

@tyvm/knowhow 0.0.105 → 0.0.107

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (219) hide show

package/CONFIG.md +8 -5
package/package.json +3 -2
package/scripts/check-model-pricing.ts +509 -0
package/scripts/compare-openrouter-coverage.ts +576 -0
package/src/agents/base/base.ts +169 -5
package/src/agents/tools/execCommand.ts +4 -0
package/src/agents/tools/executeScript/definition.ts +1 -1
package/src/agents/tools/index.ts +0 -1
package/src/agents/tools/list.ts +3 -43
package/src/agents/tools/writeFile.ts +1 -1
package/src/auth/browserLogin.ts +9 -4
package/src/chat/modules/RemoteSyncModule.ts +3 -0
package/src/cli.ts +31 -1
package/src/clients/anthropic.ts +8 -2
package/src/clients/cerebras.ts +10 -0
package/src/clients/contextLimits.ts +7 -2
package/src/clients/copilot.ts +23 -0
package/src/clients/deepseek.ts +16 -0
package/src/clients/fireworks.ts +15 -0
package/src/clients/gemini.ts +59 -4
package/src/clients/github.ts +16 -0
package/src/clients/groq.ts +15 -0
package/src/clients/http.ts +194 -6
package/src/clients/index.ts +116 -4
package/src/clients/llama.ts +16 -0
package/src/clients/mistral.ts +16 -0
package/src/clients/nvidia.ts +16 -0
package/src/clients/openai.ts +53 -12
package/src/clients/openrouter.ts +17 -0
package/src/clients/pricing/anthropic.ts +105 -78
package/src/clients/pricing/cerebras.ts +11 -0
package/src/clients/pricing/copilot.ts +60 -0
package/src/clients/pricing/deepseek.ts +15 -0
package/src/clients/pricing/fireworks.ts +32 -0
package/src/clients/pricing/github.ts +69 -0
package/src/clients/pricing/google.ts +245 -206
package/src/clients/pricing/groq.ts +56 -0
package/src/clients/pricing/index.ts +42 -5
package/src/clients/pricing/llama.ts +18 -0
package/src/clients/pricing/mistral.ts +34 -0
package/src/clients/pricing/models.ts +7 -236
package/src/clients/pricing/nvidia.ts +102 -0
package/src/clients/pricing/openai.ts +348 -171
package/src/clients/pricing/openrouter.ts +36 -0
package/src/clients/pricing/types.ts +83 -2
package/src/clients/pricing/xai.ts +121 -65
package/src/clients/types.ts +28 -1
package/src/clients/xai.ts +161 -1
package/src/fileSync.ts +8 -2
package/src/login.ts +11 -3
package/src/services/AgentSyncFs.ts +36 -12
package/src/services/KnowhowClient.ts +11 -0
package/src/services/LazyToolsService.ts +6 -0
package/src/services/S3.ts +0 -7
package/src/services/modules/index.ts +11 -2
package/src/types.ts +56 -279
package/src/worker.ts +174 -0
package/tests/clients/AIClient.test.ts +1 -1
package/tests/clients/anthropic.test.ts +202 -0
package/tests/clients/pricing.test.ts +37 -0
package/tests/manual/clients/completions.json +838 -226
package/tests/manual/clients/completions.test.ts +46 -31
package/ts_build/package.json +3 -2
package/ts_build/src/agents/base/base.d.ts +18 -1
package/ts_build/src/agents/base/base.js +111 -4
package/ts_build/src/agents/base/base.js.map +1 -1
package/ts_build/src/agents/tools/execCommand.js +3 -0
package/ts_build/src/agents/tools/execCommand.js.map +1 -1
package/ts_build/src/agents/tools/executeScript/definition.js +1 -1
package/ts_build/src/agents/tools/executeScript/definition.js.map +1 -1
package/ts_build/src/agents/tools/index.d.ts +0 -1
package/ts_build/src/agents/tools/index.js +0 -1
package/ts_build/src/agents/tools/index.js.map +1 -1
package/ts_build/src/agents/tools/list.js +3 -38
package/ts_build/src/agents/tools/list.js.map +1 -1
package/ts_build/src/agents/tools/visionTool.d.ts +1 -1
package/ts_build/src/agents/tools/writeFile.js +1 -1
package/ts_build/src/agents/tools/writeFile.js.map +1 -1
package/ts_build/src/ai.d.ts +1 -1
package/ts_build/src/auth/browserLogin.d.ts +2 -1
package/ts_build/src/auth/browserLogin.js +10 -3
package/ts_build/src/auth/browserLogin.js.map +1 -1
package/ts_build/src/chat/modules/RemoteSyncModule.js +1 -0
package/ts_build/src/chat/modules/RemoteSyncModule.js.map +1 -1
package/ts_build/src/cli.js +19 -0
package/ts_build/src/cli.js.map +1 -1
package/ts_build/src/clients/anthropic.d.ts +1 -82
package/ts_build/src/clients/anthropic.js +8 -2
package/ts_build/src/clients/anthropic.js.map +1 -1
package/ts_build/src/clients/cerebras.d.ts +4 -0
package/ts_build/src/clients/cerebras.js +14 -0
package/ts_build/src/clients/cerebras.js.map +1 -0
package/ts_build/src/clients/contextLimits.js +7 -2
package/ts_build/src/clients/contextLimits.js.map +1 -1
package/ts_build/src/clients/copilot.d.ts +4 -0
package/ts_build/src/clients/copilot.js +15 -0
package/ts_build/src/clients/copilot.js.map +1 -0
package/ts_build/src/clients/deepseek.d.ts +4 -0
package/ts_build/src/clients/deepseek.js +15 -0
package/ts_build/src/clients/deepseek.js.map +1 -0
package/ts_build/src/clients/fireworks.d.ts +4 -0
package/ts_build/src/clients/fireworks.js +15 -0
package/ts_build/src/clients/fireworks.js.map +1 -0
package/ts_build/src/clients/gemini.d.ts +1 -0
package/ts_build/src/clients/gemini.js +38 -2
package/ts_build/src/clients/gemini.js.map +1 -1
package/ts_build/src/clients/github.d.ts +4 -0
package/ts_build/src/clients/github.js +15 -0
package/ts_build/src/clients/github.js.map +1 -0
package/ts_build/src/clients/groq.d.ts +4 -0
package/ts_build/src/clients/groq.js +15 -0
package/ts_build/src/clients/groq.js.map +1 -0
package/ts_build/src/clients/http.d.ts +22 -1
package/ts_build/src/clients/http.js +135 -7
package/ts_build/src/clients/http.js.map +1 -1
package/ts_build/src/clients/index.d.ts +14 -0
package/ts_build/src/clients/index.js +94 -4
package/ts_build/src/clients/index.js.map +1 -1
package/ts_build/src/clients/llama.d.ts +4 -0
package/ts_build/src/clients/llama.js +15 -0
package/ts_build/src/clients/llama.js.map +1 -0
package/ts_build/src/clients/mistral.d.ts +4 -0
package/ts_build/src/clients/mistral.js +15 -0
package/ts_build/src/clients/mistral.js.map +1 -0
package/ts_build/src/clients/nvidia.d.ts +4 -0
package/ts_build/src/clients/nvidia.js +15 -0
package/ts_build/src/clients/nvidia.js.map +1 -0
package/ts_build/src/clients/openai.d.ts +4 -206
package/ts_build/src/clients/openai.js +38 -10
package/ts_build/src/clients/openai.js.map +1 -1
package/ts_build/src/clients/openrouter.d.ts +4 -0
package/ts_build/src/clients/openrouter.js +15 -0
package/ts_build/src/clients/openrouter.js.map +1 -0
package/ts_build/src/clients/pricing/anthropic.d.ts +26 -78
package/ts_build/src/clients/pricing/anthropic.js +75 -78
package/ts_build/src/clients/pricing/anthropic.js.map +1 -1
package/ts_build/src/clients/pricing/cerebras.d.ts +4 -0
package/ts_build/src/clients/pricing/cerebras.js +11 -0
package/ts_build/src/clients/pricing/cerebras.js.map +1 -0
package/ts_build/src/clients/pricing/copilot.d.ts +5 -0
package/ts_build/src/clients/pricing/copilot.js +35 -0
package/ts_build/src/clients/pricing/copilot.js.map +1 -0
package/ts_build/src/clients/pricing/deepseek.d.ts +5 -0
package/ts_build/src/clients/pricing/deepseek.js +10 -0
package/ts_build/src/clients/pricing/deepseek.js.map +1 -0
package/ts_build/src/clients/pricing/fireworks.d.ts +5 -0
package/ts_build/src/clients/pricing/fireworks.js +21 -0
package/ts_build/src/clients/pricing/fireworks.js.map +1 -0
package/ts_build/src/clients/pricing/github.d.ts +4 -0
package/ts_build/src/clients/pricing/github.js +58 -0
package/ts_build/src/clients/pricing/github.js.map +1 -0
package/ts_build/src/clients/pricing/google.d.ts +59 -6
package/ts_build/src/clients/pricing/google.js +214 -167
package/ts_build/src/clients/pricing/google.js.map +1 -1
package/ts_build/src/clients/pricing/groq.d.ts +5 -0
package/ts_build/src/clients/pricing/groq.js +41 -0
package/ts_build/src/clients/pricing/groq.js.map +1 -0
package/ts_build/src/clients/pricing/index.d.ts +16 -5
package/ts_build/src/clients/pricing/index.js +62 -7
package/ts_build/src/clients/pricing/index.js.map +1 -1
package/ts_build/src/clients/pricing/llama.d.ts +4 -0
package/ts_build/src/clients/pricing/llama.js +14 -0
package/ts_build/src/clients/pricing/llama.js.map +1 -0
package/ts_build/src/clients/pricing/mistral.d.ts +5 -0
package/ts_build/src/clients/pricing/mistral.js +23 -0
package/ts_build/src/clients/pricing/mistral.js.map +1 -0
package/ts_build/src/clients/pricing/models.d.ts +5 -4
package/ts_build/src/clients/pricing/models.js +8 -162
package/ts_build/src/clients/pricing/models.js.map +1 -1
package/ts_build/src/clients/pricing/nvidia.d.ts +8 -0
package/ts_build/src/clients/pricing/nvidia.js +96 -0
package/ts_build/src/clients/pricing/nvidia.js.map +1 -0
package/ts_build/src/clients/pricing/openai.d.ts +86 -197
package/ts_build/src/clients/pricing/openai.js +295 -168
package/ts_build/src/clients/pricing/openai.js.map +1 -1
package/ts_build/src/clients/pricing/openrouter.d.ts +4 -0
package/ts_build/src/clients/pricing/openrouter.js +29 -0
package/ts_build/src/clients/pricing/openrouter.js.map +1 -0
package/ts_build/src/clients/pricing/types.d.ts +27 -2
package/ts_build/src/clients/pricing/types.js +46 -0
package/ts_build/src/clients/pricing/types.js.map +1 -1
package/ts_build/src/clients/pricing/xai.d.ts +37 -57
package/ts_build/src/clients/pricing/xai.js +92 -59
package/ts_build/src/clients/pricing/xai.js.map +1 -1
package/ts_build/src/clients/types.d.ts +12 -1
package/ts_build/src/clients/xai.d.ts +2 -62
package/ts_build/src/clients/xai.js +132 -1
package/ts_build/src/clients/xai.js.map +1 -1
package/ts_build/src/fileSync.js +7 -2
package/ts_build/src/fileSync.js.map +1 -1
package/ts_build/src/login.js +8 -2
package/ts_build/src/login.js.map +1 -1
package/ts_build/src/services/AgentSyncFs.js +1 -0
package/ts_build/src/services/AgentSyncFs.js.map +1 -1
package/ts_build/src/services/KnowhowClient.d.ts +1 -0
package/ts_build/src/services/KnowhowClient.js +7 -0
package/ts_build/src/services/KnowhowClient.js.map +1 -1
package/ts_build/src/services/LazyToolsService.d.ts +1 -0
package/ts_build/src/services/LazyToolsService.js +3 -0
package/ts_build/src/services/LazyToolsService.js.map +1 -1
package/ts_build/src/services/S3.js +0 -7
package/ts_build/src/services/S3.js.map +1 -1
package/ts_build/src/services/modules/index.js +41 -1
package/ts_build/src/services/modules/index.js.map +1 -1
package/ts_build/src/types.d.ts +163 -124
package/ts_build/src/types.js +33 -213
package/ts_build/src/types.js.map +1 -1
package/ts_build/src/worker.d.ts +4 -0
package/ts_build/src/worker.js +140 -0
package/ts_build/src/worker.js.map +1 -1
package/ts_build/tests/clients/AIClient.test.js +1 -1
package/ts_build/tests/clients/AIClient.test.js.map +1 -1
package/ts_build/tests/clients/anthropic.test.d.ts +1 -0
package/ts_build/tests/clients/anthropic.test.js +159 -0
package/ts_build/tests/clients/anthropic.test.js.map +1 -0
package/ts_build/tests/clients/pricing.test.js +21 -0
package/ts_build/tests/clients/pricing.test.js.map +1 -1
package/ts_build/tests/manual/clients/completions.test.js +27 -24
package/ts_build/tests/manual/clients/completions.test.js.map +1 -1

package/src/clients/pricing/types.ts CHANGED Viewed

@@ -4,7 +4,8 @@ export type ModelType =
   | "image"
   | "audio"
   | "video"
-  | "transaction";
+  | "transaction"
+  | "live";
 export interface ModelPricing {
   input?: number;
@@ -17,13 +18,93 @@ export interface ModelPricing {
   input_gt_200k?: number;
   output_gt_200k?: number;
   image_generation?: number;
+  image_generation_per_1m_tokens?: number;
   video_generation?: number;
+  output_image_per_1m_tokens?: number;
+  // Optional metadata — when set on a pricing entry, the catalog picks them up automatically
+  deprecated?: boolean;
+  deprecationDate?: string;
+  limitedAvailability?: boolean;
+  replacedBy?: string;
+  /** Supported reasoning effort levels for this model (ordered low→high). If set, effort will be clamped to these values. */
+  reasoningLevels?: string[];
+  /** If true, this model must be called via the Responses API (/v1/responses) instead of /v1/chat/completions */
+  useResponsesApi?: boolean;
 }
 export interface ModelCatalogEntry {
   id: string;
   provider: string;
   type: ModelType;
-  displayName: string;
   pricing: ModelPricing;
+  deprecated?: boolean;
+  deprecationDate?: string;
+  /** Model exists but is not generally available (e.g. Live API only, limited access, or returns empty responses) */
+  limitedAvailability?: boolean;
+  /** Recommended replacement model ID when this model is deprecated */
+  replacedBy?: string;
+}
+// ─── Bulk catalog helpers ─────────────────────────────────────────────────────
+export interface DeprecationOptions {
+  deprecated?: boolean;
+  deprecationDate?: string;
+  limitedAvailability?: boolean;
+  replacedBy?: string;
+}
+function makeEntries(
+  type: ModelType,
+  ids: string[],
+  provider: string,
+  pricing: Record<string, ModelPricing>,
+  deprecation?: DeprecationOptions
+): ModelCatalogEntry[] {
+  return ids.map((id) => {
+    const p = pricing[id] ?? {};
+    // Explicit dep options take precedence; fall back to metadata embedded in the pricing entry
+    const deprecated       = deprecation?.deprecated       ?? p.deprecated;
+    const deprecationDate  = deprecation?.deprecationDate  ?? p.deprecationDate;
+    const limitedAvailability = deprecation?.limitedAvailability ?? p.limitedAvailability;
+    const replacedBy       = deprecation?.replacedBy       ?? p.replacedBy;
+    // Strip metadata fields before storing as pricing
+    const { deprecated: _d, deprecationDate: _dd, limitedAvailability: _la, replacedBy: _rb, reasoningLevels: _rl, useResponsesApi: _ura, ...pricingOnly } = p;
+    return {
+      id,
+      provider,
+      type,
+      pricing: { input: 0, output: 0, ...pricingOnly },
+      deprecated,
+      deprecationDate,
+      limitedAvailability,
+      replacedBy,
+    };
+  });
+}
+export const completions  = (ids: string[], provider: string, pricing: Record<string, ModelPricing>, dep?: DeprecationOptions) => makeEntries("completion",   ids, provider, pricing, dep);
+export const embeddings   = (ids: string[], provider: string, pricing: Record<string, ModelPricing>, dep?: DeprecationOptions) => makeEntries("embedding",    ids, provider, pricing, dep);
+export const images       = (ids: string[], provider: string, pricing: Record<string, ModelPricing>, dep?: DeprecationOptions) => makeEntries("image",        ids, provider, pricing, dep);
+export const videos       = (ids: string[], provider: string, pricing: Record<string, ModelPricing>, dep?: DeprecationOptions) => makeEntries("video",        ids, provider, pricing, dep);
+export const audios       = (ids: string[], provider: string, pricing: Record<string, ModelPricing>, dep?: DeprecationOptions) => makeEntries("audio",        ids, provider, pricing, dep);
+export const transactions = (ids: string[], provider: string, pricing: Record<string, ModelPricing>, dep?: DeprecationOptions) => makeEntries("transaction",  ids, provider, pricing, dep);
+export const liveApi      = (ids: string[], provider: string, pricing: Record<string, ModelPricing>, dep?: DeprecationOptions) => makeEntries("live",         ids, provider, pricing, dep);
+// ─── Single-entry helpers (for deprecated/special cases) ─────────────────────
+export function completion(
+  id: string,
+  provider: string,
+  pricing: Partial<ModelPricing> = {},
+  deprecation?: DeprecationOptions
+): ModelCatalogEntry {
+  return {
+    id, provider, type: "completion",
+    pricing: { input: 0, output: 0, ...pricing },
+    deprecated: deprecation?.deprecated,
+    deprecationDate: deprecation?.deprecationDate,
+    limitedAvailability: deprecation?.limitedAvailability,
+    replacedBy: deprecation?.replacedBy,
+  };
 }

package/src/clients/pricing/xai.ts CHANGED Viewed

@@ -1,74 +1,130 @@
-import { Models } from "../../types";
-import { ModelPricing } from "./types";
+/**
+ * xAI model IDs, pricing, and catalog.
+ * Single source of truth for all xAI/Grok models.
+ */
+import { completions, images, videos, ModelCatalogEntry, ModelPricing } from "./types";
-export const XaiTextPricing = {
+// ─── Model IDs ────────────────────────────────────────────────────────────────
-  [Models.xai.Grok_4_20_Reasoning]: {
-    input: 2.0,
-    cache_hit: 0.20,
-    output: 6.0,
-  },
-  [Models.xai.Grok_4_20_NonReasoning]: {
-    input: 2.0,
-    cache_hit: 0.20,
-    output: 6.0,
-  },
-  [Models.xai.Grok4_1_Fast_NonReasoning]: {
-    input: 0.2,
-    cache_hit: 0.05,
-    output: 0.5,
-  },
-  [Models.xai.Grok4_1_Fast_Reasoning]: {
-    input: 0.2,
-    cache_hit: 0.05,
-    output: 0.5,
-  },
-  [Models.xai.GrokCodeFast]: {
-    input: 0.2,
-    cache_hit: 0.02,
-    output: 1.5,
-  },
-  [Models.xai.Grok4]: {
-    input: 3.0,
-    output: 15.0,
-  },
-  [Models.xai.Grok3Beta]: {
-    input: 3.0,
-    output: 15.0,
-  },
-  [Models.xai.Grok3MiniBeta]: {
-    input: 0.3,
-    output: 0.5,
-  },
-  [Models.xai.Grok3FastBeta]: {
-    input: 5.0,
-    output: 25.0,
-  },
-  [Models.xai.Grok3MiniFastBeta]: {
-    input: 0.6,
-    output: 4.0,
-  },
-  [Models.xai.Grok21212]: {
-    input: 2.0,
-    output: 10.0,
-  },
-  [Models.xai.Grok2Vision1212]: {
-    input: 2.0,
-    output: 10.0,
-    image_input: 2.0,
-  },
+export const XaiModels = {
+  Grok_4_20_Reasoning: "grok-4.20-0309-reasoning",
+  Grok_4_20_NonReasoning: "grok-4.20-0309-non-reasoning",
+  Grok_4_20_MultiAgent: "grok-4.20-multi-agent-0309",
+  Grok4_1_Fast_Reasoning: "grok-4-1-fast-reasoning",
+  Grok4_1_Fast_NonReasoning: "grok-4-1-fast-non-reasoning",
+  GrokCodeFast: "grok-code-fast-1",
+  Grok4: "grok-4-0709",
+  Grok3Beta: "grok-3-beta",
+  Grok3MiniBeta: "grok-3-mini-beta",
+  Grok3FastBeta: "grok-3-fast-beta",
+  Grok3MiniFastBeta: "grok-3-mini-fast-beta",
+  // Deprecated alias IDs used by models.dev (latest aliases and older beta names)
+  Grok2Latest: "grok-2-latest",
+  Grok2VisionLatest: "grok-2-vision-latest",
+  Grok3Latest: "grok-3-latest",
+  Grok3FastLatest: "grok-3-fast-latest",
+  Grok3MiniLatest: "grok-3-mini-latest",
+  Grok3MiniFastLatest: "grok-3-mini-fast-latest",
+  GrokBeta: "grok-beta",
+  GrokVisionBeta: "grok-vision-beta",
+  // grok-4-1-fast variants (aliases for grok-4-1-fast-reasoning/non-reasoning)
+  Grok4_1_Fast: "grok-4-1-fast",
+  Grok4Fast: "grok-4-fast",
+  Grok4FastNonReasoning: "grok-4-fast-non-reasoning",
+  Grok21212: "grok-2-1212",
+  Grok2Vision1212: "grok-2-vision-1212",
+  GrokImagineImage: "grok-imagine-image",
+  GrokImagineVideo: "grok-imagine-video",
+  Grok2Image1212: "grok-2-image-1212",
+} as const;
+// ─── Modality arrays ──────────────────────────────────────────────────────────
+export const XaiTextModels: string[] = [
+  XaiModels.Grok_4_20_Reasoning, XaiModels.Grok_4_20_NonReasoning,
+  XaiModels.Grok_4_20_MultiAgent,
+  XaiModels.Grok4_1_Fast_Reasoning, XaiModels.Grok4_1_Fast_NonReasoning,
+  XaiModels.GrokCodeFast, XaiModels.Grok4,
+  XaiModels.Grok3Beta, XaiModels.Grok3MiniBeta, XaiModels.Grok3FastBeta, XaiModels.Grok3MiniFastBeta,
+];
+// Models that require the Responses API (/v1/responses) instead of /v1/chat/completions
+// The xAI reasoning variants and multi-agent model use the Responses API
+export const XaiResponsesOnlyModels: string[] = [
+  XaiModels.Grok_4_20_Reasoning,
+  XaiModels.Grok_4_20_NonReasoning,
+  XaiModels.Grok_4_20_MultiAgent,
+  XaiModels.Grok4_1_Fast_Reasoning,
+  XaiModels.Grok4_1_Fast_NonReasoning,
+];
+// Models that support the reasoning_effort parameter
+// grok-3-mini variants support reasoning_effort; grok-3-beta, grok-4 etc. do NOT
+export const XaiReasoningModels: string[] = [
+  XaiModels.Grok_4_20_MultiAgent,
+  XaiModels.Grok3MiniBeta,
+  XaiModels.Grok3MiniFastBeta,
+];
+// Deprecated xAI models — "Model not found" (400) when called
+export const XaiDeprecatedTextModels: string[] = [
+  XaiModels.Grok21212, XaiModels.Grok2Vision1212,
+  // Alias IDs from models.dev that map to deprecated/versioned models
+  XaiModels.Grok2Latest, XaiModels.Grok2VisionLatest,
+  XaiModels.Grok3Latest, XaiModels.Grok3FastLatest,
+  XaiModels.Grok3MiniLatest, XaiModels.Grok3MiniFastLatest,
+  XaiModels.GrokBeta, XaiModels.GrokVisionBeta,
+  XaiModels.Grok4_1_Fast, XaiModels.Grok4Fast, XaiModels.Grok4FastNonReasoning,
+];
+export const XaiImageModels: string[] = [XaiModels.GrokImagineImage, XaiModels.Grok2Image1212];
+export const XaiVideoModels: string[] = [XaiModels.GrokImagineVideo];
+// ─── Pricing (USD per 1M tokens / per-image / per-second) ────────────────────
+export const XaiTextPricing: Record<string, ModelPricing> = {
+  [XaiModels.Grok_4_20_Reasoning]:       { input: 2.0, cache_hit: 0.20, output: 6.0, useResponsesApi: true },
+  [XaiModels.Grok_4_20_NonReasoning]:    { input: 2.0, cache_hit: 0.20, output: 6.0, useResponsesApi: true },
+  [XaiModels.Grok_4_20_MultiAgent]:      { input: 2.0, cache_hit: 0.20, output: 6.0, reasoningLevels: ["low", "medium", "high", "xhigh"], useResponsesApi: true },
+  [XaiModels.Grok4_1_Fast_Reasoning]:    { input: 0.2, cache_hit: 0.05, output: 0.5, useResponsesApi: true },
+  [XaiModels.Grok4_1_Fast_NonReasoning]: { input: 0.2, cache_hit: 0.05, output: 0.5, useResponsesApi: true },
+  [XaiModels.GrokCodeFast]:              { input: 0.2, cache_hit: 0.02, output: 1.5 },
+  [XaiModels.Grok4]:                     { input: 3.0, output: 15.0 },
+  [XaiModels.Grok3Beta]:                 { input: 3.0, output: 15.0 },
+  [XaiModels.Grok3MiniBeta]:             { input: 0.3, output: 0.5 },
+  [XaiModels.Grok3FastBeta]:             { input: 5.0, output: 25.0 },
+  [XaiModels.Grok3MiniFastBeta]:         { input: 0.6, output: 4.0 },
+  [XaiModels.Grok21212]:       { input: 2.0, output: 10.0, deprecated: true },
+  [XaiModels.Grok2Vision1212]: { input: 2.0, output: 10.0, deprecated: true },
+  // Deprecated alias IDs (models.dev uses these; they map to versioned/beta models above)
+  [XaiModels.Grok2Latest]:          { input: 2.0, output: 10.0, deprecated: true },
+  [XaiModels.Grok2VisionLatest]:    { input: 2.0, output: 10.0, deprecated: true },
+  [XaiModels.Grok3Latest]:          { input: 3.0, output: 15.0, deprecated: true },
+  [XaiModels.Grok3FastLatest]:      { input: 5.0, output: 25.0, deprecated: true },
+  [XaiModels.Grok3MiniLatest]:      { input: 0.3, output: 0.5,  deprecated: true },
+  [XaiModels.Grok3MiniFastLatest]:  { input: 0.6, output: 4.0,  deprecated: true },
+  [XaiModels.GrokBeta]:             { input: 5.0, output: 15.0, deprecated: true },
+  [XaiModels.GrokVisionBeta]:       { input: 5.0, output: 15.0, deprecated: true },
+  // grok-4-1-fast / grok-4-fast aliases — deprecated in favor of versioned reasoning/non-reasoning variants
+  [XaiModels.Grok4_1_Fast]:         { input: 0.2, output: 0.5, deprecated: true },
+  [XaiModels.Grok4Fast]:            { input: 0.2, output: 0.5, deprecated: true },
+  [XaiModels.Grok4FastNonReasoning]:{ input: 0.2, output: 0.5, deprecated: true },
 };
-// Image generation pricing: per image
-// Based on https://docs.x.ai/developers/models
 export const XaiImagePricing: Record<string, ModelPricing> = {
-  "grok-imagine-image-pro": { image_generation: 0.07 },
-  "grok-imagine-image": { image_generation: 0.02 },
-  "grok-2-image-1212": { image_generation: 0.07 },
+  "grok-imagine-image-pro":        { image_generation: 0.07 },
+  [XaiModels.GrokImagineImage]:    { image_generation: 0.02 },
+  [XaiModels.Grok2Image1212]:      { image_generation: 0.07 },
 };
-// Video generation pricing: $0.05 per second
-// Based on https://docs.x.ai/developers/models
 export const XaiVideoPricing: Record<string, ModelPricing> = {
-  "grok-imagine-video": { video_generation: 0.05 }, // per second
+  [XaiModels.GrokImagineVideo]: { video_generation: 0.05 },
 };
+// ─── Catalog ──────────────────────────────────────────────────────────────────
+// Metadata (deprecated, useResponsesApi) is read directly from XaiTextPricing entries.
+export const XAI_MODEL_CATALOG: ModelCatalogEntry[] = [
+  ...completions([...XaiTextModels, ...XaiDeprecatedTextModels], "xai", XaiTextPricing),
+  ...images(XaiImageModels, "xai", XaiImagePricing),
+  ...videos(XaiVideoModels, "xai", XaiVideoPricing),
+];

package/src/clients/types.ts CHANGED Viewed

@@ -57,6 +57,33 @@ export interface CompletionOptions {
   tools?: Tool[];
   tool_choice?: "auto" | "none";
   max_tokens?: number;
+  /** Reasoning effort level for models that support it.
+   *  Maps to: OpenAI reasoning_effort, xAI reasoning.effort, Gemini thinkingLevel/thinkingBudget, Anthropic thinking budget.
+   *  "low" = minimal thinking, "medium" = balanced, "high" = maximum reasoning */
+  reasoning_effort?: "low" | "medium" | "high";
+}
+/**
+ * Normalised token-usage shape that every client must return.
+ * All clients must map their provider-specific field names into this structure
+ * so that base.ts can accurately track input/output and cache utilization.
+ */
+export interface TokenUsage {
+  /** Total input/prompt tokens consumed */
+  prompt_tokens: number;
+  /** Total output/completion tokens generated */
+  completion_tokens: number;
+  /** Convenience total (prompt + completion) */
+  total_tokens?: number;
+  /** Cache details */
+  prompt_tokens_details?: {
+    /** Tokens served from the prompt cache (reduces cost) */
+    cached_tokens: number;
+  };
+  /** Anthropic-style cache write tokens */
+  cache_creation_input_tokens?: number;
+  /** Anthropic-style cache read tokens (alternative field name) */
+  cache_read_input_tokens?: number;
 }
 export interface CompletionResponse {
@@ -65,7 +92,7 @@ export interface CompletionResponse {
   }[];
   model: string;
-  usage: any;
+  usage: TokenUsage | undefined;
   usd_cost?: number;
 }

package/src/clients/xai.ts CHANGED Viewed

@@ -29,6 +29,7 @@ import {
 import { Models, XaiImageModels, XaiVideoModels } from "../types";
 import { ModelModality } from "./types";
+import { XaiReasoningModels, XaiResponsesOnlyModels } from "./pricing/xai";
 export class GenericXAIClient implements GenericClient {
   private client: OpenAI;
@@ -54,6 +55,11 @@ export class GenericXAIClient implements GenericClient {
   async createChatCompletion(
     options: CompletionOptions
   ): Promise<CompletionResponse> {
+    // Route to Responses API for models that require it
+    if (XaiResponsesOnlyModels.includes(options.model)) {
+      return this.createChatResponse(options);
+    }
     const xaiMessages = options.messages.map((msg) => {
       if (msg.role === "tool") {
         return {
@@ -70,6 +76,10 @@ export class GenericXAIClient implements GenericClient {
       model: options.model,
       messages: xaiMessages,
       max_tokens: options.max_tokens,
+      ...(XaiReasoningModels.includes(options.model) && options.reasoning_effort && {
+        // grok-3-mini models support reasoning_effort: "low" | "medium" | "high"
+        reasoning_effort: options.reasoning_effort,
+      }),
       ...(options.tools && {
         tools: options.tools,
         tool_choice: "auto",
@@ -89,7 +99,157 @@ export class GenericXAIClient implements GenericClient {
       })),
       model: options.model,
-      usage: response.usage,
+      usage: response.usage ? {
+        prompt_tokens: response.usage.prompt_tokens ?? 0,
+        completion_tokens: response.usage.completion_tokens ?? 0,
+        total_tokens: response.usage.total_tokens,
+        prompt_tokens_details: {
+          cached_tokens: response.usage.prompt_tokens_details?.cached_tokens ?? 0,
+        },
+      } : undefined,
+      usd_cost: usdCost,
+    };
+  }
+  /**
+   * Creates a completion using the xAI Responses API (/v1/responses).
+   * Used for grok-4.20 reasoning/non-reasoning and multi-agent models.
+   * Translates Chat Completions message format to Responses API format.
+   */
+  async createChatResponse(
+    options: CompletionOptions
+  ): Promise<CompletionResponse> {
+    const apiKey = this.apiKey || process.env.XAI_API_KEY;
+    if (!apiKey) {
+      throw new Error("XAI API key not set");
+    }
+    // Extract system messages as instructions
+    const systemMessages = options.messages.filter((m) => m.role === "system");
+    const nonSystemMessages = options.messages.filter((m) => m.role !== "system");
+    const instructions = systemMessages
+      .map((m) => (typeof m.content === "string" ? m.content : ""))
+      .join("\n")
+      .trim() || undefined;
+    // Convert chat messages to Responses API input items
+    const input: any[] = nonSystemMessages.map((msg) => {
+      if (msg.role === "tool") {
+        return {
+          type: "function_call_output",
+          call_id: msg.tool_call_id,
+          output: typeof msg.content === "string" ? msg.content : JSON.stringify(msg.content),
+        };
+      }
+      if (msg.role === "assistant" && msg.tool_calls?.length) {
+        return msg.tool_calls.map((tc) => ({
+          type: "function_call",
+          id: tc.id.startsWith("fc") ? tc.id : `fc_${tc.id}`,
+          call_id: tc.id,
+          name: tc.function.name,
+          arguments: tc.function.arguments,
+        }));
+      }
+      return {
+        role: msg.role,
+        content: typeof msg.content === "string" ? msg.content : JSON.stringify(msg.content),
+      };
+    }).flat();
+    // Convert tool definitions to Responses API format
+    const tools = options.tools?.map((tool) => ({
+      type: "function" as const,
+      name: tool.function.name,
+      description: tool.function.description,
+      parameters: tool.function.parameters as Record<string, unknown>,
+      strict: false,
+    }));
+    // Resolve reasoning effort, clamping to supported levels if defined in pricing
+    const pricing = XaiTextPricing[options.model];
+    const supportedLevels = pricing?.reasoningLevels;
+    let reasoningEffort: string | undefined = options.reasoning_effort;
+    if (supportedLevels?.length) {
+      if (!reasoningEffort || !supportedLevels.includes(reasoningEffort)) {
+        reasoningEffort = supportedLevels[0];
+      }
+    }
+    const body: any = {
+      model: options.model,
+      input,
+      ...(instructions && { instructions }),
+      ...(options.max_tokens && { max_output_tokens: Math.max(options.max_tokens, 16_000) }),
+      ...(reasoningEffort && { reasoning: { effort: reasoningEffort } }),
+      ...(tools?.length && { tools, tool_choice: "auto" }),
+      store: false,
+    };
+    const response = await fetch("https://api.x.ai/v1/responses", {
+      method: "POST",
+      headers: {
+        "Content-Type": "application/json",
+        Authorization: `Bearer ${apiKey}`,
+      },
+      body: JSON.stringify(body),
+    });
+    if (!response.ok) {
+      const errorText = await response.text();
+      throw new Error(`XAI Responses API error: ${response.status} ${errorText}`);
+    }
+    const data = await response.json();
+    // Map usage
+    const usage = data.usage
+      ? {
+          prompt_tokens: data.usage.input_tokens,
+          completion_tokens: data.usage.output_tokens,
+          total_tokens: data.usage.input_tokens + data.usage.output_tokens,
+          prompt_tokens_details: {
+            cached_tokens: data.usage.input_tokens_details?.cached_tokens ?? 0,
+          },
+        }
+      : undefined;
+    const usdCost = usage ? this.calculateCost(options.model, usage) : undefined;
+    // Collect text content and tool calls from output items
+    let textContent: string | null = null;
+    const toolCalls: any[] = [];
+    for (const item of data.output ?? []) {
+      if (item.type === "message") {
+        for (const part of item.content ?? []) {
+          if (part.type === "output_text") {
+            textContent = (textContent ?? "") + part.text;
+          }
+        }
+      } else if (item.type === "function_call") {
+        toolCalls.push({
+          id: item.call_id,
+          type: "function",
+          function: {
+            name: item.name,
+            arguments: item.arguments,
+          },
+        });
+      }
+    }
+    return {
+      choices: [
+        {
+          message: {
+            role: "assistant",
+            content: textContent,
+            ...(toolCalls.length > 0 && { tool_calls: toolCalls }),
+          },
+        },
+      ],
+      model: options.model,
+      usage,
       usd_cost: usdCost,
     };
   }

package/src/fileSync.ts CHANGED Viewed

@@ -265,8 +265,14 @@ export async function uploadDirectory(
   for (const relFile of localFiles) {
     const localFilePath = localDir + relFile;
     const remoteFilePath = remoteDir + relFile;
-    await uploadFile(client, s3Service, remoteFilePath, localFilePath, dryRun);
-    count++;
+    try {
+      await uploadFile(client, s3Service, remoteFilePath, localFilePath, dryRun);
+      count++;
+    } catch (error) {
+      console.error(
+        `   ❌ Failed to upload ${localFilePath}, skipping: ${error.message}`
+      );
+    }
   }
   return count;
 }

package/src/login.ts CHANGED Viewed

@@ -29,7 +29,10 @@ export async function login(jwtFlag?: boolean): Promise<void> {
     // Use browser login as default method
     console.log("Starting browser-based authentication...");
     try {
-      const browserLoginService = new BrowserLoginService();
+      // Pass existing orgId from config (if any) so the browser pre-selects the right org
+      const existingConfig = await getConfig();
+      const existingOrgId = existingConfig?.orgId;
+      const browserLoginService = new BrowserLoginService(undefined, existingOrgId);
       await browserLoginService.login();
       console.log("Successfully authenticated via browser!");
     } catch (error) {
@@ -43,6 +46,7 @@ export async function login(jwtFlag?: boolean): Promise<void> {
   try {
     const storedJwt = await loadJwt();
     const { user, currentOrg } = await checkJwt(storedJwt);
+    const orgId = currentOrg?.organizationId;
     console.log(
       `Current user: ${user.email}, \nOrganization: ${currentOrg?.organization?.name} - ${currentOrg?.organization?.id}`
@@ -61,9 +65,13 @@ export async function login(jwtFlag?: boolean): Promise<void> {
       config.modelProviders.push({
         provider: "knowhow",
       });
-      await updateConfig(config);
     }
+    // Save orgId to config so sync:remote and other features use the correct org
+    if (orgId) {
+      config.orgId = orgId;
+    }
+    await updateConfig(config);
   } catch (error) {
     if (http.isHttpError(error) && error.response) {
       const errData = await error.response.json().catch(() => ({ message: "Unknown error" }));