npm - @x12i/ai-gateway - Versions diffs - 9.0.8 → 9.1.0 - Mend

@x12i/ai-gateway 9.0.8 → 9.1.0

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (38) hide show

package/README.md +897 -998
package/dist/activity-manager.js +46 -6
package/dist/config/activity-tracking-config.d.ts +2 -1
package/dist/config/activity-tracking-config.js +3 -2
package/dist/gateway-memory.d.ts +1 -2
package/dist/gateway-memory.js +1 -15
package/dist/gateway-meta.js +3 -0
package/dist/gateway-utils.d.ts +15 -1
package/dist/gateway-utils.js +125 -17
package/dist/gateway-validation.d.ts +3 -3
package/dist/gateway-validation.js +10 -1
package/dist/gateway.d.ts +2 -2
package/dist/gateway.js +73 -22
package/dist/index.d.ts +2 -2
package/dist/instruction-optimizer.js +3 -0
package/dist/runtime-objects.d.ts +2 -13
package/dist/troubleshooting-helper.d.ts +0 -3
package/dist/troubleshooting-helper.js +99 -20
package/dist/types.d.ts +39 -89
package/dist-cjs/activity-manager.cjs +45 -5
package/dist-cjs/config/activity-tracking-config.cjs +3 -2
package/dist-cjs/config/activity-tracking-config.d.ts +2 -1
package/dist-cjs/gateway-memory.cjs +1 -15
package/dist-cjs/gateway-memory.d.ts +1 -2
package/dist-cjs/gateway-meta.cjs +3 -0
package/dist-cjs/gateway-utils.cjs +128 -17
package/dist-cjs/gateway-utils.d.ts +15 -1
package/dist-cjs/gateway-validation.cjs +10 -1
package/dist-cjs/gateway-validation.d.ts +3 -3
package/dist-cjs/gateway.cjs +72 -21
package/dist-cjs/gateway.d.ts +2 -2
package/dist-cjs/index.d.ts +2 -2
package/dist-cjs/instruction-optimizer.cjs +3 -0
package/dist-cjs/runtime-objects.d.ts +2 -13
package/dist-cjs/troubleshooting-helper.cjs +99 -20
package/dist-cjs/troubleshooting-helper.d.ts +0 -3
package/dist-cjs/types.d.ts +39 -89
package/package.json +2 -2

package/dist/activity-manager.js CHANGED Viewed

@@ -4,7 +4,7 @@
  * Manages activity tracking for LLM requests.
  * Wraps the ActivityTracker and provides convenience methods.
  */
-import { Activix, activixActivityIo, activixOuterTier } from '@x12i/activix';
+import { Activix, activixActivityIo, activixOuterTier, resolveActivixLogsDatabaseName, resolveActivixMongoUriFromEnv } from '@x12i/activix';
 import { resolveActivityTrackingConfig } from './config/activity-tracking-config.js';
 import { gatewayLogDebug, withActivityIdentity } from './gateway-log-meta.js';
 function readAiRequestIdFromRequest(request) {
@@ -161,6 +161,17 @@ function mergeGatewayActivityIdentity(request, aiRequestId, extras) {
     merged.aiRequestId = aiRequestId;
     merged.jobId = upstreamJobId;
     merged.taskId = upstreamTaskId;
+    // gateway.invoke (AIInvokeRequest): request root is canonical for Activix runContext.
+    if ('actionType' in request && 'actionRef' in request) {
+        const inv = request;
+        if (inv.actionType) {
+            merged.actionType = inv.actionType;
+        }
+        const ref = typeof inv.actionRef === 'string' ? inv.actionRef.trim() : '';
+        if (ref) {
+            merged.actionRef = ref;
+        }
+    }
     return merged;
 }
 /**
@@ -259,12 +270,37 @@ export class ActivityManager {
                         }
                     }
                 });
-                this.initPromise = this.activix.init().catch((error) => {
-                    // MongoDB config not available - log warning but don't throw.
-                    // This allows tests and development to work without MongoDB.
-                    this.logger.warn('Activity tracking enabled but MongoDB configuration not available. Activity records will not be persisted.', {
+                this.initPromise = this.activix
+                    .init()
+                    .then(() => {
+                    const ax = this.activix;
+                    if (!ax) {
+                        return;
+                    }
+                    const backend = ax.storageBackend;
+                    const mongoDb = backend === 'database' ? resolveActivixLogsDatabaseName() : undefined;
+                    const mongoUriConfigured = Boolean(resolveActivixMongoUriFromEnv());
+                    this.logger.info('Activity tracking persistence backend ready', {
+                        storageBackend: backend,
+                        mongoDatabase: mongoDb,
+                        mongoUriConfigured,
+                        mainCollection: collectionName,
+                        badRequestsCollection: badRequestsCollectionName,
+                        skillExecutionsCollection: this.skillExecutionsCollectionName,
+                        ...(backend === 'local'
+                            ? {
+                                note: 'Activix is using local playground storage, not MongoDB. The ai-actions collection will not appear in Mongo until URI is set (MONGO_URI or MONGO_LOGS_URI), Activix can ping the database, and at least one activity is written.'
+                            }
+                            : {
+                                note: 'MongoDB stores one document per activity; the ai-actions collection is created on first insert (empty collections may be hidden in some tools until then).'
+                            })
+                    });
+                })
+                    .catch((error) => {
+                    // Init threw — disable tracker so requests are not blocked.
+                    this.logger.warn('Activity tracking enabled but Activix init failed. Activity records will not be persisted.', {
                         error: error instanceof Error ? error.message : String(error),
-                        hint: 'Set MONGO_URI and MONGO_LOGS_DB (or MONGO_DB) environment variables to enable activity tracking persistence'
+                        hint: 'Set MONGO_URI or MONGO_LOGS_URI and a database name (MONGO_LOGS_DB, MONGO_DB, MONGO_AI_LOGS_DB, or ACTIVIX_DB_NAME). See README: Activity tracking / persistence troubleshooting.'
                     });
                     this.activix = undefined;
                 });
@@ -343,6 +379,8 @@ export class ActivityManager {
             startTime,
             status: 'started',
             activityType: 'gateway-invocation',
+            ...(identity.actionType !== undefined && { actionType: identity.actionType }),
+            ...(identity.actionRef !== undefined && identity.actionRef !== '' && { actionRef: identity.actionRef }),
             // Activix v5+: correlation BSON field is `runContext` (same object as `request.identity`)
             runContext: identity
             // Removed root-level fields per v2.3.2:
@@ -557,6 +595,8 @@ export class ActivityManager {
             taskTypeId: request.taskTypeId,
             startTime,
             status: 'started',
+            ...(identity.actionType !== undefined && { actionType: identity.actionType }),
+            ...(identity.actionRef !== undefined && identity.actionRef !== '' && { actionRef: identity.actionRef }),
             runContext: identity,
             ...(instructionMetadata.key && { instructionKey: instructionMetadata.key }),
             ...(instructionMetadata.version && { instructionVersion: instructionMetadata.version }),

package/dist/config/activity-tracking-config.d.ts CHANGED Viewed

@@ -1,6 +1,7 @@
 /**
  * Centralized activity tracking configuration.
- * Single source of truth for package-level collection names.
+ * Package-level Mongo collection names are fixed literals here (no env override).
+ * Main gateway rows: `ai-actions`; bad requests: `bad-requests` (see constants below).
  */
 export interface ActivityTrackingConfig {
     mongoUri: string;

package/dist/config/activity-tracking-config.js CHANGED Viewed

@@ -1,8 +1,9 @@
 /**
  * Centralized activity tracking configuration.
- * Single source of truth for package-level collection names.
+ * Package-level Mongo collection names are fixed literals here (no env override).
+ * Main gateway rows: `ai-actions`; bad requests: `bad-requests` (see constants below).
  */
-const ACTIVITY_COLLECTION_NAME = 'ai-activities';
+const ACTIVITY_COLLECTION_NAME = 'ai-actions';
 const BAD_REQUESTS_COLLECTION_NAME = 'bad-requests';
 export function resolveActivityTrackingConfig() {
     // Collection names are intentionally hardcoded at package level.

package/dist/gateway-memory.d.ts CHANGED Viewed

@@ -10,7 +10,6 @@ type Request = ChatRequest | AIRequest;
  * Merges existing workingMemory (from request or memory component) with request metadata
  *
  * Implements tiered token resolution:
- * - Tier 1 (highest): templateTokens (handled in resolveTemplateParams, merged into shortTermMemory)
  * - Tier 2: workingMemory (this method) - checks existing workingMemory first
  * - Tier 3: derived from request fields or other memories (fallback)
  */
@@ -27,7 +26,7 @@ export declare function buildWorkingMemory(request: Request, existingWorkingMemo
 }): unknown;
 /**
  * Resolves template parameters with smart fallback logic
- * Priority: Request args (tier 1) -> Memory component (tier 2) -> Gateway config (tier 3) -> defaults
+ * Priority: request.workingMemory -> memoryManager resolution -> buildWorkingMemory merge
  */
 export declare function resolveTemplateParams(request: Request, config: GatewayConfig, logger: Logxer): Promise<{
     workingMemory: unknown;

package/dist/gateway-memory.js CHANGED Viewed

@@ -14,7 +14,6 @@ function isAIRequest(request) {
  * Merges existing workingMemory (from request or memory component) with request metadata
  *
  * Implements tiered token resolution:
- * - Tier 1 (highest): templateTokens (handled in resolveTemplateParams, merged into shortTermMemory)
  * - Tier 2: workingMemory (this method) - checks existing workingMemory first
  * - Tier 3: derived from request fields or other memories (fallback)
  */
@@ -34,7 +33,6 @@ export function buildWorkingMemory(request, existingWorkingMemory, otherMemories
     }
     /**
      * Token Resolution with Tiered Fallback
-     * Tier 1: templateTokens (handled in resolveTemplateParams, merged into shortTermMemory)
      * Tier 2: workingMemory (check existing workingMemory first)
      * Tier 3: derive from request fields or other memories
      */
@@ -138,7 +136,7 @@ export function buildWorkingMemory(request, existingWorkingMemory, otherMemories
 }
 /**
  * Resolves template parameters with smart fallback logic
- * Priority: Request args (tier 1) -> Memory component (tier 2) -> Gateway config (tier 3) -> defaults
+ * Priority: request.workingMemory -> memoryManager resolution -> buildWorkingMemory merge
  */
 export async function resolveTemplateParams(request, config, logger) {
     // Tier 1: Request args (highest priority)
@@ -189,19 +187,7 @@ export async function resolveTemplateParams(request, config, logger) {
     // Build proper workingMemory structure (merge with request fields if needed)
     // This implements tiered token resolution: tier 2 (workingMemory) and tier 3 (derive from request fields)
     const finalWorkingMemory = buildWorkingMemory(request, workingMemory);
-    // Merge templateTokens (tier 1 - highest priority) into shortTermMemory AFTER memory resolution
-    // This ensures templateTokens override everything (workingMemory and other memories)
-    // Rendrix priority: shortTermMemory > workingMemory > experienceMemory > knowledgeMemory
-    if (request.templateTokens && Object.keys(request.templateTokens).length > 0) {
-        logger?.debug('Merged templateTokens into shortTermMemory (tier 1 - highest priority)', {
-            jobId: request.identity.jobId,
-            tokenKeys: Object.keys(request.templateTokens)
-        });
-    }
-    // Note: taskConfig removed - Rendrix 3.0.0+ no longer accepts it
-    // taskConfig is deprecated and no longer used
     return {
         workingMemory: finalWorkingMemory
-        // taskConfig removed - Rendrix 3.0.0+ no longer uses it
     };
 }

package/dist/gateway-meta.js CHANGED Viewed

@@ -27,8 +27,11 @@ export async function testInstructions(instructions, testInput, expectedSchema,
     const testRequest = {
         aiRequestId,
         agentId,
+        actionType: 'skill',
+        actionRef: 'gateway-meta/test-instructions',
         instructions,
         identity: runtimeIdentity,
+        prompt: '{{input}}',
         workingMemory: { input: testInput },
         config: {
             model,

package/dist/gateway-utils.d.ts CHANGED Viewed

@@ -21,7 +21,7 @@ export declare function mergeConfig(request: ChatRequest & {
 }, config: GatewayConfig, logger: Logxer): Promise<ChatRequest['config']>;
 /**
  * Maps provider/router usage objects to gateway token counts (`metadata.tokens`, Activix, trace attempts).
- * Handles promptTokens/inputTokens, OpenAI-style snake_case, and missing total (sum prompt+completion).
+ * Handles promptTokens/inputTokens, OpenAI-style snake_case, Responses-style input/output tokens, and missing total (sum prompt+completion).
  */
 export declare function normalizeRouterUsageTokens(usage: unknown): {
     prompt: number;
@@ -30,9 +30,23 @@ export declare function normalizeRouterUsageTokens(usage: unknown): {
 } | undefined;
 /**
  * Reads token usage from every stable location the router may populate (see docs/PROVIDERS_ROUTER_DIAGNOSTICS_TRACE_REQUIREMENTS.md).
+ * Prefers the raw/provider body (`rawResponse` / `raw`) when it carries non-zero usage before re-reading the outer envelope.
  */
 export declare function extractTokenUsageFromRouterResponse(routerResponse: unknown): {
     prompt: number;
     completion: number;
     total: number;
 };
+/**
+ * Best-effort USD cost from router/sync AIResponse shape: metadata.costUsd (preferred),
+ * metadata.attempts[].costUsd, response root, then common raw payload locations.
+ * Does not compute cost from tokens — adapters must populate normalized fields or raw usage.cost-style keys.
+ */
+export declare function extractCostUsdFromRouterResponse(routerResponse: unknown): number | undefined;
+/** Default JSON string length cap for Activix `content.fullResponse` when diagnostics allow storing it. */
+export declare const DEFAULT_ACTIVITY_FULL_RESPONSE_MAX_CHARS = 512000;
+/**
+ * Size-cap a provider/router payload before storing on an activity record.
+ * Non-serializable values become a small marker object instead of throwing.
+ */
+export declare function capActivityFullResponsePayload(payload: unknown, maxChars?: number): unknown;

package/dist/gateway-utils.js CHANGED Viewed

@@ -183,51 +183,159 @@ function firstFiniteNumber(...vals) {
     for (const v of vals) {
         if (typeof v === 'number' && Number.isFinite(v))
             return v;
+        if (typeof v === 'string' && v.trim() !== '') {
+            const n = Number(v);
+            if (Number.isFinite(n))
+                return n;
+        }
     }
     return undefined;
 }
+function isNonZeroTokenCount(n) {
+    return !!(n.prompt || n.completion || n.total);
+}
 /**
  * Maps provider/router usage objects to gateway token counts (`metadata.tokens`, Activix, trace attempts).
- * Handles promptTokens/inputTokens, OpenAI-style snake_case, and missing total (sum prompt+completion).
+ * Handles promptTokens/inputTokens, OpenAI-style snake_case, Responses-style input/output tokens, and missing total (sum prompt+completion).
  */
 export function normalizeRouterUsageTokens(usage) {
     if (usage == null || typeof usage !== 'object')
         return undefined;
     const u = usage;
-    const prompt = firstFiniteNumber(u.promptTokens, u.inputTokens, u.prompt, u.prompt_tokens) ?? 0;
-    const completion = firstFiniteNumber(u.completionTokens, u.outputTokens, u.completion, u.completion_tokens) ?? 0;
-    let total = firstFiniteNumber(u.totalTokens, u.total_tokens) ?? 0;
+    const prompt = firstFiniteNumber(u.promptTokens, u.inputTokens, u.input_tokens, u.prompt, u.prompt_tokens) ?? 0;
+    const completion = firstFiniteNumber(u.completionTokens, u.outputTokens, u.output_tokens, u.completion, u.completion_tokens) ?? 0;
+    let total = firstFiniteNumber(u.totalTokens, u.total_tokens, u.total) ?? 0;
     if (!total && (prompt || completion))
         total = prompt + completion;
     return { prompt, completion, total };
 }
+/**
+ * Collect usage from one router/provider envelope (single object).
+ * When followRaw is true, also reads `(rawResponse ?? raw).usage` on that envelope.
+ */
+function collectUsageBucketsFromRoot(root, followRaw) {
+    const meta = root.metadata != null && typeof root.metadata === 'object'
+        ? root.metadata
+        : undefined;
+    const buckets = [root.usage];
+    if (meta) {
+        buckets.push(meta.usage);
+        buckets.push(meta.tokens);
+        const nested = meta['ai-activities-response'];
+        if (nested != null && typeof nested === 'object') {
+            buckets.push(nested.usage);
+        }
+    }
+    if (followRaw) {
+        const raw = root.rawResponse ?? root.raw;
+        if (raw != null && typeof raw === 'object') {
+            buckets.push(raw.usage);
+        }
+    }
+    return buckets;
+}
+function firstNonZeroUsageFromBuckets(buckets) {
+    for (const b of buckets) {
+        const n = normalizeRouterUsageTokens(b);
+        if (n && isNonZeroTokenCount(n))
+            return n;
+    }
+    return undefined;
+}
 /**
  * Reads token usage from every stable location the router may populate (see docs/PROVIDERS_ROUTER_DIAGNOSTICS_TRACE_REQUIREMENTS.md).
+ * Prefers the raw/provider body (`rawResponse` / `raw`) when it carries non-zero usage before re-reading the outer envelope.
  */
 export function extractTokenUsageFromRouterResponse(routerResponse) {
+    const zeros = { prompt: 0, completion: 0, total: 0 };
     if (routerResponse == null || typeof routerResponse !== 'object') {
-        return { prompt: 0, completion: 0, total: 0 };
+        return zeros;
+    }
+    const r = routerResponse;
+    const raw = r.rawResponse ?? r.raw;
+    const inner = raw != null && typeof raw === 'object' ? raw : undefined;
+    const roots = inner != null && inner !== r
+        ? [
+            { root: inner, followRaw: false },
+            { root: r, followRaw: true }
+        ]
+        : [{ root: r, followRaw: true }];
+    for (const { root, followRaw } of roots) {
+        const buckets = collectUsageBucketsFromRoot(root, followRaw);
+        const found = firstNonZeroUsageFromBuckets(buckets);
+        if (found)
+            return found;
     }
+    return zeros;
+}
+/**
+ * Best-effort USD cost from router/sync AIResponse shape: metadata.costUsd (preferred),
+ * metadata.attempts[].costUsd, response root, then common raw payload locations.
+ * Does not compute cost from tokens — adapters must populate normalized fields or raw usage.cost-style keys.
+ */
+export function extractCostUsdFromRouterResponse(routerResponse) {
+    if (routerResponse == null || typeof routerResponse !== 'object')
+        return undefined;
     const r = routerResponse;
     const meta = r.metadata != null && typeof r.metadata === 'object'
         ? r.metadata
         : undefined;
-    const buckets = [r.usage];
-    if (meta) {
-        buckets.push(meta.usage);
-        const nested = meta['ai-activities-response'];
-        if (nested != null && typeof nested === 'object') {
-            buckets.push(nested.usage);
+    const pick = (...vals) => firstFiniteNumber(...vals);
+    const fromMeta = pick(meta?.costUsd, meta?.cost);
+    if (fromMeta !== undefined)
+        return fromMeta;
+    const fromRoot = pick(r.costUsd, r.cost);
+    if (fromRoot !== undefined)
+        return fromRoot;
+    const attempts = meta?.attempts;
+    if (Array.isArray(attempts)) {
+        for (let i = attempts.length - 1; i >= 0; i--) {
+            const a = attempts[i];
+            if (a != null && typeof a === 'object') {
+                const o = a;
+                const c = pick(o.costUsd, o.cost);
+                if (c !== undefined)
+                    return c;
+            }
         }
     }
     const raw = r.rawResponse ?? r.raw;
     if (raw != null && typeof raw === 'object') {
-        buckets.push(raw.usage);
+        const rawObj = raw;
+        const usage = rawObj.usage;
+        if (usage != null && typeof usage === 'object') {
+            const u = usage;
+            const fromUsage = pick(u.cost, u.costUsd, u.total_cost, u.totalCost);
+            if (fromUsage !== undefined)
+                return fromUsage;
+        }
+        const fromRawTop = pick(rawObj.cost, rawObj.costUsd);
+        if (fromRawTop !== undefined)
+            return fromRawTop;
     }
-    for (const b of buckets) {
-        const n = normalizeRouterUsageTokens(b);
-        if (n && (n.prompt || n.completion || n.total))
-            return n;
+    return undefined;
+}
+/** Default JSON string length cap for Activix `content.fullResponse` when diagnostics allow storing it. */
+export const DEFAULT_ACTIVITY_FULL_RESPONSE_MAX_CHARS = 512_000;
+/**
+ * Size-cap a provider/router payload before storing on an activity record.
+ * Non-serializable values become a small marker object instead of throwing.
+ */
+export function capActivityFullResponsePayload(payload, maxChars = DEFAULT_ACTIVITY_FULL_RESPONSE_MAX_CHARS) {
+    if (payload == null)
+        return payload;
+    let serialized;
+    try {
+        serialized = typeof payload === 'string' ? payload : JSON.stringify(payload);
     }
-    return { prompt: 0, completion: 0, total: 0 };
+    catch {
+        return { _truncated: true, _reason: 'not_serializable' };
+    }
+    if (serialized.length <= maxChars)
+        return payload;
+    return {
+        _truncated: true,
+        _originalCharLength: serialized.length,
+        _preview: serialized.slice(0, maxChars)
+    };
 }

package/dist/gateway-validation.d.ts CHANGED Viewed

@@ -2,12 +2,12 @@
  * Gateway Validation Module
  * Basic validation for clean proxy implementation
  */
-import type { ChatRequest, AIRequest } from './types.js';
+import type { ChatRequest, AIInvokeRequest } from './types.js';
 /**
  * Validates ChatRequest has required fields
  */
 export declare function validateChatRequest(request: ChatRequest): void;
 /**
- * Validates AIRequest has required fields
+ * Validates AIInvokeRequest has required fields
  */
-export declare function validateAIRequest(request: AIRequest): void;
+export declare function validateAIRequest(request: AIInvokeRequest): void;

package/dist/gateway-validation.js CHANGED Viewed

@@ -32,8 +32,9 @@ export function validateChatRequest(request) {
         throw err;
     }
 }
+const GATEWAY_ACTION_TYPES = ['skill', 'preSkill', 'postSkill'];
 /**
- * Validates AIRequest has required fields
+ * Validates AIInvokeRequest has required fields
  */
 export function validateAIRequest(request) {
     if (!request.aiRequestId) {
@@ -43,6 +44,14 @@ export function validateAIRequest(request) {
         throw new Error('agentId is required for AI requests');
     }
     validateMandatoryRuntimeIdentity(request);
+    if (!request.actionType ||
+        !GATEWAY_ACTION_TYPES.includes(request.actionType)) {
+        throw new Error(`actionType is required and must be one of: ${GATEWAY_ACTION_TYPES.join(', ')}`);
+    }
+    const ref = typeof request.actionRef === 'string' ? request.actionRef.trim() : '';
+    if (!ref) {
+        throw new Error('actionRef is required and must be a non-empty string');
+    }
     // Reject input field - it has been removed
     if ('input' in request && request.input !== undefined) {
         const err = new Error(`The 'input' field has been removed. Use workingMemory.input instead for template rendering. Prompt templates should contain {{input}} which will be resolved from workingMemory.input.`);

package/dist/gateway.d.ts CHANGED Viewed

@@ -4,7 +4,7 @@
  * Simplified AI Gateway - Clean proxy implementation
  */
 import { LLMProviderRouter } from '@x12i/ai-providers-router';
-import type { GatewayConfig, ChatRequest, AIRequest, EnhancedLLMResponse } from './types.js';
+import type { GatewayConfig, ChatRequest, AIInvokeRequest, EnhancedLLMResponse } from './types.js';
 import type { Logxer } from '@x12i/logxer';
 import { ActivityManager } from './activity-manager.js';
 /**
@@ -25,7 +25,7 @@ export declare class AIGateway {
     /**
      * Invoke AI request (with structured output support)
      */
-    invoke<TContent = unknown>(request: AIRequest): Promise<EnhancedLLMResponse<TContent>>;
+    invoke<TContent = unknown>(request: AIInvokeRequest): Promise<EnhancedLLMResponse<TContent>>;
     /**
      * Build simple messages from request (instructions and prompt as literal template text; no registry).
      */

package/dist/gateway.js CHANGED Viewed

@@ -8,7 +8,7 @@ import { ensureGatewayRequestIdentity } from './activity-manager.js';
 import { initializeGatewayComponents } from './gateway-config.js';
 import { buildMessages } from './message-builder.js';
 import { extractJsonFromFlexMd } from './flex-md-loader.js';
-import { extractTokenUsageFromRouterResponse, mergeConfig } from './gateway-utils.js';
+import { capActivityFullResponsePayload, DEFAULT_ACTIVITY_FULL_RESPONSE_MAX_CHARS, extractCostUsdFromRouterResponse, extractTokenUsageFromRouterResponse, mergeConfig } from './gateway-utils.js';
 import { autoRegisterProviders } from './gateway-provider-auto-register.js';
 import { setGatewayLastJobId, setGatewayRuntimeClients } from './runtime-objects.js';
 import { gatewayLogDebug, withActivityIdentity } from './gateway-log-meta.js';
@@ -16,6 +16,25 @@ import { invokeWithRetry } from './gateway-retry.js';
 /** Error message thrown by the router when no provider is registered or specified */
 const NO_PROVIDER_ERROR = 'No provider specified and no providers registered';
 const NO_PROVIDER_HINT = ' Set OPEN_ROUTER_KEY (or OPENROUTER_API_KEY) in the environment to use OpenRouter, or register a provider with the router (e.g. via autoRegisterProviders or gateway config).';
+/** Warn when a successful call reports no tokens and/or explicit zero cost (often missing adapter metadata). */
+function warnIfSuccessfulInvokeReportsZeroUsageOrCost(logger, identity, meta, invokeKind) {
+    const { tokens, costUsd, cost } = meta;
+    const zeroTokens = tokens.prompt === 0 && tokens.completion === 0 && tokens.total === 0;
+    const zeroCostUsd = typeof costUsd === 'number' && costUsd === 0;
+    const zeroCost = typeof cost === 'number' && cost === 0;
+    if (!zeroTokens && !zeroCostUsd && !zeroCost)
+        return;
+    logger.warn('Successful provider response reported zero token usage and/or zero cost; verify router adapter usage and billing metadata', withActivityIdentity(identity, {
+        invokeKind,
+        zeroTokens,
+        zeroCostUsd,
+        zeroCostField: zeroCost,
+        tokens,
+        costUsd,
+        cost,
+        debugKind: gatewayLogDebug.anomaly
+    }));
+}
 /**
  * Simplified AI Gateway - Clean proxy implementation
  */
@@ -87,6 +106,8 @@ export class AIGateway {
                 },
                 mode: 'sync'
             });
+            const costUsdChat = extractCostUsdFromRouterResponse(response);
+            const metaChat = response?.metadata || {};
             // Create enhanced response
             const enhancedResponse = {
                 content: response.content || '',
@@ -96,13 +117,20 @@ export class AIGateway {
                     latencyMs: Date.now() - startTime,
                     tokens: extractTokenUsageFromRouterResponse(response),
                     taskTypeId,
-                    agentType: 'chat'
+                    agentType: 'chat',
+                    ...(typeof costUsdChat === 'number'
+                        ? {
+                            costUsd: costUsdChat,
+                            ...(typeof metaChat.cost === 'number' ? { cost: metaChat.cost } : { cost: costUsdChat })
+                        }
+                        : {})
                 }
             };
             // Track activity success if activity was started
             if (activity) {
                 try {
                     await this.activityManager.logSuccess(activity, {
+                        ...(typeof costUsdChat === 'number' ? { cost: costUsdChat } : {}),
                         response: enhancedResponse,
                         endTime: Date.now(),
                         duration: Date.now() - startTime
@@ -116,6 +144,11 @@ export class AIGateway {
                     });
                 }
             }
+            warnIfSuccessfulInvokeReportsZeroUsageOrCost(this.logger, request.identity, {
+                tokens: enhancedResponse.metadata.tokens,
+                costUsd: enhancedResponse.metadata.costUsd,
+                cost: enhancedResponse.metadata.cost
+            }, 'invokeChat');
             return enhancedResponse;
         }
         catch (error) {
@@ -369,17 +402,9 @@ export class AIGateway {
                                     a.routing.requestIds = requestIds;
                                     a.modelUsed =
                                         meta?.modelUsed || meta?.model || respAny.model || candidate.model;
-                                    const costUsd = typeof meta?.costUsd === 'number'
-                                        ? meta.costUsd
-                                        : typeof meta?.cost === 'number'
-                                            ? meta.cost
-                                            : typeof respAny?.costUsd === 'number'
-                                                ? respAny.costUsd
-                                                : typeof respAny?.cost === 'number'
-                                                    ? respAny.cost
-                                                    : undefined;
-                                    if (typeof costUsd === 'number')
-                                        a.costUsd = costUsd;
+                                    const attemptCostUsd = extractCostUsdFromRouterResponse(respAny);
+                                    if (typeof attemptCostUsd === 'number')
+                                        a.costUsd = attemptCostUsd;
                                     if (includeRawProviderPayload) {
                                         // Size-capped preview only.
                                         const raw = respAny.rawResponse ?? respAny.raw ?? respAny;
@@ -488,7 +513,17 @@ export class AIGateway {
             }
             contentType = 'structured';
             parsingMethod = 'flex-md';
-            const tokens = extractTokenUsageFromRouterResponse(routerResponse);
+            let tokens = extractTokenUsageFromRouterResponse(routerResponse);
+            if (!(tokens.prompt || tokens.completion || tokens.total)) {
+                const alt = routerResponse?.rawResponse ?? routerResponse?.raw;
+                if (alt != null && typeof alt === 'object' && alt !== routerResponse) {
+                    const second = extractTokenUsageFromRouterResponse(alt);
+                    if (second.prompt || second.completion || second.total)
+                        tokens = second;
+                }
+            }
+            const resolvedCostUsd = extractCostUsdFromRouterResponse(routerResponse);
+            const routerMetaForCost = routerResponse?.metadata || {};
             const enhancedResponse = {
                 content: content,
                 parsedContent: parsedContent,
@@ -501,6 +536,14 @@ export class AIGateway {
                     agentType: 'ai',
                     contentType,
                     parsingMethod,
+                    ...(typeof resolvedCostUsd === 'number'
+                        ? {
+                            costUsd: resolvedCostUsd,
+                            ...(typeof routerMetaForCost.cost === 'number'
+                                ? { cost: routerMetaForCost.cost }
+                                : { cost: resolvedCostUsd })
+                        }
+                        : {}),
                     ...(traceEnabled
                         ? (() => {
                             const meta = routerResponse?.metadata || {};
@@ -512,18 +555,11 @@ export class AIGateway {
                                 : typeof mergedConfig?.maxTokens === 'number'
                                     ? mergedConfig.maxTokens
                                     : undefined;
-                            const costUsd = typeof meta.costUsd === 'number'
-                                ? meta.costUsd
-                                : typeof meta.cost === 'number'
-                                    ? meta.cost
-                                    : undefined;
                             return {
                                 provider,
                                 region,
                                 modelUsed,
                                 maxTokensRequested,
-                                cost: typeof meta.cost === 'number' ? meta.cost : undefined,
-                                costUsd,
                                 requestIds: traceRequestIds,
                                 retryCount: traceRetryCount,
                                 fallbackCount: traceFallbackCount,
@@ -536,11 +572,20 @@ export class AIGateway {
             // Track activity success if activity was started
             if (activity) {
                 try {
+                    const diag = request.diagnostics;
+                    const includeFullProviderBlob = diag?.includeFullProviderResponseInActivity !== false;
+                    const maxFullChars = typeof diag?.activityFullResponseMaxChars === 'number' && diag.activityFullResponseMaxChars > 0
+                        ? diag.activityFullResponseMaxChars
+                        : DEFAULT_ACTIVITY_FULL_RESPONSE_MAX_CHARS;
+                    const rawFull = routerResponse.rawResponse || routerResponse;
+                    const fullResponseForActivity = includeFullProviderBlob
+                        ? capActivityFullResponsePayload(rawFull, maxFullChars)
+                        : undefined;
                     // Create activity response with proper structure for ActivityTracker
                     const activityResponse = {
                         content: {
                             rawContent: content, // Store the actual response content as rawContent
-                            fullResponse: routerResponse.rawResponse || routerResponse // Include full router response
+                            ...(fullResponseForActivity !== undefined ? { fullResponse: fullResponseForActivity } : {})
                         },
                         parsed: parsedContent, // Include parsed content in activity record
                         metadata: enhancedResponse.metadata,
@@ -549,6 +594,7 @@ export class AIGateway {
                         usage: tokens
                     };
                     await this.activityManager.logSuccess(activity, {
+                        ...(typeof resolvedCostUsd === 'number' ? { cost: resolvedCostUsd } : {}),
                         response: activityResponse,
                         endTime: Date.now(),
                         duration: Date.now() - startTime
@@ -562,6 +608,11 @@ export class AIGateway {
                     });
                 }
             }
+            warnIfSuccessfulInvokeReportsZeroUsageOrCost(this.logger, request.identity, {
+                tokens: enhancedResponse.metadata.tokens,
+                costUsd: enhancedResponse.metadata.costUsd,
+                cost: enhancedResponse.metadata.cost
+            }, 'invoke');
             this.logger.debug('gateway: enhancedResponse', withActivityIdentity(request.identity, {
                 latencyMs: enhancedResponse.metadata?.latencyMs,
                 contentType: enhancedResponse.metadata?.contentType,