npm - @juspay/neurolink - Versions diffs - 9.64.0 → 9.65.1 - Mend

@juspay/neurolink 9.64.0 → 9.65.1

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (324) hide show

package/CHANGELOG.md +12 -0
package/README.md +18 -17
package/dist/adapters/providerImageAdapter.js +29 -1
package/dist/adapters/replicate/auth.d.ts +19 -0
package/dist/adapters/replicate/auth.js +32 -0
package/dist/adapters/replicate/predictionLifecycle.d.ts +46 -0
package/dist/adapters/replicate/predictionLifecycle.js +283 -0
package/dist/adapters/video/klingVideoHandler.d.ts +37 -0
package/dist/adapters/video/klingVideoHandler.js +305 -0
package/dist/adapters/video/replicateVideoHandler.d.ts +29 -0
package/dist/adapters/video/replicateVideoHandler.js +157 -0
package/dist/adapters/video/runwayVideoHandler.d.ts +32 -0
package/dist/adapters/video/runwayVideoHandler.js +316 -0
package/dist/adapters/video/vertexVideoHandler.d.ts +19 -1
package/dist/adapters/video/vertexVideoHandler.js +33 -9
package/dist/agent/directTools.js +11 -3
package/dist/autoresearch/runner.js +8 -2
package/dist/avatar/index.d.ts +13 -0
package/dist/avatar/index.js +13 -0
package/dist/avatar/providers/DIDAvatar.d.ts +49 -0
package/dist/avatar/providers/DIDAvatar.js +501 -0
package/dist/avatar/providers/HeyGenAvatar.d.ts +30 -0
package/dist/avatar/providers/HeyGenAvatar.js +337 -0
package/dist/avatar/providers/ReplicateAvatar.d.ts +36 -0
package/dist/avatar/providers/ReplicateAvatar.js +267 -0
package/dist/browser/neurolink.min.js +624 -601
package/dist/cli/commands/mcp.js +29 -0
package/dist/cli/commands/proxy.js +24 -5
package/dist/cli/factories/commandFactory.d.ts +11 -1
package/dist/cli/factories/commandFactory.js +291 -38
package/dist/constants/contextWindows.js +101 -0
package/dist/constants/enums.d.ts +273 -2
package/dist/constants/enums.js +290 -1
package/dist/constants/videoErrors.d.ts +4 -0
package/dist/constants/videoErrors.js +4 -0
package/dist/core/baseProvider.d.ts +22 -2
package/dist/core/baseProvider.js +217 -11
package/dist/core/constants.d.ts +12 -0
package/dist/core/constants.js +72 -1
package/dist/evaluation/index.d.ts +2 -0
package/dist/evaluation/index.js +4 -0
package/dist/factories/providerFactory.js +7 -1
package/dist/factories/providerRegistry.js +202 -5
package/dist/features/ppt/contentPlanner.js +42 -14
package/dist/index.d.ts +9 -1
package/dist/index.js +16 -1
package/dist/lib/adapters/providerImageAdapter.js +29 -1
package/dist/lib/adapters/replicate/auth.d.ts +19 -0
package/dist/lib/adapters/replicate/auth.js +33 -0
package/dist/lib/adapters/replicate/predictionLifecycle.d.ts +46 -0
package/dist/lib/adapters/replicate/predictionLifecycle.js +284 -0
package/dist/lib/adapters/video/klingVideoHandler.d.ts +37 -0
package/dist/lib/adapters/video/klingVideoHandler.js +306 -0
package/dist/lib/adapters/video/replicateVideoHandler.d.ts +29 -0
package/dist/lib/adapters/video/replicateVideoHandler.js +158 -0
package/dist/lib/adapters/video/runwayVideoHandler.d.ts +32 -0
package/dist/lib/adapters/video/runwayVideoHandler.js +317 -0
package/dist/lib/adapters/video/vertexVideoHandler.d.ts +19 -1
package/dist/lib/adapters/video/vertexVideoHandler.js +33 -9
package/dist/lib/agent/directTools.js +11 -3
package/dist/lib/autoresearch/runner.js +8 -2
package/dist/lib/avatar/index.d.ts +13 -0
package/dist/lib/avatar/index.js +14 -0
package/dist/lib/avatar/providers/DIDAvatar.d.ts +49 -0
package/dist/lib/avatar/providers/DIDAvatar.js +502 -0
package/dist/lib/avatar/providers/HeyGenAvatar.d.ts +30 -0
package/dist/lib/avatar/providers/HeyGenAvatar.js +338 -0
package/dist/lib/avatar/providers/ReplicateAvatar.d.ts +36 -0
package/dist/lib/avatar/providers/ReplicateAvatar.js +268 -0
package/dist/lib/constants/contextWindows.js +101 -0
package/dist/lib/constants/enums.d.ts +273 -2
package/dist/lib/constants/enums.js +290 -1
package/dist/lib/constants/videoErrors.d.ts +4 -0
package/dist/lib/constants/videoErrors.js +4 -0
package/dist/lib/core/baseProvider.d.ts +22 -2
package/dist/lib/core/baseProvider.js +217 -11
package/dist/lib/core/constants.d.ts +12 -0
package/dist/lib/core/constants.js +72 -1
package/dist/lib/evaluation/index.d.ts +2 -0
package/dist/lib/evaluation/index.js +4 -0
package/dist/lib/factories/providerFactory.js +7 -1
package/dist/lib/factories/providerRegistry.js +202 -5
package/dist/lib/features/ppt/contentPlanner.js +42 -14
package/dist/lib/index.d.ts +9 -1
package/dist/lib/index.js +16 -1
package/dist/lib/middleware/builtin/lifecycle.js +39 -9
package/dist/lib/music/index.d.ts +13 -0
package/dist/lib/music/index.js +14 -0
package/dist/lib/music/providers/BeatovenMusic.d.ts +31 -0
package/dist/lib/music/providers/BeatovenMusic.js +334 -0
package/dist/lib/music/providers/ElevenLabsMusic.d.ts +30 -0
package/dist/lib/music/providers/ElevenLabsMusic.js +169 -0
package/dist/lib/music/providers/LyriaMusic.d.ts +29 -0
package/dist/lib/music/providers/LyriaMusic.js +173 -0
package/dist/lib/music/providers/ReplicateMusic.d.ts +31 -0
package/dist/lib/music/providers/ReplicateMusic.js +262 -0
package/dist/lib/neurolink.d.ts +30 -0
package/dist/lib/neurolink.js +323 -77
package/dist/lib/providers/amazonBedrock.d.ts +10 -0
package/dist/lib/providers/amazonBedrock.js +94 -39
package/dist/lib/providers/anthropic.js +55 -7
package/dist/lib/providers/anthropicBaseProvider.js +1 -1
package/dist/lib/providers/azureOpenai.js +66 -17
package/dist/lib/providers/cloudflare.d.ts +35 -0
package/dist/lib/providers/cloudflare.js +174 -0
package/dist/lib/providers/cohere.d.ts +52 -0
package/dist/lib/providers/cohere.js +253 -0
package/dist/lib/providers/deepseek.js +72 -17
package/dist/lib/providers/fireworks.d.ts +33 -0
package/dist/lib/providers/fireworks.js +164 -0
package/dist/lib/providers/googleAiStudio.js +126 -10
package/dist/lib/providers/googleNativeGemini3.d.ts +26 -6
package/dist/lib/providers/googleNativeGemini3.js +276 -29
package/dist/lib/providers/googleVertex.js +639 -181
package/dist/lib/providers/groq.d.ts +33 -0
package/dist/lib/providers/groq.js +181 -0
package/dist/lib/providers/huggingFace.js +9 -8
package/dist/lib/providers/ideogram.d.ts +34 -0
package/dist/lib/providers/ideogram.js +184 -0
package/dist/lib/providers/index.d.ts +13 -0
package/dist/lib/providers/index.js +13 -0
package/dist/lib/providers/jina.d.ts +59 -0
package/dist/lib/providers/jina.js +218 -0
package/dist/lib/providers/llamaCpp.js +14 -46
package/dist/lib/providers/lmStudio.js +14 -47
package/dist/lib/providers/mistral.js +7 -7
package/dist/lib/providers/nvidiaNim.js +160 -19
package/dist/lib/providers/ollama.js +7 -7
package/dist/lib/providers/openAI.d.ts +22 -1
package/dist/lib/providers/openAI.js +181 -0
package/dist/lib/providers/openRouter.js +35 -23
package/dist/lib/providers/openaiCompatible.js +9 -8
package/dist/lib/providers/perplexity.d.ts +33 -0
package/dist/lib/providers/perplexity.js +179 -0
package/dist/lib/providers/recraft.d.ts +34 -0
package/dist/lib/providers/recraft.js +197 -0
package/dist/lib/providers/replicate.d.ts +75 -0
package/dist/lib/providers/replicate.js +403 -0
package/dist/lib/providers/stability.d.ts +37 -0
package/dist/lib/providers/stability.js +191 -0
package/dist/lib/providers/togetherAi.d.ts +33 -0
package/dist/lib/providers/togetherAi.js +176 -0
package/dist/lib/providers/voyage.d.ts +47 -0
package/dist/lib/providers/voyage.js +177 -0
package/dist/lib/providers/xai.d.ts +33 -0
package/dist/lib/providers/xai.js +172 -0
package/dist/lib/telemetry/index.d.ts +1 -1
package/dist/lib/telemetry/index.js +1 -1
package/dist/lib/telemetry/tracers.d.ts +19 -0
package/dist/lib/telemetry/tracers.js +19 -0
package/dist/lib/telemetry/withSpan.d.ts +35 -0
package/dist/lib/telemetry/withSpan.js +103 -0
package/dist/lib/types/avatar.d.ts +143 -0
package/dist/lib/types/avatar.js +20 -0
package/dist/lib/types/cli.d.ts +6 -0
package/dist/lib/types/conversation.d.ts +16 -0
package/dist/lib/types/generate.d.ts +62 -5
package/dist/lib/types/index.d.ts +5 -0
package/dist/lib/types/index.js +7 -0
package/dist/lib/types/middleware.d.ts +27 -0
package/dist/lib/types/multimodal.d.ts +35 -2
package/dist/lib/types/music.d.ts +165 -0
package/dist/lib/types/music.js +21 -0
package/dist/lib/types/providers.d.ts +144 -1
package/dist/lib/types/replicate.d.ts +67 -0
package/dist/lib/types/replicate.js +10 -0
package/dist/lib/types/safeFetch.d.ts +15 -0
package/dist/lib/types/safeFetch.js +7 -0
package/dist/lib/types/stream.d.ts +2 -1
package/dist/lib/types/tools.d.ts +13 -0
package/dist/lib/types/video.d.ts +89 -0
package/dist/lib/types/video.js +15 -0
package/dist/lib/utils/avatarProcessor.d.ts +68 -0
package/dist/lib/utils/avatarProcessor.js +172 -0
package/dist/lib/utils/cloneOptions.d.ts +36 -0
package/dist/lib/utils/cloneOptions.js +62 -0
package/dist/lib/utils/lifecycleCallbacks.d.ts +51 -8
package/dist/lib/utils/lifecycleCallbacks.js +82 -26
package/dist/lib/utils/lifecycleTimeout.d.ts +25 -0
package/dist/lib/utils/lifecycleTimeout.js +39 -0
package/dist/lib/utils/logSanitize.d.ts +49 -0
package/dist/lib/utils/logSanitize.js +170 -0
package/dist/lib/utils/loggingFetch.d.ts +29 -0
package/dist/lib/utils/loggingFetch.js +60 -0
package/dist/lib/utils/messageBuilder.js +43 -25
package/dist/lib/utils/modelChoices.js +236 -3
package/dist/lib/utils/musicProcessor.d.ts +67 -0
package/dist/lib/utils/musicProcessor.js +189 -0
package/dist/lib/utils/optionsConversion.js +3 -2
package/dist/lib/utils/parameterValidation.js +14 -4
package/dist/lib/utils/pricing.js +193 -0
package/dist/lib/utils/providerConfig.d.ts +55 -0
package/dist/lib/utils/providerConfig.js +224 -0
package/dist/lib/utils/safeFetch.d.ts +26 -0
package/dist/lib/utils/safeFetch.js +83 -0
package/dist/lib/utils/sizeGuard.d.ts +34 -0
package/dist/lib/utils/sizeGuard.js +45 -0
package/dist/lib/utils/ssrfGuard.d.ts +52 -0
package/dist/lib/utils/ssrfGuard.js +411 -0
package/dist/lib/utils/videoProcessor.d.ts +60 -0
package/dist/lib/utils/videoProcessor.js +201 -0
package/dist/lib/voice/providers/FishAudioTTS.d.ts +27 -0
package/dist/lib/voice/providers/FishAudioTTS.js +183 -0
package/dist/lib/workflow/core/ensembleExecutor.js +26 -9
package/dist/middleware/builtin/lifecycle.js +39 -9
package/dist/music/index.d.ts +13 -0
package/dist/music/index.js +13 -0
package/dist/music/providers/BeatovenMusic.d.ts +31 -0
package/dist/music/providers/BeatovenMusic.js +333 -0
package/dist/music/providers/ElevenLabsMusic.d.ts +30 -0
package/dist/music/providers/ElevenLabsMusic.js +168 -0
package/dist/music/providers/LyriaMusic.d.ts +29 -0
package/dist/music/providers/LyriaMusic.js +172 -0
package/dist/music/providers/ReplicateMusic.d.ts +31 -0
package/dist/music/providers/ReplicateMusic.js +261 -0
package/dist/neurolink.d.ts +30 -0
package/dist/neurolink.js +323 -77
package/dist/providers/amazonBedrock.d.ts +10 -0
package/dist/providers/amazonBedrock.js +94 -39
package/dist/providers/anthropic.js +55 -7
package/dist/providers/anthropicBaseProvider.js +1 -1
package/dist/providers/azureOpenai.js +66 -17
package/dist/providers/cloudflare.d.ts +35 -0
package/dist/providers/cloudflare.js +173 -0
package/dist/providers/cohere.d.ts +52 -0
package/dist/providers/cohere.js +252 -0
package/dist/providers/deepseek.js +72 -17
package/dist/providers/fireworks.d.ts +33 -0
package/dist/providers/fireworks.js +163 -0
package/dist/providers/googleAiStudio.js +126 -10
package/dist/providers/googleNativeGemini3.d.ts +26 -6
package/dist/providers/googleNativeGemini3.js +276 -29
package/dist/providers/googleVertex.js +639 -181
package/dist/providers/groq.d.ts +33 -0
package/dist/providers/groq.js +180 -0
package/dist/providers/huggingFace.js +9 -8
package/dist/providers/ideogram.d.ts +34 -0
package/dist/providers/ideogram.js +183 -0
package/dist/providers/index.d.ts +13 -0
package/dist/providers/index.js +13 -0
package/dist/providers/jina.d.ts +59 -0
package/dist/providers/jina.js +217 -0
package/dist/providers/llamaCpp.js +14 -46
package/dist/providers/lmStudio.js +14 -47
package/dist/providers/mistral.js +7 -7
package/dist/providers/nvidiaNim.js +160 -19
package/dist/providers/ollama.js +7 -7
package/dist/providers/openAI.d.ts +22 -1
package/dist/providers/openAI.js +181 -0
package/dist/providers/openRouter.js +35 -23
package/dist/providers/openaiCompatible.js +9 -8
package/dist/providers/perplexity.d.ts +33 -0
package/dist/providers/perplexity.js +178 -0
package/dist/providers/recraft.d.ts +34 -0
package/dist/providers/recraft.js +196 -0
package/dist/providers/replicate.d.ts +75 -0
package/dist/providers/replicate.js +402 -0
package/dist/providers/stability.d.ts +37 -0
package/dist/providers/stability.js +190 -0
package/dist/providers/togetherAi.d.ts +33 -0
package/dist/providers/togetherAi.js +175 -0
package/dist/providers/voyage.d.ts +47 -0
package/dist/providers/voyage.js +176 -0
package/dist/providers/xai.d.ts +33 -0
package/dist/providers/xai.js +171 -0
package/dist/telemetry/index.d.ts +1 -1
package/dist/telemetry/index.js +1 -1
package/dist/telemetry/tracers.d.ts +19 -0
package/dist/telemetry/tracers.js +19 -0
package/dist/telemetry/withSpan.d.ts +35 -0
package/dist/telemetry/withSpan.js +103 -0
package/dist/types/avatar.d.ts +143 -0
package/dist/types/avatar.js +19 -0
package/dist/types/cli.d.ts +6 -0
package/dist/types/conversation.d.ts +16 -0
package/dist/types/generate.d.ts +62 -5
package/dist/types/index.d.ts +5 -0
package/dist/types/index.js +7 -0
package/dist/types/middleware.d.ts +27 -0
package/dist/types/multimodal.d.ts +35 -2
package/dist/types/music.d.ts +165 -0
package/dist/types/music.js +20 -0
package/dist/types/providers.d.ts +144 -1
package/dist/types/replicate.d.ts +67 -0
package/dist/types/replicate.js +9 -0
package/dist/types/safeFetch.d.ts +15 -0
package/dist/types/safeFetch.js +6 -0
package/dist/types/stream.d.ts +2 -1
package/dist/types/tools.d.ts +13 -0
package/dist/types/video.d.ts +89 -0
package/dist/types/video.js +14 -0
package/dist/utils/avatarProcessor.d.ts +68 -0
package/dist/utils/avatarProcessor.js +171 -0
package/dist/utils/cloneOptions.d.ts +36 -0
package/dist/utils/cloneOptions.js +61 -0
package/dist/utils/lifecycleCallbacks.d.ts +51 -8
package/dist/utils/lifecycleCallbacks.js +82 -26
package/dist/utils/lifecycleTimeout.d.ts +25 -0
package/dist/utils/lifecycleTimeout.js +38 -0
package/dist/utils/logSanitize.d.ts +49 -0
package/dist/utils/logSanitize.js +169 -0
package/dist/utils/loggingFetch.d.ts +29 -0
package/dist/utils/loggingFetch.js +59 -0
package/dist/utils/messageBuilder.js +43 -25
package/dist/utils/modelChoices.js +236 -3
package/dist/utils/musicProcessor.d.ts +67 -0
package/dist/utils/musicProcessor.js +188 -0
package/dist/utils/optionsConversion.js +3 -2
package/dist/utils/parameterValidation.js +14 -4
package/dist/utils/pricing.js +193 -0
package/dist/utils/providerConfig.d.ts +55 -0
package/dist/utils/providerConfig.js +224 -0
package/dist/utils/safeFetch.d.ts +26 -0
package/dist/utils/safeFetch.js +82 -0
package/dist/utils/sizeGuard.d.ts +34 -0
package/dist/utils/sizeGuard.js +44 -0
package/dist/utils/ssrfGuard.d.ts +52 -0
package/dist/utils/ssrfGuard.js +410 -0
package/dist/utils/videoProcessor.d.ts +60 -0
package/dist/utils/videoProcessor.js +200 -0
package/dist/voice/providers/FishAudioTTS.d.ts +27 -0
package/dist/voice/providers/FishAudioTTS.js +182 -0
package/dist/workflow/core/ensembleExecutor.js +26 -9
package/package.json +32 -5

package/dist/lib/providers/googleVertex.js CHANGED Viewed

@@ -1,3 +1,4 @@
+/* eslint-disable max-lines-per-function */
 // Native SDK imports - no more @ai-sdk/google-vertex dependency
 import fs from "fs";
 import path from "path";
@@ -5,7 +6,7 @@ import os from "os";
 import {} from "ai";
 import { AIProviderName, ErrorCategory, ErrorSeverity, } from "../constants/enums.js";
 import { BaseProvider } from "../core/baseProvider.js";
-import { DEFAULT_MAX_STEPS, DEFAULT_TOOL_MAX_RETRIES, GLOBAL_LOCATION_MODELS, IMAGE_GENERATION_MODELS, } from "../core/constants.js";
+import { DEFAULT_MAX_STEPS, DEFAULT_TOOL_MAX_RETRIES, GLOBAL_LOCATION_MODELS, IMAGE_GENERATION_MODELS, TOOL_STORAGE_TIMEOUT_MS, } from "../core/constants.js";
 import { ModelConfigurationManager } from "../core/modelConfiguration.js";
 import { createProxyFetch } from "../proxy/proxyFetch.js";
 import { AuthenticationError, InvalidModelError, NetworkError, ProviderError, RateLimitError, } from "../types/index.js";
@@ -17,10 +18,12 @@ import { hasRestrictedOutputLimit, RESTRICTED_OUTPUT_TOKEN_LIMIT, } from "../uti
 import { validateApiKey, createVertexProjectConfig, createGoogleAuthConfig, } from "../utils/providerConfig.js";
 import { convertZodToJsonSchema, inlineJsonSchema, ensureNestedSchemaTypes, } from "../utils/schemaConversion.js";
 import { createNativeThinkingConfig } from "../utils/thinkingConfig.js";
-import { TimeoutError } from "../utils/async/index.js";
-import { prependConversationMessages } from "./googleNativeGemini3.js";
-import { ATTR, tracers, withClientSpan, withSpan } from "../telemetry/index.js";
+import { TimeoutError, withTimeout } from "../utils/async/index.js";
+import { parseTimeout } from "../utils/timeout.js";
+import { createTextChannel, extractThoughtSignature, prependConversationMessages, } from "./googleNativeGemini3.js";
+import { ATTR, tracers, withClientSpan, withClientStreamSpan, withSpan, } from "../telemetry/index.js";
 import { calculateCost } from "../utils/pricing.js";
+import { transformToolExecutions } from "../utils/transformationUtils.js";
 // Import proper types for multimodal message handling
 // Dynamic import helper for native Anthropic Vertex SDK
 let anthropicVertexModule = null;
@@ -36,6 +39,110 @@ const hasAnthropicSupport = () => {
     // Actual availability is checked at runtime when creating the client
     return true;
 };
+/**
+ * Recursively strip JSON-schema fields that Vertex Gemini's function-call
+ * validator rejects with 400 INVALID_ARGUMENT. Vertex implements OpenAPI 3.0
+ * Schema strictly and rejects extension fields that the broader JSON Schema
+ * spec allows. The fields stripped here have no semantic meaning for the
+ * model, so removing them is safe for every caller.
+ *
+ * Fields removed:
+ * - `additionalProperties` — extension; Vertex rejects on any nested object.
+ * - `default` — Vertex rejects defaults on object/array-typed properties and
+ *   on properties that are also marked `required`. Safest to strip globally
+ *   because the model never inspects them.
+ * - `$schema`, `$id`, `$ref`, `definitions`, `$defs` — JSON-Schema-meta
+ *   fields that Vertex doesn't recognise.
+ * - `examples` — accepted by some Gemini variants but not 2.5-flash; strip
+ *   to avoid the model rejecting tool schemas under that path.
+ */
+function stripAdditionalPropertiesDeep(schema) {
+    if (!schema || typeof schema !== "object") {
+        return;
+    }
+    const FIELDS_TO_STRIP = [
+        "additionalProperties",
+        "default",
+        "$schema",
+        "$id",
+        "$ref",
+        "definitions",
+        "$defs",
+        "examples",
+    ];
+    for (const field of FIELDS_TO_STRIP) {
+        if (field in schema) {
+            delete schema[field];
+        }
+    }
+    // JSON Schema Draft-4 `exclusiveMinimum: true` / `exclusiveMaximum: true`
+    // (boolean form) is rejected by Vertex's OpenAPI 3.0 validator, which
+    // expects a numeric bound. zod-to-json-schema's openApi3 target still
+    // emits the Draft-4 form for `z.number().positive()` etc. Translate the
+    // boolean form into the numeric form when paired with `minimum` /
+    // `maximum`; otherwise drop it (the model doesn't validate, so the
+    // constraint is informational only).
+    if (typeof schema.exclusiveMinimum === "boolean") {
+        if (schema.exclusiveMinimum === true &&
+            typeof schema.minimum === "number") {
+            schema.exclusiveMinimum = schema.minimum;
+            delete schema.minimum;
+        }
+        else {
+            delete schema.exclusiveMinimum;
+        }
+    }
+    if (typeof schema.exclusiveMaximum === "boolean") {
+        if (schema.exclusiveMaximum === true &&
+            typeof schema.maximum === "number") {
+            schema.exclusiveMaximum = schema.maximum;
+            delete schema.maximum;
+        }
+        else {
+            delete schema.exclusiveMaximum;
+        }
+    }
+    // Strip `maximum` values that exceed int32 range — Vertex's protobuf
+    // serializer treats `type: "integer"` as int32 and rejects bounds beyond
+    // 2^31. zod's `.positive().int()` emits Number.MAX_SAFE_INTEGER as the
+    // upper bound (8.9e15), which trips this. The constraint is informational
+    // for the model anyway, so dropping it is safe.
+    const INT32_MAX = 2147483647;
+    if (typeof schema.maximum === "number" && schema.maximum > INT32_MAX) {
+        delete schema.maximum;
+    }
+    if (typeof schema.minimum === "number" && schema.minimum < -INT32_MAX) {
+        delete schema.minimum;
+    }
+    if (schema.properties && typeof schema.properties === "object") {
+        for (const child of Object.values(schema.properties)) {
+            if (child && typeof child === "object") {
+                stripAdditionalPropertiesDeep(child);
+            }
+        }
+    }
+    if (schema.items && typeof schema.items === "object") {
+        if (Array.isArray(schema.items)) {
+            for (const item of schema.items) {
+                if (item && typeof item === "object") {
+                    stripAdditionalPropertiesDeep(item);
+                }
+            }
+        }
+        else {
+            stripAdditionalPropertiesDeep(schema.items);
+        }
+    }
+    for (const key of ["allOf", "anyOf", "oneOf"]) {
+        if (Array.isArray(schema[key])) {
+            for (const branch of schema[key]) {
+                if (branch && typeof branch === "object") {
+                    stripAdditionalPropertiesDeep(branch);
+                }
+            }
+        }
+    }
+}
 // Configuration helpers - now using consolidated utility
 const getVertexProjectId = () => {
     return validateApiKey(createVertexProjectConfig());
@@ -605,7 +712,7 @@ export class GoogleVertexProvider extends BaseProvider {
         // the test:tracing observability harness sees the same span hierarchy
         // it sees for AI Studio. BaseProvider.stream does NOT emit this span
         // for any provider — each native provider has to add it itself.
-        return withClientSpan({
+        return withClientStreamSpan({
             name: "neurolink.provider.stream",
             tracer: tracers.provider,
             attributes: {
@@ -672,7 +779,7 @@ export class GoogleVertexProvider extends BaseProvider {
                 this.emitStreamEnd(modelName, streamStartTime, false, error);
                 throw error;
             }
-        });
+        }, (r) => r.stream, (r, wrapped) => ({ ...r, stream: wrapped }));
     }
     /**
      * Emit `stream:end` so the Pipeline B observability listener creates a
@@ -747,8 +854,11 @@ export class GoogleVertexProvider extends BaseProvider {
         });
         // Build contents from input with multimodal support
         const contents = [];
-        // Build user message parts - start with text
-        const userParts = [{ text: options.input.text }];
+        // Build user message parts - start with text.
+        // `options.input.text` is `string | undefined` in strict mode; the
+        // VertexNativePart `text` field requires `string`, so coerce to "" if
+        // unset (the multimodal-only path still appends other parts below).
+        const userParts = [{ text: options.input.text ?? "" }];
         // Add PDF files as inlineData parts if present
         // Cast input to access multimodal properties that may exist at runtime
         const multimodalInput = options.input;
@@ -887,6 +997,12 @@ export class GoogleVertexProvider extends BaseProvider {
                     // ensureNestedSchemaTypes recursively adds missing type fields to tool schemas
                     // Note: convertZodToJsonSchema now uses openApi3 target which produces nullable: true
                     const typedSchema = ensureNestedSchemaTypes(inlinedSchema);
+                    // Strip `additionalProperties` recursively — Vertex Gemini's
+                    // function-call validator rejects it on object schemas (returns
+                    // 400 INVALID_ARGUMENT) even though it's valid OpenAPI 3. The
+                    // field has no semantic meaning to the model, so dropping it
+                    // before send is safe for every caller.
+                    stripAdditionalPropertiesDeep(typedSchema);
                     decl.parametersJsonSchema = typedSchema;
                 }
                 functionDeclarations.push(decl);
@@ -1013,6 +1129,11 @@ export class GoogleVertexProvider extends BaseProvider {
         let finalText = "";
         let lastStepText = ""; // Track text from last step for maxSteps termination
         const allToolCalls = [];
+        // Mirrors the generate-path shape so StreamResult.toolExecutions can be
+        // populated (parity with AI-SDK-driven providers) and so the storage
+        // hook can persist actual tool outputs rather than the placeholder
+        // "success" string used by flushPendingToolData's default fallback.
+        const toolExecutions = [];
         let step = 0;
         // Track structured output from final_result tool (when using final_result pattern)
         let finalResultStructuredOutput;
@@ -1119,22 +1240,38 @@ export class GoogleVertexProvider extends BaseProvider {
                 });
                 // Execute each function and collect responses
                 const functionResponses = [];
+                // Per-step bookkeeping for conversation-memory storage.
+                const stepStorageCalls = [];
+                const stepStorageResults = [];
+                // Note: tool:start / tool:end events are emitted by ToolsManager's
+                // wrapped `execute` (see ToolsManager.ts:355) — no inline emit needed.
                 for (const call of stepFunctionCalls) {
                     allToolCalls.push({ toolName: call.name, args: call.args });
+                    stepStorageCalls.push({ toolName: call.name, args: call.args });
                     // Check if this tool has already exceeded retry limit
                     const failedInfo = failedTools.get(call.name);
                     if (failedInfo && failedInfo.count >= DEFAULT_TOOL_MAX_RETRIES) {
                         logger.warn(`[GoogleVertex] Tool "${call.name}" has exceeded retry limit (${DEFAULT_TOOL_MAX_RETRIES}), skipping execution`);
+                        const errorPayload = {
+                            error: `TOOL_PERMANENTLY_FAILED: The tool "${call.name}" has failed ${failedInfo.count} times and will not be retried. Last error: ${failedInfo.lastError}. Please proceed without using this tool or inform the user that this functionality is unavailable.`,
+                            status: "permanently_failed",
+                            do_not_retry: true,
+                        };
                         functionResponses.push({
                             functionResponse: {
                                 name: call.name,
-                                response: {
-                                    error: `TOOL_PERMANENTLY_FAILED: The tool "${call.name}" has failed ${failedInfo.count} times and will not be retried. Last error: ${failedInfo.lastError}. Please proceed without using this tool or inform the user that this functionality is unavailable.`,
-                                    status: "permanently_failed",
-                                    do_not_retry: true,
-                                },
+                                response: errorPayload,
                             },
                         });
+                        toolExecutions.push({
+                            name: call.name,
+                            input: call.args,
+                            output: errorPayload,
+                        });
+                        stepStorageResults.push({
+                            toolName: call.name,
+                            output: errorPayload,
+                        });
                         continue;
                     }
                     const execute = executeMap.get(call.name);
@@ -1147,9 +1284,18 @@ export class GoogleVertexProvider extends BaseProvider {
                                 abortSignal: undefined,
                             };
                             const result = await execute(call.args, toolOptions);
+                            toolExecutions.push({
+                                name: call.name,
+                                input: call.args,
+                                output: result,
+                            });
                             functionResponses.push({
                                 functionResponse: { name: call.name, response: { result } },
                             });
+                            stepStorageResults.push({
+                                toolName: call.name,
+                                output: result,
+                            });
                         }
                         catch (error) {
                             const errorMessage = error instanceof Error ? error.message : "Unknown error";
@@ -1164,38 +1310,77 @@ export class GoogleVertexProvider extends BaseProvider {
                             logger.warn(`[GoogleVertex] Tool "${call.name}" failed (attempt ${currentFailInfo.count}/${DEFAULT_TOOL_MAX_RETRIES}): ${errorMessage}`);
                             // Determine if this is a permanent failure
                             const isPermanentFailure = currentFailInfo.count >= DEFAULT_TOOL_MAX_RETRIES;
+                            const errorPayload = {
+                                error: isPermanentFailure
+                                    ? `TOOL_PERMANENTLY_FAILED: The tool "${call.name}" has failed ${currentFailInfo.count} times with error: ${errorMessage}. This tool will not be retried. Please proceed without using this tool or inform the user that this functionality is unavailable.`
+                                    : `TOOL_EXECUTION_ERROR: ${errorMessage}. Retry attempt ${currentFailInfo.count}/${DEFAULT_TOOL_MAX_RETRIES}.`,
+                                status: isPermanentFailure ? "permanently_failed" : "failed",
+                                do_not_retry: isPermanentFailure,
+                                retry_count: currentFailInfo.count,
+                                max_retries: DEFAULT_TOOL_MAX_RETRIES,
+                            };
                             functionResponses.push({
                                 functionResponse: {
                                     name: call.name,
-                                    response: {
-                                        error: isPermanentFailure
-                                            ? `TOOL_PERMANENTLY_FAILED: The tool "${call.name}" has failed ${currentFailInfo.count} times with error: ${errorMessage}. This tool will not be retried. Please proceed without using this tool or inform the user that this functionality is unavailable.`
-                                            : `TOOL_EXECUTION_ERROR: ${errorMessage}. Retry attempt ${currentFailInfo.count}/${DEFAULT_TOOL_MAX_RETRIES}.`,
-                                        status: isPermanentFailure
-                                            ? "permanently_failed"
-                                            : "failed",
-                                        do_not_retry: isPermanentFailure,
-                                        retry_count: currentFailInfo.count,
-                                        max_retries: DEFAULT_TOOL_MAX_RETRIES,
-                                    },
+                                    response: errorPayload,
                                 },
                             });
+                            toolExecutions.push({
+                                name: call.name,
+                                input: call.args,
+                                output: errorPayload,
+                            });
+                            stepStorageResults.push({
+                                toolName: call.name,
+                                output: errorPayload,
+                            });
                         }
                     }
                     else {
                         // Tool not found is a permanent error
+                        const errorPayload = {
+                            error: `TOOL_NOT_FOUND: The tool "${call.name}" does not exist. Do not attempt to call this tool again.`,
+                            status: "permanently_failed",
+                            do_not_retry: true,
+                        };
                         functionResponses.push({
                             functionResponse: {
                                 name: call.name,
-                                response: {
-                                    error: `TOOL_NOT_FOUND: The tool "${call.name}" does not exist. Do not attempt to call this tool again.`,
-                                    status: "permanently_failed",
-                                    do_not_retry: true,
-                                },
+                                response: errorPayload,
                             },
                         });
+                        toolExecutions.push({
+                            name: call.name,
+                            input: call.args,
+                            output: errorPayload,
+                        });
+                        stepStorageResults.push({
+                            toolName: call.name,
+                            output: errorPayload,
+                        });
                     }
                 }
+                // Persist this step's tool calls/results into conversation memory.
+                // Without this, tool_call / tool_result rows never reach Redis and
+                // the chat-history UI loses every tool invocation.
+                //
+                // `thoughtSignature` rides as a sibling on the first call of the
+                // step — Gemini 3 needs it to match thinking patterns when the
+                // conversation is replayed on the next turn.
+                if (stepStorageCalls.length > 0 || stepStorageResults.length > 0) {
+                    const stepThoughtSig = extractThoughtSignature(rawResponseParts);
+                    withTimeout(this.handleToolExecutionStorage(stepStorageCalls.map((c, i) => ({
+                        ...c,
+                        ...(i === 0 && stepThoughtSig
+                            ? { thoughtSignature: stepThoughtSig }
+                            : {}),
+                        stepIndex: step,
+                    })), stepStorageResults.map((r) => ({ ...r, stepIndex: step })), options, new Date()), TOOL_STORAGE_TIMEOUT_MS, "tool storage write timed out").catch((error) => {
+                        logger.warn("[GoogleVertex] Failed to store native Gemini stream tool executions", {
+                            error: error instanceof Error ? error.message : String(error),
+                        });
+                    });
+                }
                 // The @google/genai SDK only accepts "user" and "model" as valid
                 // roles in contents — function/tool responses must use role: "user"
                 // (matching the SDK's automaticFunctionCalling implementation and
@@ -1241,6 +1426,7 @@ export class GoogleVertexProvider extends BaseProvider {
         }
         // Filter out final_result from tool calls as it's an internal pattern
         const externalToolCalls = allToolCalls.filter((tc) => tc.toolName !== "final_result");
+        const externalToolExecutions = toolExecutions.filter((te) => te.name !== "final_result");
         const result = {
             stream: createTextStream(),
             provider: this.providerName,
@@ -1254,6 +1440,12 @@ export class GoogleVertexProvider extends BaseProvider {
                 toolName: tc.toolName,
                 args: tc.args,
             })),
+            // Surface tools-used + execution summary so `hasToolActivity` in
+            // conversationMemory.ts evaluates true for tool-only stream turns
+            // (assistant text empty but tools ran) and downstream consumers see
+            // the same shape AI-SDK-driven providers expose.
+            toolsUsed: externalToolCalls.map((tc) => tc.toolName),
+            toolExecutions: transformToolExecutions(externalToolExecutions),
             metadata: {
                 streamId: `native-vertex-${Date.now()}`,
                 startTime,
@@ -1427,6 +1619,12 @@ export class GoogleVertexProvider extends BaseProvider {
                     // ensureNestedSchemaTypes recursively adds missing type fields to tool schemas
                     // Note: convertZodToJsonSchema now uses openApi3 target which produces nullable: true
                     const typedSchema = ensureNestedSchemaTypes(inlinedSchema);
+                    // Strip `additionalProperties` recursively — Vertex Gemini's
+                    // function-call validator rejects it on object schemas (returns
+                    // 400 INVALID_ARGUMENT) even though it's valid OpenAPI 3. The
+                    // field has no semantic meaning to the model, so dropping it
+                    // before send is safe for every caller.
+                    stripAdditionalPropertiesDeep(typedSchema);
                     decl.parametersJsonSchema = typedSchema;
                 }
                 functionDeclarations.push(decl);
@@ -1649,6 +1847,10 @@ export class GoogleVertexProvider extends BaseProvider {
                 });
                 // Execute each function and collect responses
                 const functionResponses = [];
+                const toolCallsBefore = allToolCalls.length;
+                const toolExecsBefore = toolExecutions.length;
+                // Note: tool:start / tool:end events are emitted by ToolsManager's
+                // wrapped `execute` (see ToolsManager.ts:355) — no inline emit needed.
                 for (const call of stepFunctionCalls) {
                     allToolCalls.push({ toolName: call.name, args: call.args });
                     // Check if this tool has already exceeded retry limit
@@ -1751,6 +1953,32 @@ export class GoogleVertexProvider extends BaseProvider {
                         });
                     }
                 }
+                // Persist this step's tool calls/results into conversation memory.
+                // Without this, tool_call / tool_result rows never reach Redis and
+                // the chat-history UI loses every tool invocation. The first call
+                // of the step carries the step's `thoughtSignature` so Gemini 3 can
+                // match thinking patterns on replay.
+                const stepToolCalls = allToolCalls.slice(toolCallsBefore);
+                const stepToolExecs = toolExecutions.slice(toolExecsBefore);
+                if (stepToolCalls.length > 0 || stepToolExecs.length > 0) {
+                    const stepThoughtSig = extractThoughtSignature(rawResponseParts);
+                    withTimeout(this.handleToolExecutionStorage(stepToolCalls.map((tc, i) => ({
+                        toolName: tc.toolName,
+                        args: tc.args,
+                        ...(i === 0 && stepThoughtSig
+                            ? { thoughtSignature: stepThoughtSig }
+                            : {}),
+                        stepIndex: step,
+                    })), stepToolExecs.map((te) => ({
+                        toolName: te.name,
+                        output: te.output,
+                        stepIndex: step,
+                    })), options, new Date()), TOOL_STORAGE_TIMEOUT_MS, "tool storage write timed out").catch((error) => {
+                        logger.warn("[GoogleVertex] Failed to store native Gemini generate tool executions", {
+                            error: error instanceof Error ? error.message : String(error),
+                        });
+                    });
+                }
                 // The @google/genai SDK only accepts "user" and "model" as valid
                 // roles in contents — function/tool responses must use role: "user"
                 // (matching the SDK's automaticFunctionCalling implementation and
@@ -1789,7 +2017,7 @@ export class GoogleVertexProvider extends BaseProvider {
             },
             responseTime,
             toolsUsed: externalToolCalls.map((tc) => tc.toolName),
-            toolExecutions: externalToolExecutions,
+            toolExecutions: transformToolExecutions(externalToolExecutions),
             enhancedWithTools: externalToolCalls.length > 0,
         };
         // Add structured output if final_result tool was used
@@ -1825,7 +2053,15 @@ export class GoogleVertexProvider extends BaseProvider {
         });
         // Build messages from input
         const messages = [];
-        // Add conversation history if present
+        // Add conversation history if present.
+        //
+        // Intentionally text-only. Anthropic's API rejects messages where a
+        // tool_use_id reference appears without its matching tool_use in the
+        // same turn — so synthesising tool_use / tool_result blocks from
+        // stored ChatMessages risks emitting orphaned references that fail
+        // validation. Tool rows are still persisted to Redis (chat-history
+        // UI renders them) but they don't re-enter the model's context on
+        // subsequent turns.
         if (options.conversationMessages &&
             options.conversationMessages.length > 0) {
             for (const msg of options.conversationMessages) {
@@ -2056,157 +2292,270 @@ export class GoogleVertexProvider extends BaseProvider {
                 stop_sequences: options.stopSequences,
             }),
         };
-        // Handle tool calling loop with max steps
+        // ── Real-time streaming via stream.on('text', ...) ────────────────────
+        //
+        // The Anthropic SDK exposes per-delta streaming through `stream.on('text', listener)`:
+        // each content_block_delta SSE event fires the listener synchronously
+        // with that token's text — typically ~10 chars per delta, ~26ms apart
+        // on Claude Haiku. Awaiting `stream.finalMessage()` here would buffer
+        // the entire response before yielding anything; the listener pattern
+        // keeps the wire and the consumer in lockstep instead.
+        //
+        // Structure: push-channel + background agentic loop, returning the
+        // StreamResult immediately so callers can iterate `channel.iterable`
+        // while generation is still in progress. Mirrors the executeStream
+        // pattern in googleAiStudio.ts.
         const maxSteps = options.maxSteps || DEFAULT_MAX_STEPS;
-        let step = 0;
-        let finalText = "";
-        let structuredOutput;
         const allToolCalls = [];
-        // Track each Anthropic text block separately so the returned async
-        // iterable yields multiple chunks. The chunk-count smoke test fails
-        // when an entire response collapses into a single yield, even though
-        // the upstream stream is genuinely incremental.
-        const allTextBlocks = [];
-        let totalInputTokens = 0;
-        let totalOutputTokens = 0;
-        const currentMessages = [...messages];
-        while (step < maxSteps) {
-            step++;
+        const toolExecutions = [];
+        const channel = createTextChannel();
+        // Mutable holders the StreamResult references. Background loop updates
+        // these as state progresses; consumer reads them after iterating the
+        // stream to completion (channel.close() is called AFTER mutations).
+        const usage = { input: 0, output: 0, total: 0 };
+        const metadata = {
+            streamId: `native-anthropic-vertex-${Date.now()}`,
+            startTime,
+            responseTime: 0,
+            totalToolExecutions: 0,
+        };
+        const toolsUsedRef = [];
+        const structuredOutputRef = {};
+        // Track the active Anthropic stream so options.abortSignal can cancel it
+        // mid-flight (pre-rewrite code had no abort handling — fixed for free).
+        let activeStream;
+        const abortHandler = () => {
             try {
-                // Use streaming API
-                const stream = await client.messages.stream({
-                    ...requestParams,
-                    messages: currentMessages,
-                });
-                // Collect the full response
-                const response = await stream.finalMessage();
-                // Update token counts
-                totalInputTokens += response.usage?.input_tokens || 0;
-                totalOutputTokens += response.usage?.output_tokens || 0;
-                // Check if we need to handle tool use
-                const toolUseBlocks = response.content.filter((block) => block.type === "tool_use");
-                // Check for final_result tool call (for structured output)
-                if (useFinalResultTool) {
-                    const finalResultCall = toolUseBlocks.find((block) => block.name === "final_result");
-                    if (finalResultCall) {
-                        // Extract structured output and convert to JSON string for finalText
-                        structuredOutput = finalResultCall.input;
-                        finalText = JSON.stringify(structuredOutput);
-                        logger.debug("[GoogleVertex] Extracted structured output from final_result tool (stream)", { keys: Object.keys(structuredOutput) });
-                        break; // We have the structured output, we're done
-                    }
-                }
-                // Extract text from response
-                const textBlocks = response.content.filter((block) => block.type === "text");
-                const responseText = textBlocks.map((b) => b.text).join("");
-                // Preserve each Anthropic text block separately so the
-                // consumer-visible stream yields multiple chunks (one per block).
-                for (const tb of textBlocks) {
-                    if (tb.text.length > 0) {
-                        allTextBlocks.push(tb.text);
+                activeStream?.controller.abort();
+            }
+            catch {
+                /* ignore — stream may already be finalized */
+            }
+        };
+        options.abortSignal?.addEventListener("abort", abortHandler);
+        // Defensive upper bound: if neither the caller nor the SDK ever fires,
+        // abort the stream after the configured timeout so a stalled
+        // Vertex/Anthropic endpoint can't hang forever. options.timeout wins
+        // if set; otherwise 5 min — generous for tool-heavy turns.
+        const streamTimeoutMs = parseTimeout(options.timeout) ?? 300_000;
+        const streamTimeoutHandle = setTimeout(() => {
+            logger.warn(`[GoogleVertex] Anthropic stream exceeded ${streamTimeoutMs}ms — aborting`);
+            abortHandler();
+        }, streamTimeoutMs);
+        const loopPromise = (async () => {
+            let step = 0;
+            const currentMessages = [...messages];
+            try {
+                while (step < maxSteps) {
+                    if (options.abortSignal?.aborted) {
+                        throw new Error("Stream aborted by caller");
                     }
-                }
-                if (toolUseBlocks.length === 0) {
-                    // No tool calls, we're done
-                    finalText = responseText || finalText;
-                    break;
-                }
-                // Handle tool calls
-                const toolResults = [];
-                for (const toolUse of toolUseBlocks) {
-                    allToolCalls.push({
-                        toolName: toolUse.name,
-                        args: toolUse.input,
+                    step++;
+                    const stream = await client.messages.stream({
+                        ...requestParams,
+                        messages: currentMessages,
                     });
-                    const execute = executeMap.get(toolUse.name);
-                    if (execute) {
-                        try {
-                            const result = await execute(toolUse.input);
-                            toolResults.push({
-                                type: "tool_result",
-                                tool_use_id: toolUse.id,
-                                content: typeof result === "string" ? result : JSON.stringify(result),
-                            });
+                    activeStream = stream;
+                    // Forward each text delta to the consumer as it arrives. The
+                    // Anthropic SDK fires this listener synchronously for every
+                    // content_block_delta SSE event, so the channel sees bytes at
+                    // the same cadence the wire delivers them.
+                    stream.on("text", (delta) => {
+                        if (delta.length > 0) {
+                            channel.push(delta);
                         }
-                        catch (err) {
+                    });
+                    // finalMessage() resolves AFTER message_stop. By then the listener
+                    // has already fired for every delta — awaiting here doesn't block
+                    // visible streaming, it just gives us the structured response
+                    // shape needed for tool_use block extraction.
+                    const response = await stream.finalMessage();
+                    activeStream = undefined;
+                    usage.input += response.usage?.input_tokens || 0;
+                    usage.output += response.usage?.output_tokens || 0;
+                    usage.total = usage.input + usage.output;
+                    const toolUseBlocks = response.content.filter((block) => block.type === "tool_use");
+                    // Structured-output pattern: when the model returns the
+                    // final_result tool call, push its arguments as JSON and stop.
+                    // Single-shot yield so callers consuming the stream still see
+                    // the structured value.
+                    if (useFinalResultTool) {
+                        const finalResultCall = toolUseBlocks.find((block) => block.name === "final_result");
+                        if (finalResultCall) {
+                            structuredOutputRef.value = finalResultCall.input;
+                            channel.push(JSON.stringify(finalResultCall.input));
+                            logger.debug("[GoogleVertex] Extracted structured output from final_result tool (stream)", { keys: Object.keys(finalResultCall.input) });
+                            break;
+                        }
+                    }
+                    // No tools — pure text turn. Listener already pushed all deltas;
+                    // loop terminates and channel.close() flushes the consumer.
+                    if (toolUseBlocks.length === 0) {
+                        break;
+                    }
+                    // Tool execution loop. tool:start / tool:end events fire from
+                    // ToolsManager's wrapped execute (ToolsManager.ts:355) — no inline
+                    // emit needed.
+                    const toolResults = [];
+                    // Per-step bookkeeping for conversation-memory storage.
+                    const stepStorageCalls = [];
+                    const stepStorageResults = [];
+                    // Note: tool:start / tool:end events are emitted by ToolsManager's
+                    // wrapped `execute` (see ToolsManager.ts:355) — no inline emit needed.
+                    for (const toolUse of toolUseBlocks) {
+                        allToolCalls.push({
+                            toolName: toolUse.name,
+                            args: toolUse.input,
+                        });
+                        toolsUsedRef.push(toolUse.name);
+                        stepStorageCalls.push({
+                            toolCallId: toolUse.id,
+                            toolName: toolUse.name,
+                            args: toolUse.input,
+                        });
+                        const execute = executeMap.get(toolUse.name);
+                        if (execute) {
+                            try {
+                                const toolOptions = {
+                                    toolCallId: toolUse.id,
+                                    messages: [],
+                                    abortSignal: options.abortSignal,
+                                };
+                                const result = await execute(toolUse.input, toolOptions);
+                                toolExecutions.push({
+                                    name: toolUse.name,
+                                    input: toolUse.input,
+                                    output: result,
+                                });
+                                // Anthropic requires tool_result.content to be a string.
+                                // JSON.stringify returns undefined for undefined/function/symbol,
+                                // so coerce defensively to keep the follow-up turn valid.
+                                const resultContent = typeof result === "string"
+                                    ? result
+                                    : (JSON.stringify(result ?? null) ?? String(result));
+                                toolResults.push({
+                                    type: "tool_result",
+                                    tool_use_id: toolUse.id,
+                                    content: resultContent,
+                                });
+                                stepStorageResults.push({
+                                    toolCallId: toolUse.id,
+                                    toolName: toolUse.name,
+                                    output: result,
+                                });
+                            }
+                            catch (err) {
+                                const errMsg = `Error executing tool "${toolUse.name}": ${err instanceof Error ? err.message : String(err)}`;
+                                const errorPayload = { error: errMsg };
+                                toolExecutions.push({
+                                    name: toolUse.name,
+                                    input: toolUse.input,
+                                    output: errorPayload,
+                                });
+                                toolResults.push({
+                                    type: "tool_result",
+                                    tool_use_id: toolUse.id,
+                                    content: errMsg,
+                                });
+                                stepStorageResults.push({
+                                    toolCallId: toolUse.id,
+                                    toolName: toolUse.name,
+                                    output: errorPayload,
+                                });
+                            }
+                        }
+                        else {
+                            const errMsg = `TOOL_NOT_FOUND: The tool "${toolUse.name}" does not exist.`;
+                            const errorPayload = { error: errMsg };
+                            toolExecutions.push({
+                                name: toolUse.name,
+                                input: toolUse.input,
+                                output: errorPayload,
+                            });
                             toolResults.push({
                                 type: "tool_result",
                                 tool_use_id: toolUse.id,
-                                content: `Error executing tool: ${err instanceof Error ? err.message : String(err)}`,
+                                content: errMsg,
+                            });
+                            stepStorageResults.push({
+                                toolCallId: toolUse.id,
+                                toolName: toolUse.name,
+                                output: errorPayload,
                             });
                         }
                     }
-                    else {
-                        toolResults.push({
-                            type: "tool_result",
-                            tool_use_id: toolUse.id,
-                            content: `TOOL_NOT_FOUND: The tool "${toolUse.name}" does not exist.`,
+                    // Persist this step's tool calls/results into conversation memory.
+                    // Without this hook, tool rows never land in Redis and the
+                    // chat-history UI loses every tool invocation.
+                    if (stepStorageCalls.length > 0 || stepStorageResults.length > 0) {
+                        withTimeout(this.handleToolExecutionStorage(stepStorageCalls.map((c) => ({ ...c, stepIndex: step })), stepStorageResults.map((r) => ({ ...r, stepIndex: step })), options, new Date()), TOOL_STORAGE_TIMEOUT_MS, "tool storage write timed out").catch((error) => {
+                            logger.warn("[GoogleVertex] Failed to store native Anthropic stream tool executions", {
+                                error: error instanceof Error ? error.message : String(error),
+                            });
                         });
                     }
+                    // Continue the loop: assistant turn + tool_result user turn.
+                    // Filter server_tool_use blocks (Anthropic API rejects them in
+                    // subsequent message turns).
+                    const assistantContent = response.content.filter((block) => block.type !== "server_tool_use");
+                    currentMessages.push({
+                        role: "assistant",
+                        content: assistantContent,
+                    });
+                    currentMessages.push({
+                        role: "user",
+                        content: toolResults,
+                    });
                 }
-                // Add assistant message and tool results to continue the loop
-                // Filter out server_tool_use blocks that the Anthropic API doesn't accept in messages
-                const assistantContent = response.content.filter((block) => block.type !== "server_tool_use");
-                currentMessages.push({
-                    role: "assistant",
-                    content: assistantContent,
-                });
-                currentMessages.push({
-                    role: "user",
-                    content: toolResults,
-                });
-                // Store last text in case we hit max steps
-                if (responseText) {
-                    finalText = responseText;
-                }
-            }
-            catch (error) {
-                logger.error("[GoogleVertex] Native Anthropic SDK stream error", error);
-                throw this.handleProviderError(error);
+                metadata.responseTime = Date.now() - startTime;
+                metadata.totalToolExecutions = allToolCalls.filter((tc) => tc.toolName !== "final_result").length;
+                channel.close();
             }
-        }
-        const responseTime = Date.now() - startTime;
-        // Yield each text block separately so the CLI receives multiple
-        // stream chunks instead of a single coalesced buffer. The Anthropic
-        // SDK gives us discrete text blocks; collapsing them into one chunk
-        // breaks the chunk-count smoke test even though the upstream
-        // streaming is real.
-        const finalContentBlocks = (() => {
-            if (structuredOutput) {
-                return [finalText];
+            catch (err) {
+                logger.error("[GoogleVertex] Native Anthropic SDK stream error", err);
+                channel.error(this.handleProviderError(err));
             }
-            if (allTextBlocks.length > 0) {
-                return allTextBlocks;
+            finally {
+                options.abortSignal?.removeEventListener("abort", abortHandler);
+                clearTimeout(streamTimeoutHandle);
             }
-            return finalText ? [finalText] : [];
         })();
-        async function* createTextStream() {
-            for (const part of finalContentBlocks) {
-                if (part.length > 0) {
-                    yield { content: part };
-                }
-            }
-        }
-        return {
-            stream: createTextStream(),
+        // Suppress unhandled-rejection: errors funnel through channel.error()
+        // and surface when the consumer iterates the stream.
+        loopPromise.catch(() => undefined);
+        // Return StreamResult IMMEDIATELY — caller's for-await can begin
+        // iterating channel.iterable while the background loop is still
+        // generating. usage / metadata / toolCalls / toolExecutions are mutable
+        // references that the loop fills in over time; the consumer reads them
+        // after iteration completes (after channel.close() has fired).
+        const result = {
+            stream: channel.iterable,
             provider: this.providerName,
             model: modelName,
-            usage: {
-                input: totalInputTokens,
-                output: totalOutputTokens,
-                total: totalInputTokens + totalOutputTokens,
-            },
-            toolCalls: allToolCalls.map((tc) => ({
-                toolName: tc.toolName,
-                args: tc.args,
-            })),
-            metadata: {
-                streamId: `native-anthropic-vertex-${Date.now()}`,
-                startTime,
-                responseTime,
-                totalToolExecutions: allToolCalls.length,
-            },
+            usage,
+            metadata,
         };
+        Object.defineProperty(result, "toolCalls", {
+            enumerable: true,
+            configurable: true,
+            get: () => allToolCalls.filter((tc) => tc.toolName !== "final_result"),
+        });
+        Object.defineProperty(result, "toolsUsed", {
+            enumerable: true,
+            configurable: true,
+            get: () => toolsUsedRef.filter((name) => name !== "final_result"),
+        });
+        Object.defineProperty(result, "toolExecutions", {
+            enumerable: true,
+            configurable: true,
+            get: () => transformToolExecutions(toolExecutions.filter((te) => te.name !== "final_result")),
+        });
+        Object.defineProperty(result, "structuredOutput", {
+            enumerable: true,
+            configurable: true,
+            get: () => structuredOutputRef.value,
+        });
+        return result;
     }
     /**
      * Execute generate using native @anthropic-ai/vertex-sdk for Claude models on Vertex AI
@@ -2229,6 +2578,9 @@ export class GoogleVertexProvider extends BaseProvider {
         // the older surface. The Vertex Claude STREAM path already follows this
         // priority — keeping the GENERATE path on `conversationHistory` only
         // would silently drop multi-turn context for memory/loop sessions.
+        // Intentionally text-only: see the stream sibling for the rationale —
+        // synthesising tool_use / tool_result blocks from stored ChatMessages
+        // risks emitting orphaned references that Anthropic's API rejects.
         const historyMessages = options.conversationMessages && options.conversationMessages.length > 0
             ? options.conversationMessages
             : options.conversationHistory;
@@ -2472,10 +2824,14 @@ export class GoogleVertexProvider extends BaseProvider {
         while (step < maxSteps) {
             step++;
             try {
-                const response = await client.messages.create({
+                // Bound the SDK wait so a stalled Vertex/Anthropic call can't hang
+                // generate forever. options.timeout wins if set, otherwise default
+                // to 5 min — generous for tool-heavy turns.
+                const generateTimeoutMs = parseTimeout(options.timeout) ?? 300_000;
+                const response = await withTimeout(client.messages.create({
                     ...requestParams,
                     messages: currentMessages,
-                });
+                }), generateTimeoutMs, "Anthropic generate timed out");
                 // Update token counts
                 totalInputTokens += response.usage?.input_tokens || 0;
                 totalOutputTokens += response.usage?.output_tokens || 0;
@@ -2502,42 +2858,105 @@ export class GoogleVertexProvider extends BaseProvider {
                 }
                 // Handle tool calls
                 const toolResults = [];
+                // Per-step bookkeeping for conversation-memory storage. Tracks calls
+                // and results for ONLY the tools fired in this step so the storage
+                // hook can tag them with the current stepIndex.
+                const stepStorageCalls = [];
+                const stepStorageResults = [];
+                // Note: tool:start / tool:end events are emitted by ToolsManager's
+                // wrapped `execute` (see ToolsManager.ts:355) — no inline emit needed.
                 for (const toolUse of toolUseBlocks) {
                     allToolCalls.push({
                         toolName: toolUse.name,
                         args: toolUse.input,
                     });
+                    stepStorageCalls.push({
+                        toolCallId: toolUse.id,
+                        toolName: toolUse.name,
+                        args: toolUse.input,
+                    });
                     const execute = executeMap.get(toolUse.name);
                     if (execute) {
                         try {
-                            const result = await execute(toolUse.input);
+                            const toolOptions = {
+                                toolCallId: toolUse.id,
+                                messages: [],
+                                abortSignal: options.abortSignal,
+                            };
+                            const result = await execute(toolUse.input, toolOptions);
                             toolExecutions.push({
                                 name: toolUse.name,
                                 input: toolUse.input,
                                 output: result,
                             });
+                            // Anthropic requires tool_result.content to be a string.
+                            // JSON.stringify returns undefined for undefined/function/symbol,
+                            // so coerce defensively to keep the follow-up turn valid.
+                            const resultContent = typeof result === "string"
+                                ? result
+                                : (JSON.stringify(result ?? null) ?? String(result));
                             toolResults.push({
                                 type: "tool_result",
                                 tool_use_id: toolUse.id,
-                                content: typeof result === "string" ? result : JSON.stringify(result),
+                                content: resultContent,
+                            });
+                            stepStorageResults.push({
+                                toolCallId: toolUse.id,
+                                toolName: toolUse.name,
+                                output: result,
                             });
                         }
                         catch (err) {
+                            const errMsg = `Error executing tool "${toolUse.name}": ${err instanceof Error ? err.message : String(err)}`;
+                            const errorPayload = { error: errMsg };
+                            toolExecutions.push({
+                                name: toolUse.name,
+                                input: toolUse.input,
+                                output: errorPayload,
+                            });
                             toolResults.push({
                                 type: "tool_result",
                                 tool_use_id: toolUse.id,
-                                content: `Error executing tool: ${err instanceof Error ? err.message : String(err)}`,
+                                content: errMsg,
+                            });
+                            stepStorageResults.push({
+                                toolCallId: toolUse.id,
+                                toolName: toolUse.name,
+                                output: errorPayload,
                             });
                         }
                     }
                     else {
+                        const errMsg = `TOOL_NOT_FOUND: The tool "${toolUse.name}" does not exist.`;
+                        const errorPayload = { error: errMsg };
+                        toolExecutions.push({
+                            name: toolUse.name,
+                            input: toolUse.input,
+                            output: errorPayload,
+                        });
                         toolResults.push({
                             type: "tool_result",
                             tool_use_id: toolUse.id,
-                            content: `TOOL_NOT_FOUND: The tool "${toolUse.name}" does not exist.`,
+                            content: errMsg,
+                        });
+                        stepStorageResults.push({
+                            toolCallId: toolUse.id,
+                            toolName: toolUse.name,
+                            output: errorPayload,
                         });
                     }
                 }
+                // Persist this step's tool calls/results into conversation memory.
+                // Without this, tool_call / tool_result rows never reach Redis and
+                // the chat-history UI loses every tool invocation.
+                // Fire-and-forget — storage failures must not break generation.
+                if (stepStorageCalls.length > 0 || stepStorageResults.length > 0) {
+                    withTimeout(this.handleToolExecutionStorage(stepStorageCalls.map((c) => ({ ...c, stepIndex: step })), stepStorageResults.map((r) => ({ ...r, stepIndex: step })), options, new Date()), TOOL_STORAGE_TIMEOUT_MS, "tool storage write timed out").catch((error) => {
+                        logger.warn("[GoogleVertex] Failed to store native Anthropic generate tool executions", {
+                            error: error instanceof Error ? error.message : String(error),
+                        });
+                    });
+                }
                 // Add assistant message and tool results to continue the loop
                 // Filter out server_tool_use blocks that the Anthropic API doesn't accept in messages
                 const assistantContent = response.content.filter((block) => block.type !== "server_tool_use");
@@ -2560,6 +2979,8 @@ export class GoogleVertexProvider extends BaseProvider {
             }
         }
         const responseTime = Date.now() - startTime;
+        const externalToolCalls = allToolCalls.filter((tc) => tc.toolName !== "final_result");
+        const externalToolExecutions = toolExecutions.filter((te) => te.name !== "final_result");
         const result = {
             content: finalText,
             provider: this.providerName,
@@ -2570,9 +2991,9 @@ export class GoogleVertexProvider extends BaseProvider {
                 total: totalInputTokens + totalOutputTokens,
             },
             responseTime,
-            toolsUsed: allToolCalls.map((tc) => tc.toolName),
-            toolExecutions,
-            enhancedWithTools: allToolCalls.length > 0,
+            toolsUsed: externalToolCalls.map((tc) => tc.toolName),
+            toolExecutions: transformToolExecutions(externalToolExecutions),
+            enhancedWithTools: externalToolCalls.length > 0,
         };
         // Route through enhanceResult so analytics/evaluation/tracing are picked
         // up the same way the BaseProvider.generate() path picks them up. The
@@ -2737,6 +3158,17 @@ export class GoogleVertexProvider extends BaseProvider {
                 this.emitGenerationEnd(modelName, videoResult, generateStartTime, true);
                 return videoResult;
             }
+            // TTS direct-synthesis mode: when caller passes `tts.enabled` without
+            // `tts.useAiResponse`, route to the shared `handleDirectTTSSynthesis`
+            // (synthesise the input text directly; no LLM call). BaseProvider's
+            // standard generate() does the same dispatch — we replicate it here
+            // because Vertex's override bypasses that path.
+            if (options.tts?.enabled && !options.tts?.useAiResponse) {
+                logger.info("[GoogleVertex] Routing TTS direct-synthesis to handleDirectTTSSynthesis", { model: modelName });
+                const ttsResult = await this.handleDirectTTSSynthesis(options, generateStartTime);
+                this.emitGenerationEnd(modelName, ttsResult, generateStartTime, true);
+                return ttsResult;
+            }
             // Check if this is an image generation model - route to executeImageGeneration without tools
             const isImageModel = IMAGE_GENERATION_MODELS.some((m) => modelName.toLowerCase().startsWith(m.toLowerCase()));
             if (isImageModel) {
@@ -2797,23 +3229,41 @@ export class GoogleVertexProvider extends BaseProvider {
                 "";
             try {
                 let result;
-                // Route Claude models to native Anthropic SDK
-                if (isAnthropicModel(modelName)) {
-                    logger.info("[GoogleVertex] Routing Claude generate to native @anthropic-ai/vertex-sdk", {
-                        model: modelName,
-                        totalToolCount: Object.keys(mergedOptions.tools).length,
-                    });
-                    result = await this.executeNativeAnthropicGenerate(mergedOptions);
-                }
-                else {
-                    // ALL Gemini models use native @google/genai SDK
+                // Wrap the actual native generate call in `neurolink.executeGeneration`
+                // so the observability span chain (tested by
+                // "Tracing: Generate Span Chain") sees a third inner span on the
+                // native @google/genai / @anthropic-ai/vertex-sdk path — Pipeline A
+                // gets this for free from GenerationHandler.executeGeneration.
+                result = await withSpan({
+                    name: "neurolink.executeGeneration",
+                    tracer: tracers.provider,
+                    attributes: {
+                        [ATTR.GEN_AI_SYSTEM]: this.providerName,
+                        [ATTR.GEN_AI_MODEL]: modelName,
+                        "neurolink.path": isAnthropicModel(modelName)
+                            ? "native.anthropic"
+                            : "native.google-genai",
+                    },
+                }, async () => {
+                    if (isAnthropicModel(modelName)) {
+                        logger.info("[GoogleVertex] Routing Claude generate to native @anthropic-ai/vertex-sdk", {
+                            model: modelName,
+                            totalToolCount: Object.keys(mergedOptions.tools).length,
+                        });
+                        return this.executeNativeAnthropicGenerate(mergedOptions);
+                    }
                     logger.info("[GoogleVertex] Routing Gemini generate to native @google/genai", {
                         model: modelName,
                         totalToolCount: Object.keys(mergedOptions.tools).length,
                     });
-                    result = await this.executeNativeGemini3Generate(mergedOptions);
-                }
+                    return this.executeNativeGemini3Generate(mergedOptions);
+                });
                 this.attachUsageAndCostAttributes(generateSpan, modelName, result?.usage);
+                // Pipe through TTS-of-AI-response when caller asks for it. The
+                // shared `synthesizeAIResponseIfNeeded` no-ops when tts is not
+                // enabled / useAiResponse is false, so the cost is zero on
+                // non-TTS paths.
+                result = await this.synthesizeAIResponseIfNeeded(result, options);
                 // Fire onFinish lifecycle callback for the native generate path.
                 // Pipeline A providers get this for free via the AI SDK middleware
                 // wrapper (LifecycleMiddleware); native @google/genai bypasses
@@ -3053,6 +3503,14 @@ export class GoogleVertexProvider extends BaseProvider {
                 ? { error: error instanceof Error ? error.message : String(error) }
                 : {}),
         });
+        // Mark on the result so the SDK-level runStandardGenerateRequest knows
+        // this provider already emitted `generation:end` itself and skips its
+        // own duplicate emission. Without this flag the public event listener
+        // (and the observability test) would see two events per generate call.
+        if (result && typeof result === "object") {
+            result._generationEndEmitted =
+                true;
+        }
     }
     formatProviderError(error) {
         const errorRecord = error;