npm - browser-use - Versions diffs - 0.2.0 → 0.4.0 - Mend

browser-use 0.2.0 → 0.4.0

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (259) hide show

package/README.md +295 -686
package/dist/actor/element.d.ts +19 -0
package/dist/actor/element.js +46 -0
package/dist/actor/index.d.ts +4 -0
package/dist/actor/index.js +4 -0
package/dist/actor/mouse.d.ts +19 -0
package/dist/actor/mouse.js +39 -0
package/dist/actor/page.d.ts +29 -0
package/dist/actor/page.js +88 -0
package/dist/actor/utils.d.ts +4 -0
package/dist/actor/utils.js +35 -0
package/dist/agent/cloud-events.d.ts +18 -0
package/dist/agent/cloud-events.js +65 -2
package/dist/agent/gif.d.ts +1 -0
package/dist/agent/gif.js +24 -2
package/dist/agent/judge.d.ts +17 -0
package/dist/agent/judge.js +197 -0
package/dist/agent/message-manager/service.d.ts +12 -4
package/dist/agent/message-manager/service.js +205 -39
package/dist/agent/message-manager/utils.js +0 -1
package/dist/agent/message-manager/views.d.ts +4 -0
package/dist/agent/message-manager/views.js +11 -7
package/dist/agent/prompts.d.ts +24 -3
package/dist/agent/prompts.js +274 -59
package/dist/agent/service.d.ts +103 -41
package/dist/agent/service.js +2336 -472
package/dist/agent/variable-detector.d.ts +12 -0
package/dist/agent/variable-detector.js +211 -0
package/dist/agent/views.d.ts +237 -18
package/dist/agent/views.js +446 -33
package/dist/browser/cloud/cloud.d.ts +20 -0
package/dist/browser/cloud/cloud.js +129 -0
package/dist/browser/cloud/index.d.ts +2 -0
package/dist/browser/cloud/index.js +2 -0
package/dist/browser/cloud/views.d.ts +41 -0
package/dist/browser/cloud/views.js +35 -0
package/dist/browser/events.d.ts +345 -0
package/dist/browser/events.js +566 -0
package/dist/browser/extensions.js +17 -17
package/dist/browser/index.d.ts +4 -0
package/dist/browser/index.js +4 -0
package/dist/browser/profile.d.ts +10 -4
package/dist/browser/profile.js +79 -12
package/dist/browser/session-manager.d.ts +85 -0
package/dist/browser/session-manager.js +208 -0
package/dist/browser/session.d.ts +105 -9
package/dist/browser/session.js +1166 -95
package/dist/browser/types.d.ts +153 -156
package/dist/browser/views.d.ts +39 -0
package/dist/browser/views.js +32 -0
package/dist/browser/watchdogs/aboutblank-watchdog.d.ts +12 -0
package/dist/browser/watchdogs/aboutblank-watchdog.js +131 -0
package/dist/browser/watchdogs/base.d.ts +21 -0
package/dist/browser/watchdogs/base.js +81 -0
package/dist/browser/watchdogs/cdp-session-watchdog.d.ts +14 -0
package/dist/browser/watchdogs/cdp-session-watchdog.js +177 -0
package/dist/browser/watchdogs/crash-watchdog.d.ts +38 -0
package/dist/browser/watchdogs/crash-watchdog.js +296 -0
package/dist/browser/watchdogs/default-action-watchdog.d.ts +49 -0
package/dist/browser/watchdogs/default-action-watchdog.js +212 -0
package/dist/browser/watchdogs/dom-watchdog.d.ts +8 -0
package/dist/browser/watchdogs/dom-watchdog.js +31 -0
package/dist/browser/watchdogs/downloads-watchdog.d.ts +77 -0
package/dist/browser/watchdogs/downloads-watchdog.js +409 -0
package/dist/browser/watchdogs/har-recording-watchdog.d.ts +19 -0
package/dist/browser/watchdogs/har-recording-watchdog.js +317 -0
package/dist/browser/watchdogs/index.d.ts +15 -0
package/dist/browser/watchdogs/index.js +15 -0
package/dist/browser/watchdogs/local-browser-watchdog.d.ts +10 -0
package/dist/browser/watchdogs/local-browser-watchdog.js +32 -0
package/dist/browser/watchdogs/permissions-watchdog.d.ts +8 -0
package/dist/browser/watchdogs/permissions-watchdog.js +73 -0
package/dist/browser/watchdogs/popups-watchdog.d.ts +13 -0
package/dist/browser/watchdogs/popups-watchdog.js +77 -0
package/dist/browser/watchdogs/recording-watchdog.d.ts +27 -0
package/dist/browser/watchdogs/recording-watchdog.js +249 -0
package/dist/browser/watchdogs/screenshot-watchdog.d.ts +6 -0
package/dist/browser/watchdogs/screenshot-watchdog.js +13 -0
package/dist/browser/watchdogs/security-watchdog.d.ts +10 -0
package/dist/browser/watchdogs/security-watchdog.js +84 -0
package/dist/browser/watchdogs/storage-state-watchdog.d.ts +24 -0
package/dist/browser/watchdogs/storage-state-watchdog.js +288 -0
package/dist/cli.d.ts +7 -2
package/dist/cli.js +182 -25
package/dist/code-use/formatting.d.ts +3 -0
package/dist/code-use/formatting.js +18 -0
package/dist/code-use/index.d.ts +6 -0
package/dist/code-use/index.js +6 -0
package/dist/code-use/namespace.d.ts +5 -0
package/dist/code-use/namespace.js +81 -0
package/dist/code-use/notebook-export.d.ts +3 -0
package/dist/code-use/notebook-export.js +56 -0
package/dist/code-use/service.d.ts +24 -0
package/dist/code-use/service.js +104 -0
package/dist/code-use/utils.d.ts +4 -0
package/dist/code-use/utils.js +98 -0
package/dist/code-use/views.d.ts +108 -0
package/dist/code-use/views.js +165 -0
package/dist/config.d.ts +15 -0
package/dist/config.js +109 -7
package/dist/controller/registry/service.d.ts +10 -1
package/dist/controller/registry/service.js +266 -10
package/dist/controller/registry/views.d.ts +4 -1
package/dist/controller/registry/views.js +25 -2
package/dist/controller/service.d.ts +10 -1
package/dist/controller/service.js +1814 -268
package/dist/controller/views.d.ts +78 -155
package/dist/controller/views.js +61 -12
package/dist/dom/history-tree-processor/service.d.ts +5 -0
package/dist/dom/history-tree-processor/service.js +169 -14
package/dist/dom/history-tree-processor/view.d.ts +7 -1
package/dist/dom/history-tree-processor/view.js +10 -1
package/dist/dom/markdown-extractor.d.ts +37 -0
package/dist/dom/markdown-extractor.js +345 -0
package/dist/dom/service.d.ts +3 -1
package/dist/dom/service.js +76 -0
package/dist/dom/views.d.ts +1 -0
package/dist/dom/views.js +45 -0
package/dist/event-bus.d.ts +107 -7
package/dist/event-bus.js +313 -10
package/dist/exceptions.d.ts +0 -3
package/dist/exceptions.js +0 -7
package/dist/filesystem/file-system.d.ts +18 -0
package/dist/filesystem/file-system.js +503 -42
package/dist/index.d.ts +7 -0
package/dist/index.js +6 -0
package/dist/integrations/gmail/actions.d.ts +3 -3
package/dist/integrations/gmail/actions.js +4 -4
package/dist/llm/anthropic/chat.d.ts +18 -1
package/dist/llm/anthropic/chat.js +123 -55
package/dist/llm/anthropic/serializer.d.ts +2 -0
package/dist/llm/anthropic/serializer.js +81 -9
package/dist/llm/aws/chat-anthropic.d.ts +17 -0
package/dist/llm/aws/chat-anthropic.js +126 -26
package/dist/llm/aws/chat-bedrock.d.ts +28 -1
package/dist/llm/aws/chat-bedrock.js +161 -34
package/dist/llm/aws/serializer.d.ts +13 -1
package/dist/llm/aws/serializer.js +56 -17
package/dist/llm/azure/chat.d.ts +53 -2
package/dist/llm/azure/chat.js +366 -54
package/dist/llm/base.d.ts +2 -0
package/dist/llm/browser-use/chat.d.ts +40 -0
package/dist/llm/browser-use/chat.js +305 -0
package/dist/llm/browser-use/index.d.ts +1 -0
package/dist/llm/browser-use/index.js +1 -0
package/dist/llm/cerebras/chat.d.ts +39 -0
package/dist/llm/cerebras/chat.js +178 -0
package/dist/llm/cerebras/index.d.ts +2 -0
package/dist/llm/cerebras/index.js +2 -0
package/dist/llm/cerebras/serializer.d.ts +7 -0
package/dist/llm/cerebras/serializer.js +82 -0
package/dist/llm/deepseek/chat.d.ts +19 -2
package/dist/llm/deepseek/chat.js +138 -25
package/dist/llm/google/chat.d.ts +46 -2
package/dist/llm/google/chat.js +267 -64
package/dist/llm/google/serializer.d.ts +9 -1
package/dist/llm/google/serializer.js +141 -34
package/dist/llm/groq/chat.d.ts +21 -2
package/dist/llm/groq/chat.js +125 -26
package/dist/llm/groq/parser.js +3 -1
package/dist/llm/mistral/chat.d.ts +43 -0
package/dist/llm/mistral/chat.js +154 -0
package/dist/llm/mistral/index.d.ts +2 -0
package/dist/llm/mistral/index.js +2 -0
package/dist/llm/mistral/schema.d.ts +8 -0
package/dist/llm/mistral/schema.js +27 -0
package/dist/llm/models.d.ts +2 -0
package/dist/llm/models.js +317 -0
package/dist/llm/ollama/chat.d.ts +13 -1
package/dist/llm/ollama/chat.js +110 -19
package/dist/llm/ollama/serializer.d.ts +1 -0
package/dist/llm/ollama/serializer.js +34 -12
package/dist/llm/openai/chat.d.ts +16 -0
package/dist/llm/openai/chat.js +94 -44
package/dist/llm/openai/like.d.ts +5 -3
package/dist/llm/openai/like.js +7 -3
package/dist/llm/openai/responses-serializer.d.ts +18 -0
package/dist/llm/openai/responses-serializer.js +72 -0
package/dist/llm/openrouter/chat.d.ts +28 -2
package/dist/llm/openrouter/chat.js +115 -29
package/dist/llm/schema.d.ts +11 -1
package/dist/llm/schema.js +109 -4
package/dist/llm/vercel/chat.d.ts +50 -0
package/dist/llm/vercel/chat.js +276 -0
package/dist/llm/vercel/index.d.ts +1 -0
package/dist/llm/vercel/index.js +1 -0
package/dist/llm/vercel/serializer.d.ts +5 -0
package/dist/llm/vercel/serializer.js +7 -0
package/dist/llm/views.d.ts +2 -1
package/dist/llm/views.js +3 -1
package/dist/logging-config.d.ts +2 -0
package/dist/logging-config.js +82 -29
package/dist/mcp/client.d.ts +10 -5
package/dist/mcp/client.js +14 -9
package/dist/mcp/controller.d.ts +42 -3
package/dist/mcp/controller.js +56 -31
package/dist/mcp/server.d.ts +15 -0
package/dist/mcp/server.js +261 -52
package/dist/observability.js +10 -4
package/dist/sandbox/index.d.ts +2 -0
package/dist/sandbox/index.js +2 -0
package/dist/sandbox/sandbox.d.ts +19 -0
package/dist/sandbox/sandbox.js +140 -0
package/dist/sandbox/views.d.ts +67 -0
package/dist/sandbox/views.js +121 -0
package/dist/skill-cli/index.d.ts +3 -0
package/dist/skill-cli/index.js +3 -0
package/dist/skill-cli/protocol.d.ts +30 -0
package/dist/skill-cli/protocol.js +48 -0
package/dist/skill-cli/server.d.ts +11 -0
package/dist/skill-cli/server.js +85 -0
package/dist/skill-cli/sessions.d.ts +24 -0
package/dist/skill-cli/sessions.js +47 -0
package/dist/skills/index.d.ts +3 -0
package/dist/skills/index.js +3 -0
package/dist/skills/service.d.ts +27 -0
package/dist/skills/service.js +266 -0
package/dist/skills/utils.d.ts +6 -0
package/dist/skills/utils.js +53 -0
package/dist/skills/views.d.ts +40 -0
package/dist/skills/views.js +10 -0
package/dist/sync/auth.js +8 -3
package/dist/sync/service.d.ts +6 -6
package/dist/sync/service.js +54 -89
package/dist/telemetry/views.d.ts +20 -6
package/dist/telemetry/views.js +23 -5
package/dist/tokens/custom-pricing.d.ts +2 -0
package/dist/tokens/custom-pricing.js +22 -0
package/dist/tokens/index.d.ts +2 -0
package/dist/tokens/index.js +2 -0
package/dist/tokens/mappings.d.ts +1 -0
package/dist/tokens/mappings.js +3 -0
package/dist/tokens/service.js +27 -8
package/dist/tools/extraction/index.d.ts +2 -0
package/dist/tools/extraction/index.js +2 -0
package/dist/tools/extraction/schema-utils.d.ts +6 -0
package/dist/tools/extraction/schema-utils.js +237 -0
package/dist/tools/extraction/views.d.ts +7 -0
package/dist/tools/index.d.ts +5 -0
package/dist/tools/index.js +5 -0
package/dist/tools/registry/index.d.ts +2 -0
package/dist/tools/registry/index.js +2 -0
package/dist/tools/registry/service.d.ts +1 -0
package/dist/tools/registry/service.js +1 -0
package/dist/tools/registry/views.d.ts +1 -0
package/dist/tools/registry/views.js +1 -0
package/dist/tools/service.d.ts +2 -0
package/dist/tools/service.js +1 -0
package/dist/tools/utils.d.ts +2 -0
package/dist/tools/utils.js +57 -0
package/dist/tools/views.d.ts +1 -0
package/dist/tools/views.js +1 -0
package/dist/utils.d.ts +10 -1
package/dist/utils.js +70 -3
package/package.json +116 -49
package/dist/dom/playground/process-dom.js +0 -5
package/dist/dom/playground/test-accessibility.d.ts +0 -44
package/dist/dom/playground/test-accessibility.js +0 -111
/package/dist/{dom/playground/process-dom.d.ts → tools/extraction/views.js} +0 -0

package/dist/llm/azure/chat.d.ts CHANGED Viewed

@@ -1,15 +1,66 @@
 import type { BaseChatModel, ChatInvokeOptions } from '../base.js';
-import { ChatInvokeCompletion } from '../views.js';
 import type { Message } from '../messages.js';
+import { ChatInvokeCompletion } from '../views.js';
+export interface ChatAzureOptions {
+    model?: string;
+    apiKey?: string;
+    endpoint?: string;
+    baseURL?: string;
+    apiVersion?: string;
+    deployment?: string;
+    azureAdToken?: string | null;
+    azureAdTokenProvider?: (() => Promise<string>) | null;
+    timeout?: number | null;
+    temperature?: number | null;
+    frequencyPenalty?: number | null;
+    reasoningEffort?: 'low' | 'medium' | 'high';
+    serviceTier?: 'auto' | 'default' | 'flex' | 'priority' | 'scale' | null;
+    maxCompletionTokens?: number | null;
+    topP?: number | null;
+    seed?: number | null;
+    maxRetries?: number;
+    defaultHeaders?: Record<string, string> | null;
+    defaultQuery?: Record<string, string | undefined> | null;
+    fetchImplementation?: typeof fetch;
+    fetchOptions?: RequestInit | null;
+    useResponsesApi?: boolean | 'auto';
+    addSchemaToSystemPrompt?: boolean;
+    dontForceStructuredOutput?: boolean;
+    removeMinItemsFromSchema?: boolean;
+    removeDefaultsFromSchema?: boolean;
+}
 export declare class ChatAzure implements BaseChatModel {
     model: string;
     provider: string;
     private client;
-    constructor(model?: string);
+    private temperature;
+    private frequencyPenalty;
+    private reasoningEffort;
+    private serviceTier;
+    private maxCompletionTokens;
+    private topP;
+    private seed;
+    private useResponsesApi;
+    private addSchemaToSystemPrompt;
+    private dontForceStructuredOutput;
+    private removeMinItemsFromSchema;
+    private removeDefaultsFromSchema;
+    constructor(options?: string | ChatAzureOptions);
     get name(): string;
     get model_name(): string;
+    private isReasoningModel;
+    private shouldUseResponsesApi;
+    private getChatUsage;
+    private getResponsesUsage;
+    private getResponseOutputText;
+    private getModelParamsForCompletions;
+    private getModelParamsForResponses;
+    private getZodSchemaCandidate;
+    private applySchemaToSystemMessage;
     ainvoke(messages: Message[], output_format?: undefined, options?: ChatInvokeOptions): Promise<ChatInvokeCompletion<string>>;
     ainvoke<T>(messages: Message[], output_format: {
         parse: (input: string) => T;
     } | undefined, options?: ChatInvokeOptions): Promise<ChatInvokeCompletion<T>>;
+    private invokeChatCompletions;
+    private invokeResponses;
 }

package/dist/llm/azure/chat.js CHANGED Viewed

@@ -1,17 +1,74 @@
 import { AzureOpenAI } from 'openai';
-import { ChatInvokeCompletion } from '../views.js';
+import { ModelProviderError, ModelRateLimitError } from '../exceptions.js';
 import { OpenAIMessageSerializer } from '../openai/serializer.js';
+import { ResponsesAPIMessageSerializer } from '../openai/responses-serializer.js';
+import { SchemaOptimizer, zodSchemaToJsonSchema } from '../schema.js';
+import { ChatInvokeCompletion } from '../views.js';
+const RESPONSES_API_ONLY_MODELS = [
+    'gpt-5.1-codex',
+    'gpt-5.1-codex-mini',
+    'gpt-5.1-codex-max',
+    'gpt-5-codex',
+    'codex-mini-latest',
+    'computer-use-preview',
+];
+const REASONING_MODELS = [
+    'o4-mini',
+    'o3',
+    'o3-mini',
+    'o1',
+    'o1-pro',
+    'o3-pro',
+    'gpt-5',
+    'gpt-5-mini',
+    'gpt-5-nano',
+];
 export class ChatAzure {
     model;
     provider = 'azure';
     client;
-    constructor(model = 'gpt-4o') {
+    temperature;
+    frequencyPenalty;
+    reasoningEffort;
+    serviceTier;
+    maxCompletionTokens;
+    topP;
+    seed;
+    useResponsesApi;
+    addSchemaToSystemPrompt;
+    dontForceStructuredOutput;
+    removeMinItemsFromSchema;
+    removeDefaultsFromSchema;
+    constructor(options = {}) {
+        const normalizedOptions = typeof options === 'string' ? { model: options } : options;
+        const { model = 'gpt-4o', apiKey = process.env.AZURE_OPENAI_API_KEY ?? process.env.AZURE_OPENAI_KEY, endpoint = process.env.AZURE_OPENAI_ENDPOINT, baseURL = undefined, apiVersion = process.env.AZURE_OPENAI_API_VERSION ?? '2024-12-01-preview', deployment = process.env.AZURE_OPENAI_DEPLOYMENT ?? model, azureAdToken = null, azureAdTokenProvider = null, timeout = null, temperature = 0.2, frequencyPenalty = 0.3, reasoningEffort = 'low', serviceTier = null, maxCompletionTokens = 4096, topP = null, seed = null, maxRetries = 5, defaultHeaders = null, defaultQuery = null, fetchImplementation, fetchOptions = null, useResponsesApi = 'auto', addSchemaToSystemPrompt = false, dontForceStructuredOutput = false, removeMinItemsFromSchema = false, removeDefaultsFromSchema = false, } = normalizedOptions;
         this.model = model;
+        this.temperature = temperature;
+        this.frequencyPenalty = frequencyPenalty;
+        this.reasoningEffort = reasoningEffort;
+        this.serviceTier = serviceTier;
+        this.maxCompletionTokens = maxCompletionTokens;
+        this.topP = topP;
+        this.seed = seed;
+        this.useResponsesApi = useResponsesApi;
+        this.addSchemaToSystemPrompt = addSchemaToSystemPrompt;
+        this.dontForceStructuredOutput = dontForceStructuredOutput;
+        this.removeMinItemsFromSchema = removeMinItemsFromSchema;
+        this.removeDefaultsFromSchema = removeDefaultsFromSchema;
         this.client = new AzureOpenAI({
-            apiKey: process.env.AZURE_OPENAI_API_KEY,
-            endpoint: process.env.AZURE_OPENAI_ENDPOINT,
-            apiVersion: process.env.AZURE_OPENAI_API_VERSION || '2024-05-01-preview',
-            deployment: model,
+            apiKey,
+            endpoint,
+            baseURL,
+            apiVersion,
+            deployment,
+            azureADTokenProvider: azureAdTokenProvider ??
+                (azureAdToken ? async () => String(azureAdToken) : undefined),
+            timeout: timeout ?? undefined,
+            maxRetries,
+            defaultHeaders: defaultHeaders ?? undefined,
+            defaultQuery: defaultQuery ?? undefined,
+            fetch: fetchImplementation,
+            fetchOptions: (fetchOptions ?? undefined),
         });
     }
     get name() {
@@ -20,65 +77,320 @@ export class ChatAzure {
     get model_name() {
         return this.model;
     }
+    isReasoningModel() {
+        return REASONING_MODELS.some((m) => this.model.toLowerCase().includes(m.toLowerCase()));
+    }
+    shouldUseResponsesApi() {
+        if (typeof this.useResponsesApi === 'boolean') {
+            return this.useResponsesApi;
+        }
+        return RESPONSES_API_ONLY_MODELS.some((name) => this.model.toLowerCase().includes(name.toLowerCase()));
+    }
+    getChatUsage(response) {
+        if (!response?.usage) {
+            return null;
+        }
+        let completionTokens = response.usage.completion_tokens;
+        const completionDetails = response.usage.completion_tokens_details;
+        if (completionDetails?.reasoning_tokens) {
+            completionTokens += completionDetails.reasoning_tokens;
+        }
+        return {
+            prompt_tokens: response.usage.prompt_tokens,
+            prompt_cached_tokens: response.usage.prompt_tokens_details?.cached_tokens ?? null,
+            prompt_cache_creation_tokens: null,
+            prompt_image_tokens: null,
+            completion_tokens: completionTokens,
+            total_tokens: response.usage.total_tokens,
+        };
+    }
+    getResponsesUsage(response) {
+        if (!response?.usage) {
+            return null;
+        }
+        return {
+            prompt_tokens: response.usage.input_tokens ?? 0,
+            prompt_cached_tokens: response.usage.input_tokens_details?.cached_tokens ?? null,
+            prompt_cache_creation_tokens: null,
+            prompt_image_tokens: null,
+            completion_tokens: response.usage.output_tokens ?? 0,
+            total_tokens: response.usage.total_tokens ?? 0,
+        };
+    }
+    getResponseOutputText(response) {
+        if (typeof response?.output_text === 'string') {
+            return response.output_text;
+        }
+        const outputs = Array.isArray(response?.output) ? response.output : [];
+        for (const item of outputs) {
+            if (Array.isArray(item?.content)) {
+                for (const part of item.content) {
+                    if (typeof part?.text === 'string') {
+                        return part.text;
+                    }
+                    if (typeof part?.output_text === 'string') {
+                        return part.output_text;
+                    }
+                }
+            }
+        }
+        return '';
+    }
+    getModelParamsForCompletions() {
+        const modelParams = {};
+        if (!this.isReasoningModel()) {
+            if (this.temperature !== null) {
+                modelParams.temperature = this.temperature;
+            }
+            if (this.frequencyPenalty !== null) {
+                modelParams.frequency_penalty = this.frequencyPenalty;
+            }
+        }
+        else {
+            modelParams.reasoning_effort = this.reasoningEffort;
+        }
+        if (this.maxCompletionTokens !== null) {
+            modelParams.max_completion_tokens = this.maxCompletionTokens;
+        }
+        if (this.topP !== null) {
+            modelParams.top_p = this.topP;
+        }
+        if (this.seed !== null) {
+            modelParams.seed = this.seed;
+        }
+        if (this.serviceTier !== null) {
+            modelParams.service_tier = this.serviceTier;
+        }
+        return modelParams;
+    }
+    getModelParamsForResponses() {
+        const modelParams = {};
+        if (!this.isReasoningModel()) {
+            if (this.temperature !== null) {
+                modelParams.temperature = this.temperature;
+            }
+            if (this.frequencyPenalty !== null) {
+                modelParams.frequency_penalty = this.frequencyPenalty;
+            }
+        }
+        else {
+            modelParams.reasoning = { effort: this.reasoningEffort };
+        }
+        if (this.maxCompletionTokens !== null) {
+            modelParams.max_output_tokens = this.maxCompletionTokens;
+        }
+        if (this.topP !== null) {
+            modelParams.top_p = this.topP;
+        }
+        if (this.seed !== null) {
+            modelParams.seed = this.seed;
+        }
+        if (this.serviceTier !== null) {
+            modelParams.service_tier = this.serviceTier;
+        }
+        return modelParams;
+    }
+    getZodSchemaCandidate(output_format) {
+        const output = output_format;
+        if (output &&
+            typeof output === 'object' &&
+            typeof output.safeParse === 'function' &&
+            typeof output.parse === 'function') {
+            return output;
+        }
+        if (output &&
+            typeof output === 'object' &&
+            output.schema &&
+            typeof output.schema.safeParse === 'function' &&
+            typeof output.schema.parse === 'function') {
+            return output.schema;
+        }
+        return null;
+    }
+    applySchemaToSystemMessage(openaiMessages, responseJsonSchema) {
+        if (!this.addSchemaToSystemPrompt || openaiMessages.length === 0) {
+            return;
+        }
+        const firstMessage = openaiMessages[0];
+        if (firstMessage?.role !== 'system') {
+            return;
+        }
+        const schemaText = `\n<json_schema>\n` +
+            `${JSON.stringify(responseJsonSchema, null, 2)}\n` +
+            `</json_schema>`;
+        if (typeof firstMessage.content === 'string') {
+            firstMessage.content = (firstMessage.content ?? '') + schemaText;
+            return;
+        }
+        if (Array.isArray(firstMessage.content)) {
+            firstMessage.content = [
+                ...firstMessage.content,
+                { type: 'text', text: schemaText },
+            ];
+        }
+    }
     async ainvoke(messages, output_format, options = {}) {
+        const zodSchemaCandidate = this.getZodSchemaCandidate(output_format);
+        if (this.shouldUseResponsesApi()) {
+            return this.invokeResponses(messages, output_format, zodSchemaCandidate, options);
+        }
+        return this.invokeChatCompletions(messages, output_format, zodSchemaCandidate, options);
+    }
+    async invokeChatCompletions(messages, output_format, zodSchemaCandidate, options) {
         const serializer = new OpenAIMessageSerializer();
         const openaiMessages = serializer.serialize(messages);
-        // Use simple json_object format for better compatibility with Azure
-        // json_schema format may not be supported on all Azure API versions/deployments
-        const responseFormat = output_format
-            ? { type: 'json_object' }
-            : undefined;
-        const response = await this.client.chat.completions.create({
+        let responseFormat = undefined;
+        if (zodSchemaCandidate) {
+            try {
+                const rawJsonSchema = zodSchemaToJsonSchema(zodSchemaCandidate, {
+                    name: 'agent_output',
+                    target: 'jsonSchema7',
+                });
+                const optimizedJsonSchema = SchemaOptimizer.createOptimizedJsonSchema(rawJsonSchema, {
+                    removeMinItems: this.removeMinItemsFromSchema,
+                    removeDefaults: this.removeDefaultsFromSchema,
+                });
+                const responseJsonSchema = {
+                    name: 'agent_output',
+                    schema: optimizedJsonSchema,
+                    strict: true,
+                };
+                this.applySchemaToSystemMessage(openaiMessages, responseJsonSchema);
+                if (!this.dontForceStructuredOutput) {
+                    responseFormat = {
+                        type: 'json_schema',
+                        json_schema: responseJsonSchema,
+                    };
+                }
+            }
+            catch {
+                responseFormat = undefined;
+            }
+        }
+        try {
+            const response = await this.client.chat.completions.create({
+                model: this.model,
+                messages: openaiMessages,
+                response_format: responseFormat,
+                ...this.getModelParamsForCompletions(),
+            }, options.signal ? { signal: options.signal } : undefined);
+            const content = response.choices[0].message.content || '';
+            const usage = this.getChatUsage(response);
+            const stopReason = response.choices[0].finish_reason ?? null;
+            let completion = content;
+            if (output_format) {
+                if (zodSchemaCandidate) {
+                    const parsedJson = JSON.parse(content);
+                    const output = output_format;
+                    if (output &&
+                        typeof output === 'object' &&
+                        output.schema &&
+                        typeof output.schema.parse === 'function') {
+                        completion = output.schema.parse(parsedJson);
+                    }
+                    else {
+                        completion = output.parse(parsedJson);
+                    }
+                }
+                else {
+                    completion = output_format.parse(content);
+                }
+            }
+            return new ChatInvokeCompletion(completion, usage, null, null, stopReason);
+        }
+        catch (error) {
+            if (error?.status === 429) {
+                throw new ModelRateLimitError(error?.message ?? 'Rate limit exceeded', 429, this.model);
+            }
+            throw new ModelProviderError(error?.message ?? String(error), error?.status ?? 500, this.model);
+        }
+    }
+    async invokeResponses(messages, output_format, zodSchemaCandidate, options) {
+        const serializer = new ResponsesAPIMessageSerializer();
+        const inputMessages = serializer.serialize(messages);
+        const request = {
             model: this.model,
-            messages: openaiMessages,
-            response_format: responseFormat,
-        }, options.signal ? { signal: options.signal } : undefined);
-        const content = response.choices[0].message.content || '';
-        let completion = content;
-        if (output_format) {
+            input: inputMessages,
+            ...this.getModelParamsForResponses(),
+        };
+        if (zodSchemaCandidate) {
             try {
-                // Extract JSON from the response
-                let jsonText = content.trim();
-                // Handle markdown fenced code blocks
-                const fencedMatch = jsonText.match(/```(?:json)?\s*([\s\S]*?)```/);
-                if (fencedMatch && fencedMatch[1]) {
-                    jsonText = fencedMatch[1].trim();
+                const rawJsonSchema = zodSchemaToJsonSchema(zodSchemaCandidate, {
+                    name: 'agent_output',
+                    target: 'jsonSchema7',
+                });
+                const optimizedJsonSchema = SchemaOptimizer.createOptimizedJsonSchema(rawJsonSchema, {
+                    removeMinItems: this.removeMinItemsFromSchema,
+                    removeDefaults: this.removeDefaultsFromSchema,
+                });
+                if (this.addSchemaToSystemPrompt &&
+                    inputMessages.length > 0 &&
+                    inputMessages[0]?.role === 'system') {
+                    const schemaText = `\n<json_schema>\n${JSON.stringify(optimizedJsonSchema)}\n</json_schema>`;
+                    const firstInput = inputMessages[0];
+                    const firstContent = firstInput?.content;
+                    let patchedContent = firstContent ?? '';
+                    if (typeof firstContent === 'string') {
+                        patchedContent = firstContent + schemaText;
+                    }
+                    else if (Array.isArray(firstContent)) {
+                        patchedContent = [
+                            ...firstContent,
+                            { type: 'input_text', text: schemaText },
+                        ];
+                    }
+                    inputMessages[0] = {
+                        ...inputMessages[0],
+                        content: patchedContent,
+                    };
+                    request.input = inputMessages;
                 }
-                // Extract JSON object/array from the text
-                const firstBrace = jsonText.indexOf('{');
-                const firstBracket = jsonText.indexOf('[');
-                const lastBrace = jsonText.lastIndexOf('}');
-                const lastBracket = jsonText.lastIndexOf(']');
-                // Determine if it's an object or array
-                let startIdx = -1;
-                let endIdx = -1;
-                if (firstBrace !== -1 &&
-                    (firstBracket === -1 || firstBrace < firstBracket)) {
-                    // It's an object
-                    startIdx = firstBrace;
-                    endIdx = lastBrace;
+                if (!this.dontForceStructuredOutput) {
+                    request.text = {
+                        format: {
+                            type: 'json_schema',
+                            name: 'agent_output',
+                            strict: true,
+                            schema: optimizedJsonSchema,
+                        },
+                    };
                 }
-                else if (firstBracket !== -1) {
-                    // It's an array
-                    startIdx = firstBracket;
-                    endIdx = lastBracket;
+            }
+            catch {
+                // Skip structured output forcing when schema conversion fails.
+            }
+        }
+        try {
+            const response = await this.client.responses.create(request, options.signal ? { signal: options.signal } : undefined);
+            const content = this.getResponseOutputText(response);
+            const usage = this.getResponsesUsage(response);
+            const stopReason = response?.status ?? null;
+            let completion = content;
+            if (output_format) {
+                if (zodSchemaCandidate) {
+                    const parsedJson = JSON.parse(content);
+                    const output = output_format;
+                    if (output &&
+                        typeof output === 'object' &&
+                        output.schema &&
+                        typeof output.schema.parse === 'function') {
+                        completion = output.schema.parse(parsedJson);
+                    }
+                    else {
+                        completion = output.parse(parsedJson);
+                    }
                 }
-                if (startIdx !== -1 && endIdx !== -1 && endIdx > startIdx) {
-                    jsonText = jsonText.slice(startIdx, endIdx + 1);
+                else {
+                    completion = output_format.parse(content);
                 }
-                const parsedJson = JSON.parse(jsonText);
-                completion = output_format.parse(parsedJson);
             }
-            catch (e) {
-                console.error('Failed to parse Azure completion:', e);
-                console.error('Raw content:', content.substring(0, 500));
-                throw new Error(`Failed to parse LLM completion as JSON: ${e}`);
+            return new ChatInvokeCompletion(completion, usage, null, null, stopReason);
+        }
+        catch (error) {
+            if (error?.status === 429) {
+                throw new ModelRateLimitError(error?.message ?? 'Rate limit exceeded', 429, this.model);
             }
+            throw new ModelProviderError(error?.message ?? String(error), error?.status ?? 500, this.model);
         }
-        return new ChatInvokeCompletion(completion, {
-            prompt_tokens: response.usage?.prompt_tokens ?? 0,
-            completion_tokens: response.usage?.completion_tokens ?? 0,
-            total_tokens: response.usage?.total_tokens ?? 0,
-        });
     }
 }

package/dist/llm/base.d.ts CHANGED Viewed

@@ -2,6 +2,8 @@ import type { ChatInvokeCompletion } from './views.js';
 import type { Message } from './messages.js';
 export interface ChatInvokeOptions {
     signal?: AbortSignal;
+    request_type?: string;
+    [key: string]: unknown;
 }
 export interface BaseChatModel {
     model: string;

package/dist/llm/browser-use/chat.d.ts ADDED Viewed

@@ -0,0 +1,40 @@
+import type { BaseChatModel, ChatInvokeOptions } from '../base.js';
+import type { Message } from '../messages.js';
+import { ChatInvokeCompletion } from '../views.js';
+export interface ChatBrowserUseOptions {
+    model?: string;
+    apiKey?: string;
+    baseUrl?: string;
+    timeout?: number;
+    maxRetries?: number;
+    retryBaseDelay?: number;
+    retryMaxDelay?: number;
+    fast?: boolean;
+    fetchImplementation?: typeof fetch;
+}
+export declare class ChatBrowserUse implements BaseChatModel {
+    model: string;
+    provider: string;
+    private readonly apiKey;
+    private readonly baseUrl;
+    private readonly timeoutMs;
+    private readonly maxRetries;
+    private readonly retryBaseDelay;
+    private readonly retryMaxDelay;
+    private readonly fast;
+    private readonly fetchImplementation;
+    constructor(options?: ChatBrowserUseOptions);
+    get name(): string;
+    get model_name(): string;
+    private getOutputSchema;
+    private parseOutput;
+    private serializeMessage;
+    private getUsage;
+    private raiseHttpError;
+    private isRetryableNetworkError;
+    private makeRequest;
+    ainvoke(messages: Message[], output_format?: undefined, options?: ChatInvokeOptions): Promise<ChatInvokeCompletion<string>>;
+    ainvoke<T>(messages: Message[], output_format: {
+        parse: (input: string) => T;
+    } | undefined, options?: ChatInvokeOptions): Promise<ChatInvokeCompletion<T>>;
+}