npm - browser-use - Versions diffs - 0.2.0 → 0.3.0 - Mend

browser-use 0.2.0 → 0.3.0

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (259) hide show

package/README.md +295 -686
package/dist/actor/element.d.ts +19 -0
package/dist/actor/element.js +46 -0
package/dist/actor/index.d.ts +4 -0
package/dist/actor/index.js +4 -0
package/dist/actor/mouse.d.ts +19 -0
package/dist/actor/mouse.js +39 -0
package/dist/actor/page.d.ts +29 -0
package/dist/actor/page.js +88 -0
package/dist/actor/utils.d.ts +4 -0
package/dist/actor/utils.js +35 -0
package/dist/agent/cloud-events.d.ts +18 -0
package/dist/agent/cloud-events.js +65 -2
package/dist/agent/gif.d.ts +1 -0
package/dist/agent/gif.js +24 -2
package/dist/agent/judge.d.ts +17 -0
package/dist/agent/judge.js +197 -0
package/dist/agent/message-manager/service.d.ts +12 -4
package/dist/agent/message-manager/service.js +205 -39
package/dist/agent/message-manager/utils.js +0 -1
package/dist/agent/message-manager/views.d.ts +4 -0
package/dist/agent/message-manager/views.js +11 -7
package/dist/agent/prompts.d.ts +24 -3
package/dist/agent/prompts.js +274 -59
package/dist/agent/service.d.ts +99 -41
package/dist/agent/service.js +2266 -472
package/dist/agent/variable-detector.d.ts +12 -0
package/dist/agent/variable-detector.js +211 -0
package/dist/agent/views.d.ts +237 -18
package/dist/agent/views.js +446 -33
package/dist/browser/cloud/cloud.d.ts +20 -0
package/dist/browser/cloud/cloud.js +129 -0
package/dist/browser/cloud/index.d.ts +2 -0
package/dist/browser/cloud/index.js +2 -0
package/dist/browser/cloud/views.d.ts +41 -0
package/dist/browser/cloud/views.js +35 -0
package/dist/browser/events.d.ts +345 -0
package/dist/browser/events.js +566 -0
package/dist/browser/extensions.js +17 -17
package/dist/browser/index.d.ts +4 -0
package/dist/browser/index.js +4 -0
package/dist/browser/profile.d.ts +8 -2
package/dist/browser/profile.js +79 -12
package/dist/browser/session-manager.d.ts +85 -0
package/dist/browser/session-manager.js +208 -0
package/dist/browser/session.d.ts +100 -8
package/dist/browser/session.js +1097 -58
package/dist/browser/types.d.ts +0 -2
package/dist/browser/views.d.ts +39 -0
package/dist/browser/views.js +32 -0
package/dist/browser/watchdogs/aboutblank-watchdog.d.ts +12 -0
package/dist/browser/watchdogs/aboutblank-watchdog.js +131 -0
package/dist/browser/watchdogs/base.d.ts +21 -0
package/dist/browser/watchdogs/base.js +81 -0
package/dist/browser/watchdogs/cdp-session-watchdog.d.ts +14 -0
package/dist/browser/watchdogs/cdp-session-watchdog.js +177 -0
package/dist/browser/watchdogs/crash-watchdog.d.ts +38 -0
package/dist/browser/watchdogs/crash-watchdog.js +296 -0
package/dist/browser/watchdogs/default-action-watchdog.d.ts +49 -0
package/dist/browser/watchdogs/default-action-watchdog.js +212 -0
package/dist/browser/watchdogs/dom-watchdog.d.ts +8 -0
package/dist/browser/watchdogs/dom-watchdog.js +31 -0
package/dist/browser/watchdogs/downloads-watchdog.d.ts +77 -0
package/dist/browser/watchdogs/downloads-watchdog.js +409 -0
package/dist/browser/watchdogs/har-recording-watchdog.d.ts +19 -0
package/dist/browser/watchdogs/har-recording-watchdog.js +317 -0
package/dist/browser/watchdogs/index.d.ts +15 -0
package/dist/browser/watchdogs/index.js +15 -0
package/dist/browser/watchdogs/local-browser-watchdog.d.ts +10 -0
package/dist/browser/watchdogs/local-browser-watchdog.js +32 -0
package/dist/browser/watchdogs/permissions-watchdog.d.ts +8 -0
package/dist/browser/watchdogs/permissions-watchdog.js +73 -0
package/dist/browser/watchdogs/popups-watchdog.d.ts +13 -0
package/dist/browser/watchdogs/popups-watchdog.js +77 -0
package/dist/browser/watchdogs/recording-watchdog.d.ts +27 -0
package/dist/browser/watchdogs/recording-watchdog.js +249 -0
package/dist/browser/watchdogs/screenshot-watchdog.d.ts +6 -0
package/dist/browser/watchdogs/screenshot-watchdog.js +13 -0
package/dist/browser/watchdogs/security-watchdog.d.ts +10 -0
package/dist/browser/watchdogs/security-watchdog.js +84 -0
package/dist/browser/watchdogs/storage-state-watchdog.d.ts +24 -0
package/dist/browser/watchdogs/storage-state-watchdog.js +288 -0
package/dist/cli.d.ts +7 -2
package/dist/cli.js +182 -25
package/dist/code-use/formatting.d.ts +3 -0
package/dist/code-use/formatting.js +18 -0
package/dist/code-use/index.d.ts +6 -0
package/dist/code-use/index.js +6 -0
package/dist/code-use/namespace.d.ts +5 -0
package/dist/code-use/namespace.js +81 -0
package/dist/code-use/notebook-export.d.ts +3 -0
package/dist/code-use/notebook-export.js +56 -0
package/dist/code-use/service.d.ts +24 -0
package/dist/code-use/service.js +104 -0
package/dist/code-use/utils.d.ts +4 -0
package/dist/code-use/utils.js +98 -0
package/dist/code-use/views.d.ts +108 -0
package/dist/code-use/views.js +165 -0
package/dist/config.d.ts +13 -0
package/dist/config.js +69 -3
package/dist/controller/registry/service.d.ts +10 -1
package/dist/controller/registry/service.js +266 -10
package/dist/controller/registry/views.d.ts +4 -1
package/dist/controller/registry/views.js +25 -2
package/dist/controller/service.d.ts +10 -1
package/dist/controller/service.js +1807 -268
package/dist/controller/views.d.ts +78 -155
package/dist/controller/views.js +61 -12
package/dist/dom/history-tree-processor/service.d.ts +5 -0
package/dist/dom/history-tree-processor/service.js +169 -14
package/dist/dom/history-tree-processor/view.d.ts +7 -1
package/dist/dom/history-tree-processor/view.js +10 -1
package/dist/dom/markdown-extractor.d.ts +37 -0
package/dist/dom/markdown-extractor.js +345 -0
package/dist/dom/service.d.ts +3 -1
package/dist/dom/service.js +76 -0
package/dist/dom/views.d.ts +1 -0
package/dist/dom/views.js +45 -0
package/dist/event-bus.d.ts +107 -7
package/dist/event-bus.js +313 -10
package/dist/exceptions.d.ts +0 -3
package/dist/exceptions.js +0 -7
package/dist/filesystem/file-system.d.ts +18 -0
package/dist/filesystem/file-system.js +503 -42
package/dist/index.d.ts +7 -0
package/dist/index.js +6 -0
package/dist/integrations/gmail/actions.d.ts +3 -3
package/dist/integrations/gmail/actions.js +4 -4
package/dist/llm/anthropic/chat.d.ts +18 -1
package/dist/llm/anthropic/chat.js +123 -55
package/dist/llm/anthropic/serializer.d.ts +2 -0
package/dist/llm/anthropic/serializer.js +81 -9
package/dist/llm/aws/chat-anthropic.d.ts +17 -0
package/dist/llm/aws/chat-anthropic.js +126 -26
package/dist/llm/aws/chat-bedrock.d.ts +28 -1
package/dist/llm/aws/chat-bedrock.js +161 -34
package/dist/llm/aws/serializer.d.ts +13 -1
package/dist/llm/aws/serializer.js +56 -17
package/dist/llm/azure/chat.d.ts +53 -2
package/dist/llm/azure/chat.js +366 -54
package/dist/llm/base.d.ts +2 -0
package/dist/llm/browser-use/chat.d.ts +40 -0
package/dist/llm/browser-use/chat.js +305 -0
package/dist/llm/browser-use/index.d.ts +1 -0
package/dist/llm/browser-use/index.js +1 -0
package/dist/llm/cerebras/chat.d.ts +39 -0
package/dist/llm/cerebras/chat.js +178 -0
package/dist/llm/cerebras/index.d.ts +2 -0
package/dist/llm/cerebras/index.js +2 -0
package/dist/llm/cerebras/serializer.d.ts +7 -0
package/dist/llm/cerebras/serializer.js +82 -0
package/dist/llm/deepseek/chat.d.ts +19 -2
package/dist/llm/deepseek/chat.js +138 -25
package/dist/llm/google/chat.d.ts +46 -2
package/dist/llm/google/chat.js +267 -64
package/dist/llm/google/serializer.d.ts +9 -1
package/dist/llm/google/serializer.js +141 -34
package/dist/llm/groq/chat.d.ts +21 -2
package/dist/llm/groq/chat.js +125 -26
package/dist/llm/groq/parser.js +3 -1
package/dist/llm/mistral/chat.d.ts +43 -0
package/dist/llm/mistral/chat.js +154 -0
package/dist/llm/mistral/index.d.ts +2 -0
package/dist/llm/mistral/index.js +2 -0
package/dist/llm/mistral/schema.d.ts +8 -0
package/dist/llm/mistral/schema.js +27 -0
package/dist/llm/models.d.ts +2 -0
package/dist/llm/models.js +317 -0
package/dist/llm/ollama/chat.d.ts +13 -1
package/dist/llm/ollama/chat.js +110 -19
package/dist/llm/ollama/serializer.d.ts +1 -0
package/dist/llm/ollama/serializer.js +34 -12
package/dist/llm/openai/chat.d.ts +16 -0
package/dist/llm/openai/chat.js +94 -44
package/dist/llm/openai/like.d.ts +5 -3
package/dist/llm/openai/like.js +7 -3
package/dist/llm/openai/responses-serializer.d.ts +18 -0
package/dist/llm/openai/responses-serializer.js +72 -0
package/dist/llm/openrouter/chat.d.ts +28 -2
package/dist/llm/openrouter/chat.js +115 -29
package/dist/llm/schema.d.ts +11 -1
package/dist/llm/schema.js +81 -1
package/dist/llm/vercel/chat.d.ts +50 -0
package/dist/llm/vercel/chat.js +276 -0
package/dist/llm/vercel/index.d.ts +1 -0
package/dist/llm/vercel/index.js +1 -0
package/dist/llm/vercel/serializer.d.ts +5 -0
package/dist/llm/vercel/serializer.js +7 -0
package/dist/llm/views.d.ts +2 -1
package/dist/llm/views.js +3 -1
package/dist/logging-config.d.ts +2 -0
package/dist/logging-config.js +82 -29
package/dist/mcp/client.d.ts +10 -5
package/dist/mcp/client.js +14 -9
package/dist/mcp/controller.d.ts +42 -3
package/dist/mcp/controller.js +56 -31
package/dist/mcp/server.d.ts +14 -0
package/dist/mcp/server.js +255 -52
package/dist/observability.js +10 -4
package/dist/sandbox/index.d.ts +2 -0
package/dist/sandbox/index.js +2 -0
package/dist/sandbox/sandbox.d.ts +19 -0
package/dist/sandbox/sandbox.js +140 -0
package/dist/sandbox/views.d.ts +67 -0
package/dist/sandbox/views.js +121 -0
package/dist/skill-cli/index.d.ts +3 -0
package/dist/skill-cli/index.js +3 -0
package/dist/skill-cli/protocol.d.ts +30 -0
package/dist/skill-cli/protocol.js +48 -0
package/dist/skill-cli/server.d.ts +11 -0
package/dist/skill-cli/server.js +85 -0
package/dist/skill-cli/sessions.d.ts +24 -0
package/dist/skill-cli/sessions.js +47 -0
package/dist/skills/index.d.ts +3 -0
package/dist/skills/index.js +3 -0
package/dist/skills/service.d.ts +27 -0
package/dist/skills/service.js +266 -0
package/dist/skills/utils.d.ts +6 -0
package/dist/skills/utils.js +53 -0
package/dist/skills/views.d.ts +40 -0
package/dist/skills/views.js +10 -0
package/dist/sync/auth.js +8 -3
package/dist/sync/service.d.ts +6 -6
package/dist/sync/service.js +54 -89
package/dist/telemetry/views.d.ts +20 -6
package/dist/telemetry/views.js +23 -5
package/dist/tokens/custom-pricing.d.ts +2 -0
package/dist/tokens/custom-pricing.js +22 -0
package/dist/tokens/index.d.ts +2 -0
package/dist/tokens/index.js +2 -0
package/dist/tokens/mappings.d.ts +1 -0
package/dist/tokens/mappings.js +3 -0
package/dist/tokens/service.js +27 -8
package/dist/tools/extraction/index.d.ts +2 -0
package/dist/tools/extraction/index.js +2 -0
package/dist/tools/extraction/schema-utils.d.ts +6 -0
package/dist/tools/extraction/schema-utils.js +237 -0
package/dist/tools/extraction/views.d.ts +7 -0
package/dist/tools/index.d.ts +5 -0
package/dist/tools/index.js +5 -0
package/dist/tools/registry/index.d.ts +2 -0
package/dist/tools/registry/index.js +2 -0
package/dist/tools/registry/service.d.ts +1 -0
package/dist/tools/registry/service.js +1 -0
package/dist/tools/registry/views.d.ts +1 -0
package/dist/tools/registry/views.js +1 -0
package/dist/tools/service.d.ts +2 -0
package/dist/tools/service.js +1 -0
package/dist/tools/utils.d.ts +2 -0
package/dist/tools/utils.js +57 -0
package/dist/tools/views.d.ts +1 -0
package/dist/tools/views.js +1 -0
package/dist/utils.d.ts +10 -1
package/dist/utils.js +70 -3
package/package.json +87 -26
package/dist/dom/playground/process-dom.js +0 -5
package/dist/dom/playground/test-accessibility.d.ts +0 -44
package/dist/dom/playground/test-accessibility.js +0 -111
/package/dist/{dom/playground/process-dom.d.ts → tools/extraction/views.js} +0 -0

package/dist/llm/openai/chat.js CHANGED Viewed

@@ -1,10 +1,10 @@
 import OpenAI from 'openai';
-import { zodToJsonSchema } from 'zod-to-json-schema';
 import { ChatInvokeCompletion } from '../views.js';
 import { OpenAIMessageSerializer } from './serializer.js';
-import { ModelProviderError } from '../exceptions.js';
+import { ModelProviderError, ModelRateLimitError } from '../exceptions.js';
+import { SchemaOptimizer, zodSchemaToJsonSchema } from '../schema.js';
 // Reasoning models that support reasoning_effort parameter
-const ReasoningModels = [
+const DEFAULT_REASONING_MODELS = [
     'o4-mini',
     'o3',
     'o3-mini',
@@ -22,25 +22,43 @@ export class ChatOpenAI {
     temperature;
     frequencyPenalty;
     reasoningEffort;
+    serviceTier;
     maxCompletionTokens;
     seed;
     topP;
     addSchemaToSystemPrompt;
+    dontForceStructuredOutput;
+    removeMinItemsFromSchema;
+    removeDefaultsFromSchema;
+    reasoningModels;
     constructor(options = {}) {
-        const { model = 'gpt-4o', apiKey, organization, baseURL, temperature = 0.2, frequencyPenalty = 0.1, reasoningEffort = 'low', maxCompletionTokens = 8000, maxRetries = 10, seed = null, topP = null, addSchemaToSystemPrompt = false, } = options;
+        const { model = 'gpt-4o', apiKey, organization, project, baseURL, timeout = null, temperature = 0.2, frequencyPenalty = 0.3, reasoningEffort = 'low', serviceTier = null, maxCompletionTokens = 4096, maxRetries = 5, defaultHeaders = null, defaultQuery = null, fetchImplementation, fetchOptions = null, seed = null, topP = null, addSchemaToSystemPrompt = false, dontForceStructuredOutput = false, removeMinItemsFromSchema = false, removeDefaultsFromSchema = false, reasoningModels = DEFAULT_REASONING_MODELS, } = options;
         this.model = model;
         this.temperature = temperature;
         this.frequencyPenalty = frequencyPenalty;
         this.reasoningEffort = reasoningEffort;
+        this.serviceTier = serviceTier;
         this.maxCompletionTokens = maxCompletionTokens;
         this.seed = seed;
         this.topP = topP;
         this.addSchemaToSystemPrompt = addSchemaToSystemPrompt;
+        this.dontForceStructuredOutput = dontForceStructuredOutput;
+        this.removeMinItemsFromSchema = removeMinItemsFromSchema;
+        this.removeDefaultsFromSchema = removeDefaultsFromSchema;
+        this.reasoningModels = reasoningModels
+            ? [...reasoningModels]
+            : reasoningModels;
         this.client = new OpenAI({
             apiKey,
             organization,
+            project,
             baseURL,
+            timeout: timeout ?? undefined,
             maxRetries,
+            defaultHeaders: defaultHeaders ?? undefined,
+            defaultQuery: defaultQuery ?? undefined,
+            fetch: fetchImplementation,
+            fetchOptions: (fetchOptions ?? undefined),
         });
     }
     get name() {
@@ -50,7 +68,7 @@ export class ChatOpenAI {
         return this.model;
     }
     isReasoningModel() {
-        return ReasoningModels.some((m) => this.model.toLowerCase().includes(m.toLowerCase()));
+        return (this.reasoningModels ?? []).some((m) => this.model.toLowerCase().includes(m.toLowerCase()));
     }
     getUsage(response) {
         if (!response.usage)
@@ -96,36 +114,69 @@ export class ChatOpenAI {
         if (this.topP !== null) {
             modelParams.top_p = this.topP;
         }
+        if (this.serviceTier !== null) {
+            modelParams.service_tier = this.serviceTier;
+        }
+        const zodSchemaCandidate = (() => {
+            const output = output_format;
+            if (output &&
+                typeof output === 'object' &&
+                typeof output.safeParse === 'function' &&
+                typeof output.parse === 'function') {
+                return output;
+            }
+            if (output &&
+                typeof output === 'object' &&
+                output.schema &&
+                typeof output.schema.safeParse === 'function' &&
+                typeof output.schema.parse === 'function') {
+                return output.schema;
+            }
+            return null;
+        })();
         let responseFormat = undefined;
-        if (output_format && 'schema' in output_format && output_format.schema) {
-            // Assuming output_format is a Zod schema wrapper or similar that has a schema property
-            // But the interface says { parse: ... }
-            // In the plan, it was passed as a Zod schema directly.
-            // However, the BaseChatModel interface I saw earlier has:
-            // ainvoke<T>(messages: Message[], output_format: { parse: (input: string) => T } | undefined): Promise<ChatInvokeCompletion<T>>;
-            // So I need to handle how to extract the schema if I want to use structured outputs.
-            // If output_format is just a Zod schema, it has a parse method.
-            // Let's assume it's a Zod schema for now, as that's what the plan implies.
-            // We need to cast it to any or check if it's a Zod schema to get the schema for JSON schema generation.
-            // For now, I'll try to use zodToJsonSchema on it if possible.
+        if (zodSchemaCandidate) {
             try {
-                const jsonSchema = zodToJsonSchema(output_format, {
-                    name: 'Response',
+                const rawJsonSchema = zodSchemaToJsonSchema(zodSchemaCandidate, {
+                    name: 'agent_output',
                     target: 'jsonSchema7',
                 });
-                // OpenAI expects a specific format for json_schema
-                responseFormat = {
-                    type: 'json_schema',
-                    json_schema: {
-                        name: 'Response',
-                        schema: jsonSchema,
-                        strict: true,
-                    },
+                const optimizedJsonSchema = SchemaOptimizer.createOptimizedJsonSchema(rawJsonSchema, {
+                    removeMinItems: this.removeMinItemsFromSchema,
+                    removeDefaults: this.removeDefaultsFromSchema,
+                });
+                const responseJsonSchema = {
+                    name: 'agent_output',
+                    schema: optimizedJsonSchema,
+                    strict: true,
                 };
+                if (this.addSchemaToSystemPrompt && openaiMessages.length > 0) {
+                    const firstMessage = openaiMessages[0];
+                    const schemaText = `\n<json_schema>\n` +
+                        `${JSON.stringify(responseJsonSchema, null, 2)}\n` +
+                        `</json_schema>`;
+                    if (firstMessage?.role === 'system') {
+                        if (typeof firstMessage.content === 'string') {
+                            firstMessage.content =
+                                (firstMessage.content ?? '') + schemaText;
+                        }
+                        else if (Array.isArray(firstMessage.content)) {
+                            firstMessage.content = [
+                                ...firstMessage.content,
+                                { type: 'text', text: schemaText },
+                            ];
+                        }
+                    }
+                }
+                if (!this.dontForceStructuredOutput) {
+                    responseFormat = {
+                        type: 'json_schema',
+                        json_schema: responseJsonSchema,
+                    };
+                }
             }
-            catch (e) {
-                // If it's not a Zod schema or fails, we might fallback or just not use response_format
-                console.warn('Failed to convert output_format to JSON schema', e);
+            catch {
+                responseFormat = undefined;
             }
         }
         try {
@@ -137,33 +188,32 @@ export class ChatOpenAI {
             }, options.signal ? { signal: options.signal } : undefined);
             const content = response.choices[0].message.content || '';
             const usage = this.getUsage(response);
+            const stopReason = response.choices[0].finish_reason ?? null;
             let completion = content;
             if (output_format) {
-                try {
-                    // If it's structured output, we need to parse the JSON first
-                    if (responseFormat?.type === 'json_schema') {
-                        const parsedJson = JSON.parse(content);
-                        completion = output_format.parse(parsedJson);
+                if (zodSchemaCandidate) {
+                    const parsedJson = JSON.parse(content);
+                    const output = output_format;
+                    if (output &&
+                        typeof output === 'object' &&
+                        output.schema &&
+                        typeof output.schema.parse === 'function') {
+                        completion = output.schema.parse(parsedJson);
                     }
                     else {
-                        // If it's not structured output but we have a parser (e.g. for simple types or manual parsing)
-                        // But usually for OpenAI we want structured output if a schema is provided.
-                        // If we didn't use json_schema, we might still try to parse if it looks like JSON?
-                        // For now, let's trust the output_format.parse
-                        completion = output_format.parse(content);
+                        completion = output_format.parse(parsedJson);
                     }
                 }
-                catch (e) {
-                    console.error('Failed to parse completion', e);
-                    throw e;
+                else {
+                    completion = output_format.parse(content);
                 }
             }
-            return new ChatInvokeCompletion(completion, usage);
+            return new ChatInvokeCompletion(completion, usage, null, null, stopReason);
         }
         catch (error) {
             // Handle OpenAI-specific errors
             if (error?.status === 429) {
-                throw new ModelProviderError(error?.message ?? 'Rate limit exceeded', 429, this.model);
+                throw new ModelRateLimitError(error?.message ?? 'Rate limit exceeded', 429, this.model);
             }
             if (error?.status >= 500) {
                 throw new ModelProviderError(error?.message ?? 'Server error', error.status, this.model);

package/dist/llm/openai/like.d.ts CHANGED Viewed

@@ -1,4 +1,4 @@
-import { ChatOpenAI } from './chat.js';
+import { ChatOpenAI, type ChatOpenAIOptions } from './chat.js';
 /**
  * A class to interact with any provider using the OpenAI API schema.
  *
@@ -11,7 +11,9 @@ import { ChatOpenAI } from './chat.js';
  */
 export declare class ChatOpenAILike extends ChatOpenAI {
     /**
-     * @param model - The name of the model to use (any OpenAI-compatible model)
+     * @param options - A model name or ChatOpenAI-compatible options
      */
-    constructor(model: string);
+    constructor(options: string | (ChatOpenAIOptions & {
+        model: string;
+    }));
 }

package/dist/llm/openai/like.js CHANGED Viewed

@@ -11,9 +11,13 @@ import { ChatOpenAI } from './chat.js';
  */
 export class ChatOpenAILike extends ChatOpenAI {
     /**
-     * @param model - The name of the model to use (any OpenAI-compatible model)
+     * @param options - A model name or ChatOpenAI-compatible options
      */
-    constructor(model) {
-        super({ model });
+    constructor(options) {
+        if (typeof options === 'string') {
+            super({ model: options });
+            return;
+        }
+        super(options);
     }
 }

package/dist/llm/openai/responses-serializer.d.ts ADDED Viewed

@@ -0,0 +1,18 @@
+import { type Message } from '../messages.js';
+type ResponsesInputPart = {
+    type: 'input_text';
+    text: string;
+} | {
+    type: 'input_image';
+    image_url: string;
+    detail?: 'auto' | 'low' | 'high';
+};
+export type ResponsesInputMessage = {
+    role: 'user' | 'system' | 'assistant';
+    content: string | ResponsesInputPart[];
+};
+export declare class ResponsesAPIMessageSerializer {
+    serialize(messages: Message[]): ResponsesInputMessage[];
+    private serializeMessage;
+}
+export {};

package/dist/llm/openai/responses-serializer.js ADDED Viewed

@@ -0,0 +1,72 @@
+import { AssistantMessage, ContentPartImageParam, ContentPartRefusalParam, ContentPartTextParam, SystemMessage, UserMessage, } from '../messages.js';
+export class ResponsesAPIMessageSerializer {
+    serialize(messages) {
+        return messages.map((message) => this.serializeMessage(message));
+    }
+    serializeMessage(message) {
+        if (message instanceof UserMessage) {
+            if (typeof message.content === 'string') {
+                return { role: 'user', content: message.content };
+            }
+            const content = message.content
+                .map((part) => {
+                if (part instanceof ContentPartTextParam) {
+                    return { type: 'input_text', text: part.text };
+                }
+                if (part instanceof ContentPartImageParam) {
+                    return {
+                        type: 'input_image',
+                        image_url: part.image_url.url,
+                        detail: part.image_url.detail,
+                    };
+                }
+                return null;
+            })
+                .filter((part) => part !== null);
+            return { role: 'user', content };
+        }
+        if (message instanceof SystemMessage) {
+            if (typeof message.content === 'string') {
+                return { role: 'system', content: message.content };
+            }
+            return {
+                role: 'system',
+                content: message.content.map((part) => ({
+                    type: 'input_text',
+                    text: part.text,
+                })),
+            };
+        }
+        if (message instanceof AssistantMessage) {
+            if (message.content == null) {
+                if (Array.isArray(message.tool_calls) &&
+                    message.tool_calls.length > 0) {
+                    const toolCallText = message.tool_calls
+                        .map((toolCall) => `[Tool call: ${toolCall.functionCall.name}(${toolCall.functionCall.arguments})]`)
+                        .join('\n');
+                    return { role: 'assistant', content: toolCallText };
+                }
+                return { role: 'assistant', content: '' };
+            }
+            if (typeof message.content === 'string') {
+                return { role: 'assistant', content: message.content };
+            }
+            const content = message.content
+                .map((part) => {
+                if (part instanceof ContentPartTextParam) {
+                    return { type: 'input_text', text: part.text };
+                }
+                if (part instanceof ContentPartRefusalParam) {
+                    return {
+                        type: 'input_text',
+                        text: `[Refusal: ${part.refusal}]`,
+                    };
+                }
+                return null;
+            })
+                .filter((part) => part !== null);
+            return { role: 'assistant', content };
+        }
+        throw new Error(`Unknown message type: ${message?.constructor?.name ?? typeof message}`);
+    }
+}

package/dist/llm/openrouter/chat.d.ts CHANGED Viewed

@@ -1,13 +1,39 @@
 import type { BaseChatModel, ChatInvokeOptions } from '../base.js';
-import { ChatInvokeCompletion } from '../views.js';
 import type { Message } from '../messages.js';
+import { ChatInvokeCompletion } from '../views.js';
+export interface ChatOpenRouterOptions {
+    model?: string;
+    apiKey?: string;
+    baseURL?: string;
+    timeout?: number | null;
+    temperature?: number | null;
+    topP?: number | null;
+    seed?: number | null;
+    maxRetries?: number;
+    defaultHeaders?: Record<string, string> | null;
+    defaultQuery?: Record<string, string | undefined> | null;
+    fetchImplementation?: typeof fetch;
+    fetchOptions?: RequestInit | null;
+    httpReferer?: string | null;
+    extraBody?: Record<string, unknown> | null;
+    removeMinItemsFromSchema?: boolean;
+    removeDefaultsFromSchema?: boolean;
+}
 export declare class ChatOpenRouter implements BaseChatModel {
     model: string;
     provider: string;
     private client;
-    constructor(model?: string);
+    private temperature;
+    private topP;
+    private seed;
+    private httpReferer;
+    private extraBody;
+    private removeMinItemsFromSchema;
+    private removeDefaultsFromSchema;
+    constructor(options?: string | ChatOpenRouterOptions);
     get name(): string;
     get model_name(): string;
+    private getUsage;
     ainvoke(messages: Message[], output_format?: undefined, options?: ChatInvokeOptions): Promise<ChatInvokeCompletion<string>>;
     ainvoke<T>(messages: Message[], output_format: {
         parse: (input: string) => T;

package/dist/llm/openrouter/chat.js CHANGED Viewed

@@ -1,16 +1,39 @@
 import OpenAI from 'openai';
-import { zodToJsonSchema } from 'zod-to-json-schema';
+import { ModelProviderError } from '../exceptions.js';
+import { SchemaOptimizer, zodSchemaToJsonSchema } from '../schema.js';
 import { ChatInvokeCompletion } from '../views.js';
 import { OpenRouterMessageSerializer } from './serializer.js';
 export class ChatOpenRouter {
     model;
     provider = 'openrouter';
     client;
-    constructor(model = 'openai/gpt-4o') {
+    temperature;
+    topP;
+    seed;
+    httpReferer;
+    extraBody;
+    removeMinItemsFromSchema;
+    removeDefaultsFromSchema;
+    constructor(options = {}) {
+        const normalizedOptions = typeof options === 'string' ? { model: options } : options;
+        const { model = 'openai/gpt-4o', apiKey = process.env.OPENROUTER_API_KEY, baseURL = 'https://openrouter.ai/api/v1', timeout = null, temperature = null, topP = null, seed = null, maxRetries = 10, defaultHeaders = null, defaultQuery = null, fetchImplementation, fetchOptions = null, httpReferer = null, extraBody = null, removeMinItemsFromSchema = false, removeDefaultsFromSchema = false, } = normalizedOptions;
         this.model = model;
+        this.temperature = temperature;
+        this.topP = topP;
+        this.seed = seed;
+        this.httpReferer = httpReferer;
+        this.extraBody = extraBody;
+        this.removeMinItemsFromSchema = removeMinItemsFromSchema;
+        this.removeDefaultsFromSchema = removeDefaultsFromSchema;
         this.client = new OpenAI({
-            apiKey: process.env.OPENROUTER_API_KEY,
-            baseURL: 'https://openrouter.ai/api/v1',
+            apiKey,
+            baseURL,
+            timeout: timeout ?? undefined,
+            maxRetries,
+            defaultHeaders: defaultHeaders ?? undefined,
+            defaultQuery: defaultQuery ?? undefined,
+            fetch: fetchImplementation,
+            fetchOptions: (fetchOptions ?? undefined),
         });
     }
     get name() {
@@ -19,56 +42,119 @@ export class ChatOpenRouter {
     get model_name() {
         return this.model;
     }
+    getUsage(response) {
+        if (!response.usage) {
+            return null;
+        }
+        return {
+            prompt_tokens: response.usage.prompt_tokens,
+            prompt_cached_tokens: response.usage.prompt_tokens_details?.cached_tokens ?? null,
+            prompt_cache_creation_tokens: null,
+            prompt_image_tokens: null,
+            completion_tokens: response.usage.completion_tokens,
+            total_tokens: response.usage.total_tokens,
+        };
+    }
     async ainvoke(messages, output_format, options = {}) {
         const serializer = new OpenRouterMessageSerializer();
         const openRouterMessages = serializer.serialize(messages);
+        const modelParams = {};
+        if (this.temperature !== null) {
+            modelParams.temperature = this.temperature;
+        }
+        if (this.topP !== null) {
+            modelParams.top_p = this.topP;
+        }
+        if (this.seed !== null) {
+            modelParams.seed = this.seed;
+        }
+        const zodSchemaCandidate = (() => {
+            const output = output_format;
+            if (output &&
+                typeof output === 'object' &&
+                typeof output.safeParse === 'function' &&
+                typeof output.parse === 'function') {
+                return output;
+            }
+            if (output &&
+                typeof output === 'object' &&
+                output.schema &&
+                typeof output.schema.safeParse === 'function' &&
+                typeof output.schema.parse === 'function') {
+                return output.schema;
+            }
+            return null;
+        })();
         let responseFormat = undefined;
-        if (output_format && 'schema' in output_format && output_format.schema) {
-            // OpenRouter supports structured outputs for some models, but it depends on the underlying provider.
-            // We'll try to use json_schema if possible, or json_object.
+        if (zodSchemaCandidate) {
             try {
-                const jsonSchema = zodToJsonSchema(output_format, {
-                    name: 'Response',
+                const rawJsonSchema = zodSchemaToJsonSchema(zodSchemaCandidate, {
+                    name: 'agent_output',
                     target: 'jsonSchema7',
                 });
+                const optimizedJsonSchema = SchemaOptimizer.createOptimizedJsonSchema(rawJsonSchema, {
+                    removeMinItems: this.removeMinItemsFromSchema,
+                    removeDefaults: this.removeDefaultsFromSchema,
+                });
                 responseFormat = {
                     type: 'json_schema',
                     json_schema: {
-                        name: 'Response',
-                        schema: jsonSchema,
+                        name: 'agent_output',
+                        schema: optimizedJsonSchema,
                         strict: true,
                     },
                 };
             }
-            catch (e) {
-                console.warn('Failed to convert output_format to JSON schema for OpenRouter', e);
+            catch {
+                responseFormat = undefined;
             }
         }
-        const response = await this.client.chat.completions.create({
+        const request = {
             model: this.model,
             messages: openRouterMessages,
             response_format: responseFormat,
-        }, options.signal ? { signal: options.signal } : undefined);
-        const content = response.choices[0].message.content || '';
-        let completion = content;
-        if (output_format) {
-            try {
-                if (responseFormat?.type === 'json_schema') {
-                    completion = output_format.parse(JSON.parse(content));
+            ...modelParams,
+            ...(this.extraBody ?? {}),
+        };
+        if (this.httpReferer) {
+            request.extra_headers = {
+                'HTTP-Referer': this.httpReferer,
+            };
+        }
+        try {
+            const response = await this.client.chat.completions.create(request, options.signal ? { signal: options.signal } : undefined);
+            const content = response.choices[0].message.content || '';
+            const usage = this.getUsage(response);
+            const stopReason = response.choices[0].finish_reason ?? null;
+            let completion = content;
+            if (output_format) {
+                if (zodSchemaCandidate) {
+                    const parsedJson = JSON.parse(content);
+                    const output = output_format;
+                    if (output &&
+                        typeof output === 'object' &&
+                        output.schema &&
+                        typeof output.schema.parse === 'function') {
+                        completion = output.schema.parse(parsedJson);
+                    }
+                    else {
+                        completion = output_format.parse(parsedJson);
+                    }
                 }
                 else {
                     completion = output_format.parse(content);
                 }
             }
-            catch (e) {
-                console.error('Failed to parse completion', e);
-                throw e;
+            return new ChatInvokeCompletion(completion, usage, null, null, stopReason);
+        }
+        catch (error) {
+            if (error?.status === 429) {
+                throw new ModelProviderError(error?.message ?? 'Rate limit exceeded', 429, this.model);
+            }
+            if (error?.status >= 500) {
+                throw new ModelProviderError(error?.message ?? 'Server error', error.status, this.model);
             }
+            throw new ModelProviderError(error?.message ?? String(error), error?.status ?? 500, this.model);
         }
-        return new ChatInvokeCompletion(completion, {
-            prompt_tokens: response.usage?.prompt_tokens ?? 0,
-            completion_tokens: response.usage?.completion_tokens ?? 0,
-            total_tokens: response.usage?.total_tokens ?? 0,
-        });
     }
 }

package/dist/llm/schema.d.ts CHANGED Viewed

@@ -1,6 +1,16 @@
 type JsonSchema = Record<string, unknown>;
+interface ZodJsonSchemaOptions {
+    name?: string;
+    target?: string;
+    [key: string]: unknown;
+}
+export declare const zodSchemaToJsonSchema: (schema: unknown, options?: ZodJsonSchemaOptions) => JsonSchema;
 export declare class SchemaOptimizer {
-    static createOptimizedJsonSchema(schema: JsonSchema): JsonSchema;
+    static createOptimizedJsonSchema(schema: JsonSchema, options?: {
+        removeMinItems?: boolean;
+        removeDefaults?: boolean;
+    }): JsonSchema;
+    static createGeminiOptimizedSchema(schema: JsonSchema): JsonSchema;
     static makeStrictCompatible(schema: any): void;
 }
 export {};