npm - universal-llm-client - Versions diffs - 4.5.0 → 4.5.1 - Mend

universal-llm-client 4.5.0 → 4.5.1

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (174) hide show

package/CHANGELOG.md +12 -0
package/README.md +2 -0
package/dist/ai-model.d.ts +0 -1
package/dist/ai-model.js +0 -1
package/dist/auditor.d.ts +0 -1
package/dist/auditor.js +0 -1
package/dist/client.d.ts +0 -1
package/dist/client.js +0 -1
package/dist/gemma-channel.d.ts +0 -1
package/dist/gemma-channel.js +0 -1
package/dist/gemma-diffusion.d.ts +0 -1
package/dist/gemma-diffusion.js +0 -1
package/dist/http.d.ts +0 -1
package/dist/http.js +0 -1
package/dist/index.d.ts +0 -1
package/dist/index.js +0 -1
package/dist/interfaces.d.ts +0 -1
package/dist/interfaces.js +0 -1
package/dist/mcp.d.ts +0 -1
package/dist/mcp.js +0 -1
package/dist/providers/anthropic.d.ts +0 -1
package/dist/providers/anthropic.js +0 -1
package/dist/providers/google.d.ts +0 -1
package/dist/providers/google.js +0 -1
package/dist/providers/index.d.ts +0 -1
package/dist/providers/index.js +0 -1
package/dist/providers/ollama.d.ts +0 -1
package/dist/providers/ollama.js +0 -1
package/dist/providers/openai.d.ts +2 -1
package/dist/providers/openai.js +303 -74
package/dist/router.d.ts +0 -1
package/dist/router.js +0 -1
package/dist/stream-decoder.d.ts +0 -1
package/dist/stream-decoder.js +0 -1
package/dist/structured-output.d.ts +0 -1
package/dist/structured-output.js +0 -1
package/dist/thinking.d.ts +0 -1
package/dist/thinking.js +0 -1
package/dist/tools.d.ts +0 -1
package/dist/tools.js +0 -1
package/dist/zod-adapter.d.ts +0 -1
package/dist/zod-adapter.js +0 -1
package/package.json +1 -2
package/dist/ai-model.d.ts.map +0 -1
package/dist/ai-model.js.map +0 -1
package/dist/auditor.d.ts.map +0 -1
package/dist/auditor.js.map +0 -1
package/dist/client.d.ts.map +0 -1
package/dist/client.js.map +0 -1
package/dist/gemma-channel.d.ts.map +0 -1
package/dist/gemma-channel.js.map +0 -1
package/dist/gemma-diffusion.d.ts.map +0 -1
package/dist/gemma-diffusion.js.map +0 -1
package/dist/http.d.ts.map +0 -1
package/dist/http.js.map +0 -1
package/dist/index.d.ts.map +0 -1
package/dist/index.js.map +0 -1
package/dist/interfaces.d.ts.map +0 -1
package/dist/interfaces.js.map +0 -1
package/dist/mcp.d.ts.map +0 -1
package/dist/mcp.js.map +0 -1
package/dist/providers/anthropic.d.ts.map +0 -1
package/dist/providers/anthropic.js.map +0 -1
package/dist/providers/google.d.ts.map +0 -1
package/dist/providers/google.js.map +0 -1
package/dist/providers/index.d.ts.map +0 -1
package/dist/providers/index.js.map +0 -1
package/dist/providers/ollama.d.ts.map +0 -1
package/dist/providers/ollama.js.map +0 -1
package/dist/providers/openai.d.ts.map +0 -1
package/dist/providers/openai.js.map +0 -1
package/dist/router.d.ts.map +0 -1
package/dist/router.js.map +0 -1
package/dist/stream-decoder.d.ts.map +0 -1
package/dist/stream-decoder.js.map +0 -1
package/dist/structured-output.d.ts.map +0 -1
package/dist/structured-output.js.map +0 -1
package/dist/thinking.d.ts.map +0 -1
package/dist/thinking.js.map +0 -1
package/dist/tools.d.ts.map +0 -1
package/dist/tools.js.map +0 -1
package/dist/zod-adapter.d.ts.map +0 -1
package/dist/zod-adapter.js.map +0 -1
package/src/ai-model.ts +0 -400
package/src/auditor.ts +0 -213
package/src/client.ts +0 -402
package/src/debug/debug-google-streaming.ts +0 -97
package/src/debug/debug-tool-execution.ts +0 -86
package/src/debug/test-lmstudio-tools.ts +0 -155
package/src/demos/README.md +0 -47
package/src/demos/basic/universal-llm-examples.ts +0 -161
package/src/demos/diffusion-gemma/.env +0 -29
package/src/demos/diffusion-gemma/.env.example +0 -27
package/src/demos/diffusion-gemma/CLAUDE.md +0 -95
package/src/demos/diffusion-gemma/README.md +0 -59
package/src/demos/diffusion-gemma/canvas.ts +0 -1606
package/src/demos/diffusion-gemma/docker-compose.yml +0 -29
package/src/demos/diffusion-gemma/probe-stream.ts +0 -51
package/src/demos/diffusion-gemma/probe-tools.ts +0 -55
package/src/demos/diffusion-gemma/server.ts +0 -1205
package/src/demos/diffusion-gemma/start-vllm.sh +0 -98
package/src/demos/mcp/astrid-memory-demo.ts +0 -295
package/src/demos/mcp/astrid-persona-memory.ts +0 -357
package/src/demos/mcp/mcp-mongodb-demo.ts +0 -275
package/src/demos/mcp/simple-astrid-memory.ts +0 -148
package/src/demos/mcp/simple-mcp-demo.ts +0 -68
package/src/demos/mcp/working-mcp-demo.ts +0 -62
package/src/demos/model-alias-demo.ts +0 -0
package/src/demos/tools/RAG_MEMORY_INTEGRATION.md +0 -267
package/src/demos/tools/astrid-memory-demo.ts +0 -270
package/src/demos/tools/astrid-production-memory-clean.ts +0 -785
package/src/demos/tools/astrid-production-memory.ts +0 -558
package/src/demos/tools/basic-translation-test.ts +0 -66
package/src/demos/tools/chromadb-similarity-tuning.ts +0 -390
package/src/demos/tools/clean-multilingual-conversation.ts +0 -209
package/src/demos/tools/clean-translation-test.ts +0 -119
package/src/demos/tools/clean-universal-multilingual-test.ts +0 -131
package/src/demos/tools/complete-rag-demo.ts +0 -369
package/src/demos/tools/complete-tool-demo.ts +0 -132
package/src/demos/tools/demo-tool-calling.ts +0 -124
package/src/demos/tools/dynamic-language-switching-test.ts +0 -251
package/src/demos/tools/hybrid-thinking-test.ts +0 -154
package/src/demos/tools/memory-integration-test.ts +0 -420
package/src/demos/tools/multilingual-memory-system.ts +0 -802
package/src/demos/tools/ondemand-translation-demo.ts +0 -655
package/src/demos/tools/production-tool-demo.ts +0 -245
package/src/demos/tools/revolutionary-multilingual-test.ts +0 -151
package/src/demos/tools/rigorous-language-analysis.ts +0 -218
package/src/demos/tools/test-universal-memory-system.ts +0 -126
package/src/demos/tools/translation-integration-guide.ts +0 -346
package/src/demos/tools/universal-memory-system.ts +0 -560
package/src/gemma-channel.ts +0 -47
package/src/gemma-diffusion.ts +0 -167
package/src/http.ts +0 -261
package/src/index.ts +0 -180
package/src/interfaces.ts +0 -843
package/src/mcp.ts +0 -345
package/src/providers/anthropic.ts +0 -796
package/src/providers/google.ts +0 -840
package/src/providers/index.ts +0 -8
package/src/providers/ollama.ts +0 -503
package/src/providers/openai.ts +0 -587
package/src/router.ts +0 -785
package/src/stream-decoder.ts +0 -535
package/src/structured-output.ts +0 -759
package/src/test-scripts/test-advanced-tools.ts +0 -310
package/src/test-scripts/test-google-deep-research.ts +0 -33
package/src/test-scripts/test-google-streaming-enhanced.ts +0 -147
package/src/test-scripts/test-google-streaming.ts +0 -63
package/src/test-scripts/test-google-system-prompt-comprehensive.ts +0 -189
package/src/test-scripts/test-google-thinking.ts +0 -46
package/src/test-scripts/test-mcp-config.ts +0 -28
package/src/test-scripts/test-mcp-connection.ts +0 -29
package/src/test-scripts/test-system-message-positions.ts +0 -163
package/src/test-scripts/test-system-prompt-improvement-demo.ts +0 -83
package/src/test-scripts/test-tool-calling.ts +0 -231
package/src/test-scripts/test-vllm-qwen36.ts +0 -256
package/src/tests/ai-model.test.ts +0 -1614
package/src/tests/auditor.test.ts +0 -224
package/src/tests/gemma-diffusion.test.ts +0 -115
package/src/tests/http.test.ts +0 -200
package/src/tests/interfaces.test.ts +0 -117
package/src/tests/providers/anthropic.test.ts +0 -118
package/src/tests/providers/google.test.ts +0 -841
package/src/tests/providers/ollama.test.ts +0 -1034
package/src/tests/providers/openai.test.ts +0 -1511
package/src/tests/router.test.ts +0 -254
package/src/tests/stream-decoder.test.ts +0 -263
package/src/tests/structured-output.test.ts +0 -1450
package/src/tests/thinking.test.ts +0 -65
package/src/tests/tools.test.ts +0 -175
package/src/thinking.ts +0 -73
package/src/tools.ts +0 -246
package/src/zod-adapter.ts +0 -72

package/src/providers/openai.ts DELETED Viewed

@@ -1,587 +0,0 @@
-/**
- * Universal LLM Client v3 — OpenAI-Compatible Provider
- *
- * Implements BaseLLMClient for OpenAI-compatible APIs.
- * Works with: OpenAI, OpenRouter, LM Studio, LlamaCpp, vLLM, Groq, Together.
- */
-import { BaseLLMClient } from '../client.js';
-import { resolveThinking, isOpenAIReasoningModel } from '../thinking.js';
-import { httpRequest, httpStream, parseSSE, buildHeaders } from '../http.js';
-import { StandardChatDecoder } from '../stream-decoder.js';
-import {
-    normalizeJsonSchema,
-    getJsonSchemaFromConfig,
-    type JSONSchema,
-    type StructuredOutputOptions,
-} from '../structured-output.js';
-import type {
-    LLMClientOptions,
-    LLMChatMessage,
-    LLMChatResponse,
-    ChatOptions,
-    OpenAIResponse,
-    OpenAIModelInfo,
-    LLMToolCall,
-    TokenUsageInfo,
-} from '../interfaces.js';
-import type { DecodedEvent } from '../stream-decoder.js';
-import type { Auditor } from '../auditor.js';
-import { isGemmaDiffusionModel, parseGemmaDiffusionOutput } from '../gemma-diffusion.js';
-export class OpenAICompatibleClient extends BaseLLMClient {
-    /**
-     * DiffusionGemma on trimmed vLLM builds has no server-side reasoning or
-     * tool-call parser — the native channel protocol is handled client-side
-     * (see gemma-diffusion.ts). Auto-detected from the model name; override
-     * with `gemmaNativeProtocol` in LLMClientOptions.
-     */
-    private get gemmaNative(): boolean {
-        return this.options.gemmaNativeProtocol ?? isGemmaDiffusionModel(this.options.model);
-    }
-    /**
-     * Build a full endpoint URL, respecting apiBasePath (already baked into this.options.url)
-     * and any queryParams provided at the provider config level.
-     */
-    private buildUrl(suffix: string): string {
-        const raw = this.options.url.replace(/\/+$/, '');
-        // Split off any query string already on the configured base URL so the
-        // path is inserted before it (avoids `host/v1?k=v/chat/completions`).
-        const qIdx = raw.indexOf('?');
-        const basePath = (qIdx === -1 ? raw : raw.slice(0, qIdx)).replace(/\/+$/, '');
-        const existingQuery = qIdx === -1 ? '' : raw.slice(qIdx + 1);
-        const path = suffix.startsWith('/') ? suffix : '/' + suffix;
-        const search = new URLSearchParams(existingQuery);
-        const qp = this.options.queryParams;
-        if (qp) {
-            for (const [k, v] of Object.entries(qp)) {
-                if (v != null) search.set(k, String(v));
-            }
-        }
-        const qs = search.toString();
-        return basePath + path + (qs ? `?${qs}` : '');
-    }
-    constructor(options: LLMClientOptions, auditor?: Auditor) {
-        let base = (options.url || 'https://api.openai.com').replace(/\/+$/, '');
-        // Respect apiBasePath (from ProviderConfig.apiBasePath). Default "/v1" for broad compatibility.
-        // Set apiBasePath: '' (or '/') when you are supplying a *complete* path already
-        // (e.g. full Azure ".../deployments/my-model" URL) or for non-/v1 OpenAI-compatible servers.
-        const desired = options.apiBasePath;
-        const shouldAppend = desired !== '' && desired !== '/';
-        if (shouldAppend) {
-            // Normalize to exactly one leading slash and no trailing slash
-            // (so 'v1', '/v1', '//v1' and '/v1/' all become '/v1').
-            const basePath = ('/' + (desired || '/v1').replace(/^\/+/, '')).replace(/\/+$/, '');
-            if (!base.endsWith(basePath)) {
-                base += basePath;
-            }
-        }
-        super({ ...options, url: base }, auditor);
-    }
-    // ========================================================================
-    // Chat
-    // ========================================================================
-    async chat(
-        messages: LLMChatMessage[],
-        options?: ChatOptions,
-    ): Promise<LLMChatResponse> {
-        // Structured output and tools can now be used together.\n        // The provider sends both response_format and tools in the request.\n        // The Router handles skipping validation when the response contains tool calls.
-        const url = this.buildUrl('/chat/completions');
-        const tools = options?.tools ?? (Object.keys(this.toolRegistry).length > 0 ? this.getToolDefinitions() : undefined);
-        const body: Record<string, unknown> = {
-            model: this.options.model,
-            messages: this.convertMessages(messages),
-            ...this.buildRequestParams(options),
-        };
-        // Handle structured output
-        const schemaOptions = this.extractSchemaOptions(options);
-        if (schemaOptions) {
-            body['response_format'] = this.buildResponseFormat(schemaOptions);
-        } else if (options?.responseFormat) {
-            body['response_format'] = options.responseFormat;
-        }
-        if (tools?.length) {
-            body['tools'] = tools;
-            if (options?.toolChoice) {
-                body['tool_choice'] = options.toolChoice;
-            }
-        }
-        if (this.gemmaNative) {
-            // Markers must survive decoding for client-side parsing,
-            // and request-level tool parsing is unavailable server-side.
-            body['skip_special_tokens'] = false;
-            if (tools?.length) body['tool_choice'] = 'none';
-        }
-        const start = Date.now();
-        this.auditor.record({
-            timestamp: start,
-            type: 'request',
-            provider: 'openai',
-            model: this.options.model,
-        });
-        const response = await httpRequest<OpenAIResponse>(url, {
-            method: 'POST',
-            headers: buildHeaders(this.options),
-            body,
-            timeout: this.options.timeout ?? 30000,
-        });
-        const data = response.data;
-        const choice = data.choices[0];
-        if (!choice) {
-            throw new Error('No choices returned from OpenAI API');
-        }
-        // vLLM / OpenAI-compatible `usage` carries no timing, so derive decode
-        // throughput from the client-measured wall-clock duration.
-        const durationMs = Date.now() - start;
-        const usage: TokenUsageInfo | undefined = data.usage
-            ? {
-                inputTokens: data.usage.prompt_tokens,
-                outputTokens: data.usage.completion_tokens,
-                totalTokens: data.usage.total_tokens,
-                cachedTokens: data.usage.prompt_tokens_details?.cached_tokens,
-                durationMs,
-                tokensPerSecond: durationMs > 0
-                    ? data.usage.completion_tokens / (durationMs / 1000)
-                    : undefined,
-            }
-            : undefined;
-        // Normalize tool calls (ensure IDs and JSON-parseable empty args exist).
-        let toolCalls = choice.message.tool_calls?.map(tc => this.normalizeToolCall(tc));
-        // Get content, handling null case
-        let content = choice.message.content || '';
-        let reasoning: string | undefined;
-        // Reasoning models served over the OpenAI-compatible API (vLLM
-        // `--reasoning-parser`, DeepSeek-R1, etc.) return the chain-of-thought
-        // in a dedicated field instead of inline <think> tags. vLLM uses
-        // `reasoning_content`; some gateways use `reasoning`.
-        const serverReasoning = choice.message.reasoning ?? choice.message.reasoning_content;
-        if (typeof serverReasoning === 'string' && serverReasoning.length > 0) {
-            reasoning = serverReasoning;
-        }
-        if (this.gemmaNative && content) {
-            const parsed = parseGemmaDiffusionOutput(content);
-            content = parsed.content;
-            if (parsed.reasoning) reasoning = parsed.reasoning;
-            if (!toolCalls?.length && parsed.toolCalls.length) {
-                toolCalls = parsed.toolCalls.map(tc => ({
-                    id: this.generateToolCallId(),
-                    type: 'function' as const,
-                    function: { name: tc.name, arguments: tc.argumentsJson },
-                }));
-            }
-        }
-        const result: LLMChatResponse = {
-            message: {
-                role: 'assistant',
-                content,
-                tool_calls: toolCalls,
-            },
-            ...(reasoning !== undefined && { reasoning }),
-            usage,
-            provider: 'openai',
-        };
-        this.auditor.record({
-            timestamp: Date.now(),
-            type: 'response',
-            provider: 'openai',
-            model: this.options.model,
-            duration: Date.now() - start,
-            usage,
-        });
-        return result;
-    }
-    // ========================================================================
-    // Streaming
-    // ========================================================================
-    async *chatStream(
-        messages: LLMChatMessage[],
-        options?: ChatOptions,
-    ): AsyncGenerator<DecodedEvent, LLMChatResponse | void, unknown> {
-        const url = this.buildUrl('/chat/completions');
-        const tools = options?.tools ?? (Object.keys(this.toolRegistry).length > 0 ? this.getToolDefinitions() : undefined);
-        const body: Record<string, unknown> = {
-            model: this.options.model,
-            messages: this.convertMessages(messages),
-            stream: true,
-            ...this.buildRequestParams(options),
-        };
-        if (tools?.length) {
-            body['tools'] = tools;
-            if (options?.toolChoice) {
-                body['tool_choice'] = options.toolChoice;
-            }
-        }
-        if (this.gemmaNative) {
-            body['skip_special_tokens'] = false;
-            if (tools?.length) body['tool_choice'] = 'none';
-        }
-        const start = Date.now();
-        this.auditor.record({
-            timestamp: start,
-            type: 'stream_start',
-            provider: 'openai',
-            model: this.options.model,
-        });
-        // In gemma-native mode the decoder classifies thought-channel content,
-        // so we yield ITS events (thinking vs text) instead of the raw deltas.
-        const decoderEvents: DecodedEvent[] = [];
-        const decoder = new StandardChatDecoder(
-            this.gemmaNative ? e => decoderEvents.push(e) : () => {},
-        );
-        // Track accumulated tool calls across chunks
-        const toolCallAccum: Map<number, {
-            id: string;
-            type: 'function';
-            function: { name: string; arguments: string };
-        }> = new Map();
-        const stream = httpStream(url, {
-            method: 'POST',
-            headers: buildHeaders(this.options),
-            body,
-            timeout: this.options.timeout ?? 120000,
-        });
-        let usage: TokenUsageInfo | undefined;
-        // Accumulates reasoning deltas from servers that stream a dedicated
-        // `reasoning` / `reasoning_content` field (vLLM, DeepSeek-R1, etc.).
-        let reasoningBuffer = '';
-        for await (const { data } of parseSSE(stream)) {
-            try {
-                const parsed = JSON.parse(data) as {
-                    choices?: Array<{
-                        delta?: {
-                            content?: string;
-                            // Reasoning-model chain-of-thought deltas (vLLM
-                            // `--reasoning-parser`, DeepSeek-R1, etc.).
-                            reasoning?: string;
-                            reasoning_content?: string;
-                            tool_calls?: Array<{
-                                index: number;
-                                id?: string;
-                                type?: string;
-                                function?: { name?: string; arguments?: string };
-                            }>;
-                        };
-                        finish_reason?: string;
-                    }>;
-                    usage?: {
-                        prompt_tokens: number;
-                        completion_tokens: number;
-                        total_tokens: number;
-                        prompt_tokens_details?: {
-                            cached_tokens?: number;
-                        };
-                    };
-                };
-                if (parsed.usage) {
-                    usage = {
-                        inputTokens: parsed.usage.prompt_tokens,
-                        outputTokens: parsed.usage.completion_tokens,
-                        totalTokens: parsed.usage.total_tokens,
-                        cachedTokens: parsed.usage.prompt_tokens_details?.cached_tokens,
-                    };
-                }
-                const delta = parsed.choices?.[0]?.delta;
-                if (!delta) continue;
-                // Surface server-side reasoning deltas as thinking events.
-                const reasoningDelta = delta.reasoning ?? delta.reasoning_content;
-                if (reasoningDelta) {
-                    reasoningBuffer += reasoningDelta;
-                    yield { type: 'thinking', content: reasoningDelta };
-                }
-                if (delta.content) {
-                    decoder.push(delta.content);
-                    if (this.gemmaNative) {
-                        while (decoderEvents.length) yield decoderEvents.shift()!;
-                    } else {
-                        yield { type: 'text', content: delta.content };
-                    }
-                }
-                // Accumulate streamed tool calls
-                if (delta.tool_calls) {
-                    for (const tc of delta.tool_calls) {
-                        const existing = toolCallAccum.get(tc.index);
-                        if (!existing) {
-                            toolCallAccum.set(tc.index, {
-                                id: tc.id || this.generateToolCallId(),
-                                type: 'function',
-                                function: {
-                                    name: tc.function?.name || '',
-                                    arguments: tc.function?.arguments || '',
-                                },
-                            });
-                        } else {
-                            if (tc.function?.arguments) {
-                                existing.function.arguments += tc.function.arguments;
-                            }
-                            if (tc.function?.name) {
-                                existing.function.name += tc.function.name;
-                            }
-                        }
-                    }
-                }
-                // Emit tool calls when stream finishes
-                if (parsed.choices?.[0]?.finish_reason === 'tool_calls' || parsed.choices?.[0]?.finish_reason === 'stop') {
-                    if (toolCallAccum.size > 0) {
-                        const calls = Array.from(toolCallAccum.values())
-                            .map(tc => this.normalizeToolCall(tc));
-                        yield { type: 'tool_call', calls };
-                    }
-                }
-            } catch {
-                // Skip unparseable SSE data
-            }
-        }
-        decoder.flush();
-        if (this.gemmaNative) {
-            while (decoderEvents.length) yield decoderEvents.shift()!;
-        }
-        // Augment usage with client-measured timing (vLLM streams no timing).
-        if (usage) {
-            const durationMs = Date.now() - start;
-            usage = {
-                ...usage,
-                durationMs,
-                tokensPerSecond: durationMs > 0
-                    ? usage.outputTokens / (durationMs / 1000)
-                    : undefined,
-            };
-        }
-        this.auditor.record({
-            timestamp: Date.now(),
-            type: 'stream_end',
-            provider: 'openai',
-            model: this.options.model,
-            duration: Date.now() - start,
-            usage,
-        });
-        let finalToolCalls = toolCallAccum.size > 0
-            ? Array.from(toolCallAccum.values()).map(tc => this.normalizeToolCall(tc))
-            : undefined;
-        let cleanContent = decoder.getCleanContent();
-        // Prefer the server's dedicated reasoning field; fall back to <think>
-        // tags parsed from the content stream by the decoder.
-        let reasoning = reasoningBuffer || decoder.getReasoning();
-        if (this.gemmaNative) {
-            // Native tool-call blocks live in the text channel; extract them.
-            const parsed = parseGemmaDiffusionOutput(cleanContent);
-            cleanContent = parsed.content;
-            if (parsed.reasoning) {
-                reasoning = reasoning ? `${reasoning}\n\n${parsed.reasoning}` : parsed.reasoning;
-            }
-            if (!finalToolCalls?.length && parsed.toolCalls.length) {
-                finalToolCalls = parsed.toolCalls.map(tc => ({
-                    id: this.generateToolCallId(),
-                    type: 'function' as const,
-                    function: { name: tc.name, arguments: tc.argumentsJson },
-                }));
-                yield { type: 'tool_call', calls: finalToolCalls };
-            }
-        }
-        return {
-            message: {
-                role: 'assistant',
-                content: cleanContent,
-                tool_calls: finalToolCalls,
-            },
-            reasoning,
-            usage,
-            provider: 'openai',
-        };
-    }
-    private normalizeToolCall(
-        toolCall: Partial<LLMToolCall> & { function?: Partial<LLMToolCall['function']> },
-    ): LLMToolCall {
-        return {
-            ...toolCall,
-            id: toolCall.id || this.generateToolCallId(),
-            type: 'function',
-            function: {
-                ...toolCall.function,
-                name: toolCall.function?.name || '',
-                arguments: this.normalizeToolArguments(toolCall.function?.arguments),
-            },
-        };
-    }
-    private normalizeToolArguments(args: unknown): string {
-        if (typeof args === 'string') {
-            return args.trim().length > 0 ? args : '{}';
-        }
-        if (args == null) {
-            return '{}';
-        }
-        return JSON.stringify(args) ?? '{}';
-    }
-    // ========================================================================
-    // Embeddings
-    // ========================================================================
-    async embed(text: string): Promise<number[]> {
-        const url = this.buildUrl('/embeddings');
-        const response = await httpRequest<{
-            data: Array<{ embedding: number[] }>;
-        }>(url, {
-            method: 'POST',
-            headers: buildHeaders(this.options),
-            body: {
-                model: this.options.model,
-                input: text,
-            },
-            timeout: this.options.timeout ?? 30000,
-        });
-        return response.data.data[0]?.embedding ?? [];
-    }
-    // ========================================================================
-    // Model Discovery
-    // ========================================================================
-    async getModels(): Promise<string[]> {
-        const url = this.buildUrl('/models');
-        try {
-            const response = await httpRequest<{
-                data: OpenAIModelInfo[];
-            }>(url, {
-                headers: buildHeaders(this.options),
-                timeout: 5000,
-            });
-            return response.data.data.map(m => m.id);
-        } catch {
-            return [];
-        }
-    }
-    // ========================================================================
-    // Internals
-    // ========================================================================
-    private convertMessages(messages: LLMChatMessage[]): LLMChatMessage[] {
-        // OpenAI format is our canonical format, minimal conversion needed
-        return messages.map(msg => ({
-            ...msg,
-            // Ensure content is never null/undefined
-            content: msg.content ?? '',
-        }));
-    }
-    private buildRequestParams(options?: ChatOptions): Record<string, unknown> {
-        const params: Record<string, unknown> = {
-            ...this.options.defaultParameters,
-            ...options?.parameters,
-        };
-        if (options?.temperature !== undefined) params['temperature'] = options.temperature;
-        if (options?.maxTokens !== undefined) params['max_tokens'] = options.maxTokens;
-        // Unified thinking flag. Per-call overrides model config; only emitted
-        // when explicitly set, so servers that reject unknown fields are
-        // unaffected by default. OpenAI reasoning models (o-series / GPT-5) use
-        // `reasoning_effort`; vLLM / Qwen use `chat_template_kwargs.enable_thinking`.
-        // A user-supplied value (via parameters) always wins.
-        const thinking = resolveThinking(options?.thinking, this.options.thinking);
-        if (thinking) {
-            const isOfficialOpenAI = (this.options.url ?? '').includes('api.openai.com');
-            if (isOpenAIReasoningModel(this.options.model)) {
-                if (params['reasoning_effort'] === undefined) {
-                    params['reasoning_effort'] = thinking.enabled ? (thinking.level ?? 'medium') : 'minimal';
-                }
-            } else if (!isOfficialOpenAI) {
-                // `chat_template_kwargs` is a vLLM/Qwen extension. Official OpenAI
-                // rejects unknown body fields (and gpt-4o has no thinking toggle),
-                // so only send it to self-hosted / compatible gateways.
-                const existing = (params['chat_template_kwargs'] as Record<string, unknown> | undefined) ?? {};
-                params['chat_template_kwargs'] = { enable_thinking: thinking.enabled, ...existing };
-            }
-        }
-        return params;
-    }
-    // ========================================================================
-    // Structured Output Helpers
-    // ========================================================================
-    /**
-     * Build OpenAI response_format for structured output.
-     */
-    private buildResponseFormat(options: StructuredOutputOptions<unknown> & { strict?: boolean }): Record<string, unknown> {
-        let jsonSchema: JSONSchema;
-        let name: string;
-        let description: string | undefined;
-        // Prefer jsonSchema if provided (handles raw JSON Schema case)
-        if (options.jsonSchema) {
-            // Use raw JSON Schema
-            jsonSchema = normalizeJsonSchema(options.jsonSchema);
-            name = options.name || 'response';
-            description = options.description;
-        } else if (options.schemaConfig) {
-            // Use SchemaConfig's embedded JSON Schema
-            jsonSchema = getJsonSchemaFromConfig(options.schemaConfig);
-            name = options.name || options.schemaConfig.name || 'response';
-            description = options.description || options.schemaConfig.description;
-        } else {
-            // Should not happen - we check this in extractSchemaOptions
-            throw new Error('Either schemaConfig or jsonSchema must be provided');
-        }
-        // OpenAI strict mode — configurable, defaults to true for reliable structured output
-        return {
-            type: 'json_schema',
-            json_schema: {
-                name,
-                ...(description && { description }),
-                schema: jsonSchema,
-                strict: options.strict ?? true,
-            },
-        };
-    }
-}