npm - universal-llm-client - Versions diffs - 4.0.0 → 4.2.0 - Mend

universal-llm-client 4.0.0 → 4.2.0

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (127) hide show

package/dist/ai-model.d.ts +20 -22
package/dist/ai-model.d.ts.map +1 -1
package/dist/ai-model.js +26 -23
package/dist/ai-model.js.map +1 -1
package/dist/client.d.ts +5 -5
package/dist/client.d.ts.map +1 -1
package/dist/client.js +17 -9
package/dist/client.js.map +1 -1
package/dist/http.d.ts +2 -0
package/dist/http.d.ts.map +1 -1
package/dist/http.js +1 -0
package/dist/http.js.map +1 -1
package/dist/index.d.ts +3 -3
package/dist/index.d.ts.map +1 -1
package/dist/index.js +4 -4
package/dist/index.js.map +1 -1
package/dist/interfaces.d.ts +49 -11
package/dist/interfaces.d.ts.map +1 -1
package/dist/interfaces.js +14 -0
package/dist/interfaces.js.map +1 -1
package/dist/providers/anthropic.d.ts +56 -0
package/dist/providers/anthropic.d.ts.map +1 -0
package/dist/providers/anthropic.js +524 -0
package/dist/providers/anthropic.js.map +1 -0
package/dist/providers/google.d.ts +5 -0
package/dist/providers/google.d.ts.map +1 -1
package/dist/providers/google.js +64 -8
package/dist/providers/google.js.map +1 -1
package/dist/providers/index.d.ts +1 -0
package/dist/providers/index.d.ts.map +1 -1
package/dist/providers/index.js +1 -0
package/dist/providers/index.js.map +1 -1
package/dist/providers/ollama.d.ts.map +1 -1
package/dist/providers/ollama.js +38 -11
package/dist/providers/ollama.js.map +1 -1
package/dist/providers/openai.d.ts.map +1 -1
package/dist/providers/openai.js +9 -7
package/dist/providers/openai.js.map +1 -1
package/dist/router.d.ts +13 -33
package/dist/router.d.ts.map +1 -1
package/dist/router.js +33 -57
package/dist/router.js.map +1 -1
package/dist/stream-decoder.d.ts +29 -2
package/dist/stream-decoder.d.ts.map +1 -1
package/dist/stream-decoder.js +39 -11
package/dist/stream-decoder.js.map +1 -1
package/dist/structured-output.d.ts +107 -181
package/dist/structured-output.d.ts.map +1 -1
package/dist/structured-output.js +137 -192
package/dist/structured-output.js.map +1 -1
package/dist/zod-adapter.d.ts +44 -0
package/dist/zod-adapter.d.ts.map +1 -0
package/dist/zod-adapter.js +61 -0
package/dist/zod-adapter.js.map +1 -0
package/package.json +9 -1
package/src/ai-model.ts +350 -0
package/src/auditor.ts +213 -0
package/src/client.ts +402 -0
package/src/debug/debug-google-streaming.ts +97 -0
package/src/debug/debug-tool-execution.ts +86 -0
package/src/debug/test-lmstudio-tools.ts +155 -0
package/src/demos/README.md +47 -0
package/src/demos/basic/universal-llm-examples.ts +161 -0
package/src/demos/mcp/astrid-memory-demo.ts +295 -0
package/src/demos/mcp/astrid-persona-memory.ts +357 -0
package/src/demos/mcp/mcp-mongodb-demo.ts +275 -0
package/src/demos/mcp/simple-astrid-memory.ts +148 -0
package/src/demos/mcp/simple-mcp-demo.ts +68 -0
package/src/demos/mcp/working-mcp-demo.ts +62 -0
package/src/demos/model-alias-demo.ts +0 -0
package/src/demos/tools/RAG_MEMORY_INTEGRATION.md +267 -0
package/src/demos/tools/astrid-memory-demo.ts +270 -0
package/src/demos/tools/astrid-production-memory-clean.ts +785 -0
package/src/demos/tools/astrid-production-memory.ts +558 -0
package/src/demos/tools/basic-translation-test.ts +66 -0
package/src/demos/tools/chromadb-similarity-tuning.ts +390 -0
package/src/demos/tools/clean-multilingual-conversation.ts +209 -0
package/src/demos/tools/clean-translation-test.ts +119 -0
package/src/demos/tools/clean-universal-multilingual-test.ts +131 -0
package/src/demos/tools/complete-rag-demo.ts +369 -0
package/src/demos/tools/complete-tool-demo.ts +132 -0
package/src/demos/tools/demo-tool-calling.ts +124 -0
package/src/demos/tools/dynamic-language-switching-test.ts +251 -0
package/src/demos/tools/hybrid-thinking-test.ts +154 -0
package/src/demos/tools/memory-integration-test.ts +420 -0
package/src/demos/tools/multilingual-memory-system.ts +802 -0
package/src/demos/tools/ondemand-translation-demo.ts +655 -0
package/src/demos/tools/production-tool-demo.ts +245 -0
package/src/demos/tools/revolutionary-multilingual-test.ts +151 -0
package/src/demos/tools/rigorous-language-analysis.ts +218 -0
package/src/demos/tools/test-universal-memory-system.ts +126 -0
package/src/demos/tools/translation-integration-guide.ts +346 -0
package/src/demos/tools/universal-memory-system.ts +560 -0
package/src/http.ts +247 -0
package/src/index.ts +161 -0
package/src/interfaces.ts +657 -0
package/src/mcp.ts +345 -0
package/src/providers/anthropic.ts +762 -0
package/src/providers/google.ts +620 -0
package/src/providers/index.ts +8 -0
package/src/providers/ollama.ts +469 -0
package/src/providers/openai.ts +392 -0
package/src/router.ts +780 -0
package/src/stream-decoder.ts +361 -0
package/src/structured-output.ts +759 -0
package/src/test-scripts/test-advanced-tools.ts +310 -0
package/src/test-scripts/test-google-streaming-enhanced.ts +147 -0
package/src/test-scripts/test-google-streaming.ts +63 -0
package/src/test-scripts/test-google-system-prompt-comprehensive.ts +189 -0
package/src/test-scripts/test-mcp-config.ts +28 -0
package/src/test-scripts/test-mcp-connection.ts +29 -0
package/src/test-scripts/test-system-message-positions.ts +163 -0
package/src/test-scripts/test-system-prompt-improvement-demo.ts +83 -0
package/src/test-scripts/test-tool-calling.ts +231 -0
package/src/tests/ai-model.test.ts +1614 -0
package/src/tests/auditor.test.ts +224 -0
package/src/tests/http.test.ts +200 -0
package/src/tests/interfaces.test.ts +117 -0
package/src/tests/providers/google.test.ts +660 -0
package/src/tests/providers/ollama.test.ts +954 -0
package/src/tests/providers/openai.test.ts +1122 -0
package/src/tests/router.test.ts +254 -0
package/src/tests/stream-decoder.test.ts +179 -0
package/src/tests/structured-output.test.ts +1450 -0
package/src/tests/tools.test.ts +175 -0
package/src/tools.ts +246 -0
package/src/zod-adapter.ts +72 -0

package/src/providers/openai.ts ADDED Viewed

@@ -0,0 +1,392 @@
+/**
+ * Universal LLM Client v3 — OpenAI-Compatible Provider
+ *
+ * Implements BaseLLMClient for OpenAI-compatible APIs.
+ * Works with: OpenAI, OpenRouter, LM Studio, LlamaCpp, vLLM, Groq, Together.
+ */
+import { BaseLLMClient } from '../client.js';
+import { httpRequest, httpStream, parseSSE, buildHeaders } from '../http.js';
+import { StandardChatDecoder } from '../stream-decoder.js';
+import {
+    normalizeJsonSchema,
+    getJsonSchemaFromConfig,
+    type JSONSchema,
+    type StructuredOutputOptions,
+} from '../structured-output.js';
+import type {
+    LLMClientOptions,
+    LLMChatMessage,
+    LLMChatResponse,
+    ChatOptions,
+    OpenAIResponse,
+    OpenAIModelInfo,
+    TokenUsageInfo,
+} from '../interfaces.js';
+import type { DecodedEvent } from '../stream-decoder.js';
+import type { Auditor } from '../auditor.js';
+export class OpenAICompatibleClient extends BaseLLMClient {
+    constructor(options: LLMClientOptions, auditor?: Auditor) {
+        // Ensure URL ends with /v1 for standard endpoints
+        let url = (options.url || 'https://api.openai.com').replace(/\/+$/, '');
+        if (!url.endsWith('/v1')) {
+            url += '/v1';
+        }
+        super({ ...options, url }, auditor);
+    }
+    // ========================================================================
+    // Chat
+    // ========================================================================
+    async chat(
+        messages: LLMChatMessage[],
+        options?: ChatOptions,
+    ): Promise<LLMChatResponse> {
+        // Structured output and tools can now be used together.\n        // The provider sends both response_format and tools in the request.\n        // The Router handles skipping validation when the response contains tool calls.
+        const url = `${this.options.url}/chat/completions`;
+        const tools = options?.tools ?? (Object.keys(this.toolRegistry).length > 0 ? this.getToolDefinitions() : undefined);
+        const body: Record<string, unknown> = {
+            model: this.options.model,
+            messages: this.convertMessages(messages),
+            ...this.buildRequestParams(options),
+        };
+        // Handle structured output
+        const schemaOptions = this.extractSchemaOptions(options);
+        if (schemaOptions) {
+            body['response_format'] = this.buildResponseFormat(schemaOptions);
+        } else if (options?.responseFormat) {
+            body['response_format'] = options.responseFormat;
+        }
+        if (tools?.length) {
+            body['tools'] = tools;
+            if (options?.toolChoice) {
+                body['tool_choice'] = options.toolChoice;
+            }
+        }
+        const start = Date.now();
+        this.auditor.record({
+            timestamp: start,
+            type: 'request',
+            provider: 'openai',
+            model: this.options.model,
+        });
+        const response = await httpRequest<OpenAIResponse>(url, {
+            method: 'POST',
+            headers: buildHeaders(this.options),
+            body,
+            timeout: this.options.timeout ?? 30000,
+        });
+        const data = response.data;
+        const choice = data.choices[0];
+        if (!choice) {
+            throw new Error('No choices returned from OpenAI API');
+        }
+        const usage: TokenUsageInfo | undefined = data.usage
+            ? {
+                inputTokens: data.usage.prompt_tokens,
+                outputTokens: data.usage.completion_tokens,
+                totalTokens: data.usage.total_tokens,
+                cachedTokens: data.usage.prompt_tokens_details?.cached_tokens,
+            }
+            : undefined;
+        // Normalize tool calls (ensure IDs exist)
+        const toolCalls = choice.message.tool_calls?.map(tc => ({
+            ...tc,
+            id: tc.id || this.generateToolCallId(),
+        }));
+        // Get content, handling null case
+        const content = choice.message.content || '';
+        const result: LLMChatResponse = {
+            message: {
+                role: 'assistant',
+                content,
+                tool_calls: toolCalls,
+            },
+            usage,
+            provider: 'openai',
+        };
+        this.auditor.record({
+            timestamp: Date.now(),
+            type: 'response',
+            provider: 'openai',
+            model: this.options.model,
+            duration: Date.now() - start,
+            usage,
+        });
+        return result;
+    }
+    // ========================================================================
+    // Streaming
+    // ========================================================================
+    async *chatStream(
+        messages: LLMChatMessage[],
+        options?: ChatOptions,
+    ): AsyncGenerator<DecodedEvent, LLMChatResponse | void, unknown> {
+        const url = `${this.options.url}/chat/completions`;
+        const tools = options?.tools ?? (Object.keys(this.toolRegistry).length > 0 ? this.getToolDefinitions() : undefined);
+        const body: Record<string, unknown> = {
+            model: this.options.model,
+            messages: this.convertMessages(messages),
+            stream: true,
+            ...this.buildRequestParams(options),
+        };
+        if (tools?.length) {
+            body['tools'] = tools;
+            if (options?.toolChoice) {
+                body['tool_choice'] = options.toolChoice;
+            }
+        }
+        const start = Date.now();
+        this.auditor.record({
+            timestamp: start,
+            type: 'stream_start',
+            provider: 'openai',
+            model: this.options.model,
+        });
+        const decoder = new StandardChatDecoder(() => {});
+        // Track accumulated tool calls across chunks
+        const toolCallAccum: Map<number, {
+            id: string;
+            type: 'function';
+            function: { name: string; arguments: string };
+        }> = new Map();
+        const stream = httpStream(url, {
+            method: 'POST',
+            headers: buildHeaders(this.options),
+            body,
+            timeout: this.options.timeout ?? 120000,
+        });
+        let usage: TokenUsageInfo | undefined;
+        for await (const { data } of parseSSE(stream)) {
+            try {
+                const parsed = JSON.parse(data) as {
+                    choices?: Array<{
+                        delta?: {
+                            content?: string;
+                            tool_calls?: Array<{
+                                index: number;
+                                id?: string;
+                                type?: string;
+                                function?: { name?: string; arguments?: string };
+                            }>;
+                        };
+                        finish_reason?: string;
+                    }>;
+                    usage?: {
+                        prompt_tokens: number;
+                        completion_tokens: number;
+                        total_tokens: number;
+                        prompt_tokens_details?: {
+                            cached_tokens?: number;
+                        };
+                    };
+                };
+                if (parsed.usage) {
+                    usage = {
+                        inputTokens: parsed.usage.prompt_tokens,
+                        outputTokens: parsed.usage.completion_tokens,
+                        totalTokens: parsed.usage.total_tokens,
+                        cachedTokens: parsed.usage.prompt_tokens_details?.cached_tokens,
+                    };
+                }
+                const delta = parsed.choices?.[0]?.delta;
+                if (!delta) continue;
+                if (delta.content) {
+                    decoder.push(delta.content);
+                    yield { type: 'text', content: delta.content };
+                }
+                // Accumulate streamed tool calls
+                if (delta.tool_calls) {
+                    for (const tc of delta.tool_calls) {
+                        const existing = toolCallAccum.get(tc.index);
+                        if (!existing) {
+                            toolCallAccum.set(tc.index, {
+                                id: tc.id || this.generateToolCallId(),
+                                type: 'function',
+                                function: {
+                                    name: tc.function?.name || '',
+                                    arguments: tc.function?.arguments || '',
+                                },
+                            });
+                        } else {
+                            if (tc.function?.arguments) {
+                                existing.function.arguments += tc.function.arguments;
+                            }
+                            if (tc.function?.name) {
+                                existing.function.name += tc.function.name;
+                            }
+                        }
+                    }
+                }
+                // Emit tool calls when stream finishes
+                if (parsed.choices?.[0]?.finish_reason === 'tool_calls' || parsed.choices?.[0]?.finish_reason === 'stop') {
+                    if (toolCallAccum.size > 0) {
+                        const calls = Array.from(toolCallAccum.values());
+                        yield { type: 'tool_call', calls };
+                    }
+                }
+            } catch {
+                // Skip unparseable SSE data
+            }
+        }
+        decoder.flush();
+        this.auditor.record({
+            timestamp: Date.now(),
+            type: 'stream_end',
+            provider: 'openai',
+            model: this.options.model,
+            duration: Date.now() - start,
+            usage,
+        });
+        const finalToolCalls = toolCallAccum.size > 0
+            ? Array.from(toolCallAccum.values())
+            : undefined;
+        return {
+            message: {
+                role: 'assistant',
+                content: decoder.getCleanContent(),
+                tool_calls: finalToolCalls,
+            },
+            reasoning: decoder.getReasoning(),
+            usage,
+            provider: 'openai',
+        };
+    }
+    // ========================================================================
+    // Embeddings
+    // ========================================================================
+    async embed(text: string): Promise<number[]> {
+        const url = `${this.options.url}/embeddings`;
+        const response = await httpRequest<{
+            data: Array<{ embedding: number[] }>;
+        }>(url, {
+            method: 'POST',
+            headers: buildHeaders(this.options),
+            body: {
+                model: this.options.model,
+                input: text,
+            },
+            timeout: this.options.timeout ?? 30000,
+        });
+        return response.data.data[0]?.embedding ?? [];
+    }
+    // ========================================================================
+    // Model Discovery
+    // ========================================================================
+    async getModels(): Promise<string[]> {
+        const url = `${this.options.url}/models`;
+        try {
+            const response = await httpRequest<{
+                data: OpenAIModelInfo[];
+            }>(url, {
+                headers: buildHeaders(this.options),
+                timeout: 5000,
+            });
+            return response.data.data.map(m => m.id);
+        } catch {
+            return [];
+        }
+    }
+    // ========================================================================
+    // Internals
+    // ========================================================================
+    private convertMessages(messages: LLMChatMessage[]): LLMChatMessage[] {
+        // OpenAI format is our canonical format, minimal conversion needed
+        return messages.map(msg => ({
+            ...msg,
+            // Ensure content is never null/undefined
+            content: msg.content ?? '',
+        }));
+    }
+    private buildRequestParams(options?: ChatOptions): Record<string, unknown> {
+        const params: Record<string, unknown> = {
+            ...this.options.defaultParameters,
+            ...options?.parameters,
+        };
+        if (options?.temperature !== undefined) params['temperature'] = options.temperature;
+        if (options?.maxTokens !== undefined) params['max_tokens'] = options.maxTokens;
+        return params;
+    }
+    // ========================================================================
+    // Structured Output Helpers
+    // ========================================================================
+    /**
+     * Build OpenAI response_format for structured output.
+     */
+    private buildResponseFormat(options: StructuredOutputOptions<unknown> & { strict?: boolean }): Record<string, unknown> {
+        let jsonSchema: JSONSchema;
+        let name: string;
+        let description: string | undefined;
+        // Prefer jsonSchema if provided (handles raw JSON Schema case)
+        if (options.jsonSchema) {
+            // Use raw JSON Schema
+            jsonSchema = normalizeJsonSchema(options.jsonSchema);
+            name = options.name || 'response';
+            description = options.description;
+        } else if (options.schemaConfig) {
+            // Use SchemaConfig's embedded JSON Schema
+            jsonSchema = getJsonSchemaFromConfig(options.schemaConfig);
+            name = options.name || options.schemaConfig.name || 'response';
+            description = options.description || options.schemaConfig.description;
+        } else {
+            // Should not happen - we check this in extractSchemaOptions
+            throw new Error('Either schemaConfig or jsonSchema must be provided');
+        }
+        // OpenAI strict mode — configurable, defaults to true for reliable structured output
+        return {
+            type: 'json_schema',
+            json_schema: {
+                name,
+                ...(description && { description }),
+                schema: jsonSchema,
+                strict: options.strict ?? true,
+            },
+        };
+    }
+}