npm - @steipete/summarize - Versions diffs - 0.7.1 → 0.8.1 - Mend

@steipete/summarize 0.7.1 → 0.8.1

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (151) hide show

package/CHANGELOG.md +46 -0
package/README.md +53 -2
package/dist/cli.js +3 -0
package/dist/esm/cache.js +353 -0
package/dist/esm/cache.js.map +1 -0
package/dist/esm/config.js +78 -1
package/dist/esm/config.js.map +1 -1
package/dist/esm/content/asset.js +11 -17
package/dist/esm/content/asset.js.map +1 -1
package/dist/esm/daemon/auto-mode.js +8 -0
package/dist/esm/daemon/auto-mode.js.map +1 -0
package/dist/esm/daemon/cli.js +284 -0
package/dist/esm/daemon/cli.js.map +1 -0
package/dist/esm/daemon/config.js +82 -0
package/dist/esm/daemon/config.js.map +1 -0
package/dist/esm/daemon/constants.js +8 -0
package/dist/esm/daemon/constants.js.map +1 -0
package/dist/esm/daemon/env-merge.js +4 -0
package/dist/esm/daemon/env-merge.js.map +1 -0
package/dist/esm/daemon/env-snapshot.js +43 -0
package/dist/esm/daemon/env-snapshot.js.map +1 -0
package/dist/esm/daemon/flow-context.js +265 -0
package/dist/esm/daemon/flow-context.js.map +1 -0
package/dist/esm/daemon/launchd.js +149 -0
package/dist/esm/daemon/launchd.js.map +1 -0
package/dist/esm/daemon/meta.js +35 -0
package/dist/esm/daemon/meta.js.map +1 -0
package/dist/esm/daemon/models.js +175 -0
package/dist/esm/daemon/models.js.map +1 -0
package/dist/esm/daemon/request-settings.js +91 -0
package/dist/esm/daemon/request-settings.js.map +1 -0
package/dist/esm/daemon/schtasks.js +108 -0
package/dist/esm/daemon/schtasks.js.map +1 -0
package/dist/esm/daemon/server.js +399 -0
package/dist/esm/daemon/server.js.map +1 -0
package/dist/esm/daemon/summarize-progress.js +57 -0
package/dist/esm/daemon/summarize-progress.js.map +1 -0
package/dist/esm/daemon/summarize.js +263 -0
package/dist/esm/daemon/summarize.js.map +1 -0
package/dist/esm/daemon/systemd.js +117 -0
package/dist/esm/daemon/systemd.js.map +1 -0
package/dist/esm/flags.js +3 -1
package/dist/esm/flags.js.map +1 -1
package/dist/esm/llm/generate-text.js +445 -154
package/dist/esm/llm/generate-text.js.map +1 -1
package/dist/esm/llm/html-to-markdown.js +4 -1
package/dist/esm/llm/html-to-markdown.js.map +1 -1
package/dist/esm/llm/prompt.js +14 -0
package/dist/esm/llm/prompt.js.map +1 -0
package/dist/esm/llm/transcript-to-markdown.js +57 -0
package/dist/esm/llm/transcript-to-markdown.js.map +1 -0
package/dist/esm/model-spec.js +2 -2
package/dist/esm/model-spec.js.map +1 -1
package/dist/esm/run/attachments.js +10 -42
package/dist/esm/run/attachments.js.map +1 -1
package/dist/esm/run/cache-state.js +48 -0
package/dist/esm/run/cache-state.js.map +1 -0
package/dist/esm/run/cli-preflight.js +15 -1
package/dist/esm/run/cli-preflight.js.map +1 -1
package/dist/esm/run/cookies/twitter.js +224 -0
package/dist/esm/run/cookies/twitter.js.map +1 -0
package/dist/esm/run/fetch-with-timeout.js +1 -1
package/dist/esm/run/fetch-with-timeout.js.map +1 -1
package/dist/esm/run/finish-line.js +46 -17
package/dist/esm/run/finish-line.js.map +1 -1
package/dist/esm/run/flows/asset/input.js +2 -4
package/dist/esm/run/flows/asset/input.js.map +1 -1
package/dist/esm/run/flows/asset/preprocess.js +52 -72
package/dist/esm/run/flows/asset/preprocess.js.map +1 -1
package/dist/esm/run/flows/asset/summary.js +127 -47
package/dist/esm/run/flows/asset/summary.js.map +1 -1
package/dist/esm/run/flows/url/extract.js +6 -1
package/dist/esm/run/flows/url/extract.js.map +1 -1
package/dist/esm/run/flows/url/flow.js +166 -85
package/dist/esm/run/flows/url/flow.js.map +1 -1
package/dist/esm/run/flows/url/markdown.js +88 -46
package/dist/esm/run/flows/url/markdown.js.map +1 -1
package/dist/esm/run/flows/url/summary.js +263 -185
package/dist/esm/run/flows/url/summary.js.map +1 -1
package/dist/esm/run/help.js +33 -2
package/dist/esm/run/help.js.map +1 -1
package/dist/esm/run/run-env.js +36 -2
package/dist/esm/run/run-env.js.map +1 -1
package/dist/esm/run/runner.js +362 -227
package/dist/esm/run/runner.js.map +1 -1
package/dist/esm/run/summary-engine.js +21 -6
package/dist/esm/run/summary-engine.js.map +1 -1
package/dist/esm/run/summary-llm.js +4 -1
package/dist/esm/run/summary-llm.js.map +1 -1
package/dist/esm/tty/format.js +9 -0
package/dist/esm/tty/format.js.map +1 -1
package/dist/esm/version.js +1 -1
package/dist/types/cache.d.ts +70 -0
package/dist/types/config.d.ts +46 -0
package/dist/types/content/asset.d.ts +4 -3
package/dist/types/daemon/auto-mode.d.ts +8 -0
package/dist/types/daemon/cli.d.ts +9 -0
package/dist/types/daemon/config.d.ts +19 -0
package/dist/types/daemon/constants.d.ts +7 -0
package/dist/types/daemon/env-merge.d.ts +5 -0
package/dist/types/daemon/env-snapshot.d.ts +4 -0
package/dist/types/daemon/flow-context.d.ts +28 -0
package/dist/types/daemon/launchd.d.ts +29 -0
package/dist/types/daemon/meta.d.ts +12 -0
package/dist/types/daemon/models.d.ts +27 -0
package/dist/types/daemon/request-settings.d.ts +27 -0
package/dist/types/daemon/schtasks.d.ts +16 -0
package/dist/types/daemon/server.d.ts +12 -0
package/dist/types/daemon/summarize-progress.d.ts +2 -0
package/dist/types/daemon/summarize.d.ts +59 -0
package/dist/types/daemon/systemd.d.ts +16 -0
package/dist/types/flags.d.ts +1 -1
package/dist/types/llm/generate-text.d.ts +11 -5
package/dist/types/llm/html-to-markdown.d.ts +4 -1
package/dist/types/llm/prompt.d.ts +9 -0
package/dist/types/llm/transcript-to-markdown.d.ts +34 -0
package/dist/types/run/attachments.d.ts +4 -10
package/dist/types/run/cache-state.d.ts +12 -0
package/dist/types/run/cli-preflight.d.ts +1 -0
package/dist/types/run/cookies/twitter.d.ts +17 -0
package/dist/types/run/finish-line.d.ts +31 -1
package/dist/types/run/flows/asset/preprocess.d.ts +5 -2
package/dist/types/run/flows/asset/summary.d.ts +11 -0
package/dist/types/run/flows/url/markdown.d.ts +3 -0
package/dist/types/run/flows/url/summary.d.ts +6 -3
package/dist/types/run/flows/url/types.d.ts +52 -18
package/dist/types/run/help.d.ts +1 -0
package/dist/types/run/run-env.d.ts +6 -0
package/dist/types/run/summary-engine.d.ts +8 -2
package/dist/types/run/summary-llm.d.ts +6 -3
package/dist/types/tty/format.d.ts +1 -0
package/dist/types/version.d.ts +1 -1
package/docs/README.md +5 -0
package/docs/cache.md +72 -0
package/docs/chrome-extension.md +180 -0
package/docs/cli.md +6 -0
package/docs/config.md +65 -1
package/docs/extract-only.md +6 -0
package/docs/firecrawl.md +6 -0
package/docs/language.md +6 -0
package/docs/llm.md +20 -0
package/docs/manual-tests.md +6 -0
package/docs/model-auto.md +6 -0
package/docs/openai.md +6 -0
package/docs/site/index.html +11 -1
package/docs/smoketest.md +6 -0
package/docs/website.md +6 -0
package/docs/youtube.md +9 -2
package/package.json +7 -10
package/dist/cli.cjs +0 -80566
package/dist/cli.cjs.map +0 -7

package/dist/esm/llm/generate-text.js CHANGED Viewed

@@ -1,9 +1,5 @@
+import { completeSimple, getModel, streamSimple } from '@mariozechner/pi-ai';
 import { parseGatewayStyleModelId } from './model-id.js';
-function assertNonEmptyText(text, modelId) {
-    if (text.trim().length > 0)
-        return;
-    throw new Error(`LLM returned an empty summary (model ${modelId}).`);
-}
 function parseAnthropicErrorPayload(responseBody) {
     try {
         const parsed = JSON.parse(responseBody);
@@ -48,25 +44,20 @@ function normalizeTokenUsage(raw) {
     if (!raw || typeof raw !== 'object')
         return null;
     const usage = raw;
-    const promptTokens = typeof usage.promptTokens === 'number' && Number.isFinite(usage.promptTokens)
-        ? usage.promptTokens
-        : typeof usage.inputTokens === 'number' && Number.isFinite(usage.inputTokens)
-            ? usage.inputTokens
-            : null;
-    const completionTokens = typeof usage.completionTokens === 'number' && Number.isFinite(usage.completionTokens)
-        ? usage.completionTokens
-        : typeof usage.outputTokens === 'number' && Number.isFinite(usage.outputTokens)
-            ? usage.outputTokens
-            : null;
+    const promptTokens = typeof usage.input === 'number' && Number.isFinite(usage.input) ? usage.input : null;
+    const completionTokens = typeof usage.output === 'number' && Number.isFinite(usage.output) ? usage.output : null;
     const totalTokens = typeof usage.totalTokens === 'number' && Number.isFinite(usage.totalTokens)
         ? usage.totalTokens
         : null;
-    if (promptTokens === null && completionTokens === null && totalTokens === null) {
+    if (promptTokens === null && completionTokens === null && totalTokens === null)
         return null;
-    }
     return { promptTokens, completionTokens, totalTokens };
 }
-function resolveOpenAiClientConfig({ apiKeys, fetchImpl, forceOpenRouter, openaiBaseUrlOverride, forceChatCompletions, }) {
+function resolveBaseUrlOverride(raw) {
+    const trimmed = typeof raw === 'string' ? raw.trim() : '';
+    return trimmed.length > 0 ? trimmed : null;
+}
+function resolveOpenAiClientConfig({ apiKeys, forceOpenRouter, openaiBaseUrlOverride, forceChatCompletions, }) {
     const baseUrlRaw = openaiBaseUrlOverride ??
         (typeof process !== 'undefined' ? process.env.OPENAI_BASE_URL : undefined);
     const baseUrl = typeof baseUrlRaw === 'string' && baseUrlRaw.trim().length > 0 ? baseUrlRaw.trim() : null;
@@ -84,53 +75,221 @@ function resolveOpenAiClientConfig({ apiKeys, fetchImpl, forceOpenRouter, openai
             ? 'Missing OPENROUTER_API_KEY (or OPENAI_API_KEY) for OpenRouter'
             : 'Missing OPENAI_API_KEY for openai/... model');
     }
-    const wrappedFetch = isOpenRouter
-        ? (url, init) => {
-            const headers = new Headers(init?.headers);
-            headers.set('HTTP-Referer', 'https://github.com/steipete/summarize');
-            headers.set('X-Title', 'summarize');
-            return fetchImpl(url, { ...init, headers });
-        }
-        : fetchImpl;
     const baseURL = forceOpenRouter
         ? 'https://openrouter.ai/api/v1'
         : (baseUrl ?? (isOpenRouter ? 'https://openrouter.ai/api/v1' : undefined));
-    const useChatCompletions = Boolean(forceChatCompletions) || isOpenRouter;
+    const isCustomBaseURL = (() => {
+        if (!baseURL)
+            return false;
+        try {
+            const url = new URL(baseURL);
+            return url.host !== 'api.openai.com' && url.host !== 'openrouter.ai';
+        }
+        catch {
+            return false;
+        }
+    })();
+    const useChatCompletions = Boolean(forceChatCompletions) || isOpenRouter || isCustomBaseURL;
     return {
         apiKey,
         baseURL: baseURL ?? undefined,
-        fetch: wrappedFetch,
         useChatCompletions,
         isOpenRouter,
     };
 }
-export async function generateTextWithModelId({ modelId, apiKeys, system, prompt, temperature, maxOutputTokens, timeoutMs, fetchImpl, forceOpenRouter, openaiBaseUrlOverride, forceChatCompletions, retries = 0, onRetry, }) {
+function promptToContext({ system, prompt }) {
+    const messages = typeof prompt === 'string'
+        ? [{ role: 'user', content: prompt, timestamp: Date.now() }]
+        : prompt.map((msg) => typeof msg.timestamp === 'number'
+            ? msg
+            : { ...msg, timestamp: Date.now() });
+    return { systemPrompt: system, messages };
+}
+function extractText(message) {
+    const text = message.content
+        .filter((c) => c.type === 'text')
+        .map((c) => c.text)
+        .join('');
+    return text.trim();
+}
+function wantsImages(context) {
+    for (const msg of context.messages) {
+        if (msg.role === 'user' || msg.role === 'toolResult') {
+            if (Array.isArray(msg.content) && msg.content.some((c) => c.type === 'image'))
+                return true;
+        }
+    }
+    return false;
+}
+function tryGetModel(provider, modelId) {
+    try {
+        return getModel(provider, modelId);
+    }
+    catch {
+        return null;
+    }
+}
+function createSyntheticModel({ provider, modelId, api, baseUrl, allowImages, headers, }) {
+    return {
+        id: modelId,
+        name: `${provider}/${modelId}`,
+        api,
+        provider,
+        baseUrl,
+        reasoning: false,
+        input: allowImages ? ['text', 'image'] : ['text'],
+        cost: { input: 0, output: 0, cacheRead: 0, cacheWrite: 0 },
+        contextWindow: 128_000,
+        maxTokens: 16_384,
+        ...(headers ? { headers } : {}),
+    };
+}
+function resolveModelForCall({ modelId, parsedProvider, openaiConfig, context, openaiBaseUrlOverride, anthropicBaseUrlOverride, googleBaseUrlOverride, xaiBaseUrlOverride, }) {
+    const allowImages = wantsImages(context);
+    if (parsedProvider === 'openai') {
+        const base = tryGetModel('openai', modelId);
+        const api = openaiConfig?.useChatCompletions ? 'openai-completions' : 'openai-responses';
+        const baseUrl = openaiConfig?.baseURL ?? base?.baseUrl ?? 'https://api.openai.com/v1';
+        const headers = openaiConfig?.isOpenRouter
+            ? {
+                ...(base?.headers ?? {}),
+                'HTTP-Referer': 'https://github.com/steipete/summarize',
+                'X-Title': 'summarize',
+            }
+            : base?.headers;
+        return {
+            ...(base ?? createSyntheticModel({ provider: 'openai', modelId, api, baseUrl, allowImages })),
+            api,
+            baseUrl,
+            ...(headers ? { headers } : {}),
+        };
+    }
+    if (parsedProvider === 'zai') {
+        const base = tryGetModel('zai', modelId);
+        const api = 'openai-completions';
+        const baseUrl = openaiBaseUrlOverride ??
+            base?.baseUrl ??
+            openaiConfig?.baseURL ??
+            'https://api.z.ai/api/paas/v4';
+        return {
+            ...(base ?? createSyntheticModel({ provider: 'zai', modelId, api, baseUrl, allowImages })),
+            api,
+            baseUrl,
+            input: allowImages ? ['text', 'image'] : ['text'],
+        };
+    }
+    if (parsedProvider === 'xai') {
+        const base = tryGetModel('xai', modelId);
+        const override = resolveBaseUrlOverride(xaiBaseUrlOverride);
+        if (override) {
+            return {
+                ...(base ??
+                    createSyntheticModel({
+                        provider: 'xai',
+                        modelId,
+                        api: 'openai-completions',
+                        baseUrl: override,
+                        allowImages,
+                    })),
+                baseUrl: override,
+            };
+        }
+        return (base ??
+            createSyntheticModel({
+                provider: 'xai',
+                modelId,
+                api: 'openai-completions',
+                baseUrl: 'https://api.x.ai/v1',
+                allowImages,
+            }));
+    }
+    if (parsedProvider === 'google') {
+        const base = tryGetModel('google', modelId);
+        const override = resolveBaseUrlOverride(googleBaseUrlOverride);
+        if (override) {
+            return {
+                ...(base ??
+                    createSyntheticModel({
+                        provider: 'google',
+                        modelId,
+                        api: 'google-generative-ai',
+                        baseUrl: override,
+                        allowImages,
+                    })),
+                baseUrl: override,
+            };
+        }
+        return (base ??
+            createSyntheticModel({
+                provider: 'google',
+                modelId,
+                api: 'google-generative-ai',
+                baseUrl: 'https://generativelanguage.googleapis.com/v1beta',
+                allowImages,
+            }));
+    }
+    const base = tryGetModel('anthropic', modelId);
+    const override = resolveBaseUrlOverride(anthropicBaseUrlOverride);
+    if (override) {
+        return {
+            ...(base ??
+                createSyntheticModel({
+                    provider: 'anthropic',
+                    modelId,
+                    api: 'anthropic-messages',
+                    baseUrl: override,
+                    allowImages,
+                })),
+            baseUrl: override,
+        };
+    }
+    return (base ??
+        createSyntheticModel({
+            provider: 'anthropic',
+            modelId,
+            api: 'anthropic-messages',
+            baseUrl: 'https://api.anthropic.com',
+            allowImages,
+        }));
+}
+export async function generateTextWithModelId({ modelId, apiKeys, system, prompt, temperature, maxOutputTokens, timeoutMs, fetchImpl: _fetchImpl, forceOpenRouter, openaiBaseUrlOverride, anthropicBaseUrlOverride, googleBaseUrlOverride, xaiBaseUrlOverride, forceChatCompletions, retries = 0, onRetry, }) {
+    void _fetchImpl;
     const parsed = parseGatewayStyleModelId(modelId);
+    const context = promptToContext({ system, prompt });
+    const isOpenaiGpt5 = parsed.provider === 'openai' && /^gpt-5([-.].+)?$/i.test(parsed.model);
+    const effectiveTemperature = typeof temperature === 'number' && !(isOpenaiGpt5 && temperature === 0)
+        ? temperature
+        : undefined;
     const maxRetries = Math.max(0, retries);
     let attempt = 0;
     while (attempt <= maxRetries) {
         const controller = new AbortController();
         const timeout = setTimeout(() => controller.abort(), timeoutMs);
         try {
-            const { generateText } = await import('ai');
-            const shouldSendMaxOutputTokens = () => typeof maxOutputTokens === 'number';
             if (parsed.provider === 'xai') {
                 const apiKey = apiKeys.xaiApiKey;
                 if (!apiKey)
                     throw new Error('Missing XAI_API_KEY for xai/... model');
-                const { createXai } = await import('@ai-sdk/xai');
-                const xai = createXai({ apiKey, fetch: fetchImpl });
-                const result = await generateText({
-                    model: xai(parsed.model),
-                    system,
-                    ...(typeof prompt === 'string' ? { prompt } : { messages: prompt }),
-                    ...(typeof temperature === 'number' ? { temperature } : {}),
-                    ...(shouldSendMaxOutputTokens() ? { maxOutputTokens } : {}),
-                    abortSignal: controller.signal,
+                const model = resolveModelForCall({
+                    modelId: parsed.model,
+                    parsedProvider: parsed.provider,
+                    openaiConfig: null,
+                    context,
+                    xaiBaseUrlOverride,
+                });
+                const result = await completeSimple(model, context, {
+                    ...(typeof effectiveTemperature === 'number'
+                        ? { temperature: effectiveTemperature }
+                        : {}),
+                    ...(typeof maxOutputTokens === 'number' ? { maxTokens: maxOutputTokens } : {}),
+                    apiKey,
+                    signal: controller.signal,
                 });
-                assertNonEmptyText(result.text, parsed.canonical);
+                const text = extractText(result);
+                if (!text)
+                    throw new Error(`LLM returned an empty summary (model ${parsed.canonical}).`);
                 return {
-                    text: result.text,
+                    text,
                     canonicalModelId: parsed.canonical,
                     provider: parsed.provider,
                     usage: normalizeTokenUsage(result.usage),
@@ -140,19 +299,26 @@ export async function generateTextWithModelId({ modelId, apiKeys, system, prompt
                 const apiKey = apiKeys.googleApiKey;
                 if (!apiKey)
                     throw new Error('Missing GEMINI_API_KEY (or GOOGLE_GENERATIVE_AI_API_KEY / GOOGLE_API_KEY) for google/... model');
-                const { createGoogleGenerativeAI } = await import('@ai-sdk/google');
-                const google = createGoogleGenerativeAI({ apiKey, fetch: fetchImpl });
-                const result = await generateText({
-                    model: google(parsed.model),
-                    system,
-                    ...(typeof prompt === 'string' ? { prompt } : { messages: prompt }),
-                    ...(typeof temperature === 'number' ? { temperature } : {}),
-                    ...(shouldSendMaxOutputTokens() ? { maxOutputTokens } : {}),
-                    abortSignal: controller.signal,
+                const model = resolveModelForCall({
+                    modelId: parsed.model,
+                    parsedProvider: parsed.provider,
+                    openaiConfig: null,
+                    context,
+                    googleBaseUrlOverride,
+                });
+                const result = await completeSimple(model, context, {
+                    ...(typeof effectiveTemperature === 'number'
+                        ? { temperature: effectiveTemperature }
+                        : {}),
+                    ...(typeof maxOutputTokens === 'number' ? { maxTokens: maxOutputTokens } : {}),
+                    apiKey,
+                    signal: controller.signal,
                 });
-                assertNonEmptyText(result.text, parsed.canonical);
+                const text = extractText(result);
+                if (!text)
+                    throw new Error(`LLM returned an empty summary (model ${parsed.canonical}).`);
                 return {
-                    text: result.text,
+                    text,
                     canonicalModelId: parsed.canonical,
                     provider: parsed.provider,
                     usage: normalizeTokenUsage(result.usage),
@@ -162,52 +328,89 @@ export async function generateTextWithModelId({ modelId, apiKeys, system, prompt
                 const apiKey = apiKeys.anthropicApiKey;
                 if (!apiKey)
                     throw new Error('Missing ANTHROPIC_API_KEY for anthropic/... model');
-                const { createAnthropic } = await import('@ai-sdk/anthropic');
-                const anthropic = createAnthropic({ apiKey, fetch: fetchImpl });
-                const result = await generateText({
-                    model: anthropic(parsed.model),
-                    system,
-                    ...(typeof prompt === 'string' ? { prompt } : { messages: prompt }),
-                    ...(typeof temperature === 'number' ? { temperature } : {}),
-                    ...(shouldSendMaxOutputTokens() ? { maxOutputTokens } : {}),
-                    abortSignal: controller.signal,
+                const model = resolveModelForCall({
+                    modelId: parsed.model,
+                    parsedProvider: parsed.provider,
+                    openaiConfig: null,
+                    context,
+                    anthropicBaseUrlOverride,
                 });
-                assertNonEmptyText(result.text, parsed.canonical);
+                const result = await completeSimple(model, context, {
+                    ...(typeof effectiveTemperature === 'number'
+                        ? { temperature: effectiveTemperature }
+                        : {}),
+                    ...(typeof maxOutputTokens === 'number' ? { maxTokens: maxOutputTokens } : {}),
+                    apiKey,
+                    signal: controller.signal,
+                });
+                const text = extractText(result);
+                if (!text)
+                    throw new Error(`LLM returned an empty summary (model ${parsed.canonical}).`);
                 return {
-                    text: result.text,
+                    text,
                     canonicalModelId: parsed.canonical,
                     provider: parsed.provider,
                     usage: normalizeTokenUsage(result.usage),
                 };
             }
-            const { createOpenAI } = await import('@ai-sdk/openai');
-            const openaiConfig = resolveOpenAiClientConfig({
-                apiKeys,
-                fetchImpl,
-                forceOpenRouter,
+            const openaiConfig = parsed.provider === 'openai'
+                ? resolveOpenAiClientConfig({
+                    apiKeys,
+                    forceOpenRouter,
+                    openaiBaseUrlOverride,
+                    forceChatCompletions,
+                })
+                : null;
+            if (parsed.provider === 'zai') {
+                const apiKey = apiKeys.openaiApiKey;
+                if (!apiKey)
+                    throw new Error('Missing Z_AI_API_KEY for zai/... model');
+                const model = resolveModelForCall({
+                    modelId: parsed.model,
+                    parsedProvider: parsed.provider,
+                    openaiConfig: null,
+                    context,
+                    openaiBaseUrlOverride,
+                });
+                const result = await completeSimple(model, context, {
+                    ...(typeof effectiveTemperature === 'number'
+                        ? { temperature: effectiveTemperature }
+                        : {}),
+                    ...(typeof maxOutputTokens === 'number' ? { maxTokens: maxOutputTokens } : {}),
+                    apiKey,
+                    signal: controller.signal,
+                });
+                const text = extractText(result);
+                if (!text)
+                    throw new Error(`LLM returned an empty summary (model ${parsed.canonical}).`);
+                return {
+                    text,
+                    canonicalModelId: parsed.canonical,
+                    provider: parsed.provider,
+                    usage: normalizeTokenUsage(result.usage),
+                };
+            }
+            const model = resolveModelForCall({
+                modelId: parsed.model,
+                parsedProvider: parsed.provider,
+                openaiConfig,
+                context,
                 openaiBaseUrlOverride,
-                forceChatCompletions,
+                anthropicBaseUrlOverride,
+                googleBaseUrlOverride,
+                xaiBaseUrlOverride,
             });
-            const openai = createOpenAI({
-                apiKey: openaiConfig.apiKey,
-                ...(openaiConfig.baseURL ? { baseURL: openaiConfig.baseURL } : {}),
-                fetch: openaiConfig.fetch,
+            const result = await completeSimple(model, context, {
+                ...(typeof effectiveTemperature === 'number' ? { temperature: effectiveTemperature } : {}),
+                ...(typeof maxOutputTokens === 'number' ? { maxTokens: maxOutputTokens } : {}),
+                apiKey: openaiConfig?.apiKey ?? apiKeys.openaiApiKey ?? undefined,
+                signal: controller.signal,
             });
-            // OpenRouter requires chat completions endpoint
-            const useChatCompletions = openaiConfig.useChatCompletions;
-            const responsesModelId = parsed.model;
-            const chatModelId = parsed.model;
-            const result = await generateText({
-                model: useChatCompletions ? openai.chat(chatModelId) : openai(responsesModelId),
-                system,
-                ...(typeof prompt === 'string' ? { prompt } : { messages: prompt }),
-                ...(typeof temperature === 'number' ? { temperature } : {}),
-                ...(shouldSendMaxOutputTokens() ? { maxOutputTokens } : {}),
-                abortSignal: controller.signal,
-            });
-            assertNonEmptyText(result.text, parsed.canonical);
+            const text = extractText(result);
+            if (!text)
+                throw new Error(`LLM returned an empty summary (model ${parsed.canonical}).`);
             return {
-                text: result.text,
+                text,
                 canonicalModelId: parsed.canonical,
                 provider: parsed.provider,
                 usage: normalizeTokenUsage(result.usage),
@@ -257,8 +460,10 @@ function computeRetryDelayMs(attempt) {
 function sleep(ms) {
     return new Promise((resolve) => setTimeout(resolve, ms));
 }
-export async function streamTextWithModelId({ modelId, apiKeys, system, prompt, temperature, maxOutputTokens, timeoutMs, fetchImpl, forceOpenRouter, openaiBaseUrlOverride, forceChatCompletions, }) {
+export async function streamTextWithModelId({ modelId, apiKeys, system, prompt, temperature, maxOutputTokens, timeoutMs, fetchImpl: _fetchImpl, forceOpenRouter, openaiBaseUrlOverride, anthropicBaseUrlOverride, googleBaseUrlOverride, xaiBaseUrlOverride, forceChatCompletions, }) {
+    void _fetchImpl;
     const parsed = parseGatewayStyleModelId(modelId);
+    const context = promptToContext({ system, prompt });
     const controller = new AbortController();
     let timeoutId = null;
     const startedAtMs = Date.now();
@@ -330,36 +535,42 @@ export async function streamTextWithModelId({ modelId, apiKeys, system, prompt,
         },
     });
     try {
-        const { streamText } = await import('ai');
-        const onError = ({ error }) => {
-            if (parsed.provider === 'anthropic') {
-                lastError = normalizeAnthropicModelAccessError(error, parsed.model) ?? error;
-                return;
-            }
-            lastError = error;
-        };
-        const shouldSendMaxOutputTokens = () => typeof maxOutputTokens === 'number';
         if (parsed.provider === 'xai') {
             const apiKey = apiKeys.xaiApiKey;
             if (!apiKey)
                 throw new Error('Missing XAI_API_KEY for xai/... model');
-            const { createXai } = await import('@ai-sdk/xai');
-            const xai = createXai({ apiKey, fetch: fetchImpl });
-            const result = streamText({
-                model: xai(parsed.model),
-                system,
-                ...(typeof prompt === 'string' ? { prompt } : { messages: prompt }),
+            const model = resolveModelForCall({
+                modelId: parsed.model,
+                parsedProvider: parsed.provider,
+                openaiConfig: null,
+                context,
+                xaiBaseUrlOverride,
+            });
+            const stream = streamSimple(model, context, {
                 ...(typeof temperature === 'number' ? { temperature } : {}),
-                ...(shouldSendMaxOutputTokens() ? { maxOutputTokens } : {}),
-                abortSignal: controller.signal,
-                onError,
+                ...(typeof maxOutputTokens === 'number' ? { maxTokens: maxOutputTokens } : {}),
+                apiKey,
+                signal: controller.signal,
             });
+            const textStream = {
+                async *[Symbol.asyncIterator]() {
+                    for await (const event of stream) {
+                        if (event.type === 'text_delta')
+                            yield event.delta;
+                        if (event.type === 'error') {
+                            lastError = event.error;
+                            break;
+                        }
+                    }
+                },
+            };
             return {
-                textStream: wrapTextStream(result.textStream),
+                textStream: wrapTextStream(textStream),
                 canonicalModelId: parsed.canonical,
                 provider: parsed.provider,
-                usage: Promise.resolve(result.totalUsage)
-                    .then((raw) => normalizeTokenUsage(raw))
+                usage: stream
+                    .result()
+                    .then((msg) => normalizeTokenUsage(msg.usage))
                     .catch(() => null),
                 lastError: () => lastError,
             };
@@ -368,23 +579,38 @@ export async function streamTextWithModelId({ modelId, apiKeys, system, prompt,
             const apiKey = apiKeys.googleApiKey;
             if (!apiKey)
                 throw new Error('Missing GEMINI_API_KEY (or GOOGLE_GENERATIVE_AI_API_KEY / GOOGLE_API_KEY) for google/... model');
-            const { createGoogleGenerativeAI } = await import('@ai-sdk/google');
-            const google = createGoogleGenerativeAI({ apiKey, fetch: fetchImpl });
-            const result = streamText({
-                model: google(parsed.model),
-                system,
-                ...(typeof prompt === 'string' ? { prompt } : { messages: prompt }),
+            const model = resolveModelForCall({
+                modelId: parsed.model,
+                parsedProvider: parsed.provider,
+                openaiConfig: null,
+                context,
+                googleBaseUrlOverride,
+            });
+            const stream = streamSimple(model, context, {
                 ...(typeof temperature === 'number' ? { temperature } : {}),
-                ...(shouldSendMaxOutputTokens() ? { maxOutputTokens } : {}),
-                abortSignal: controller.signal,
-                onError,
+                ...(typeof maxOutputTokens === 'number' ? { maxTokens: maxOutputTokens } : {}),
+                apiKey,
+                signal: controller.signal,
             });
+            const textStream = {
+                async *[Symbol.asyncIterator]() {
+                    for await (const event of stream) {
+                        if (event.type === 'text_delta')
+                            yield event.delta;
+                        if (event.type === 'error') {
+                            lastError = event.error;
+                            break;
+                        }
+                    }
+                },
+            };
             return {
-                textStream: wrapTextStream(result.textStream),
+                textStream: wrapTextStream(textStream),
                 canonicalModelId: parsed.canonical,
                 provider: parsed.provider,
-                usage: Promise.resolve(result.totalUsage)
-                    .then((raw) => normalizeTokenUsage(raw))
+                usage: stream
+                    .result()
+                    .then((msg) => normalizeTokenUsage(msg.usage))
                     .catch(() => null),
                 lastError: () => lastError,
             };
@@ -393,59 +619,124 @@ export async function streamTextWithModelId({ modelId, apiKeys, system, prompt,
             const apiKey = apiKeys.anthropicApiKey;
             if (!apiKey)
                 throw new Error('Missing ANTHROPIC_API_KEY for anthropic/... model');
-            const { createAnthropic } = await import('@ai-sdk/anthropic');
-            const anthropic = createAnthropic({ apiKey, fetch: fetchImpl });
-            const result = streamText({
-                model: anthropic(parsed.model),
-                system,
-                ...(typeof prompt === 'string' ? { prompt } : { messages: prompt }),
+            const model = resolveModelForCall({
+                modelId: parsed.model,
+                parsedProvider: parsed.provider,
+                openaiConfig: null,
+                context,
+                anthropicBaseUrlOverride,
+            });
+            const stream = streamSimple(model, context, {
                 ...(typeof temperature === 'number' ? { temperature } : {}),
-                ...(shouldSendMaxOutputTokens() ? { maxOutputTokens } : {}),
-                abortSignal: controller.signal,
-                onError,
+                ...(typeof maxOutputTokens === 'number' ? { maxTokens: maxOutputTokens } : {}),
+                apiKey,
+                signal: controller.signal,
             });
+            const textStream = {
+                async *[Symbol.asyncIterator]() {
+                    for await (const event of stream) {
+                        if (event.type === 'text_delta')
+                            yield event.delta;
+                        if (event.type === 'error') {
+                            lastError =
+                                normalizeAnthropicModelAccessError(event.error, parsed.model) ?? event.error;
+                            break;
+                        }
+                    }
+                },
+            };
             return {
-                textStream: wrapTextStream(result.textStream),
+                textStream: wrapTextStream(textStream),
                 canonicalModelId: parsed.canonical,
                 provider: parsed.provider,
-                usage: Promise.resolve(result.totalUsage)
-                    .then((raw) => normalizeTokenUsage(raw))
+                usage: stream
+                    .result()
+                    .then((msg) => normalizeTokenUsage(msg.usage))
+                    .catch(() => null),
+                lastError: () => lastError,
+            };
+        }
+        if (parsed.provider === 'zai') {
+            const apiKey = apiKeys.openaiApiKey;
+            if (!apiKey)
+                throw new Error('Missing Z_AI_API_KEY for zai/... model');
+            const model = resolveModelForCall({
+                modelId: parsed.model,
+                parsedProvider: parsed.provider,
+                openaiConfig: null,
+                context,
+                openaiBaseUrlOverride,
+            });
+            const stream = streamSimple(model, context, {
+                ...(typeof temperature === 'number' ? { temperature } : {}),
+                ...(typeof maxOutputTokens === 'number' ? { maxTokens: maxOutputTokens } : {}),
+                apiKey,
+                signal: controller.signal,
+            });
+            const textStream = {
+                async *[Symbol.asyncIterator]() {
+                    for await (const event of stream) {
+                        if (event.type === 'text_delta')
+                            yield event.delta;
+                        if (event.type === 'error') {
+                            lastError = event.error;
+                            break;
+                        }
+                    }
+                },
+            };
+            return {
+                textStream: wrapTextStream(textStream),
+                canonicalModelId: parsed.canonical,
+                provider: parsed.provider,
+                usage: stream
+                    .result()
+                    .then((msg) => normalizeTokenUsage(msg.usage))
                     .catch(() => null),
                 lastError: () => lastError,
             };
         }
-        const { createOpenAI } = await import('@ai-sdk/openai');
         const openaiConfig = resolveOpenAiClientConfig({
             apiKeys,
-            fetchImpl,
             forceOpenRouter,
             openaiBaseUrlOverride,
             forceChatCompletions,
         });
-        const openai = createOpenAI({
-            apiKey: openaiConfig.apiKey,
-            ...(openaiConfig.baseURL ? { baseURL: openaiConfig.baseURL } : {}),
-            fetch: openaiConfig.fetch,
+        const model = resolveModelForCall({
+            modelId: parsed.model,
+            parsedProvider: parsed.provider,
+            openaiConfig,
+            context,
+            openaiBaseUrlOverride,
+            anthropicBaseUrlOverride,
+            googleBaseUrlOverride,
+            xaiBaseUrlOverride,
         });
-        // OpenRouter requires chat completions endpoint
-        const useChatCompletions = openaiConfig.useChatCompletions;
-        const responsesModelId = parsed.model;
-        const chatModelId = parsed.model;
-        const result = streamText({
-            model: useChatCompletions ? openai.chat(chatModelId) : openai(responsesModelId),
-            system,
-            ...(typeof prompt === 'string' ? { prompt } : { messages: prompt }),
+        const stream = streamSimple(model, context, {
             ...(typeof temperature === 'number' ? { temperature } : {}),
-            ...(shouldSendMaxOutputTokens() ? { maxOutputTokens } : {}),
-            abortSignal: controller.signal,
-            onError,
+            ...(typeof maxOutputTokens === 'number' ? { maxTokens: maxOutputTokens } : {}),
+            apiKey: openaiConfig.apiKey,
+            signal: controller.signal,
         });
+        const textStream = {
+            async *[Symbol.asyncIterator]() {
+                for await (const event of stream) {
+                    if (event.type === 'text_delta')
+                        yield event.delta;
+                    if (event.type === 'error') {
+                        lastError = event.error;
+                        break;
+                    }
+                }
+            },
+        };
         return {
-            textStream: wrapTextStream(result.textStream),
+            textStream: wrapTextStream(textStream),
             canonicalModelId: parsed.canonical,
             provider: parsed.provider,
-            usage: Promise.resolve(result.totalUsage)
-                .then((raw) => normalizeTokenUsage(raw))
+            usage: stream
+                .result()
+                .then((msg) => normalizeTokenUsage(msg.usage))
                 .catch(() => null),
             lastError: () => lastError,
         };