npm - @steipete/summarize - Versions diffs - 0.8.2 → 0.10.0 - Mend

@steipete/summarize 0.8.2 → 0.10.0

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (284) hide show

package/CHANGELOG.md +114 -1
package/LICENSE +1 -1
package/README.md +309 -182
package/dist/cli.js +1 -1
package/dist/esm/cache.js +72 -4
package/dist/esm/cache.js.map +1 -1
package/dist/esm/config.js +197 -1
package/dist/esm/config.js.map +1 -1
package/dist/esm/content/asset.js +75 -2
package/dist/esm/content/asset.js.map +1 -1
package/dist/esm/daemon/agent.js +547 -0
package/dist/esm/daemon/agent.js.map +1 -0
package/dist/esm/daemon/chat.js +97 -0
package/dist/esm/daemon/chat.js.map +1 -0
package/dist/esm/daemon/cli.js +105 -10
package/dist/esm/daemon/cli.js.map +1 -1
package/dist/esm/daemon/env-snapshot.js +3 -0
package/dist/esm/daemon/env-snapshot.js.map +1 -1
package/dist/esm/daemon/flow-context.js +53 -28
package/dist/esm/daemon/flow-context.js.map +1 -1
package/dist/esm/daemon/launchd.js +27 -0
package/dist/esm/daemon/launchd.js.map +1 -1
package/dist/esm/daemon/process-registry.js +206 -0
package/dist/esm/daemon/process-registry.js.map +1 -0
package/dist/esm/daemon/schtasks.js +64 -0
package/dist/esm/daemon/schtasks.js.map +1 -1
package/dist/esm/daemon/server.js +1034 -52
package/dist/esm/daemon/server.js.map +1 -1
package/dist/esm/daemon/summarize.js +66 -18
package/dist/esm/daemon/summarize.js.map +1 -1
package/dist/esm/daemon/systemd.js +61 -0
package/dist/esm/daemon/systemd.js.map +1 -1
package/dist/esm/flags.js +24 -0
package/dist/esm/flags.js.map +1 -1
package/dist/esm/llm/attachments.js +2 -0
package/dist/esm/llm/attachments.js.map +1 -0
package/dist/esm/llm/errors.js +6 -0
package/dist/esm/llm/errors.js.map +1 -0
package/dist/esm/llm/generate-text.js +206 -356
package/dist/esm/llm/generate-text.js.map +1 -1
package/dist/esm/llm/html-to-markdown.js +1 -2
package/dist/esm/llm/html-to-markdown.js.map +1 -1
package/dist/esm/llm/prompt.js.map +1 -1
package/dist/esm/llm/providers/anthropic.js +126 -0
package/dist/esm/llm/providers/anthropic.js.map +1 -0
package/dist/esm/llm/providers/google.js +78 -0
package/dist/esm/llm/providers/google.js.map +1 -0
package/dist/esm/llm/providers/models.js +111 -0
package/dist/esm/llm/providers/models.js.map +1 -0
package/dist/esm/llm/providers/openai.js +150 -0
package/dist/esm/llm/providers/openai.js.map +1 -0
package/dist/esm/llm/providers/shared.js +48 -0
package/dist/esm/llm/providers/shared.js.map +1 -0
package/dist/esm/llm/providers/types.js +2 -0
package/dist/esm/llm/providers/types.js.map +1 -0
package/dist/esm/llm/transcript-to-markdown.js +1 -2
package/dist/esm/llm/transcript-to-markdown.js.map +1 -1
package/dist/esm/llm/types.js +2 -0
package/dist/esm/llm/types.js.map +1 -0
package/dist/esm/llm/usage.js +69 -0
package/dist/esm/llm/usage.js.map +1 -0
package/dist/esm/logging/daemon.js +124 -0
package/dist/esm/logging/daemon.js.map +1 -0
package/dist/esm/logging/ring-file.js +66 -0
package/dist/esm/logging/ring-file.js.map +1 -0
package/dist/esm/media-cache.js +251 -0
package/dist/esm/media-cache.js.map +1 -0
package/dist/esm/model-auto.js +103 -5
package/dist/esm/model-auto.js.map +1 -1
package/dist/esm/processes.js +2 -0
package/dist/esm/processes.js.map +1 -0
package/dist/esm/refresh-free.js +3 -3
package/dist/esm/refresh-free.js.map +1 -1
package/dist/esm/run/attachments.js +8 -4
package/dist/esm/run/attachments.js.map +1 -1
package/dist/esm/run/bird.js +118 -5
package/dist/esm/run/bird.js.map +1 -1
package/dist/esm/run/cache-state.js +3 -2
package/dist/esm/run/cache-state.js.map +1 -1
package/dist/esm/run/cli-preflight.js +19 -1
package/dist/esm/run/cli-preflight.js.map +1 -1
package/dist/esm/run/constants.js +0 -7
package/dist/esm/run/constants.js.map +1 -1
package/dist/esm/run/finish-line.js +58 -11
package/dist/esm/run/finish-line.js.map +1 -1
package/dist/esm/run/flows/asset/extract.js +70 -0
package/dist/esm/run/flows/asset/extract.js.map +1 -0
package/dist/esm/run/flows/asset/input.js +209 -25
package/dist/esm/run/flows/asset/input.js.map +1 -1
package/dist/esm/run/flows/asset/media-policy.js +3 -0
package/dist/esm/run/flows/asset/media-policy.js.map +1 -0
package/dist/esm/run/flows/asset/media.js +224 -0
package/dist/esm/run/flows/asset/media.js.map +1 -0
package/dist/esm/run/flows/asset/output.js +98 -0
package/dist/esm/run/flows/asset/output.js.map +1 -0
package/dist/esm/run/flows/asset/preprocess.js +92 -16
package/dist/esm/run/flows/asset/preprocess.js.map +1 -1
package/dist/esm/run/flows/asset/summary.js +165 -11
package/dist/esm/run/flows/asset/summary.js.map +1 -1
package/dist/esm/run/flows/url/extract.js +6 -6
package/dist/esm/run/flows/url/extract.js.map +1 -1
package/dist/esm/run/flows/url/flow.js +338 -36
package/dist/esm/run/flows/url/flow.js.map +1 -1
package/dist/esm/run/flows/url/markdown.js +6 -1
package/dist/esm/run/flows/url/markdown.js.map +1 -1
package/dist/esm/run/flows/url/slides-output.js +485 -0
package/dist/esm/run/flows/url/slides-output.js.map +1 -0
package/dist/esm/run/flows/url/slides-text.js +628 -0
package/dist/esm/run/flows/url/slides-text.js.map +1 -0
package/dist/esm/run/flows/url/summary.js +358 -83
package/dist/esm/run/flows/url/summary.js.map +1 -1
package/dist/esm/run/help.js +94 -5
package/dist/esm/run/help.js.map +1 -1
package/dist/esm/run/logging.js +12 -4
package/dist/esm/run/logging.js.map +1 -1
package/dist/esm/run/media-cache-state.js +33 -0
package/dist/esm/run/media-cache-state.js.map +1 -0
package/dist/esm/run/progress.js +19 -1
package/dist/esm/run/progress.js.map +1 -1
package/dist/esm/run/run-context.js +19 -0
package/dist/esm/run/run-context.js.map +1 -0
package/dist/esm/run/run-output.js +1 -1
package/dist/esm/run/run-output.js.map +1 -1
package/dist/esm/run/run-settings.js +182 -0
package/dist/esm/run/run-settings.js.map +1 -0
package/dist/esm/run/runner.js +225 -32
package/dist/esm/run/runner.js.map +1 -1
package/dist/esm/run/slides-cli.js +225 -0
package/dist/esm/run/slides-cli.js.map +1 -0
package/dist/esm/run/slides-render.js +163 -0
package/dist/esm/run/slides-render.js.map +1 -0
package/dist/esm/run/stream-output.js +63 -0
package/dist/esm/run/stream-output.js.map +1 -0
package/dist/esm/run/streaming.js +16 -43
package/dist/esm/run/streaming.js.map +1 -1
package/dist/esm/run/summary-engine.js +59 -41
package/dist/esm/run/summary-engine.js.map +1 -1
package/dist/esm/run/transcriber-cli.js +148 -0
package/dist/esm/run/transcriber-cli.js.map +1 -0
package/dist/esm/shared/sse-events.js +26 -0
package/dist/esm/shared/sse-events.js.map +1 -0
package/dist/esm/shared/streaming-merge.js +44 -0
package/dist/esm/shared/streaming-merge.js.map +1 -0
package/dist/esm/slides/extract.js +1942 -0
package/dist/esm/slides/extract.js.map +1 -0
package/dist/esm/slides/index.js +4 -0
package/dist/esm/slides/index.js.map +1 -0
package/dist/esm/slides/settings.js +73 -0
package/dist/esm/slides/settings.js.map +1 -0
package/dist/esm/slides/store.js +111 -0
package/dist/esm/slides/store.js.map +1 -0
package/dist/esm/slides/types.js +2 -0
package/dist/esm/slides/types.js.map +1 -0
package/dist/esm/tty/osc-progress.js +21 -1
package/dist/esm/tty/osc-progress.js.map +1 -1
package/dist/esm/tty/progress/fetch-html.js +8 -4
package/dist/esm/tty/progress/fetch-html.js.map +1 -1
package/dist/esm/tty/progress/transcript.js +82 -31
package/dist/esm/tty/progress/transcript.js.map +1 -1
package/dist/esm/tty/spinner.js +2 -2
package/dist/esm/tty/spinner.js.map +1 -1
package/dist/esm/tty/theme.js +189 -0
package/dist/esm/tty/theme.js.map +1 -0
package/dist/esm/tty/website-progress.js +17 -13
package/dist/esm/tty/website-progress.js.map +1 -1
package/dist/esm/version.js +1 -1
package/dist/esm/version.js.map +1 -1
package/dist/types/cache.d.ts +14 -2
package/dist/types/config.d.ts +34 -0
package/dist/types/daemon/agent.d.ts +25 -0
package/dist/types/daemon/chat.d.ts +27 -0
package/dist/types/daemon/env-snapshot.d.ts +1 -1
package/dist/types/daemon/flow-context.d.ts +24 -3
package/dist/types/daemon/launchd.d.ts +4 -0
package/dist/types/daemon/process-registry.d.ts +73 -0
package/dist/types/daemon/schtasks.d.ts +4 -0
package/dist/types/daemon/server.d.ts +7 -1
package/dist/types/daemon/summarize.d.ts +47 -5
package/dist/types/daemon/systemd.d.ts +4 -0
package/dist/types/flags.d.ts +1 -0
package/dist/types/llm/attachments.d.ts +6 -0
package/dist/types/llm/errors.d.ts +1 -0
package/dist/types/llm/generate-text.d.ts +29 -13
package/dist/types/llm/prompt.d.ts +7 -2
package/dist/types/llm/providers/anthropic.d.ts +30 -0
package/dist/types/llm/providers/google.d.ts +29 -0
package/dist/types/llm/providers/models.d.ts +27 -0
package/dist/types/llm/providers/openai.d.ts +38 -0
package/dist/types/llm/providers/shared.d.ts +14 -0
package/dist/types/llm/providers/types.d.ts +6 -0
package/dist/types/llm/types.d.ts +5 -0
package/dist/types/llm/usage.d.ts +5 -0
package/dist/types/logging/daemon.d.ts +26 -0
package/dist/types/logging/ring-file.d.ts +10 -0
package/dist/types/media-cache.d.ts +22 -0
package/dist/types/model-auto.d.ts +1 -0
package/dist/types/processes.d.ts +1 -0
package/dist/types/run/attachments.d.ts +9 -6
package/dist/types/run/bird.d.ts +7 -0
package/dist/types/run/constants.d.ts +0 -2
package/dist/types/run/finish-line.d.ts +59 -1
package/dist/types/run/flows/asset/extract.d.ts +18 -0
package/dist/types/run/flows/asset/input.d.ts +12 -2
package/dist/types/run/flows/asset/media-policy.d.ts +2 -0
package/dist/types/run/flows/asset/media.d.ts +21 -0
package/dist/types/run/flows/asset/output.d.ts +42 -0
package/dist/types/run/flows/asset/preprocess.d.ts +22 -2
package/dist/types/run/flows/asset/summary.d.ts +6 -0
package/dist/types/run/flows/url/extract.d.ts +2 -1
package/dist/types/run/flows/url/slides-output.d.ts +66 -0
package/dist/types/run/flows/url/slides-text.d.ts +87 -0
package/dist/types/run/flows/url/summary.d.ts +11 -3
package/dist/types/run/flows/url/types.d.ts +29 -2
package/dist/types/run/help.d.ts +3 -0
package/dist/types/run/logging.d.ts +3 -2
package/dist/types/run/media-cache-state.d.ts +7 -0
package/dist/types/run/progress.d.ts +2 -1
package/dist/types/run/run-context.d.ts +44 -0
package/dist/types/run/run-settings.d.ts +62 -0
package/dist/types/run/slides-cli.d.ts +9 -0
package/dist/types/run/slides-render.d.ts +30 -0
package/dist/types/run/stream-output.d.ts +12 -0
package/dist/types/run/streaming.d.ts +10 -4
package/dist/types/run/summary-engine.d.ts +15 -3
package/dist/types/run/summary-llm.d.ts +2 -2
package/dist/types/run/transcriber-cli.d.ts +8 -0
package/dist/types/shared/sse-events.d.ts +64 -0
package/dist/types/shared/streaming-merge.d.ts +4 -0
package/dist/types/slides/extract.d.ts +42 -0
package/dist/types/slides/index.d.ts +5 -0
package/dist/types/slides/settings.d.ts +20 -0
package/dist/types/slides/store.d.ts +15 -0
package/dist/types/slides/types.d.ts +40 -0
package/dist/types/tty/osc-progress.d.ts +2 -2
package/dist/types/tty/progress/fetch-html.d.ts +3 -1
package/dist/types/tty/progress/transcript.d.ts +3 -1
package/dist/types/tty/spinner.d.ts +3 -1
package/dist/types/tty/theme.d.ts +44 -0
package/dist/types/tty/website-progress.d.ts +3 -1
package/dist/types/version.d.ts +1 -1
package/docs/README.md +13 -8
package/docs/_config.yml +26 -0
package/docs/_layouts/default.html +60 -0
package/docs/agent.md +333 -0
package/docs/assets/site.css +748 -0
package/docs/assets/site.js +72 -0
package/docs/assets/summarize-cli.png +0 -0
package/docs/assets/summarize-extension.png +0 -0
package/docs/assets/youtube-slides.png +0 -0
package/docs/cache.md +29 -3
package/docs/chrome-extension.md +85 -7
package/docs/config.md +74 -2
package/docs/extract-only.md +10 -2
package/docs/index.html +205 -0
package/docs/index.md +25 -0
package/docs/language.md +1 -1
package/docs/llm.md +17 -1
package/docs/manual-tests.md +2 -0
package/docs/media.md +37 -0
package/docs/model-auto.md +2 -1
package/docs/nvidia-onnx-transcription.md +55 -0
package/docs/openai.md +5 -0
package/docs/releasing.md +26 -0
package/docs/site/assets/site.css +399 -228
package/docs/site/assets/summarize-cli.png +0 -0
package/docs/site/assets/summarize-extension.png +0 -0
package/docs/site/docs/chrome-extension.html +89 -0
package/docs/site/docs/config.html +1 -0
package/docs/site/docs/extract-only.html +1 -0
package/docs/site/docs/firecrawl.html +1 -0
package/docs/site/docs/index.html +5 -0
package/docs/site/docs/llm.html +1 -0
package/docs/site/docs/openai.html +1 -0
package/docs/site/docs/website.html +1 -0
package/docs/site/docs/youtube.html +1 -0
package/docs/site/index.html +148 -84
package/docs/slides.md +74 -0
package/docs/timestamps.md +103 -0
package/docs/website.md +13 -0
package/docs/youtube.md +16 -0
package/package.json +22 -18
package/dist/esm/daemon/request-settings.js +0 -91
package/dist/esm/daemon/request-settings.js.map +0 -1
package/dist/types/daemon/request-settings.d.ts +0 -27

package/dist/esm/llm/generate-text.js CHANGED Viewed

@@ -1,265 +1,169 @@
-import { completeSimple, getModel, streamSimple } from '@mariozechner/pi-ai';
+import { completeSimple, streamSimple } from '@mariozechner/pi-ai';
+import { createUnsupportedFunctionalityError } from './errors.js';
 import { parseGatewayStyleModelId } from './model-id.js';
-function parseAnthropicErrorPayload(responseBody) {
-    try {
-        const parsed = JSON.parse(responseBody);
-        if (parsed?.type !== 'error')
-            return null;
-        const error = parsed.error;
-        if (!error || typeof error !== 'object')
-            return null;
-        const errorType = typeof error.type === 'string' ? error.type : null;
-        const errorMessage = typeof error.message === 'string' ? error.message : null;
-        if (!errorType || !errorMessage)
-            return null;
-        return { type: errorType, message: errorMessage };
+import { userTextAndImageMessage } from './prompt.js';
+import { completeAnthropicDocument, completeAnthropicText, normalizeAnthropicModelAccessError, } from './providers/anthropic.js';
+import { completeGoogleDocument, completeGoogleText } from './providers/google.js';
+import { resolveAnthropicModel, resolveGoogleModel, resolveOpenAiModel, resolveXaiModel, resolveZaiModel, } from './providers/models.js';
+import { completeOpenAiDocument, completeOpenAiText, resolveOpenAiClientConfig, } from './providers/openai.js';
+import { extractText } from './providers/shared.js';
+import { normalizeTokenUsage } from './usage.js';
+function promptToContext(prompt) {
+    const attachments = prompt.attachments ?? [];
+    if (attachments.some((attachment) => attachment.kind === 'document')) {
+        throw new Error('Internal error: document prompt cannot be converted to context.');
     }
-    catch {
-        return null;
+    if (attachments.length === 0) {
+        return {
+            systemPrompt: prompt.system,
+            messages: [{ role: 'user', content: prompt.userText, timestamp: Date.now() }],
+        };
     }
-}
-function normalizeAnthropicModelAccessError(error, modelId) {
-    if (!error || typeof error !== 'object')
-        return null;
-    const maybe = error;
-    const statusCode = typeof maybe.statusCode === 'number' ? maybe.statusCode : null;
-    const responseBody = typeof maybe.responseBody === 'string' ? maybe.responseBody : null;
-    const payload = responseBody ? parseAnthropicErrorPayload(responseBody) : null;
-    const payloadType = payload?.type ?? null;
-    const payloadMessage = payload?.message ?? null;
-    const message = typeof maybe.message === 'string' ? maybe.message : '';
-    const combinedMessage = (payloadMessage ?? message).trim();
-    const hasModelMessage = /^model:\s*\S+/i.test(combinedMessage);
-    const isAccessStatus = statusCode === 401 || statusCode === 403 || statusCode === 404;
-    const isAccessType = payloadType === 'not_found_error' ||
-        payloadType === 'permission_error' ||
-        payloadType === 'authentication_error';
-    if (!hasModelMessage && !isAccessStatus && !isAccessType)
-        return null;
-    const modelLabel = hasModelMessage ? combinedMessage.replace(/^model:\s*/i, '').trim() : modelId;
-    const hint = `Anthropic API rejected model "${modelLabel}". Your ANTHROPIC_API_KEY likely lacks access to this model or it is unavailable for your account. Try another anthropic/... model or request access.`;
-    return new Error(hint, { cause: error instanceof Error ? error : undefined });
-}
-function normalizeTokenUsage(raw) {
-    if (!raw || typeof raw !== 'object')
-        return null;
-    const usage = raw;
-    const promptTokens = typeof usage.input === 'number' && Number.isFinite(usage.input) ? usage.input : null;
-    const completionTokens = typeof usage.output === 'number' && Number.isFinite(usage.output) ? usage.output : null;
-    const totalTokens = typeof usage.totalTokens === 'number' && Number.isFinite(usage.totalTokens)
-        ? usage.totalTokens
-        : null;
-    if (promptTokens === null && completionTokens === null && totalTokens === null)
-        return null;
-    return { promptTokens, completionTokens, totalTokens };
-}
-function resolveBaseUrlOverride(raw) {
-    const trimmed = typeof raw === 'string' ? raw.trim() : '';
-    return trimmed.length > 0 ? trimmed : null;
-}
-function resolveOpenAiClientConfig({ apiKeys, forceOpenRouter, openaiBaseUrlOverride, forceChatCompletions, }) {
-    const baseUrlRaw = openaiBaseUrlOverride ??
-        (typeof process !== 'undefined' ? process.env.OPENAI_BASE_URL : undefined);
-    const baseUrl = typeof baseUrlRaw === 'string' && baseUrlRaw.trim().length > 0 ? baseUrlRaw.trim() : null;
-    const isOpenRouterViaBaseUrl = baseUrl ? /openrouter\.ai/i.test(baseUrl) : false;
-    const hasOpenRouterKey = apiKeys.openrouterApiKey != null;
-    const hasOpenAiKey = apiKeys.openaiApiKey != null;
-    const isOpenRouter = Boolean(forceOpenRouter) ||
-        isOpenRouterViaBaseUrl ||
-        (hasOpenRouterKey && !baseUrl && !hasOpenAiKey);
-    const apiKey = isOpenRouter
-        ? (apiKeys.openrouterApiKey ?? apiKeys.openaiApiKey)
-        : apiKeys.openaiApiKey;
-    if (!apiKey) {
-        throw new Error(isOpenRouter
-            ? 'Missing OPENROUTER_API_KEY (or OPENAI_API_KEY) for OpenRouter'
-            : 'Missing OPENAI_API_KEY for openai/... model');
+    if (attachments.length !== 1 || attachments[0]?.kind !== 'image') {
+        throw new Error('Internal error: only single image attachments are supported for prompts.');
     }
-    const baseURL = forceOpenRouter
-        ? 'https://openrouter.ai/api/v1'
-        : (baseUrl ?? (isOpenRouter ? 'https://openrouter.ai/api/v1' : undefined));
-    const isCustomBaseURL = (() => {
-        if (!baseURL)
-            return false;
-        try {
-            const url = new URL(baseURL);
-            return url.host !== 'api.openai.com' && url.host !== 'openrouter.ai';
-        }
-        catch {
-            return false;
-        }
-    })();
-    const useChatCompletions = Boolean(forceChatCompletions) || isOpenRouter || isCustomBaseURL;
-    return {
-        apiKey,
-        baseURL: baseURL ?? undefined,
-        useChatCompletions,
-        isOpenRouter,
-    };
+    const attachment = attachments[0];
+    const messages = [
+        userTextAndImageMessage({
+            text: prompt.userText,
+            imageBytes: attachment.bytes,
+            mimeType: attachment.mediaType,
+        }),
+    ];
+    return { systemPrompt: prompt.system, messages };
 }
-function promptToContext({ system, prompt }) {
-    const messages = typeof prompt === 'string'
-        ? [{ role: 'user', content: prompt, timestamp: Date.now() }]
-        : prompt.map((msg) => typeof msg.timestamp === 'number'
-            ? msg
-            : { ...msg, timestamp: Date.now() });
-    return { systemPrompt: system, messages };
+function isRetryableTimeoutError(error) {
+    if (!error)
+        return false;
+    const message = typeof error === 'string'
+        ? error
+        : error instanceof Error
+            ? error.message
+            : typeof error.message === 'string'
+                ? String(error.message)
+                : '';
+    return /timed out/i.test(message) || /empty summary/i.test(message);
 }
-function extractText(message) {
-    const text = message.content
-        .filter((c) => c.type === 'text')
-        .map((c) => c.text)
-        .join('');
-    return text.trim();
+function computeRetryDelayMs(attempt) {
+    const base = 500;
+    const jitter = Math.floor(Math.random() * 200);
+    return Math.min(2000, base * (attempt + 1) + jitter);
 }
-function wantsImages(context) {
-    for (const msg of context.messages) {
-        if (msg.role === 'user' || msg.role === 'toolResult') {
-            if (Array.isArray(msg.content) && msg.content.some((c) => c.type === 'image'))
-                return true;
-        }
-    }
-    return false;
+function sleep(ms) {
+    return new Promise((resolve) => setTimeout(resolve, ms));
 }
-function tryGetModel(provider, modelId) {
-    try {
-        return getModel(provider, modelId);
-    }
-    catch {
-        return null;
-    }
+function isOpenaiGpt5Model(parsed) {
+    return parsed.provider === 'openai' && /^gpt-5([-.].+)?$/i.test(parsed.model);
 }
-function createSyntheticModel({ provider, modelId, api, baseUrl, allowImages, headers, }) {
-    return {
-        id: modelId,
-        name: `${provider}/${modelId}`,
-        api,
-        provider,
-        baseUrl,
-        reasoning: false,
-        input: allowImages ? ['text', 'image'] : ['text'],
-        cost: { input: 0, output: 0, cacheRead: 0, cacheWrite: 0 },
-        contextWindow: 128_000,
-        maxTokens: 16_384,
-        ...(headers ? { headers } : {}),
-    };
+function resolveEffectiveTemperature({ parsed, temperature, }) {
+    if (typeof temperature !== 'number')
+        return undefined;
+    if (isOpenaiGpt5Model(parsed))
+        return undefined;
+    return temperature;
 }
-function resolveModelForCall({ modelId, parsedProvider, openaiConfig, context, openaiBaseUrlOverride, anthropicBaseUrlOverride, googleBaseUrlOverride, xaiBaseUrlOverride, }) {
-    const allowImages = wantsImages(context);
-    if (parsedProvider === 'openai') {
-        const base = tryGetModel('openai', modelId);
-        const api = openaiConfig?.useChatCompletions ? 'openai-completions' : 'openai-responses';
-        const baseUrl = openaiConfig?.baseURL ?? base?.baseUrl ?? 'https://api.openai.com/v1';
-        const headers = openaiConfig?.isOpenRouter
-            ? {
-                ...(base?.headers ?? {}),
-                'HTTP-Referer': 'https://github.com/steipete/summarize',
-                'X-Title': 'summarize',
+export async function generateTextWithModelId({ modelId, apiKeys, prompt, temperature, maxOutputTokens, timeoutMs, fetchImpl, forceOpenRouter, openaiBaseUrlOverride, anthropicBaseUrlOverride, googleBaseUrlOverride, xaiBaseUrlOverride, forceChatCompletions, retries = 0, onRetry, }) {
+    const parsed = parseGatewayStyleModelId(modelId);
+    const effectiveTemperature = resolveEffectiveTemperature({ parsed, temperature });
+    const attachments = prompt.attachments ?? [];
+    const documentAttachment = attachments.find((attachment) => attachment.kind === 'document') ?? null;
+    if (documentAttachment) {
+        if (attachments.length !== 1) {
+            throw new Error('Internal error: document attachments cannot be combined with other inputs.');
+        }
+        if (parsed.provider === 'anthropic') {
+            const apiKey = apiKeys.anthropicApiKey;
+            if (!apiKey)
+                throw new Error('Missing ANTHROPIC_API_KEY for anthropic/... model');
+            try {
+                const result = await completeAnthropicDocument({
+                    modelId: parsed.model,
+                    apiKey,
+                    promptText: prompt.userText,
+                    document: documentAttachment,
+                    system: prompt.system,
+                    maxOutputTokens,
+                    timeoutMs,
+                    fetchImpl,
+                    anthropicBaseUrlOverride,
+                });
+                return {
+                    text: result.text,
+                    canonicalModelId: parsed.canonical,
+                    provider: parsed.provider,
+                    usage: result.usage,
+                };
             }
-            : base?.headers;
-        return {
-            ...(base ?? createSyntheticModel({ provider: 'openai', modelId, api, baseUrl, allowImages })),
-            api,
-            baseUrl,
-            ...(headers ? { headers } : {}),
-        };
-    }
-    if (parsedProvider === 'zai') {
-        const base = tryGetModel('zai', modelId);
-        const api = 'openai-completions';
-        const baseUrl = openaiBaseUrlOverride ??
-            base?.baseUrl ??
-            openaiConfig?.baseURL ??
-            'https://api.z.ai/api/paas/v4';
-        return {
-            ...(base ?? createSyntheticModel({ provider: 'zai', modelId, api, baseUrl, allowImages })),
-            api,
-            baseUrl,
-            input: allowImages ? ['text', 'image'] : ['text'],
-        };
-    }
-    if (parsedProvider === 'xai') {
-        const base = tryGetModel('xai', modelId);
-        const override = resolveBaseUrlOverride(xaiBaseUrlOverride);
-        if (override) {
+            catch (error) {
+                const normalized = normalizeAnthropicModelAccessError(error, parsed.model);
+                if (normalized)
+                    throw normalized;
+                throw error;
+            }
+        }
+        if (parsed.provider === 'openai') {
+            const openaiConfig = resolveOpenAiClientConfig({
+                apiKeys: {
+                    openaiApiKey: apiKeys.openaiApiKey,
+                    openrouterApiKey: apiKeys.openrouterApiKey,
+                },
+                forceOpenRouter,
+                openaiBaseUrlOverride,
+                forceChatCompletions,
+            });
+            const result = await completeOpenAiDocument({
+                modelId: parsed.model,
+                openaiConfig,
+                promptText: prompt.userText,
+                document: documentAttachment,
+                maxOutputTokens,
+                temperature: effectiveTemperature,
+                timeoutMs,
+                fetchImpl,
+            });
             return {
-                ...(base ??
-                    createSyntheticModel({
-                        provider: 'xai',
-                        modelId,
-                        api: 'openai-completions',
-                        baseUrl: override,
-                        allowImages,
-                    })),
-                baseUrl: override,
+                text: result.text,
+                canonicalModelId: parsed.canonical,
+                provider: parsed.provider,
+                usage: result.usage,
             };
         }
-        return (base ??
-            createSyntheticModel({
-                provider: 'xai',
-                modelId,
-                api: 'openai-completions',
-                baseUrl: 'https://api.x.ai/v1',
-                allowImages,
-            }));
-    }
-    if (parsedProvider === 'google') {
-        const base = tryGetModel('google', modelId);
-        const override = resolveBaseUrlOverride(googleBaseUrlOverride);
-        if (override) {
+        if (parsed.provider === 'google') {
+            const apiKey = apiKeys.googleApiKey;
+            if (!apiKey)
+                throw new Error('Missing GEMINI_API_KEY (or GOOGLE_GENERATIVE_AI_API_KEY / GOOGLE_API_KEY) for google/... model');
+            const result = await completeGoogleDocument({
+                modelId: parsed.model,
+                apiKey,
+                promptText: prompt.userText,
+                document: documentAttachment,
+                maxOutputTokens,
+                temperature: effectiveTemperature,
+                timeoutMs,
+                fetchImpl,
+                googleBaseUrlOverride,
+            });
             return {
-                ...(base ??
-                    createSyntheticModel({
-                        provider: 'google',
-                        modelId,
-                        api: 'google-generative-ai',
-                        baseUrl: override,
-                        allowImages,
-                    })),
-                baseUrl: override,
+                text: result.text,
+                canonicalModelId: parsed.canonical,
+                provider: parsed.provider,
+                usage: result.usage,
             };
         }
-        return (base ??
-            createSyntheticModel({
-                provider: 'google',
-                modelId,
-                api: 'google-generative-ai',
-                baseUrl: 'https://generativelanguage.googleapis.com/v1beta',
-                allowImages,
-            }));
+        throw createUnsupportedFunctionalityError(`document attachments are not supported for ${parsed.provider}/... models`);
     }
-    const base = tryGetModel('anthropic', modelId);
-    const override = resolveBaseUrlOverride(anthropicBaseUrlOverride);
-    if (override) {
-        return {
-            ...(base ??
-                createSyntheticModel({
-                    provider: 'anthropic',
-                    modelId,
-                    api: 'anthropic-messages',
-                    baseUrl: override,
-                    allowImages,
-                })),
-            baseUrl: override,
-        };
-    }
-    return (base ??
-        createSyntheticModel({
-            provider: 'anthropic',
-            modelId,
-            api: 'anthropic-messages',
-            baseUrl: 'https://api.anthropic.com',
-            allowImages,
-        }));
-}
-export async function generateTextWithModelId({ modelId, apiKeys, system, prompt, temperature, maxOutputTokens, timeoutMs, fetchImpl: _fetchImpl, forceOpenRouter, openaiBaseUrlOverride, anthropicBaseUrlOverride, googleBaseUrlOverride, xaiBaseUrlOverride, forceChatCompletions, retries = 0, onRetry, }) {
-    void _fetchImpl;
-    const parsed = parseGatewayStyleModelId(modelId);
-    const context = promptToContext({ system, prompt });
-    const isOpenaiGpt5 = parsed.provider === 'openai' && /^gpt-5([-.].+)?$/i.test(parsed.model);
-    const effectiveTemperature = typeof temperature === 'number' && !(isOpenaiGpt5 && temperature === 0)
-        ? temperature
-        : undefined;
+    const context = promptToContext(prompt);
+    const openaiConfig = parsed.provider === 'openai'
+        ? resolveOpenAiClientConfig({
+            apiKeys: {
+                openaiApiKey: apiKeys.openaiApiKey,
+                openrouterApiKey: apiKeys.openrouterApiKey,
+            },
+            forceOpenRouter,
+            openaiBaseUrlOverride,
+            forceChatCompletions,
+        })
+        : null;
     const maxRetries = Math.max(0, retries);
     let attempt = 0;
     while (attempt <= maxRetries) {
@@ -270,10 +174,8 @@ export async function generateTextWithModelId({ modelId, apiKeys, system, prompt
                 const apiKey = apiKeys.xaiApiKey;
                 if (!apiKey)
                     throw new Error('Missing XAI_API_KEY for xai/... model');
-                const model = resolveModelForCall({
+                const model = resolveXaiModel({
                     modelId: parsed.model,
-                    parsedProvider: parsed.provider,
-                    openaiConfig: null,
                     context,
                     xaiBaseUrlOverride,
                 });
@@ -299,76 +201,48 @@ export async function generateTextWithModelId({ modelId, apiKeys, system, prompt
                 const apiKey = apiKeys.googleApiKey;
                 if (!apiKey)
                     throw new Error('Missing GEMINI_API_KEY (or GOOGLE_GENERATIVE_AI_API_KEY / GOOGLE_API_KEY) for google/... model');
-                const model = resolveModelForCall({
+                const result = await completeGoogleText({
                     modelId: parsed.model,
-                    parsedProvider: parsed.provider,
-                    openaiConfig: null,
-                    context,
-                    googleBaseUrlOverride,
-                });
-                const result = await completeSimple(model, context, {
-                    ...(typeof effectiveTemperature === 'number'
-                        ? { temperature: effectiveTemperature }
-                        : {}),
-                    ...(typeof maxOutputTokens === 'number' ? { maxTokens: maxOutputTokens } : {}),
                     apiKey,
+                    context,
+                    temperature: effectiveTemperature,
+                    maxOutputTokens,
                     signal: controller.signal,
+                    googleBaseUrlOverride,
                 });
-                const text = extractText(result);
-                if (!text)
-                    throw new Error(`LLM returned an empty summary (model ${parsed.canonical}).`);
                 return {
-                    text,
+                    text: result.text,
                     canonicalModelId: parsed.canonical,
                     provider: parsed.provider,
-                    usage: normalizeTokenUsage(result.usage),
+                    usage: result.usage,
                 };
             }
             if (parsed.provider === 'anthropic') {
                 const apiKey = apiKeys.anthropicApiKey;
                 if (!apiKey)
                     throw new Error('Missing ANTHROPIC_API_KEY for anthropic/... model');
-                const model = resolveModelForCall({
+                const result = await completeAnthropicText({
                     modelId: parsed.model,
-                    parsedProvider: parsed.provider,
-                    openaiConfig: null,
-                    context,
-                    anthropicBaseUrlOverride,
-                });
-                const result = await completeSimple(model, context, {
-                    ...(typeof effectiveTemperature === 'number'
-                        ? { temperature: effectiveTemperature }
-                        : {}),
-                    ...(typeof maxOutputTokens === 'number' ? { maxTokens: maxOutputTokens } : {}),
                     apiKey,
+                    context,
+                    temperature: effectiveTemperature,
+                    maxOutputTokens,
                     signal: controller.signal,
+                    anthropicBaseUrlOverride,
                 });
-                const text = extractText(result);
-                if (!text)
-                    throw new Error(`LLM returned an empty summary (model ${parsed.canonical}).`);
                 return {
-                    text,
+                    text: result.text,
                     canonicalModelId: parsed.canonical,
                     provider: parsed.provider,
-                    usage: normalizeTokenUsage(result.usage),
+                    usage: result.usage,
                 };
             }
-            const openaiConfig = parsed.provider === 'openai'
-                ? resolveOpenAiClientConfig({
-                    apiKeys,
-                    forceOpenRouter,
-                    openaiBaseUrlOverride,
-                    forceChatCompletions,
-                })
-                : null;
             if (parsed.provider === 'zai') {
                 const apiKey = apiKeys.openaiApiKey;
                 if (!apiKey)
                     throw new Error('Missing Z_AI_API_KEY for zai/... model');
-                const model = resolveModelForCall({
+                const model = resolveZaiModel({
                     modelId: parsed.model,
-                    parsedProvider: parsed.provider,
-                    openaiConfig: null,
                     context,
                     openaiBaseUrlOverride,
                 });
@@ -390,30 +264,22 @@ export async function generateTextWithModelId({ modelId, apiKeys, system, prompt
                     usage: normalizeTokenUsage(result.usage),
                 };
             }
-            const model = resolveModelForCall({
+            if (!openaiConfig) {
+                throw new Error('Missing OPENAI_API_KEY for openai/... model');
+            }
+            const result = await completeOpenAiText({
                 modelId: parsed.model,
-                parsedProvider: parsed.provider,
                 openaiConfig,
                 context,
-                openaiBaseUrlOverride,
-                anthropicBaseUrlOverride,
-                googleBaseUrlOverride,
-                xaiBaseUrlOverride,
-            });
-            const result = await completeSimple(model, context, {
-                ...(typeof effectiveTemperature === 'number' ? { temperature: effectiveTemperature } : {}),
-                ...(typeof maxOutputTokens === 'number' ? { maxTokens: maxOutputTokens } : {}),
-                apiKey: openaiConfig?.apiKey ?? apiKeys.openaiApiKey ?? undefined,
+                temperature: effectiveTemperature,
+                maxOutputTokens,
                 signal: controller.signal,
             });
-            const text = extractText(result);
-            if (!text)
-                throw new Error(`LLM returned an empty summary (model ${parsed.canonical}).`);
             return {
-                text,
+                text: result.text,
                 canonicalModelId: parsed.canonical,
                 provider: parsed.provider,
-                usage: normalizeTokenUsage(result.usage),
+                usage: result.usage,
             };
         }
         catch (error) {
@@ -440,30 +306,28 @@ export async function generateTextWithModelId({ modelId, apiKeys, system, prompt
     }
     throw new Error(`LLM request failed after ${maxRetries + 1} attempts.`);
 }
-function isRetryableTimeoutError(error) {
-    if (!error)
-        return false;
-    const message = typeof error === 'string'
-        ? error
-        : error instanceof Error
-            ? error.message
-            : typeof error.message === 'string'
-                ? String(error.message)
-                : '';
-    return /timed out/i.test(message) || /empty summary/i.test(message);
-}
-function computeRetryDelayMs(attempt) {
-    const base = 500;
-    const jitter = Math.floor(Math.random() * 200);
-    return Math.min(2000, base * (attempt + 1) + jitter);
-}
-function sleep(ms) {
-    return new Promise((resolve) => setTimeout(resolve, ms));
+export async function streamTextWithModelId({ modelId, apiKeys, prompt, temperature, maxOutputTokens, timeoutMs, fetchImpl, forceOpenRouter, openaiBaseUrlOverride, anthropicBaseUrlOverride, googleBaseUrlOverride, xaiBaseUrlOverride, forceChatCompletions, }) {
+    const context = promptToContext(prompt);
+    return streamTextWithContext({
+        modelId,
+        apiKeys,
+        context,
+        temperature,
+        maxOutputTokens,
+        timeoutMs,
+        fetchImpl,
+        forceOpenRouter,
+        openaiBaseUrlOverride,
+        anthropicBaseUrlOverride,
+        googleBaseUrlOverride,
+        xaiBaseUrlOverride,
+        forceChatCompletions,
+    });
 }
-export async function streamTextWithModelId({ modelId, apiKeys, system, prompt, temperature, maxOutputTokens, timeoutMs, fetchImpl: _fetchImpl, forceOpenRouter, openaiBaseUrlOverride, anthropicBaseUrlOverride, googleBaseUrlOverride, xaiBaseUrlOverride, forceChatCompletions, }) {
-    void _fetchImpl;
+export async function streamTextWithContext({ modelId, apiKeys, context, temperature, maxOutputTokens, timeoutMs, fetchImpl, forceOpenRouter, openaiBaseUrlOverride, anthropicBaseUrlOverride, googleBaseUrlOverride, xaiBaseUrlOverride, forceChatCompletions, }) {
     const parsed = parseGatewayStyleModelId(modelId);
-    const context = promptToContext({ system, prompt });
+    const effectiveTemperature = resolveEffectiveTemperature({ parsed, temperature });
+    void fetchImpl;
     const controller = new AbortController();
     let timeoutId = null;
     const startedAtMs = Date.now();
@@ -539,15 +403,13 @@ export async function streamTextWithModelId({ modelId, apiKeys, system, prompt,
             const apiKey = apiKeys.xaiApiKey;
             if (!apiKey)
                 throw new Error('Missing XAI_API_KEY for xai/... model');
-            const model = resolveModelForCall({
+            const model = resolveXaiModel({
                 modelId: parsed.model,
-                parsedProvider: parsed.provider,
-                openaiConfig: null,
                 context,
                 xaiBaseUrlOverride,
             });
             const stream = streamSimple(model, context, {
-                ...(typeof temperature === 'number' ? { temperature } : {}),
+                ...(typeof effectiveTemperature === 'number' ? { temperature: effectiveTemperature } : {}),
                 ...(typeof maxOutputTokens === 'number' ? { maxTokens: maxOutputTokens } : {}),
                 apiKey,
                 signal: controller.signal,
@@ -579,15 +441,13 @@ export async function streamTextWithModelId({ modelId, apiKeys, system, prompt,
             const apiKey = apiKeys.googleApiKey;
             if (!apiKey)
                 throw new Error('Missing GEMINI_API_KEY (or GOOGLE_GENERATIVE_AI_API_KEY / GOOGLE_API_KEY) for google/... model');
-            const model = resolveModelForCall({
+            const model = resolveGoogleModel({
                 modelId: parsed.model,
-                parsedProvider: parsed.provider,
-                openaiConfig: null,
                 context,
                 googleBaseUrlOverride,
             });
             const stream = streamSimple(model, context, {
-                ...(typeof temperature === 'number' ? { temperature } : {}),
+                ...(typeof effectiveTemperature === 'number' ? { temperature: effectiveTemperature } : {}),
                 ...(typeof maxOutputTokens === 'number' ? { maxTokens: maxOutputTokens } : {}),
                 apiKey,
                 signal: controller.signal,
@@ -619,15 +479,13 @@ export async function streamTextWithModelId({ modelId, apiKeys, system, prompt,
             const apiKey = apiKeys.anthropicApiKey;
             if (!apiKey)
                 throw new Error('Missing ANTHROPIC_API_KEY for anthropic/... model');
-            const model = resolveModelForCall({
+            const model = resolveAnthropicModel({
                 modelId: parsed.model,
-                parsedProvider: parsed.provider,
-                openaiConfig: null,
                 context,
                 anthropicBaseUrlOverride,
             });
             const stream = streamSimple(model, context, {
-                ...(typeof temperature === 'number' ? { temperature } : {}),
+                ...(typeof effectiveTemperature === 'number' ? { temperature: effectiveTemperature } : {}),
                 ...(typeof maxOutputTokens === 'number' ? { maxTokens: maxOutputTokens } : {}),
                 apiKey,
                 signal: controller.signal,
@@ -660,15 +518,13 @@ export async function streamTextWithModelId({ modelId, apiKeys, system, prompt,
             const apiKey = apiKeys.openaiApiKey;
             if (!apiKey)
                 throw new Error('Missing Z_AI_API_KEY for zai/... model');
-            const model = resolveModelForCall({
+            const model = resolveZaiModel({
                 modelId: parsed.model,
-                parsedProvider: parsed.provider,
-                openaiConfig: null,
                 context,
                 openaiBaseUrlOverride,
             });
             const stream = streamSimple(model, context, {
-                ...(typeof temperature === 'number' ? { temperature } : {}),
+                ...(typeof effectiveTemperature === 'number' ? { temperature: effectiveTemperature } : {}),
                 ...(typeof maxOutputTokens === 'number' ? { maxTokens: maxOutputTokens } : {}),
                 apiKey,
                 signal: controller.signal,
@@ -697,23 +553,17 @@ export async function streamTextWithModelId({ modelId, apiKeys, system, prompt,
             };
         }
         const openaiConfig = resolveOpenAiClientConfig({
-            apiKeys,
+            apiKeys: {
+                openaiApiKey: apiKeys.openaiApiKey,
+                openrouterApiKey: apiKeys.openrouterApiKey,
+            },
             forceOpenRouter,
             openaiBaseUrlOverride,
             forceChatCompletions,
         });
-        const model = resolveModelForCall({
-            modelId: parsed.model,
-            parsedProvider: parsed.provider,
-            openaiConfig,
-            context,
-            openaiBaseUrlOverride,
-            anthropicBaseUrlOverride,
-            googleBaseUrlOverride,
-            xaiBaseUrlOverride,
-        });
+        const model = resolveOpenAiModel({ modelId: parsed.model, context, openaiConfig });
         const stream = streamSimple(model, context, {
-            ...(typeof temperature === 'number' ? { temperature } : {}),
+            ...(typeof effectiveTemperature === 'number' ? { temperature: effectiveTemperature } : {}),
             ...(typeof maxOutputTokens === 'number' ? { maxTokens: maxOutputTokens } : {}),
             apiKey: openaiConfig.apiKey,
             signal: controller.signal,