npm - @steipete/summarize - Versions diffs - 0.7.1 → 0.8.1 - Mend

@steipete/summarize 0.7.1 → 0.8.1

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (151) hide show

package/CHANGELOG.md +46 -0
package/README.md +53 -2
package/dist/cli.js +3 -0
package/dist/esm/cache.js +353 -0
package/dist/esm/cache.js.map +1 -0
package/dist/esm/config.js +78 -1
package/dist/esm/config.js.map +1 -1
package/dist/esm/content/asset.js +11 -17
package/dist/esm/content/asset.js.map +1 -1
package/dist/esm/daemon/auto-mode.js +8 -0
package/dist/esm/daemon/auto-mode.js.map +1 -0
package/dist/esm/daemon/cli.js +284 -0
package/dist/esm/daemon/cli.js.map +1 -0
package/dist/esm/daemon/config.js +82 -0
package/dist/esm/daemon/config.js.map +1 -0
package/dist/esm/daemon/constants.js +8 -0
package/dist/esm/daemon/constants.js.map +1 -0
package/dist/esm/daemon/env-merge.js +4 -0
package/dist/esm/daemon/env-merge.js.map +1 -0
package/dist/esm/daemon/env-snapshot.js +43 -0
package/dist/esm/daemon/env-snapshot.js.map +1 -0
package/dist/esm/daemon/flow-context.js +265 -0
package/dist/esm/daemon/flow-context.js.map +1 -0
package/dist/esm/daemon/launchd.js +149 -0
package/dist/esm/daemon/launchd.js.map +1 -0
package/dist/esm/daemon/meta.js +35 -0
package/dist/esm/daemon/meta.js.map +1 -0
package/dist/esm/daemon/models.js +175 -0
package/dist/esm/daemon/models.js.map +1 -0
package/dist/esm/daemon/request-settings.js +91 -0
package/dist/esm/daemon/request-settings.js.map +1 -0
package/dist/esm/daemon/schtasks.js +108 -0
package/dist/esm/daemon/schtasks.js.map +1 -0
package/dist/esm/daemon/server.js +399 -0
package/dist/esm/daemon/server.js.map +1 -0
package/dist/esm/daemon/summarize-progress.js +57 -0
package/dist/esm/daemon/summarize-progress.js.map +1 -0
package/dist/esm/daemon/summarize.js +263 -0
package/dist/esm/daemon/summarize.js.map +1 -0
package/dist/esm/daemon/systemd.js +117 -0
package/dist/esm/daemon/systemd.js.map +1 -0
package/dist/esm/flags.js +3 -1
package/dist/esm/flags.js.map +1 -1
package/dist/esm/llm/generate-text.js +445 -154
package/dist/esm/llm/generate-text.js.map +1 -1
package/dist/esm/llm/html-to-markdown.js +4 -1
package/dist/esm/llm/html-to-markdown.js.map +1 -1
package/dist/esm/llm/prompt.js +14 -0
package/dist/esm/llm/prompt.js.map +1 -0
package/dist/esm/llm/transcript-to-markdown.js +57 -0
package/dist/esm/llm/transcript-to-markdown.js.map +1 -0
package/dist/esm/model-spec.js +2 -2
package/dist/esm/model-spec.js.map +1 -1
package/dist/esm/run/attachments.js +10 -42
package/dist/esm/run/attachments.js.map +1 -1
package/dist/esm/run/cache-state.js +48 -0
package/dist/esm/run/cache-state.js.map +1 -0
package/dist/esm/run/cli-preflight.js +15 -1
package/dist/esm/run/cli-preflight.js.map +1 -1
package/dist/esm/run/cookies/twitter.js +224 -0
package/dist/esm/run/cookies/twitter.js.map +1 -0
package/dist/esm/run/fetch-with-timeout.js +1 -1
package/dist/esm/run/fetch-with-timeout.js.map +1 -1
package/dist/esm/run/finish-line.js +46 -17
package/dist/esm/run/finish-line.js.map +1 -1
package/dist/esm/run/flows/asset/input.js +2 -4
package/dist/esm/run/flows/asset/input.js.map +1 -1
package/dist/esm/run/flows/asset/preprocess.js +52 -72
package/dist/esm/run/flows/asset/preprocess.js.map +1 -1
package/dist/esm/run/flows/asset/summary.js +127 -47
package/dist/esm/run/flows/asset/summary.js.map +1 -1
package/dist/esm/run/flows/url/extract.js +6 -1
package/dist/esm/run/flows/url/extract.js.map +1 -1
package/dist/esm/run/flows/url/flow.js +166 -85
package/dist/esm/run/flows/url/flow.js.map +1 -1
package/dist/esm/run/flows/url/markdown.js +88 -46
package/dist/esm/run/flows/url/markdown.js.map +1 -1
package/dist/esm/run/flows/url/summary.js +263 -185
package/dist/esm/run/flows/url/summary.js.map +1 -1
package/dist/esm/run/help.js +33 -2
package/dist/esm/run/help.js.map +1 -1
package/dist/esm/run/run-env.js +36 -2
package/dist/esm/run/run-env.js.map +1 -1
package/dist/esm/run/runner.js +362 -227
package/dist/esm/run/runner.js.map +1 -1
package/dist/esm/run/summary-engine.js +21 -6
package/dist/esm/run/summary-engine.js.map +1 -1
package/dist/esm/run/summary-llm.js +4 -1
package/dist/esm/run/summary-llm.js.map +1 -1
package/dist/esm/tty/format.js +9 -0
package/dist/esm/tty/format.js.map +1 -1
package/dist/esm/version.js +1 -1
package/dist/types/cache.d.ts +70 -0
package/dist/types/config.d.ts +46 -0
package/dist/types/content/asset.d.ts +4 -3
package/dist/types/daemon/auto-mode.d.ts +8 -0
package/dist/types/daemon/cli.d.ts +9 -0
package/dist/types/daemon/config.d.ts +19 -0
package/dist/types/daemon/constants.d.ts +7 -0
package/dist/types/daemon/env-merge.d.ts +5 -0
package/dist/types/daemon/env-snapshot.d.ts +4 -0
package/dist/types/daemon/flow-context.d.ts +28 -0
package/dist/types/daemon/launchd.d.ts +29 -0
package/dist/types/daemon/meta.d.ts +12 -0
package/dist/types/daemon/models.d.ts +27 -0
package/dist/types/daemon/request-settings.d.ts +27 -0
package/dist/types/daemon/schtasks.d.ts +16 -0
package/dist/types/daemon/server.d.ts +12 -0
package/dist/types/daemon/summarize-progress.d.ts +2 -0
package/dist/types/daemon/summarize.d.ts +59 -0
package/dist/types/daemon/systemd.d.ts +16 -0
package/dist/types/flags.d.ts +1 -1
package/dist/types/llm/generate-text.d.ts +11 -5
package/dist/types/llm/html-to-markdown.d.ts +4 -1
package/dist/types/llm/prompt.d.ts +9 -0
package/dist/types/llm/transcript-to-markdown.d.ts +34 -0
package/dist/types/run/attachments.d.ts +4 -10
package/dist/types/run/cache-state.d.ts +12 -0
package/dist/types/run/cli-preflight.d.ts +1 -0
package/dist/types/run/cookies/twitter.d.ts +17 -0
package/dist/types/run/finish-line.d.ts +31 -1
package/dist/types/run/flows/asset/preprocess.d.ts +5 -2
package/dist/types/run/flows/asset/summary.d.ts +11 -0
package/dist/types/run/flows/url/markdown.d.ts +3 -0
package/dist/types/run/flows/url/summary.d.ts +6 -3
package/dist/types/run/flows/url/types.d.ts +52 -18
package/dist/types/run/help.d.ts +1 -0
package/dist/types/run/run-env.d.ts +6 -0
package/dist/types/run/summary-engine.d.ts +8 -2
package/dist/types/run/summary-llm.d.ts +6 -3
package/dist/types/tty/format.d.ts +1 -0
package/dist/types/version.d.ts +1 -1
package/docs/README.md +5 -0
package/docs/cache.md +72 -0
package/docs/chrome-extension.md +180 -0
package/docs/cli.md +6 -0
package/docs/config.md +65 -1
package/docs/extract-only.md +6 -0
package/docs/firecrawl.md +6 -0
package/docs/language.md +6 -0
package/docs/llm.md +20 -0
package/docs/manual-tests.md +6 -0
package/docs/model-auto.md +6 -0
package/docs/openai.md +6 -0
package/docs/site/index.html +11 -1
package/docs/smoketest.md +6 -0
package/docs/website.md +6 -0
package/docs/youtube.md +9 -2
package/package.json +7 -10
package/dist/cli.cjs +0 -80566
package/dist/cli.cjs.map +0 -7

package/dist/esm/run/flows/url/summary.js CHANGED Viewed

@@ -1,6 +1,8 @@
 import { countTokens } from 'gpt-tokenizer';
 import { render as renderMarkdownAnsi } from 'markdansi';
+import { buildLanguageKey, buildLengthKey, buildPromptHash, buildSummaryCacheKey, hashString, normalizeContentForHash, } from '../../../cache.js';
 import { formatOutputLanguageForJson } from '../../../language.js';
+import { parseGatewayStyleModelId } from '../../../llm/model-id.js';
 import { buildAutoModelAttempts } from '../../../model-auto.js';
 import { buildLinkSummaryPrompt } from '../../../prompts/index.js';
 import { parseCliUserModelId } from '../../env.js';
@@ -10,7 +12,7 @@ import { prepareMarkdownForTerminal } from '../../markdown.js';
 import { runModelAttempts } from '../../model-attempts.js';
 import { buildOpenRouterNoAllowedProvidersMessage } from '../../openrouter.js';
 import { isRichTty, markdownRenderWidth, supportsColor } from '../../terminal.js';
-export function buildUrlPrompt({ extracted, outputLanguage, lengthArg, }) {
+export function buildUrlPrompt({ extracted, outputLanguage, lengthArg, promptOverride, lengthInstruction, languageInstruction, }) {
     const isYouTube = extracted.siteName === 'YouTube';
     return buildLinkSummaryPrompt({
         url: extracted.url,
@@ -18,12 +20,15 @@ export function buildUrlPrompt({ extracted, outputLanguage, lengthArg, }) {
         siteName: extracted.siteName,
         description: extracted.description,
         content: extracted.content,
-        truncated: false,
+        truncated: extracted.truncated,
         hasTranscript: isYouTube ||
             (extracted.transcriptSource !== null && extracted.transcriptSource !== 'unavailable'),
         summaryLength: lengthArg.kind === 'preset' ? lengthArg.preset : { maxCharacters: lengthArg.maxCharacters },
         outputLanguage,
         shares: [],
+        promptOverride: promptOverride ?? null,
+        lengthInstruction: lengthInstruction ?? null,
+        languageInstruction: languageInstruction ?? null,
     });
 }
 const buildFinishExtras = ({ extracted, metricsDetailed, transcriptionCostLabel, }) => {
@@ -47,315 +52,386 @@ const pickModelForFinishLine = (llmCalls, fallback) => {
         (llmCalls.length > 0 ? (llmCalls[llmCalls.length - 1]?.model ?? null) : null) ??
         fallback);
 };
+const buildModelMetaFromAttempt = (attempt) => {
+    if (attempt.transport === 'cli') {
+        return { provider: 'cli', canonical: attempt.userModelId };
+    }
+    const parsed = parseGatewayStyleModelId(attempt.llmModelId ?? attempt.userModelId);
+    const canonical = attempt.userModelId.toLowerCase().startsWith('openrouter/')
+        ? attempt.userModelId
+        : parsed.canonical;
+    return { provider: parsed.provider, canonical };
+};
 export async function outputExtractedUrl({ ctx, url, extracted, extractionUi, prompt, effectiveMarkdownMode, transcriptionCostLabel, }) {
-    ctx.clearProgressForStdout();
+    const { io, flags, model, hooks } = ctx;
+    hooks.clearProgressForStdout();
     const finishLabel = buildExtractFinishLabel({
         extracted: { diagnostics: extracted.diagnostics },
-        format: ctx.format,
+        format: flags.format,
         markdownMode: effectiveMarkdownMode,
-        hasMarkdownLlmCall: ctx.llmCalls.some((call) => call.purpose === 'markdown'),
+        hasMarkdownLlmCall: model.llmCalls.some((call) => call.purpose === 'markdown'),
     });
-    const finishModel = pickModelForFinishLine(ctx.llmCalls, null);
-    if (ctx.json) {
-        const finishReport = ctx.shouldComputeReport ? await ctx.buildReport() : null;
+    const finishModel = pickModelForFinishLine(model.llmCalls, null);
+    if (flags.json) {
+        const finishReport = flags.shouldComputeReport ? await hooks.buildReport() : null;
         const payload = {
             input: {
                 kind: 'url',
                 url,
-                timeoutMs: ctx.timeoutMs,
-                youtube: ctx.youtubeMode,
-                firecrawl: ctx.firecrawlMode,
-                format: ctx.format,
+                timeoutMs: flags.timeoutMs,
+                youtube: flags.youtubeMode,
+                firecrawl: flags.firecrawlMode,
+                format: flags.format,
                 markdown: effectiveMarkdownMode,
-                length: ctx.lengthArg.kind === 'preset'
-                    ? { kind: 'preset', preset: ctx.lengthArg.preset }
-                    : { kind: 'chars', maxCharacters: ctx.lengthArg.maxCharacters },
-                maxOutputTokens: ctx.maxOutputTokensArg,
-                model: ctx.requestedModelLabel,
-                language: formatOutputLanguageForJson(ctx.outputLanguage),
+                length: flags.lengthArg.kind === 'preset'
+                    ? { kind: 'preset', preset: flags.lengthArg.preset }
+                    : { kind: 'chars', maxCharacters: flags.lengthArg.maxCharacters },
+                maxOutputTokens: flags.maxOutputTokensArg,
+                model: model.requestedModelLabel,
+                language: formatOutputLanguageForJson(flags.outputLanguage),
             },
             env: {
-                hasXaiKey: Boolean(ctx.apiStatus.xaiApiKey),
-                hasOpenAIKey: Boolean(ctx.apiStatus.apiKey),
-                hasOpenRouterKey: Boolean(ctx.apiStatus.openrouterApiKey),
-                hasApifyToken: Boolean(ctx.apiStatus.apifyToken),
-                hasFirecrawlKey: ctx.apiStatus.firecrawlConfigured,
-                hasGoogleKey: ctx.apiStatus.googleConfigured,
-                hasAnthropicKey: ctx.apiStatus.anthropicConfigured,
+                hasXaiKey: Boolean(model.apiStatus.xaiApiKey),
+                hasOpenAIKey: Boolean(model.apiStatus.apiKey),
+                hasOpenRouterKey: Boolean(model.apiStatus.openrouterApiKey),
+                hasApifyToken: Boolean(model.apiStatus.apifyToken),
+                hasFirecrawlKey: model.apiStatus.firecrawlConfigured,
+                hasGoogleKey: model.apiStatus.googleConfigured,
+                hasAnthropicKey: model.apiStatus.anthropicConfigured,
             },
             extracted,
             prompt,
             llm: null,
-            metrics: ctx.metricsEnabled ? finishReport : null,
+            metrics: flags.metricsEnabled ? finishReport : null,
             summary: null,
         };
-        ctx.stdout.write(`${JSON.stringify(payload, null, 2)}\n`);
-        if (ctx.metricsEnabled && finishReport) {
-            const costUsd = await ctx.estimateCostUsd();
+        io.stdout.write(`${JSON.stringify(payload, null, 2)}\n`);
+        if (flags.metricsEnabled && finishReport) {
+            const costUsd = await hooks.estimateCostUsd();
             writeFinishLine({
-                stderr: ctx.stderr,
-                elapsedMs: Date.now() - ctx.runStartedAtMs,
+                stderr: io.stderr,
+                elapsedMs: Date.now() - flags.runStartedAtMs,
                 label: finishLabel,
                 model: finishModel,
                 report: finishReport,
                 costUsd,
-                detailed: ctx.metricsDetailed,
+                detailed: flags.metricsDetailed,
                 extraParts: buildFinishExtras({
                     extracted,
-                    metricsDetailed: ctx.metricsDetailed,
+                    metricsDetailed: flags.metricsDetailed,
                     transcriptionCostLabel,
                 }),
-                color: ctx.verboseColor,
+                color: flags.verboseColor,
             });
         }
         return;
     }
-    const renderedExtract = ctx.format === 'markdown' && !ctx.plain && isRichTty(ctx.stdout)
+    const renderedExtract = flags.format === 'markdown' && !flags.plain && isRichTty(io.stdout)
         ? renderMarkdownAnsi(prepareMarkdownForTerminal(extracted.content), {
-            width: markdownRenderWidth(ctx.stdout, ctx.env),
+            width: markdownRenderWidth(io.stdout, io.env),
             wrap: true,
-            color: supportsColor(ctx.stdout, ctx.envForRun),
+            color: supportsColor(io.stdout, io.envForRun),
             hyperlinks: true,
         })
         : extracted.content;
-    if (ctx.format === 'markdown' && !ctx.plain && isRichTty(ctx.stdout)) {
-        ctx.stdout.write(`\n${renderedExtract.replace(/^\n+/, '')}`);
+    if (flags.format === 'markdown' && !flags.plain && isRichTty(io.stdout)) {
+        io.stdout.write(`\n${renderedExtract.replace(/^\n+/, '')}`);
     }
     else {
-        ctx.stdout.write(renderedExtract);
+        io.stdout.write(renderedExtract);
     }
     if (!renderedExtract.endsWith('\n')) {
-        ctx.stdout.write('\n');
+        io.stdout.write('\n');
     }
-    ctx.writeViaFooter(extractionUi.footerParts);
-    const report = ctx.shouldComputeReport ? await ctx.buildReport() : null;
-    if (ctx.metricsEnabled && report) {
-        const costUsd = await ctx.estimateCostUsd();
+    hooks.writeViaFooter(extractionUi.footerParts);
+    const report = flags.shouldComputeReport ? await hooks.buildReport() : null;
+    if (flags.metricsEnabled && report) {
+        const costUsd = await hooks.estimateCostUsd();
         writeFinishLine({
-            stderr: ctx.stderr,
-            elapsedMs: Date.now() - ctx.runStartedAtMs,
+            stderr: io.stderr,
+            elapsedMs: Date.now() - flags.runStartedAtMs,
             label: finishLabel,
             model: finishModel,
             report,
             costUsd,
-            detailed: ctx.metricsDetailed,
+            detailed: flags.metricsDetailed,
             extraParts: buildFinishExtras({
                 extracted,
-                metricsDetailed: ctx.metricsDetailed,
+                metricsDetailed: flags.metricsDetailed,
                 transcriptionCostLabel,
             }),
-            color: ctx.verboseColor,
+            color: flags.verboseColor,
         });
     }
 }
 export async function summarizeExtractedUrl({ ctx, url, extracted, extractionUi, prompt, effectiveMarkdownMode, transcriptionCostLabel, onModelChosen, }) {
+    const { io, flags, model, cache: cacheState, hooks } = ctx;
     const promptTokens = countTokens(prompt);
     const kindForAuto = extracted.siteName === 'YouTube' ? 'youtube' : 'website';
     const attempts = await (async () => {
-        if (ctx.isFallbackModel) {
-            const catalog = await ctx.getLiteLlmCatalog();
+        if (model.isFallbackModel) {
+            const catalog = await model.getLiteLlmCatalog();
             const list = buildAutoModelAttempts({
                 kind: kindForAuto,
                 promptTokens,
-                desiredOutputTokens: ctx.desiredOutputTokens,
+                desiredOutputTokens: model.desiredOutputTokens,
                 requiresVideoUnderstanding: false,
-                env: ctx.envForAuto,
-                config: ctx.configForModelSelection,
+                env: model.envForAuto,
+                config: model.configForModelSelection,
                 catalog,
                 openrouterProvidersFromEnv: null,
-                cliAvailability: ctx.cliAvailability,
+                cliAvailability: model.cliAvailability,
             });
-            if (ctx.verbose) {
+            if (flags.verbose) {
                 for (const attempt of list.slice(0, 8)) {
-                    writeVerbose(ctx.stderr, ctx.verbose, `auto candidate ${attempt.debug}`, ctx.verboseColor);
+                    writeVerbose(io.stderr, flags.verbose, `auto candidate ${attempt.debug}`, flags.verboseColor);
                 }
             }
             return list.map((attempt) => {
                 if (attempt.transport !== 'cli')
-                    return ctx.summaryEngine.applyZaiOverrides(attempt);
+                    return model.summaryEngine.applyZaiOverrides(attempt);
                 const parsed = parseCliUserModelId(attempt.userModelId);
                 return { ...attempt, cliProvider: parsed.provider, cliModel: parsed.model };
             });
         }
         /* v8 ignore next */
-        if (!ctx.fixedModelSpec) {
+        if (!model.fixedModelSpec) {
             throw new Error('Internal error: missing fixed model spec');
         }
-        if (ctx.fixedModelSpec.transport === 'cli') {
+        if (model.fixedModelSpec.transport === 'cli') {
             return [
                 {
                     transport: 'cli',
-                    userModelId: ctx.fixedModelSpec.userModelId,
+                    userModelId: model.fixedModelSpec.userModelId,
                     llmModelId: null,
-                    cliProvider: ctx.fixedModelSpec.cliProvider,
-                    cliModel: ctx.fixedModelSpec.cliModel,
+                    cliProvider: model.fixedModelSpec.cliProvider,
+                    cliModel: model.fixedModelSpec.cliModel,
                     openrouterProviders: null,
                     forceOpenRouter: false,
-                    requiredEnv: ctx.fixedModelSpec.requiredEnv,
+                    requiredEnv: model.fixedModelSpec.requiredEnv,
                 },
             ];
         }
-        const openaiOverrides = ctx.fixedModelSpec.requiredEnv === 'Z_AI_API_KEY'
+        const openaiOverrides = model.fixedModelSpec.requiredEnv === 'Z_AI_API_KEY'
             ? {
-                openaiApiKeyOverride: ctx.apiStatus.zaiApiKey,
-                openaiBaseUrlOverride: ctx.apiStatus.zaiBaseUrl,
+                openaiApiKeyOverride: model.apiStatus.zaiApiKey,
+                openaiBaseUrlOverride: model.apiStatus.zaiBaseUrl,
                 forceChatCompletions: true,
             }
             : {};
         return [
             {
-                transport: ctx.fixedModelSpec.transport === 'openrouter' ? 'openrouter' : 'native',
-                userModelId: ctx.fixedModelSpec.userModelId,
-                llmModelId: ctx.fixedModelSpec.llmModelId,
-                openrouterProviders: ctx.fixedModelSpec.openrouterProviders,
-                forceOpenRouter: ctx.fixedModelSpec.forceOpenRouter,
-                requiredEnv: ctx.fixedModelSpec.requiredEnv,
+                transport: model.fixedModelSpec.transport === 'openrouter' ? 'openrouter' : 'native',
+                userModelId: model.fixedModelSpec.userModelId,
+                llmModelId: model.fixedModelSpec.llmModelId,
+                openrouterProviders: model.fixedModelSpec.openrouterProviders,
+                forceOpenRouter: model.fixedModelSpec.forceOpenRouter,
+                requiredEnv: model.fixedModelSpec.requiredEnv,
                 ...openaiOverrides,
             },
         ];
     })();
-    const attemptOutcome = await runModelAttempts({
-        attempts,
-        isFallbackModel: ctx.isFallbackModel,
-        isNamedModelSelection: ctx.isNamedModelSelection,
-        envHasKeyFor: ctx.summaryEngine.envHasKeyFor,
-        formatMissingModelError: ctx.summaryEngine.formatMissingModelError,
-        onAutoSkip: (attempt) => {
-            writeVerbose(ctx.stderr, ctx.verbose, `auto skip ${attempt.userModelId}: missing ${attempt.requiredEnv}`, ctx.verboseColor);
-        },
-        onAutoFailure: (attempt, error) => {
-            writeVerbose(ctx.stderr, ctx.verbose, `auto failed ${attempt.userModelId}: ${error instanceof Error ? error.message : String(error)}`, ctx.verboseColor);
-        },
-        onFixedModelError: (_attempt, error) => {
-            throw error;
-        },
-        runAttempt: (attempt) => ctx.summaryEngine.runSummaryAttempt({
-            attempt,
-            prompt,
-            allowStreaming: ctx.streamingEnabled,
-            onModelChosen: onModelChosen ?? null,
-        }),
-    });
-    const summaryResult = attemptOutcome.result;
-    const usedAttempt = attemptOutcome.usedAttempt;
-    const { lastError, missingRequiredEnvs, sawOpenRouterNoAllowedProviders } = attemptOutcome;
+    const cacheStore = cacheState.mode === 'default' ? cacheState.store : null;
+    const contentHash = cacheStore ? hashString(normalizeContentForHash(extracted.content)) : null;
+    const promptHash = cacheStore ? buildPromptHash(prompt) : null;
+    const lengthKey = buildLengthKey(flags.lengthArg);
+    const languageKey = buildLanguageKey(flags.outputLanguage);
+    let summaryResult = null;
+    let usedAttempt = null;
+    let summaryFromCache = false;
+    let cacheChecked = false;
+    if (cacheStore && contentHash && promptHash) {
+        cacheChecked = true;
+        for (const attempt of attempts) {
+            if (!model.summaryEngine.envHasKeyFor(attempt.requiredEnv))
+                continue;
+            const key = buildSummaryCacheKey({
+                contentHash,
+                promptHash,
+                model: attempt.userModelId,
+                lengthKey,
+                languageKey,
+            });
+            const cached = cacheStore.getText('summary', key);
+            if (!cached)
+                continue;
+            writeVerbose(io.stderr, flags.verbose, 'cache hit summary', flags.verboseColor);
+            onModelChosen?.(attempt.userModelId);
+            summaryResult = {
+                summary: cached,
+                summaryAlreadyPrinted: false,
+                modelMeta: buildModelMetaFromAttempt(attempt),
+                maxOutputTokensForCall: null,
+            };
+            usedAttempt = attempt;
+            summaryFromCache = true;
+            break;
+        }
+    }
+    if (cacheChecked && !summaryFromCache) {
+        writeVerbose(io.stderr, flags.verbose, 'cache miss summary', flags.verboseColor);
+    }
+    ctx.hooks.onSummaryCached?.(summaryFromCache);
+    let lastError = null;
+    let missingRequiredEnvs = new Set();
+    let sawOpenRouterNoAllowedProviders = false;
+    if (!summaryResult || !usedAttempt) {
+        const attemptOutcome = await runModelAttempts({
+            attempts,
+            isFallbackModel: model.isFallbackModel,
+            isNamedModelSelection: model.isNamedModelSelection,
+            envHasKeyFor: model.summaryEngine.envHasKeyFor,
+            formatMissingModelError: model.summaryEngine.formatMissingModelError,
+            onAutoSkip: (attempt) => {
+                writeVerbose(io.stderr, flags.verbose, `auto skip ${attempt.userModelId}: missing ${attempt.requiredEnv}`, flags.verboseColor);
+            },
+            onAutoFailure: (attempt, error) => {
+                writeVerbose(io.stderr, flags.verbose, `auto failed ${attempt.userModelId}: ${error instanceof Error ? error.message : String(error)}`, flags.verboseColor);
+            },
+            onFixedModelError: (_attempt, error) => {
+                throw error;
+            },
+            runAttempt: (attempt) => model.summaryEngine.runSummaryAttempt({
+                attempt,
+                prompt,
+                allowStreaming: flags.streamingEnabled,
+                onModelChosen: onModelChosen ?? null,
+            }),
+        });
+        summaryResult = attemptOutcome.result;
+        usedAttempt = attemptOutcome.usedAttempt;
+        lastError = attemptOutcome.lastError;
+        missingRequiredEnvs = attemptOutcome.missingRequiredEnvs;
+        sawOpenRouterNoAllowedProviders = attemptOutcome.sawOpenRouterNoAllowedProviders;
+    }
     if (!summaryResult || !usedAttempt) {
         // Auto mode: surface raw extracted content when no model can run.
         const withFreeTip = (message) => {
-            if (!ctx.isNamedModelSelection || !ctx.wantsFreeNamedModel)
+            if (!model.isNamedModelSelection || !model.wantsFreeNamedModel)
                 return message;
             return (`${message}\n` +
                 `Tip: run "summarize refresh-free" to refresh the free model candidates (writes ~/.summarize/config.json).`);
         };
-        if (ctx.isNamedModelSelection) {
+        if (model.isNamedModelSelection) {
             if (lastError === null && missingRequiredEnvs.size > 0) {
-                throw new Error(withFreeTip(`Missing ${Array.from(missingRequiredEnvs).sort().join(', ')} for --model ${ctx.requestedModelInput}.`));
+                throw new Error(withFreeTip(`Missing ${Array.from(missingRequiredEnvs).sort().join(', ')} for --model ${model.requestedModelInput}.`));
             }
             if (lastError instanceof Error) {
                 if (sawOpenRouterNoAllowedProviders) {
                     const message = await buildOpenRouterNoAllowedProvidersMessage({
                         attempts,
-                        fetchImpl: ctx.trackedFetch,
-                        timeoutMs: ctx.timeoutMs,
+                        fetchImpl: io.fetch,
+                        timeoutMs: flags.timeoutMs,
                     });
                     throw new Error(withFreeTip(message), { cause: lastError });
                 }
                 throw new Error(withFreeTip(lastError.message), { cause: lastError });
             }
-            throw new Error(withFreeTip(`No model available for --model ${ctx.requestedModelInput}`));
+            throw new Error(withFreeTip(`No model available for --model ${model.requestedModelInput}`));
         }
-        ctx.clearProgressForStdout();
-        if (ctx.json) {
-            const finishReport = ctx.shouldComputeReport ? await ctx.buildReport() : null;
-            const finishModel = pickModelForFinishLine(ctx.llmCalls, null);
+        hooks.clearProgressForStdout();
+        if (flags.json) {
+            const finishReport = flags.shouldComputeReport ? await hooks.buildReport() : null;
+            const finishModel = pickModelForFinishLine(model.llmCalls, null);
             const payload = {
                 input: {
                     kind: 'url',
                     url,
-                    timeoutMs: ctx.timeoutMs,
-                    youtube: ctx.youtubeMode,
-                    firecrawl: ctx.firecrawlMode,
-                    format: ctx.format,
+                    timeoutMs: flags.timeoutMs,
+                    youtube: flags.youtubeMode,
+                    firecrawl: flags.firecrawlMode,
+                    format: flags.format,
                     markdown: effectiveMarkdownMode,
-                    length: ctx.lengthArg.kind === 'preset'
-                        ? { kind: 'preset', preset: ctx.lengthArg.preset }
-                        : { kind: 'chars', maxCharacters: ctx.lengthArg.maxCharacters },
-                    maxOutputTokens: ctx.maxOutputTokensArg,
-                    model: ctx.requestedModelLabel,
-                    language: formatOutputLanguageForJson(ctx.outputLanguage),
+                    length: flags.lengthArg.kind === 'preset'
+                        ? { kind: 'preset', preset: flags.lengthArg.preset }
+                        : { kind: 'chars', maxCharacters: flags.lengthArg.maxCharacters },
+                    maxOutputTokens: flags.maxOutputTokensArg,
+                    model: model.requestedModelLabel,
+                    language: formatOutputLanguageForJson(flags.outputLanguage),
                 },
                 env: {
-                    hasXaiKey: Boolean(ctx.apiStatus.xaiApiKey),
-                    hasOpenAIKey: Boolean(ctx.apiStatus.apiKey),
-                    hasOpenRouterKey: Boolean(ctx.apiStatus.openrouterApiKey),
-                    hasApifyToken: Boolean(ctx.apiStatus.apifyToken),
-                    hasFirecrawlKey: ctx.apiStatus.firecrawlConfigured,
-                    hasGoogleKey: ctx.apiStatus.googleConfigured,
-                    hasAnthropicKey: ctx.apiStatus.anthropicConfigured,
+                    hasXaiKey: Boolean(model.apiStatus.xaiApiKey),
+                    hasOpenAIKey: Boolean(model.apiStatus.apiKey),
+                    hasOpenRouterKey: Boolean(model.apiStatus.openrouterApiKey),
+                    hasApifyToken: Boolean(model.apiStatus.apifyToken),
+                    hasFirecrawlKey: model.apiStatus.firecrawlConfigured,
+                    hasGoogleKey: model.apiStatus.googleConfigured,
+                    hasAnthropicKey: model.apiStatus.anthropicConfigured,
                 },
                 extracted,
                 prompt,
                 llm: null,
-                metrics: ctx.metricsEnabled ? finishReport : null,
+                metrics: flags.metricsEnabled ? finishReport : null,
                 summary: extracted.content,
             };
-            ctx.stdout.write(`${JSON.stringify(payload, null, 2)}\n`);
-            if (ctx.metricsEnabled && finishReport) {
-                const costUsd = await ctx.estimateCostUsd();
+            io.stdout.write(`${JSON.stringify(payload, null, 2)}\n`);
+            if (flags.metricsEnabled && finishReport) {
+                const costUsd = await hooks.estimateCostUsd();
                 writeFinishLine({
-                    stderr: ctx.stderr,
-                    elapsedMs: Date.now() - ctx.runStartedAtMs,
+                    stderr: io.stderr,
+                    elapsedMs: Date.now() - flags.runStartedAtMs,
                     label: extractionUi.finishSourceLabel,
                     model: finishModel,
                     report: finishReport,
                     costUsd,
-                    detailed: ctx.metricsDetailed,
+                    detailed: flags.metricsDetailed,
                     extraParts: buildFinishExtras({
                         extracted,
-                        metricsDetailed: ctx.metricsDetailed,
+                        metricsDetailed: flags.metricsDetailed,
                         transcriptionCostLabel,
                     }),
-                    color: ctx.verboseColor,
+                    color: flags.verboseColor,
                 });
             }
             return;
         }
-        ctx.stdout.write(`${extracted.content}\n`);
+        io.stdout.write(`${extracted.content}\n`);
         if (extractionUi.footerParts.length > 0) {
-            ctx.writeViaFooter([...extractionUi.footerParts, 'no model']);
+            hooks.writeViaFooter([...extractionUi.footerParts, 'no model']);
         }
-        if (lastError instanceof Error && ctx.verbose) {
-            writeVerbose(ctx.stderr, ctx.verbose, `auto failed all models: ${lastError.message}`, ctx.verboseColor);
+        if (lastError instanceof Error && flags.verbose) {
+            writeVerbose(io.stderr, flags.verbose, `auto failed all models: ${lastError.message}`, flags.verboseColor);
         }
         return;
     }
+    if (!summaryFromCache && cacheStore && contentHash && promptHash) {
+        const key = buildSummaryCacheKey({
+            contentHash,
+            promptHash,
+            model: usedAttempt.userModelId,
+            lengthKey,
+            languageKey,
+        });
+        cacheStore.setText('summary', key, summaryResult.summary, cacheState.ttlMs);
+        writeVerbose(io.stderr, flags.verbose, 'cache write summary', flags.verboseColor);
+    }
     const { summary, summaryAlreadyPrinted, modelMeta, maxOutputTokensForCall } = summaryResult;
-    if (ctx.json) {
-        const finishReport = ctx.shouldComputeReport ? await ctx.buildReport() : null;
+    if (flags.json) {
+        const finishReport = flags.shouldComputeReport ? await hooks.buildReport() : null;
         const payload = {
             input: {
                 kind: 'url',
                 url,
-                timeoutMs: ctx.timeoutMs,
-                youtube: ctx.youtubeMode,
-                firecrawl: ctx.firecrawlMode,
-                format: ctx.format,
+                timeoutMs: flags.timeoutMs,
+                youtube: flags.youtubeMode,
+                firecrawl: flags.firecrawlMode,
+                format: flags.format,
                 markdown: effectiveMarkdownMode,
-                length: ctx.lengthArg.kind === 'preset'
-                    ? { kind: 'preset', preset: ctx.lengthArg.preset }
-                    : { kind: 'chars', maxCharacters: ctx.lengthArg.maxCharacters },
-                maxOutputTokens: ctx.maxOutputTokensArg,
-                model: ctx.requestedModelLabel,
-                language: formatOutputLanguageForJson(ctx.outputLanguage),
+                length: flags.lengthArg.kind === 'preset'
+                    ? { kind: 'preset', preset: flags.lengthArg.preset }
+                    : { kind: 'chars', maxCharacters: flags.lengthArg.maxCharacters },
+                maxOutputTokens: flags.maxOutputTokensArg,
+                model: model.requestedModelLabel,
+                language: formatOutputLanguageForJson(flags.outputLanguage),
             },
             env: {
-                hasXaiKey: Boolean(ctx.apiStatus.xaiApiKey),
-                hasOpenAIKey: Boolean(ctx.apiStatus.apiKey),
-                hasOpenRouterKey: Boolean(ctx.apiStatus.openrouterApiKey),
-                hasApifyToken: Boolean(ctx.apiStatus.apifyToken),
-                hasFirecrawlKey: ctx.apiStatus.firecrawlConfigured,
-                hasGoogleKey: ctx.apiStatus.googleConfigured,
-                hasAnthropicKey: ctx.apiStatus.anthropicConfigured,
+                hasXaiKey: Boolean(model.apiStatus.xaiApiKey),
+                hasOpenAIKey: Boolean(model.apiStatus.apiKey),
+                hasOpenRouterKey: Boolean(model.apiStatus.openrouterApiKey),
+                hasApifyToken: Boolean(model.apiStatus.apifyToken),
+                hasFirecrawlKey: model.apiStatus.firecrawlConfigured,
+                hasGoogleKey: model.apiStatus.googleConfigured,
+                hasAnthropicKey: model.apiStatus.anthropicConfigured,
             },
             extracted,
             prompt,
@@ -365,69 +441,71 @@ export async function summarizeExtractedUrl({ ctx, url, extracted, extractionUi,
                 maxCompletionTokens: maxOutputTokensForCall,
                 strategy: 'single',
             },
-            metrics: ctx.metricsEnabled ? finishReport : null,
+            metrics: flags.metricsEnabled ? finishReport : null,
             summary,
         };
-        ctx.stdout.write(`${JSON.stringify(payload, null, 2)}\n`);
-        if (ctx.metricsEnabled && finishReport) {
-            const costUsd = await ctx.estimateCostUsd();
+        io.stdout.write(`${JSON.stringify(payload, null, 2)}\n`);
+        if (flags.metricsEnabled && finishReport) {
+            const costUsd = await hooks.estimateCostUsd();
             writeFinishLine({
-                stderr: ctx.stderr,
-                elapsedMs: Date.now() - ctx.runStartedAtMs,
+                stderr: io.stderr,
+                elapsedMs: Date.now() - flags.runStartedAtMs,
+                elapsedLabel: summaryFromCache ? 'Cached' : null,
                 label: extractionUi.finishSourceLabel,
                 model: usedAttempt.userModelId,
                 report: finishReport,
                 costUsd,
-                detailed: ctx.metricsDetailed,
+                detailed: flags.metricsDetailed,
                 extraParts: buildFinishExtras({
                     extracted,
-                    metricsDetailed: ctx.metricsDetailed,
+                    metricsDetailed: flags.metricsDetailed,
                     transcriptionCostLabel,
                 }),
-                color: ctx.verboseColor,
+                color: flags.verboseColor,
             });
         }
         return;
     }
     if (!summaryAlreadyPrinted) {
-        ctx.clearProgressForStdout();
-        const rendered = !ctx.plain && isRichTty(ctx.stdout)
+        hooks.clearProgressForStdout();
+        const rendered = !flags.plain && isRichTty(io.stdout)
             ? renderMarkdownAnsi(prepareMarkdownForTerminal(summary), {
-                width: markdownRenderWidth(ctx.stdout, ctx.env),
+                width: markdownRenderWidth(io.stdout, io.env),
                 wrap: true,
-                color: supportsColor(ctx.stdout, ctx.envForRun),
+                color: supportsColor(io.stdout, io.envForRun),
                 hyperlinks: true,
             })
             : summary;
-        if (!ctx.plain && isRichTty(ctx.stdout)) {
-            ctx.stdout.write(`\n${rendered.replace(/^\n+/, '')}`);
+        if (!flags.plain && isRichTty(io.stdout)) {
+            io.stdout.write(`\n${rendered.replace(/^\n+/, '')}`);
         }
         else {
-            if (isRichTty(ctx.stdout))
-                ctx.stdout.write('\n');
-            ctx.stdout.write(rendered.replace(/^\n+/, ''));
+            if (isRichTty(io.stdout))
+                io.stdout.write('\n');
+            io.stdout.write(rendered.replace(/^\n+/, ''));
         }
         if (!rendered.endsWith('\n')) {
-            ctx.stdout.write('\n');
+            io.stdout.write('\n');
         }
     }
-    const report = ctx.shouldComputeReport ? await ctx.buildReport() : null;
-    if (ctx.metricsEnabled && report) {
-        const costUsd = await ctx.estimateCostUsd();
+    const report = flags.shouldComputeReport ? await hooks.buildReport() : null;
+    if (flags.metricsEnabled && report) {
+        const costUsd = await hooks.estimateCostUsd();
         writeFinishLine({
-            stderr: ctx.stderr,
-            elapsedMs: Date.now() - ctx.runStartedAtMs,
+            stderr: io.stderr,
+            elapsedMs: Date.now() - flags.runStartedAtMs,
+            elapsedLabel: summaryFromCache ? 'Cached' : null,
             label: extractionUi.finishSourceLabel,
             model: modelMeta.canonical,
             report,
             costUsd,
-            detailed: ctx.metricsDetailed,
+            detailed: flags.metricsDetailed,
             extraParts: buildFinishExtras({
                 extracted,
-                metricsDetailed: ctx.metricsDetailed,
+                metricsDetailed: flags.metricsDetailed,
                 transcriptionCostLabel,
             }),
-            color: ctx.verboseColor,
+            color: flags.verboseColor,
         });
     }
 }