npm - @steipete/summarize - Versions diffs - 0.3.0 → 0.5.0 - Mend

@steipete/summarize 0.3.0 → 0.5.0

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (99) hide show

package/CHANGELOG.md +80 -5
package/README.md +122 -20
package/dist/cli.cjs +8446 -4360
package/dist/cli.cjs.map +4 -4
package/dist/esm/cli-main.js +47 -2
package/dist/esm/cli-main.js.map +1 -1
package/dist/esm/config.js +368 -3
package/dist/esm/config.js.map +1 -1
package/dist/esm/content/link-preview/content/index.js +13 -0
package/dist/esm/content/link-preview/content/index.js.map +1 -1
package/dist/esm/content/link-preview/content/utils.js +3 -1
package/dist/esm/content/link-preview/content/utils.js.map +1 -1
package/dist/esm/content/link-preview/content/video.js +96 -0
package/dist/esm/content/link-preview/content/video.js.map +1 -0
package/dist/esm/content/link-preview/transcript/providers/youtube/captions.js +21 -21
package/dist/esm/content/link-preview/transcript/providers/youtube/captions.js.map +1 -1
package/dist/esm/costs.js.map +1 -1
package/dist/esm/flags.js +41 -1
package/dist/esm/flags.js.map +1 -1
package/dist/esm/generate-free.js +616 -0
package/dist/esm/generate-free.js.map +1 -0
package/dist/esm/llm/cli.js +290 -0
package/dist/esm/llm/cli.js.map +1 -0
package/dist/esm/llm/generate-text.js +159 -105
package/dist/esm/llm/generate-text.js.map +1 -1
package/dist/esm/llm/html-to-markdown.js +4 -2
package/dist/esm/llm/html-to-markdown.js.map +1 -1
package/dist/esm/markitdown.js +54 -0
package/dist/esm/markitdown.js.map +1 -0
package/dist/esm/model-auto.js +353 -0
package/dist/esm/model-auto.js.map +1 -0
package/dist/esm/model-spec.js +82 -0
package/dist/esm/model-spec.js.map +1 -0
package/dist/esm/prompts/cli.js +18 -0
package/dist/esm/prompts/cli.js.map +1 -0
package/dist/esm/prompts/file.js +21 -2
package/dist/esm/prompts/file.js.map +1 -1
package/dist/esm/prompts/index.js +2 -1
package/dist/esm/prompts/index.js.map +1 -1
package/dist/esm/prompts/link-summary.js +3 -8
package/dist/esm/prompts/link-summary.js.map +1 -1
package/dist/esm/refresh-free.js +667 -0
package/dist/esm/refresh-free.js.map +1 -0
package/dist/esm/run.js +1612 -533
package/dist/esm/run.js.map +1 -1
package/dist/esm/version.js +1 -1
package/dist/types/config.d.ts +58 -5
package/dist/types/content/link-preview/content/types.d.ts +10 -0
package/dist/types/content/link-preview/content/utils.d.ts +1 -1
package/dist/types/content/link-preview/content/video.d.ts +5 -0
package/dist/types/costs.d.ts +2 -1
package/dist/types/flags.d.ts +7 -0
package/dist/types/generate-free.d.ts +17 -0
package/dist/types/llm/cli.d.ts +24 -0
package/dist/types/llm/generate-text.d.ts +13 -4
package/dist/types/llm/html-to-markdown.d.ts +9 -3
package/dist/types/markitdown.d.ts +10 -0
package/dist/types/model-auto.d.ts +23 -0
package/dist/types/model-spec.d.ts +33 -0
package/dist/types/prompts/cli.d.ts +8 -0
package/dist/types/prompts/file.d.ts +7 -0
package/dist/types/prompts/index.d.ts +2 -1
package/dist/types/refresh-free.d.ts +19 -0
package/dist/types/run.d.ts +3 -1
package/dist/types/version.d.ts +1 -1
package/docs/README.md +4 -1
package/docs/cli.md +95 -0
package/docs/config.md +123 -1
package/docs/extract-only.md +10 -7
package/docs/firecrawl.md +2 -2
package/docs/llm.md +24 -4
package/docs/manual-tests.md +40 -0
package/docs/model-auto.md +92 -0
package/docs/site/assets/site.js +20 -17
package/docs/site/docs/config.html +3 -3
package/docs/site/docs/extract-only.html +7 -5
package/docs/site/docs/firecrawl.html +6 -6
package/docs/site/docs/index.html +2 -2
package/docs/site/docs/llm.html +2 -2
package/docs/site/docs/openai.html +2 -2
package/docs/site/docs/website.html +7 -4
package/docs/site/docs/youtube.html +2 -2
package/docs/site/index.html +1 -1
package/docs/smoketest.md +58 -0
package/docs/website.md +13 -8
package/docs/youtube.md +1 -1
package/package.json +8 -4
package/dist/esm/content/link-preview/transcript/providers/twitter.js +0 -12
package/dist/esm/content/link-preview/transcript/providers/twitter.js.map +0 -1
package/dist/esm/content/link-preview/transcript/providers/youtube/ytdlp.js +0 -114
package/dist/esm/content/link-preview/transcript/providers/youtube/ytdlp.js.map +0 -1
package/dist/esm/summarizeHome.js +0 -20
package/dist/esm/summarizeHome.js.map +0 -1
package/dist/esm/tty/live-markdown.js +0 -52
package/dist/esm/tty/live-markdown.js.map +0 -1
package/dist/types/content/link-preview/transcript/providers/twitter.d.ts +0 -3
package/dist/types/content/link-preview/transcript/providers/youtube/ytdlp.d.ts +0 -3
package/dist/types/summarizeHome.d.ts +0 -6
package/dist/types/tty/live-markdown.d.ts +0 -10

package/CHANGELOG.md CHANGED Viewed

@@ -1,7 +1,83 @@
 # Changelog
-## 0.3.0 - 2025-12-20
+## 0.5.0 - 2025-12-24
+### Features
+- **Model selection & presets**
+  - Automatic model selection (`--model auto`, now the default):
+    - Chooses models based on input kind (website/YouTube/file/image/video/text) and prompt size.
+    - Skips candidates without API keys; retries next model on request errors.
+    - Adds OpenRouter fallback attempts when `OPENROUTER_API_KEY` is present.
+    - Shows the chosen model in the progress UI.
+  - Named model presets via config (`~/.summarize/config.json` → `models`), selectable as `--model <preset>`.
+  - Built-in preset: `--model free` (OpenRouter `:free` candidates; override via `models.free`).
+- **OpenRouter free preset maintenance**
+  - `summarize refresh-free` regenerates `models.free` by scanning OpenRouter `:free` models and testing availability + latency.
+  - `summarize refresh-free --set-default` also sets `"model": "free"` in `~/.summarize/config.json` (so free becomes your default).
+- **CLI models**
+  - Add `--cli <provider>` flag (equivalent to `--model cli/<provider>`).
+  - `--cli` accepts case-insensitive providers and can be used without a provider to enable CLI auto selection.
+- **Content extraction**
+  - Website extraction detects video-only pages:
+    - YouTube embeds switch to transcript extraction automatically.
+    - Direct video URLs can be downloaded + summarized when `--video-mode auto|understand` and a Gemini key is available.
+- **Env**
+  - `.env` in the current directory is loaded automatically (so API keys work without exporting env vars).
+### Changes
+- **CLI config**
+  - Auto mode uses CLI models only when `cli.enabled` is set; order follows the list.
+  - `cli.enabled` is an allowlist for CLI usage.
+- **OpenRouter**
+  - Stop sending extra routing headers.
+  - `--model free`: when OpenRouter rejects routing with “No allowed providers”, print the exact provider names to allow and suggest running `summarize refresh-free`.
+  - `--max-output-tokens`: when explicitly set, it is also forwarded to OpenRouter calls.
+- **Refresh Free**
+  - Default extra runs reduced to 2 (total runs = 1 + runs) to reduce rate-limit pressure.
+  - Filter `:free` candidates by recency (default: last 180 days; configurable via `--max-age-days`).
+  - Print `ctx`/`out` in `k` units for readability.
+- **Defaults**
+  - Default summary length is now `xl`.
+### Fixes
+- **LLM / OpenRouter**
+  - LLM request retries (`--retries`) and clearer timeout errors.
+  - `summarize refresh-free`: detect OpenRouter free-model rate limits and back off + retry.
+- **Streaming**
+  - Normalize + de-dupe overlapping chunks to prevent repeated sections in live Markdown output.
+- **YouTube**
+  - Prefer manual captions over auto-generated when both exist. Thanks @dougvk.
+  - Always summarize YouTube transcripts in auto mode (instead of printing the transcript).
+- **Prompting & metrics**
+  - Don’t “pad” beyond input length when asking for longer summaries.
+  - `--metrics detailed`: fold metrics into finish line and make labels less cryptic.
+### Docs
+- Add documentation for presets and Refresh Free.
+- Add a “make free the default” quick start for `summarize refresh-free --set-default`.
+- Add a manual end-to-end checklist (`docs/manual-tests.md`).
+- Add a quick CLI smoke checklist (`docs/smoketest.md`).
+- Document CLI ordering and model selection behavior.
+### Tests
+- Add coverage for presets and Refresh Free regeneration.
+- Add live coverage for the `free` preset.
+- Add regression coverage for YouTube transcript handling and metrics formatting.
+## 0.4.0 - 2025-12-21
+### Changes
+- Add URL extraction mode via `--extract` with `--format md|text`.
+- Rename HTML→Markdown conversion flag to `--markdown-mode`.
+- Add `--preprocess off|auto|always` and a `uvx markitdown` fallback for Markdown extraction and unsupported file attachments (when `--format md` is used).
+## 0.3.0 - 2025-12-20
 ### Changes
 - Add yt-dlp audio transcription fallback for YouTube; prefer OpenAI Whisper with FAL fallback. Thanks @dougvk.
@@ -9,7 +85,6 @@
 - Run yt-dlp after web + Apify in `--youtube auto`, and error early for missing keys in `--youtube yt-dlp`.
 - Require Node 22+.
 - Respect `OPENAI_BASE_URL` when set, even with OpenRouter keys.
-- Apply OpenRouter provider ordering headers to HTML→Markdown conversion.
 - Add OpenRouter configuration tests. Thanks @dougvk for the initial OpenRouter support.
 - Build and ship a Bun bytecode arm64 binary for Homebrew.
@@ -26,7 +101,7 @@
 ### Changes
-- Add native OpenRouter support via `OPENROUTER_API_KEY` with optional provider ordering (`OPENROUTER_PROVIDERS`).
+- Add native OpenRouter support via `OPENROUTER_API_KEY`.
 - Remove map-reduce summarization; reject inputs that exceed the model's context window.
 - Preflight text prompts with the GPT tokenizer and the model’s max input tokens.
 - Reject text files over 10 MB before tokenization.
@@ -94,7 +169,7 @@ First public release.
   - `--max-output-tokens <count>` (optional hard cap)
   - `--timeout <duration>` (default `2m`)
   - `--stream auto|on|off`, `--render auto|md-live|md|plain`
-  - `--extract-only` (URLs only; no summary)
+  - `--extract` (URLs only; no summary)
   - `--json` (structured output incl. input config, prompt, extracted content, LLM metadata, and metrics)
   - `--metrics off|on|detailed` (default `on`)
   - `--verbose`
@@ -103,7 +178,7 @@ First public release.
 - Websites: fetch + extract “article-ish” content + normalization for prompts.
 - Firecrawl fallback for blocked/thin sites (`--firecrawl off|auto|always`, via `FIRECRAWL_API_KEY`).
-- Markdown extraction for websites in `--extract-only` mode (`--markdown off|auto|llm`).
+- Markdown extraction for websites in `--extract` mode (`--format md|text`, `--markdown-mode off|auto|llm`).
 - YouTube (`--youtube auto|web|apify`):
   - best-effort transcript endpoints
   - optional Apify fallback (requires `APIFY_API_TOKEN`; single actor `faVsWy9VTSNVIhWpR`)

package/README.md CHANGED Viewed

@@ -16,7 +16,13 @@ Requires Node 22+.
 - npx (no install):
 ```bash
-npx -y @steipete/summarize "https://example.com" --model google/gemini-3-flash-preview
+npx -y @steipete/summarize "https://example.com"
+```
+- npm (global install):
+```bash
+npm i -g @steipete/summarize
 ```
 - Homebrew (custom tap):
@@ -30,7 +36,7 @@ Apple Silicon only (arm64).
 ## Quickstart
 ```bash
-summarize "https://example.com" --model google/gemini-3-flash-preview
+summarize "https://example.com"
 ```
 Input can be a URL or a local file path:
@@ -73,10 +79,11 @@ Use “gateway-style” ids: `<provider>/<model>`.
 Examples:
-- `openai/gpt-5.2`
-- `anthropic/claude-opus-4-5`
+- `openai/gpt-5-mini`
+- `anthropic/claude-sonnet-4-5`
 - `xai/grok-4-fast-non-reasoning`
 - `google/gemini-3-flash-preview`
+- `openrouter/openai/gpt-5-mini` (force OpenRouter)
 Note: some models/providers don’t support streaming or certain file media types. When that happens, the CLI prints a friendly error (or auto-disables streaming for that model when supported by the provider).
@@ -93,6 +100,8 @@ npx -y @steipete/summarize "https://example.com" --length 20k
 - Character targets: `1500`, `20k`, `20000`
 - Optional hard cap: `--max-output-tokens <count>` (e.g. `2000`, `2k`)
   - Provider/model APIs still enforce their own maximum output limits.
+  - If omitted, no max token parameter is sent (provider default).
+  - Prefer `--length` unless you need a hard cap (some providers count “reasoning” into the cap).
 - Minimums: `--length` numeric values must be ≥ 50 chars; `--max-output-tokens` must be ≥ 16.
 ## Limits
@@ -106,24 +115,65 @@ npx -y @steipete/summarize "https://example.com" --length 20k
 npx -y @steipete/summarize <input> [flags]
 ```
-- `--model <provider/model>`: which model to use (defaults to `google/gemini-3-flash-preview`)
+- `--model <provider/model>`: which model to use (defaults to `auto`)
+- `--model auto`: automatic model selection + fallback (default)
+- `--model <name>`: use a config-defined model (see “Configuration”)
 - `--timeout <duration>`: `30s`, `2m`, `5000ms` (default `2m`)
+- `--retries <count>`: LLM retry attempts on timeout (default `1`)
 - `--length short|medium|long|xl|xxl|<chars>`
-- `--max-output-tokens <count>`: hard cap for LLM output tokens (optional)
+- `--max-output-tokens <count>`: hard cap for LLM output tokens (optional; only sent when set)
+- `--cli [provider]`: use a CLI provider (case-insensitive; equivalent to `--model cli/<provider>`). If omitted, uses auto selection with CLI enabled.
 - `--stream auto|on|off`: stream LLM output (`auto` = TTY only; disabled in `--json` mode)
 - `--render auto|md-live|md|plain`: Markdown rendering (`auto` = best default for TTY)
-- `--extract-only`: print extracted content and exit (no summary) — only for URLs
+- `--format md|text`: website/file content format (default `text`)
+- `--preprocess off|auto|always`: controls `uvx markitdown` usage (default `auto`; `always` forces file preprocessing)
+  - Install `uvx`: `brew install uv` (or https://astral.sh/uv/)
+- `--extract`: print extracted content and exit (no summary) — only for URLs
+  - Deprecated alias: `--extract-only`
 - `--json`: machine-readable output with diagnostics, prompt, `metrics`, and optional summary
 - `--verbose`: debug/diagnostics on stderr
-- `--metrics off|on|detailed`: metrics output (default `on`; `detailed` prints a breakdown to stderr)
+- `--metrics off|on|detailed`: metrics output (default `on`; `detailed` adds a compact 2nd-line breakdown on stderr)
+## Auto model ordering
+`--model auto` builds candidate attempts from built-in rules (or your `model.rules` overrides).
+CLI tools are **not** used in auto mode unless you explicitly enable them via `cli.enabled` in config.
+Why: CLI adds ~4s latency per attempt and higher variance.
+Shortcut: `--cli` (with no provider) uses auto selection with CLI enabled.
+When enabled, auto prepends CLI attempts in the order listed in `cli.enabled`
+(recommended: `["gemini"]`), then tries the native provider candidates
+(with OpenRouter fallbacks when configured).
+Enable CLI attempts:
+```json
+{
+  "cli": { "enabled": ["gemini"] }
+}
+```
+Disable CLI attempts:
+```json
+{
+  "cli": { "enabled": [] }
+}
+```
+Note: when `cli.enabled` is set, it’s also an allowlist for explicit `--cli` / `--model cli/...`.
 ## Website extraction (Firecrawl + Markdown)
 Non-YouTube URLs go through a “fetch → extract” pipeline. When the direct fetch/extraction is blocked or too thin, `--firecrawl auto` can fall back to Firecrawl (if configured).
 - `--firecrawl off|auto|always` (default `auto`)
-- `--markdown off|auto|llm` (default `auto`; only affects `--extract-only` for non-YouTube URLs)
-- Plain-text mode: use `--firecrawl off --markdown off`.
+- `--extract --format md|text` (default `text`)
+- `--markdown-mode off|auto|llm` (default `auto`; only affects `--format md` for non-YouTube URLs)
+  - `auto`: use an LLM converter when configured; may fall back to `uvx markitdown`
+  - `llm`: force LLM conversion (requires a configured model key)
+  - `off`: disable LLM conversion (still may return Firecrawl Markdown when configured)
+- Plain-text mode: use `--format text`.
 ## YouTube transcripts
@@ -149,16 +199,34 @@ Supported keys today:
 ```json
 {
-  "model": "openai/gpt-5.2"
+  "model": { "id": "openai/gpt-5-mini" }
 }
 ```
+Shorthand (equivalent):
+```json
+{
+  "model": "openai/gpt-5-mini"
+}
+```
+Also supported:
+- `model: { "mode": "auto" }` (automatic model selection + fallback; see `docs/model-auto.md`)
+- `model.rules` (customize candidates / ordering)
+- `models` (define presets selectable via `--model <preset>`)
+- `media.videoMode: "auto"|"transcript"|"understand"`
+Note: the config is parsed leniently (JSON5), but **comments are not allowed**.
+Unknown keys are ignored.
 Precedence:
 1) `--model`
 2) `SUMMARIZE_MODEL`
 3) `~/.summarize/config.json`
-4) default
+4) default (`auto`)
 ## Environment variables
@@ -172,23 +240,57 @@ Set the key matching your chosen `--model`:
 OpenRouter (OpenAI-compatible):
-- Set `OPENROUTER_API_KEY=...` to route `openai/...` models through OpenRouter
-- Use OpenRouter models via the `openai/...` prefix, e.g. `--model openai/openai/gpt-oss-20b`
-- Optional: `OPENROUTER_PROVIDERS=...` to specify provider fallback order (e.g. `groq,google-vertex`)
+- Set `OPENROUTER_API_KEY=...`
+- Prefer forcing OpenRouter per model id: `--model openrouter/<author>/<slug>` (e.g. `openrouter/meta-llama/llama-3.1-8b-instruct:free`)
+- Built-in preset: `--model free` (uses a default set of OpenRouter `:free` models).
-Example:
+### `summarize refresh-free`
+Quick start: make free the default (keep `auto` available)
 ```bash
-OPENROUTER_API_KEY=sk-or-... summarize "https://example.com" --model openai/openai/gpt-oss-20b
+# writes ~/.summarize/config.json (models.free) and sets model="free"
+summarize refresh-free --set-default
+# now this defaults to free models
+summarize "https://example.com"
+# whenever you want best quality instead
+summarize "https://example.com" --model auto
 ```
-With provider ordering (falls back through providers in order):
+Regenerates the `free` preset (writes `models.free` into `~/.summarize/config.json`) by:
+- Fetching OpenRouter `/models`, filtering `:free`
+- Skipping models that look very small (<27B by default) based on the model id/name (best-effort heuristic)
+- Testing which ones return non-empty text (concurrency 4, timeout 10s)
+- Picking a mix of “smart-ish” (bigger `context_length` / output cap) and fast models
+- Refining timings for the final selection and writing the sorted list back
+If `--model free` stops working (rate limits, allowed-provider restrictions, models removed), run:
+```bash
+summarize refresh-free
+```
+Flags:
+- `--runs 2` (default): extra timing runs per selected model (total runs = 1 + runs)
+- `--smart 3` (default): how many “smart-first” picks (rest filled by fastest)
+- `--min-params 27b` (default): ignore models with inferred size smaller than N billion parameters
+- `--max-age-days 180` (default): ignore models older than N days (set 0 to disable)
+- `--set-default`: also sets `"model": "free"` in `~/.summarize/config.json`
+Example:
 ```bash
-OPENROUTER_API_KEY=sk-or-... OPENROUTER_PROVIDERS="groq,google-vertex" summarize "https://example.com"
+OPENROUTER_API_KEY=sk-or-... summarize "https://example.com" --model openrouter/meta-llama/llama-3.1-8b-instruct:free
 ```
-Legacy: `OPENAI_BASE_URL=https://openrouter.ai/api/v1` with `OPENAI_API_KEY` also works.
+If your OpenRouter account enforces an allowed-provider list, make sure at least one provider
+is allowed for the selected model. (When routing fails, `summarize` prints the exact providers to allow.)
+Legacy: `OPENAI_BASE_URL=https://openrouter.ai/api/v1` (and either `OPENAI_API_KEY` or `OPENROUTER_API_KEY`) also works.
 Optional services: