npm - getraw - Versions diffs - 0.1.3 → 0.2.2 - Mend

getraw 0.1.3 → 0.2.2

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (12) hide show

package/.github/workflows/release.yml +1 -0
package/README.md +101 -110
package/bun.lock +7 -0
package/package.json +6 -4
package/scripts/patch-youtubei.js +14 -0
package/skills/getraw/SKILL.md +163 -0
package/src/cli/index.ts +2 -1
package/src/cli/options.ts +2 -2
package/src/core/orchestrator.ts +1 -1
package/src/extractors/base.ts +70 -1
package/src/extractors/youtube/index.ts +105 -196
package/src/extractors/youtube/innertube.ts +4 -4

package/.github/workflows/release.yml CHANGED Viewed

@@ -41,3 +41,4 @@ jobs:
             --generate-notes
         env:
           GH_TOKEN: ${{ github.token }}

package/README.md CHANGED Viewed

@@ -1,10 +1,20 @@
 # getraw
-Fast media downloader CLI built natively in Bun/TypeScript.
+Fast media downloader CLI built natively in Bun/TypeScript. A yt-dlp replacement with native JS execution.
-## Installation
+[![npm](https://img.shields.io/npm/v/getraw)](https://www.npmjs.com/package/getraw)
+[![tests](https://img.shields.io/badge/tests-386%20passing-brightgreen)]()
+[![license](https://img.shields.io/badge/license-MIT-blue)]()
+## Why getraw?
-### Global install (Bun required)
+- **Native JS execution** — YouTube's player code runs natively in Bun. No external runtime needed (yt-dlp requires Deno/Node).
+- **50ms cold startup** — Bun-powered, not Python.
+- **30+ sites** — YouTube, Twitter, TikTok, Instagram, Reddit, Twitch, and more.
+- **Zero API keys** — All extractors use public endpoints, guest tokens, and page scraping.
+- **Agent-ready** — Install as an AI agent skill: `npx skills add onkits/getraw`
+## Installation
 ```sh
 bun install -g getraw
@@ -13,53 +23,35 @@ bun install -g getraw
 ### From source
 ```sh
-git clone https://github.com/web3mikee/getraw
+git clone https://github.com/onkits/getraw
 cd getraw
 bun install
 ```
-Run directly from source:
+### As an AI agent skill
 ```sh
-bun run src/cli/index.ts <URL>
+npx skills add onkits/getraw
 ```
-Build a standalone binary:
-```sh
-bun run build
-./getraw <URL>
-```
+Works with Claude Code, Cursor, Copilot, Codex, Windsurf, and 50+ other agents.
 ## Quick Start
-Download a video at best quality:
 ```sh
+# Download a video
 getraw https://www.youtube.com/watch?v=dQw4w9WgXcQ
-```
-Extract audio as MP3:
-```sh
+# Extract audio as MP3
 getraw -x --audio-format mp3 https://soundcloud.com/artist/track
-```
-List all available formats before downloading:
-```sh
+# List available formats
 getraw -F https://vimeo.com/123456789
-```
-Download a specific format and write subtitles:
+# Download specific quality with subtitles
+getraw -f "bestvideo[height<=1080]+bestaudio" --write-subs https://www.youtube.com/watch?v=dQw4w9WgXcQ
-```sh
-getraw -f "bestvideo[height<=1080]+bestaudio" --write-subs --sub-langs en https://www.youtube.com/watch?v=dQw4w9WgXcQ
-```
-Dump extracted metadata as JSON without downloading:
-```sh
+# Get metadata as JSON (no download)
 getraw -j https://www.reddit.com/r/videos/comments/abc123/some_post/
 ```
@@ -69,97 +61,96 @@ getraw -j https://www.reddit.com/r/videos/comments/abc123/some_post/
 Usage: getraw [OPTIONS] URL [URL...]
 ```
-| Flag | Short | Type | Default | Description |
-|------|-------|------|---------|-------------|
-| `--format` | `-f` | string | `bv*+ba/b` | Format selection string |
-| `--output` | `-o` | string | `%(title)s [%(id)s].%(ext)s` | Output filename template |
-| `--extract-audio` | `-x` | boolean | false | Extract audio only |
-| `--audio-format` | | string | `mp3` | Audio format (`mp3`, `aac`, `flac`, etc.) |
-| `--audio-quality` | | string | `5` | Audio quality (0–10 or bitrate) |
-| `--write-subs` | | boolean | false | Write subtitles to file |
-| `--sub-langs` | | string | `en` | Subtitle languages |
-| `--list-formats` | `-F` | boolean | false | List available formats |
-| `--dump-json` | `-j` | boolean | false | Dump info JSON to stdout |
-| `--quiet` | `-q` | boolean | false | Suppress output |
-| `--verbose` | `-v` | boolean | false | Verbose output |
-| `--no-progress` | | boolean | false | Disable progress bar |
-| `--retries` | `-R` | number | `3` | Number of retries |
-| `--rate-limit` | `-r` | number | none | Rate limit in bytes/sec |
-| `--proxy` | | string | none | Proxy URL |
-| `--cookies` | | string | none | Cookie file path |
-| `--user-agent` | | string | `getraw/0.0.0` | Custom User-Agent |
-| `--referer` | | string | none | Custom Referer header |
-| `--embed-thumbnail` | | boolean | false | Embed thumbnail in output file |
-| `--embed-subs` | | boolean | false | Embed subtitles in output file |
-| `--merge-output-format` | | string | none | Output container for merging streams |
-| `--ffmpeg-location` | | string | none | Path to ffmpeg binary |
-| `--version` | `-V` | boolean | false | Print version |
-| `--help` | `-h` | boolean | false | Show help |
-## Supported Sites
-| Site | Extractor name | URL pattern | Subtitles |
-|------|---------------|-------------|-----------|
-| YouTube | `youtube` | `youtube.com/watch`, `youtu.be/`, `youtube.com/shorts/`, `youtube.com/live/`, `youtube.com/playlist`, `youtube.com/channel/`, `youtube.com/@handle` | Yes (manual + auto-generated) |
-| Vimeo | `vimeo` | `vimeo.com/<id>`, `player.vimeo.com/video/<id>`, channels, groups | No |
-| Twitter / X | `twitter` | `twitter.com/*/status/*`, `x.com/*/status/*` | No |
-| Twitter Spaces | `twitter:spaces` | `twitter.com/i/spaces/*`, `x.com/i/spaces/*` | No |
-| TikTok | `tiktok` | `tiktok.com/@user/video/<id>`, `vm.tiktok.com/*` | No |
-| TikTok User | `tiktok:user` | `tiktok.com/@username` | No |
-| Instagram | `instagram` | `instagram.com/p/*`, `instagram.com/reel/*`, `instagram.com/reels/*` | No |
-| Instagram Reels feed | `instagram:reels` | `instagram.com/reels/` | No |
-| Twitch VOD | `twitch:vod` | `twitch.tv/videos/<id>` | No |
-| Twitch Clip | `twitch:clip` | `twitch.tv/*/clip/*`, `clips.twitch.tv/*` | No |
-| Twitch Live | `twitch:live` | `twitch.tv/<channel>` | No |
-| Kick VOD | `kick` | `kick.com/video/<id>` | No |
-| Kick Clip | `kick:clips` | `kick.com/<channel>/clips/<id>` | No |
-| Kick Live | `kick:live` | `kick.com/<channel>` | No |
-| Reddit | `reddit` | `reddit.com/r/*/comments/*`, `v.redd.it/*` | No |
-| Reddit Gallery | `reddit:gallery` | `reddit.com/r/*/comments/*`, `reddit.com/gallery/*` | No |
-| SoundCloud | `soundcloud` | `soundcloud.com/<user>/<track>` | No |
-| SoundCloud Playlist | `soundcloud:playlist` | `soundcloud.com/<user>/sets/<playlist>` | No |
-| Bilibili | `bilibili` | `bilibili.com/video/BV*`, `bilibili.com/video/av*` | No |
-| Bilibili Bangumi | `bilibili:bangumi` | `bilibili.com/bangumi/play/ep*`, `bilibili.com/bangumi/play/ss*` | No |
-| Niconico | `niconico` | `nicovideo.jp/watch/sm*`, `nicovideo.jp/watch/nm*` | No |
-| Bandcamp | `bandcamp` | `*.bandcamp.com/track/*`, `*.bandcamp.com/album/*` | No |
-| Dailymotion | `dailymotion` | `dailymotion.com/video/<id>` | No |
-| Streamable | `streamable` | `streamable.com/<id>` | No |
-| Coub | `coub` | `coub.com/view/*`, `coub.com/embed/*` | No |
-| Imgur | `imgur` | `imgur.com/<id>`, `imgur.com/a/<id>`, `imgur.com/gallery/<id>`, `i.imgur.com/*` | No |
-| Rumble | `rumble` | `rumble.com/v*.html`, `rumble.com/embed/*` | No |
-| Odysee | `odysee` | `odysee.com/@*:*/<slug>`, `lbry.tv/@*:*/<slug>` | No |
-| TED | `ted` | `ted.com/talks/<slug>` | Yes |
-| PeerTube | `peertube` | Any PeerTube instance: `<host>/videos/watch/*`, `<host>/w/*`, `<host>/videos/embed/*` | Yes |
-| Google Drive | `google-drive` | `drive.google.com/file/d/*`, `docs.google.com/file/d/*` | No |
-| Dropbox | `dropbox` | `dropbox.com/s/*`, `dropbox.com/sh/*`, `dropbox.com/scl/fo/*` | No |
-| Archive.org | `archive.org` | `archive.org/details/*`, `archive.org/download/*` | No |
-| Spotify | `spotify` | `open.spotify.com/episode/<id>` | No |
-| Generic | `generic` | Any `http://` or `https://` URL (fallback) | No |
-> Spotify: only 30-second preview audio is available without authentication. Full episode audio requires Spotify auth (not currently implemented).
-See [docs/supported-sites.md](docs/supported-sites.md) for full format and URL pattern details.
+| Flag | Short | Default | Description |
+|------|-------|---------|-------------|
+| `--format` | `-f` | `bv*+ba/b` | Format selection string |
+| `--output` | `-o` | `%(title)s [%(id)s].%(ext)s` | Output filename template |
+| `--extract-audio` | `-x` | | Extract audio only |
+| `--audio-format` | | `mp3` | Audio format (mp3, aac, flac, wav, opus) |
+| `--write-subs` | | | Write subtitles to file |
+| `--sub-langs` | | `en` | Subtitle languages |
+| `--list-formats` | `-F` | | List available formats |
+| `--dump-json` | `-j` | | Dump info JSON to stdout |
+| `--quiet` | `-q` | | Suppress output |
+| `--verbose` | `-v` | | Verbose output |
+| `--retries` | `-R` | `3` | Number of retries |
+| `--rate-limit` | `-r` | | Rate limit in bytes/sec |
+| `--proxy` | | | Proxy URL |
+| `--cookies` | | | Cookie file path (Netscape format) |
+| `--embed-thumbnail` | | | Embed thumbnail in output |
+| `--embed-subs` | | | Embed subtitles in output |
+| `--version` | `-V` | | Print version |
+| `--help` | `-h` | | Show help |
+## Supported Sites (30+)
+| Site | URL Patterns |
+|------|-------------|
+| **YouTube** | youtube.com, youtu.be, shorts, live, playlists, channels |
+| **Twitter/X** | twitter.com/\*/status/\*, x.com/\*/status/\*, Spaces |
+| **TikTok** | tiktok.com/@\*/video/\*, vm.tiktok.com, user profiles |
+| **Instagram** | instagram.com/p/\*, /reel/\*, /reels/ |
+| **Reddit** | reddit.com/r/\*/comments/\*, v.redd.it, galleries |
+| **Twitch** | VODs, clips, live streams |
+| **Vimeo** | vimeo.com/\*, player embeds |
+| **SoundCloud** | Tracks, playlists, albums |
+| **Bilibili** | Videos, bangumi/anime |
+| **Dailymotion** | Videos |
+| **Bandcamp** | Tracks, albums |
+| **Kick** | VODs, clips, live |
+| **Rumble** | Videos |
+| **TED** | Talks (with multi-language subtitles) |
+| **Niconico** | Videos |
+| **Streamable** | Videos |
+| **Imgur** | Videos, GIFs, albums |
+| **Coub** | Videos (video + audio merge) |
+| **Odysee/LBRY** | Videos |
+| **PeerTube** | Any instance |
+| **Spotify** | Podcast episodes (30s preview) |
+| **Archive.org** | Any public media |
+| **Google Drive** | Public files |
+| **Dropbox** | Public share links |
+| **+ more** | Generic fallback for direct media URLs |
+See [docs/supported-sites.md](docs/supported-sites.md) for full details.
+## For AI Agents
+getraw is designed to be used by AI agents. Key commands for automation:
-## Building from Source
+```sh
+# Get structured metadata
+getraw --dump-json "URL" | jq '.title, .duration, .formats[0].url'
-Requires [Bun](https://bun.sh) v1.0 or later.
+# Download transcript for summarization
+getraw --write-subs --sub-langs en --skip-download "URL"
+# Extract audio for transcription pipelines
+getraw -x --audio-format wav -o "audio.wav" "URL"
+# Batch download
+getraw URL1 URL2 URL3
+```
+Install as an agent skill for any compatible AI coding agent:
 ```sh
-git clone https://github.com/web3mikee/getraw
-cd getraw
-bun install
-bun run build    # produces ./getraw binary
+npx skills add onkits/getraw
 ```
-Run tests:
+## Building from Source
 ```sh
-bun test
+git clone https://github.com/onkits/getraw
+cd getraw
+bun install
+bun test         # 386 tests
+bun run build    # standalone binary
 ```
 ## Writing a Custom Extractor
-See [docs/plugin-guide.md](docs/plugin-guide.md) for the `BaseExtractor` interface and a minimal example.
+See [docs/plugin-guide.md](docs/plugin-guide.md) for the `BaseExtractor` interface and examples.
 ## License

package/bun.lock CHANGED Viewed

@@ -7,6 +7,7 @@
       "dependencies": {
         "hls-parser": "^0.13.6",
         "mpd-parser": "^1.3.0",
+        "youtubei.js": "^17.0.1",
       },
       "devDependencies": {
         "@types/bun": "latest",
@@ -19,6 +20,8 @@
   "packages": {
     "@babel/runtime": ["@babel/runtime@7.29.7", "", {}, "sha512-Nq8OhGWiZIZGV6hLHoyAKLLcJihP/xFeBMGJoUrxTX2psI8dCifzLhZISFb+VWS3wFMRDmCGw5R+dOySCqPLhw=="],
+    "@bufbuild/protobuf": ["@bufbuild/protobuf@2.12.0", "", {}, "sha512-B/XlCaFIP8LOwzo+bz5uFzATYokcwCKQcghqnlfwSmM5eX/qTkvDBnDPs+gXtX/RyjxJ4DRikECcPJbyALA8FA=="],
     "@types/bun": ["@types/bun@1.3.14", "", { "dependencies": { "bun-types": "1.3.14" } }, "sha512-h1hFqFVcvAvD9j9K7ZW7vd82aSA+rTdznZa+5bwvCwqSB1jmmfLcbIWhOLx1/+boy/xmjgCs/OMUL8hRJSmnPw=="],
     "@types/node": ["@types/node@25.9.3", "", { "dependencies": { "undici-types": ">=7.24.0 <7.24.7" } }, "sha512-603BddQMv3pUcr4U2dhujk83N2tTDVr/34wII2B6bJy6g+8WD6yUb11jszNs0gdi4PesVWl7ABt8nYMVpnLUcg=="],
@@ -35,6 +38,8 @@
     "hls-parser": ["hls-parser@0.13.6", "", {}, "sha512-I40sl22E2muqeSTpG8kMN2dAegAhubkXPXtnsUXFwdKwZK47d1Q+XwuX32VMZ++AZU5oeQIZqAnGNHxSG1sWaw=="],
+    "meriyah": ["meriyah@6.1.4", "", {}, "sha512-Sz8FzjzI0kN13GK/6MVEsVzMZEPvOhnmmI1lU5+/1cGOiK3QUahntrNNtdVeihrO7t9JpoH75iMNXg6R6uWflQ=="],
     "min-document": ["min-document@2.19.2", "", { "dependencies": { "dom-walk": "^0.1.0" } }, "sha512-8S5I8db/uZN8r9HSLFVWPdJCvYOejMcEC82VIzNUc6Zkklf/d1gg2psfE79/vyhWOj4+J8MtwmoOz3TmvaGu5A=="],
     "mpd-parser": ["mpd-parser@1.3.1", "", { "dependencies": { "@babel/runtime": "^7.12.5", "@videojs/vhs-utils": "^4.0.0", "@xmldom/xmldom": "^0.8.3", "global": "^4.4.0" }, "bin": { "mpd-to-m3u8-json": "bin/parse.js" } }, "sha512-1FuyEWI5k2HcmhS1HkKnUAQV7yFPfXPht2DnRRGtoiiAAW+ESTbtEXIDpRkwdU+XyrQuwrIym7UkoPKsZ0SyFw=="],
@@ -46,5 +51,7 @@
     "undici-types": ["undici-types@7.24.6", "", {}, "sha512-WRNW+sJgj5OBN4/0JpHFqtqzhpbnV0GuB+OozA9gCL7a993SmU+1JBZCzLNxYsbMfIeDL+lTsphD5jN5N+n0zg=="],
     "url-toolkit": ["url-toolkit@2.2.5", "", {}, "sha512-mtN6xk+Nac+oyJ/PrI7tzfmomRVNFIWKUbG8jdYFt52hxbiReFAXIjYskvu64/dvuW71IcB7lV8l0HvZMac6Jg=="],
+    "youtubei.js": ["youtubei.js@17.0.1", "", { "dependencies": { "@bufbuild/protobuf": "^2.0.0", "meriyah": "^6.1.4" } }, "sha512-1lO4b8UqMDzE0oh2qEGzbBOd4UYRdxn/4PdpRM7BGTHxM6ddsEsKZTu90jp8V9FHVgC2h1UirQyqoqLiKwl+Zg=="],
   }
 }

package/package.json CHANGED Viewed

@@ -1,6 +1,6 @@
 {
   "name": "getraw",
-  "version": "0.1.3",
+  "version": "0.2.2",
   "description": "Fast media downloader CLI built natively in Bun/TypeScript",
   "type": "module",
   "bin": {
@@ -10,11 +10,13 @@
     "dev": "bun run src/cli/index.ts",
     "test": "bun test",
     "build": "bun build src/cli/index.ts --compile --outfile=getraw",
-    "dashboard": "bun run tools/dashboard.ts"
+    "dashboard": "bun run tools/dashboard.ts",
+    "postinstall": "bun run scripts/patch-youtubei.js"
   },
   "dependencies": {
     "hls-parser": "^0.13.6",
-    "mpd-parser": "^1.3.0"
+    "mpd-parser": "^1.3.0",
+    "youtubei.js": "^17.0.1"
   },
   "devDependencies": {
     "@types/bun": "latest"
@@ -25,6 +27,6 @@
   "license": "MIT",
   "repository": {
     "type": "git",
-    "url": "https://github.com/web3mikee/getraw"
+    "url": "https://github.com/onkits/getraw"
   }
 }

package/scripts/patch-youtubei.js ADDED Viewed

@@ -0,0 +1,14 @@
+#!/usr/bin/env node
+// Patches youtubei.js to use Bun-native JS evaluation instead of the default stub
+import { writeFileSync } from "fs";
+import { resolve } from "path";
+const evalPath = resolve("node_modules/youtubei.js/dist/src/platform/jsruntime/default.js");
+const evalCode = `export default async function evaluate(data) {
+  const fn = new Function(data.output);
+  return fn();
+}
+`;
+writeFileSync(evalPath, evalCode);
+console.log("Patched youtubei.js jsruntime for Bun-native evaluation");

package/skills/getraw/SKILL.md ADDED Viewed

@@ -0,0 +1,163 @@
+---
+name: getraw
+description: Download videos, audio, and metadata from 30+ sites (YouTube, Twitter, TikTok, Instagram, Reddit, Twitch, Vimeo, SoundCloud, and more). Use when the user asks to download media, extract video info, get transcripts/subtitles, rip audio, or fetch metadata from a URL. Wraps the getraw CLI — a yt-dlp replacement built in Bun/TypeScript.
+---
+# getraw
+Download and extract media from 30+ sites. Built in Bun/TypeScript as a yt-dlp replacement.
+## Prerequisites
+Requires `bun` and `getraw` installed:
+```bash
+bun install -g getraw
+```
+Optional: `ffmpeg` for audio extraction, format merging, and subtitle embedding.
+## Commands
+### Download a video
+```bash
+getraw "URL"
+```
+Downloads the best available format to the current directory.
+### Get metadata as JSON (no download)
+```bash
+getraw --dump-json "URL"
+```
+Returns full metadata: title, description, uploader, duration, formats, subtitles, thumbnails. Use this when you need info about a video without downloading it. Parse the JSON output for structured data.
+### List available formats
+```bash
+getraw --list-formats "URL"
+```
+Shows all available quality/format options (resolution, codec, bitrate, filesize).
+### Download specific format
+```bash
+getraw -f "best[height<=720]" "URL"
+getraw -f "bestvideo+bestaudio" "URL"
+getraw -f "bestaudio" "URL"
+```
+Format selection strings:
+- `best` — best single file
+- `bestvideo+bestaudio` — best video + best audio, merged by ffmpeg
+- `bestaudio` — audio only (best quality)
+- `best[height<=720]` — best format at 720p or below
+- Format ID from `--list-formats` (e.g. `137+140`)
+### Extract audio only
+```bash
+getraw -x "URL"
+getraw -x --audio-format mp3 "URL"
+getraw -x --audio-format flac "URL"
+```
+Supported audio formats: `mp3`, `aac`, `flac`, `wav`, `opus`, `vorbis`, `m4a`.
+### Download subtitles
+```bash
+getraw --write-subs "URL"
+getraw --write-subs --sub-langs "en,es" "URL"
+```
+Downloads subtitle files alongside the video. Use `--sub-langs` to specify languages.
+### Custom output filename
+```bash
+getraw -o "%(title)s.%(ext)s" "URL"
+getraw -o "%(uploader)s - %(title)s [%(id)s].%(ext)s" "URL"
+```
+Template variables: `%(title)s`, `%(id)s`, `%(ext)s`, `%(uploader)s`, `%(upload_date)s`, `%(duration)s`, `%(view_count)s`.
+### Embed metadata
+```bash
+getraw --embed-thumbnail --embed-subs "URL"
+```
+Embeds thumbnail art and subtitles into the downloaded file (requires ffmpeg).
+## Supported Sites
+| Site | URL Pattern |
+|------|------------|
+| YouTube | youtube.com, youtu.be, youtube.com/shorts |
+| Twitter/X | twitter.com/*/status/*, x.com/*/status/* |
+| TikTok | tiktok.com/@*/video/*, vm.tiktok.com/* |
+| Instagram | instagram.com/p/*, instagram.com/reel/* |
+| Reddit | reddit.com/r/*/comments/*, v.redd.it/* |
+| Twitch | twitch.tv/videos/*, twitch.tv/*/clip/* |
+| Vimeo | vimeo.com/* |
+| SoundCloud | soundcloud.com/*/* |
+| Bilibili | bilibili.com/video/* |
+| Dailymotion | dailymotion.com/video/* |
+| Bandcamp | *.bandcamp.com/track/*, *.bandcamp.com/album/* |
+| Rumble | rumble.com/* |
+| TED | ted.com/talks/* |
+| Kick | kick.com/video/*, kick.com/*/clips/* |
+| Streamable | streamable.com/* |
+| PeerTube | Any PeerTube instance |
+| Archive.org | archive.org/details/* |
+| + 13 more | Imgur, Coub, Odysee, Spotify podcasts, NHK, BBC, etc. |
+## When to Use
+- User says "download this video" or shares a video URL
+- User wants video/audio metadata (`--dump-json`)
+- User wants to extract audio from a video (`-x`)
+- User wants subtitles or transcripts (`--write-subs`)
+- User wants to check available qualities (`--list-formats`)
+- User wants to save media for offline use or processing
+## Common Patterns
+### Get video transcript for summarization
+```bash
+getraw --write-subs --sub-langs en --skip-download "URL"
+# Then read the .vtt or .srt file
+```
+### Download audio for TTS/transcription pipeline
+```bash
+getraw -x --audio-format wav -o "audio.wav" "URL"
+```
+### Batch download from a list
+```bash
+getraw URL1 URL2 URL3
+```
+### Get metadata for multiple videos
+```bash
+for url in URL1 URL2 URL3; do
+  getraw --dump-json "$url"
+done
+```
+## Error Handling
+- If a site is unsupported, getraw returns a clear error with the URL
+- If a format is unavailable, it falls back to the best available
+- Network errors retry 3 times with exponential backoff
+- Use `--verbose` for debug output, `--quiet` to suppress all output

package/src/cli/index.ts CHANGED Viewed

@@ -3,7 +3,8 @@ import { parseArgs, printHelp } from "./options";
 import { Orchestrator } from "../core/orchestrator";
 import { logger } from "../core/logger";
-const VERSION = "0.0.0";
+import pkg from "../../package.json";
+const VERSION = pkg.version;
 async function main(): Promise<void> {
   const args = process.argv.slice(2);

package/src/cli/options.ts CHANGED Viewed

@@ -20,7 +20,7 @@ export const FLAG_DEFS: FlagDef[] = [
   { long: "--list-formats", short: "-F", description: "List available formats", type: "boolean", key: "listFormats" },
   { long: "--dump-json", short: "-j", description: "Dump info JSON to stdout", type: "boolean", key: "dumpJson" },
   { long: "--quiet", short: "-q", description: "Suppress output", type: "boolean", key: "quiet" },
-  { long: "--verbose", short: "-v", description: "Verbose output", type: "boolean", key: "verbose" },
+  { long: "--verbose", description: "Verbose output", type: "boolean", key: "verbose" },
   { long: "--no-progress", description: "Disable progress bar", type: "boolean", key: "noProgress" },
   { long: "--retries", short: "-R", description: "Number of retries", type: "number", key: "retries" },
   { long: "--rate-limit", short: "-r", description: "Rate limit in bytes/sec", type: "number", key: "rateLimit" },
@@ -32,7 +32,7 @@ export const FLAG_DEFS: FlagDef[] = [
   { long: "--embed-subs", description: "Embed subtitles in output", type: "boolean", key: "embedSubs" },
   { long: "--merge-output-format", description: "Output container for merging", type: "string", key: "mergeOutputFormat" },
   { long: "--ffmpeg-location", description: "Path to ffmpeg binary", type: "string", key: "ffmpegLocation" },
-  { long: "--version", short: "-V", description: "Print version", type: "boolean", key: "version" },
+  { long: "--version", short: "-v", description: "Print version", type: "boolean", key: "version" },
   { long: "--help", short: "-h", description: "Show help", type: "boolean", key: "help" },
 ];

package/src/core/orchestrator.ts CHANGED Viewed

@@ -102,7 +102,7 @@ export class Orchestrator {
           ? `${filepath}.f${format.format_id}.${format.ext}`
           : filepath;
-      await downloader.download(targetPath, format.url, {
+      await downloader.download(format.url, targetPath, {
         headers: { ...info.http_headers, ...format.http_headers },
         rateLimit: options.rateLimit,
         retries: options.retries,

package/src/extractors/base.ts CHANGED Viewed

@@ -1,9 +1,78 @@
 import { BaseExtractor } from "../core/types";
 import { GenericExtractor } from "./generic";
+import { YouTubeExtractor } from "./youtube/index";
+import { TwitterExtractor } from "./twitter/index";
+import { TwitterSpacesExtractor } from "./twitter/spaces";
+import { TikTokExtractor } from "./tiktok/index";
+import { TikTokUserExtractor } from "./tiktok/user";
+import { InstagramExtractor } from "./instagram/index";
+import { InstagramReelsExtractor } from "./instagram/reels";
+import { RedditExtractor } from "./reddit/index";
+import { RedditGalleryExtractor } from "./reddit/gallery";
+import { TwitchVODExtractor } from "./twitch/index";
+import { TwitchClipExtractor } from "./twitch/clips";
+import { TwitchLiveExtractor } from "./twitch/live";
+import { VimeoExtractor } from "./vimeo/index";
+import { SoundCloudExtractor } from "./soundcloud/index";
+import { SoundCloudPlaylistExtractor } from "./soundcloud/playlist";
+import { BilibiliExtractor } from "./bilibili/index";
+import { BilibiliBangumiExtractor } from "./bilibili/bangumi";
+import { KickExtractor } from "./kick/index";
+import { KickClipsExtractor } from "./kick/clips";
+import { KickLiveExtractor } from "./kick/live";
+import { NiconicoExtractor } from "./niconico/index";
+import { DailymotionExtractor } from "./dailymotion";
+import { RumbleExtractor } from "./rumble";
+import { BandcampExtractor } from "./bandcamp";
+import { SpotifyExtractor } from "./spotify";
+import { PeerTubeExtractor } from "./peertube";
+import { OdyseeExtractor } from "./odysee";
+import { StreamableExtractor } from "./streamable";
+import { ImgurExtractor } from "./imgur";
+import { CoubExtractor } from "./coub";
+import { TEDExtractor } from "./ted";
+import { ArchiveOrgExtractor } from "./archive-org";
+import { DropboxExtractor } from "./dropbox";
+import { GoogleDriveExtractor } from "./google-drive";
 export { BaseExtractor };
-const extractors: BaseExtractor[] = [];
+const extractors: BaseExtractor[] = [
+  new YouTubeExtractor(),
+  new TwitterExtractor(),
+  new TwitterSpacesExtractor(),
+  new TikTokExtractor(),
+  new TikTokUserExtractor(),
+  new InstagramExtractor(),
+  new InstagramReelsExtractor(),
+  new RedditExtractor(),
+  new RedditGalleryExtractor(),
+  new TwitchVODExtractor(),
+  new TwitchClipExtractor(),
+  new TwitchLiveExtractor(),
+  new VimeoExtractor(),
+  new SoundCloudExtractor(),
+  new SoundCloudPlaylistExtractor(),
+  new BilibiliExtractor(),
+  new BilibiliBangumiExtractor(),
+  new KickExtractor(),
+  new KickClipsExtractor(),
+  new KickLiveExtractor(),
+  new NiconicoExtractor(),
+  new DailymotionExtractor(),
+  new RumbleExtractor(),
+  new BandcampExtractor(),
+  new SpotifyExtractor(),
+  new PeerTubeExtractor(),
+  new OdyseeExtractor(),
+  new StreamableExtractor(),
+  new ImgurExtractor(),
+  new CoubExtractor(),
+  new TEDExtractor(),
+  new ArchiveOrgExtractor(),
+  new DropboxExtractor(),
+  new GoogleDriveExtractor(),
+];
 const genericExtractor = new GenericExtractor();
 export function registerExtractor(extractor: BaseExtractor): void {

package/src/extractors/youtube/index.ts CHANGED Viewed

@@ -1,17 +1,29 @@
 import { BaseExtractor, ExtractorError } from "../../core/types";
 import type { InfoDict, Format, Thumbnail } from "../../core/types";
-import { InnerTubeClient } from "./innertube";
-import type { PlayerResponse, VideoDetails, StreamingData } from "./innertube";
-import { fetchPlayerJs, decipherSignatureUrl, clearCache as clearSigCache } from "./signature";
-import { transformNsig, clearNsigCache } from "./nsig";
 import { parseCaptionTracks } from "./captions";
-import { PlaylistExtractor } from "./playlist";
 const VALID_URL = /^https?:\/\/(?:(?:www|m|music)\.)?(?:youtube\.com\/(?:watch\?.*v=|shorts\/|live\/|embed\/|v\/)|youtu\.be\/)([a-zA-Z0-9_-]{11})/;
 const PLAYLIST_URL = /^https?:\/\/(?:(?:www|m|music)\.)?youtube\.com\/playlist\?.*list=([a-zA-Z0-9_-]+)/;
 const CHANNEL_URL = /^https?:\/\/(?:(?:www|m|music)\.)?youtube\.com\/(?:channel\/|@)([a-zA-Z0-9_-]+)/;
-const PLAYER_URL_RE = /"jsUrl"\s*:\s*"(\/s\/player\/[^"]+\/base\.js)"/;
+function generateCpn(): string {
+  const chars = "abcdefghijklmnopqrstuvwxyzABCDEFGHIJKLMNOPQRSTUVWXYZ0123456789-_";
+  return Array.from({ length: 16 }, () => chars[Math.floor(Math.random() * 64)]).join("");
+}
+let _innertube: Awaited<ReturnType<typeof createInnertube>> | null = null;
+async function createInnertube() {
+  const { Innertube } = await import("youtubei.js");
+  return Innertube.create({ generate_session_locally: true });
+}
+async function getInnertube() {
+  if (!_innertube) {
+    _innertube = await createInnertube();
+  }
+  return _innertube;
+}
 export class YouTubeExtractor extends BaseExtractor {
   readonly _VALID_URL = new RegExp(
@@ -19,234 +31,131 @@ export class YouTubeExtractor extends BaseExtractor {
   );
   readonly _NAME = "youtube";
-  private playlistExtractor = new PlaylistExtractor();
   protected async _real_extract(url: string): Promise<InfoDict> {
-    const playlistMatch = url.match(PLAYLIST_URL);
-    if (playlistMatch) {
-      return this.playlistExtractor.extractPlaylist(playlistMatch[1]);
-    }
-    const channelMatch = url.match(CHANNEL_URL);
-    if (channelMatch && !url.match(VALID_URL)) {
-      return this.playlistExtractor.extractChannelVideos(channelMatch[1]);
-    }
     const videoMatch = url.match(VALID_URL);
     if (!videoMatch) {
-      throw new ExtractorError(`Could not extract video ID from URL: ${url}`);
+      throw new ExtractorError(`Unsupported YouTube URL: ${url}`);
     }
     return this.extractVideo(videoMatch[1]);
   }
   private async extractVideo(videoId: string): Promise<InfoDict> {
-    const webClient = InnerTubeClient.withClient("WEB");
-    let playerResponse = await webClient.getPlayerResponse(videoId);
+    const yt = await getInnertube();
+    const info = await yt.getInfo(videoId);
-    const status = playerResponse.playabilityStatus?.status;
-    if (status === "LOGIN_REQUIRED" || status === "CONTENT_CHECK_REQUIRED") {
-      playerResponse = await this.tryAgeGateBypass(videoId, playerResponse);
+    if (!info.basic_info.title) {
+      throw new ExtractorError("Could not extract video info");
     }
-    if (playerResponse.playabilityStatus?.status === "ERROR") {
-      throw new ExtractorError(
-        playerResponse.playabilityStatus.reason ?? "Video unavailable"
-      );
-    }
+    const formats = await this.extractFormats(info, yt);
-    const videoDetails = playerResponse.videoDetails;
-    if (!videoDetails) {
-      throw new ExtractorError("No video details in player response");
-    }
+    const thumbnails: Thumbnail[] = (info.basic_info.thumbnail ?? []).map((t: { url: string; width: number; height: number }) => ({
+      url: t.url,
+      width: t.width,
+      height: t.height,
+    }));
-    let formats = await this.extractFormats(playerResponse, webClient, videoId);
+    const result: InfoDict = {
+      id: videoId,
+      title: info.basic_info.title,
+      formats,
+      thumbnails,
+      description: info.basic_info.short_description,
+      channel: info.basic_info.author,
+      channel_id: info.basic_info.channel_id,
+      duration: info.basic_info.duration,
+      view_count: info.basic_info.view_count,
+      webpage_url: `https://www.youtube.com/watch?v=${videoId}`,
+      live_status: info.basic_info.is_live ? "is_live" : "not_live",
+    };
-    if (formats.length === 0) {
-      const androidClient = InnerTubeClient.withClient("ANDROID");
-      const androidResponse = await androidClient.getPlayerResponse(videoId);
-      if (androidResponse.streamingData) {
-        formats = androidClient.parseFormats(androidResponse.streamingData);
+    // Extract captions from page response
+    const pageResponse = await this.fetchPagePlayerResponse(videoId);
+    if (pageResponse) {
+      const captionTracks = pageResponse.captions?.playerCaptionsTracklistRenderer?.captionTracks;
+      if (captionTracks?.length) {
+        const { subtitles, automatic_captions } = parseCaptionTracks(captionTracks);
+        result.subtitles = subtitles;
+        result.automatic_captions = automatic_captions;
       }
     }
-    const info = this.buildInfoDict(videoId, videoDetails, playerResponse, formats);
-    return info;
-  }
-  private async tryAgeGateBypass(
-    videoId: string,
-    originalResponse: PlayerResponse,
-  ): Promise<PlayerResponse> {
-    const tvClient = InnerTubeClient.withClient("TVHTML5_EMBED");
-    const embedUrl = `https://www.youtube.com/embed/${videoId}`;
-    const tvResponse = await tvClient.getPlayerResponse(videoId, embedUrl);
-    if (tvResponse.playabilityStatus?.status === "OK" && tvResponse.streamingData) {
-      return {
-        ...tvResponse,
-        videoDetails: originalResponse.videoDetails ?? tvResponse.videoDetails,
-        captions: originalResponse.captions ?? tvResponse.captions,
-        microformat: originalResponse.microformat ?? tvResponse.microformat,
-      };
-    }
-    return originalResponse;
+    return result;
   }
-  private async extractFormats(
-    playerResponse: PlayerResponse,
-    client: InnerTubeClient,
-    videoId: string,
-  ): Promise<Format[]> {
-    const streamingData = playerResponse.streamingData;
-    if (!streamingData) return [];
-    let formats = client.parseFormats(streamingData);
-    const needsDecipher = this.formatsNeedDecipher(streamingData);
-    if (needsDecipher) {
-      formats = await this.decipherFormats(formats, streamingData, videoId);
-    }
-    return formats;
-  }
+  private async extractFormats(info: { streaming_data?: { formats?: unknown[]; adaptive_formats?: unknown[] }; chooseFormat: (opts: { type: string; quality: string }) => unknown }, yt: { session: { player: unknown } }): Promise<Format[]> {
+    const formats: Format[] = [];
+    const player = yt.session.player;
+    const cpn = generateCpn();
-  private formatsNeedDecipher(streamingData: StreamingData): boolean {
     const allFormats = [
-      ...(streamingData.formats ?? []),
-      ...(streamingData.adaptiveFormats ?? []),
+      ...(info.streaming_data?.formats ?? []),
+      ...(info.streaming_data?.adaptive_formats ?? []),
     ];
-    return allFormats.some((f) => f.signatureCipher && !f.url);
-  }
-  private async decipherFormats(
-    formats: Format[],
-    streamingData: StreamingData,
-    videoId: string,
-  ): Promise<Format[]> {
-    const playerJsUrl = await this.getPlayerJsUrl(videoId);
-    if (!playerJsUrl) return formats;
-    const playerJs = await fetchPlayerJs(playerJsUrl);
-    const allRaw = [
-      ...(streamingData.formats ?? []),
-      ...(streamingData.adaptiveFormats ?? []),
-    ];
-    for (let i = 0; i < formats.length; i++) {
-      const raw = allRaw[i];
-      if (!raw) continue;
-      if (raw.signatureCipher && !raw.url) {
-        try {
-          formats[i].url = decipherSignatureUrl(raw.signatureCipher, playerJs);
-        } catch {
-          continue;
+    for (const raw of allFormats) {
+      const f = raw as Record<string, unknown>;
+      try {
+        let url: string | undefined;
+        if (typeof (f as { decipher?: unknown }).decipher === "function") {
+          const deciphered = await (f as { decipher: (p: unknown) => Promise<unknown> }).decipher(player);
+          if (typeof deciphered === "string") {
+            const parsed = new URL(deciphered);
+            parsed.searchParams.set("cpn", cpn);
+            url = parsed.toString();
+          }
         }
-      }
-      if (formats[i].url) {
-        try {
-          formats[i].url = transformNsig(formats[i].url, playerJs);
-        } catch {
-          continue;
-        }
+        if (!url) continue;
+        const mime = String(f.mime_type ?? "");
+        const mimeMatch = mime.match(/^(video|audio)\/(\w+);\s*codecs="([^"]+)"/);
+        const ext = mimeMatch?.[2] ?? "mp4";
+        const codecs = mimeMatch?.[3] ?? "";
+        const isVideo = mime.startsWith("video");
+        const isAudio = mime.startsWith("audio");
+        formats.push({
+          format_id: String(f.itag ?? ""),
+          url,
+          ext,
+          vcodec: isVideo ? codecs.split(",")[0]?.trim() : "none",
+          acodec: isAudio ? codecs : (isVideo && codecs.includes(",") ? codecs.split(",")[1]?.trim() : undefined),
+          width: (f.width as number) ?? undefined,
+          height: (f.height as number) ?? undefined,
+          fps: (f.fps as number) ?? undefined,
+          tbr: f.bitrate ? Math.round((f.bitrate as number) / 1000) : undefined,
+          filesize: f.content_length ? parseInt(String(f.content_length), 10) : undefined,
+          format_note: String(f.quality_label ?? f.quality ?? ""),
+          audio_channels: (f.audio_channels as number) ?? undefined,
+          http_headers: {
+            "Origin": "https://www.youtube.com",
+            "Referer": "https://www.youtube.com/",
+            "User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/137.0.0.0 Safari/537.36",
+          },
+        });
+      } catch {
+        continue;
       }
     }
     return formats;
   }
-  private async getPlayerJsUrl(videoId: string): Promise<string | null> {
-    const watchUrl = `https://www.youtube.com/watch?v=${videoId}`;
+  private async fetchPagePlayerResponse(videoId: string): Promise<Record<string, unknown> | null> {
     try {
-      const response = await fetch(watchUrl, {
+      const resp = await fetch(`https://www.youtube.com/watch?v=${videoId}`, {
         headers: {
-          "User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/125.0.0.0 Safari/537.36",
+          "User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/137.0.0.0 Safari/537.36",
         },
       });
-      const html = await response.text();
-      const match = html.match(PLAYER_URL_RE);
-      return match ? `https://www.youtube.com${match[1]}` : null;
+      const html = await resp.text();
+      const match = html.match(/var\s+ytInitialPlayerResponse\s*=\s*(\{.+?\});/s);
+      return match ? JSON.parse(match[1]) : null;
     } catch {
       return null;
     }
   }
-  private buildInfoDict(
-    videoId: string,
-    details: VideoDetails,
-    response: PlayerResponse,
-    formats: Format[],
-  ): InfoDict {
-    const microformat = response.microformat?.playerMicroformatRenderer;
-    const thumbnails: Thumbnail[] = (details.thumbnail?.thumbnails ?? []).map((t) => ({
-      url: t.url,
-      width: t.width,
-      height: t.height,
-    }));
-    const liveStatus = this.getLiveStatus(details, response);
-    const info: InfoDict = {
-      id: videoId,
-      title: details.title,
-      formats,
-      thumbnails,
-      description: details.shortDescription ?? microformat?.description?.simpleText,
-      channel: details.author,
-      channel_id: details.channelId,
-      channel_url: `https://www.youtube.com/channel/${details.channelId}`,
-      uploader: details.author,
-      uploader_id: details.channelId,
-      uploader_url: microformat?.ownerProfileUrl,
-      duration: parseInt(details.lengthSeconds, 10) || undefined,
-      view_count: parseInt(details.viewCount, 10) || undefined,
-      upload_date: microformat?.uploadDate?.replace(/-/g, ""),
-      live_status: liveStatus,
-      webpage_url: `https://www.youtube.com/watch?v=${videoId}`,
-      age_limit: 0,
-      categories: microformat?.category ? [microformat.category] : undefined,
-    };
-    if (microformat?.liveBroadcastDetails?.startTimestamp) {
-      info.release_timestamp = Math.floor(
-        new Date(microformat.liveBroadcastDetails.startTimestamp).getTime() / 1000
-      );
-    }
-    const captionTracks = response.captions?.playerCaptionsTracklistRenderer?.captionTracks;
-    if (captionTracks?.length) {
-      const { subtitles, automatic_captions } = parseCaptionTracks(captionTracks);
-      info.subtitles = subtitles;
-      info.automatic_captions = automatic_captions;
-    }
-    return info;
-  }
-  private getLiveStatus(
-    details: VideoDetails,
-    response: PlayerResponse,
-  ): InfoDict["live_status"] {
-    if (details.isLive) return "is_live";
-    if (details.isUpcoming) return "is_upcoming";
-    if (details.isLiveContent) return "was_live";
-    if (response.playabilityStatus?.liveStreamability) return "is_live";
-    return "not_live";
-  }
-  static clearCaches(): void {
-    clearSigCache();
-    clearNsigCache();
-  }
 }
-export { InnerTubeClient } from "./innertube";
-export { PlaylistExtractor } from "./playlist";
-export { parseCaptionTracks, convertToSrt, convertToVtt } from "./captions";
-export { decipherSignatureUrl, fetchPlayerJs } from "./signature";
-export { transformNsig } from "./nsig";

package/src/extractors/youtube/innertube.ts CHANGED Viewed

@@ -104,14 +104,14 @@ export interface BrowseResponse {
 const CLIENTS: Record<string, ClientContext> = {
   WEB: {
     clientName: "WEB",
-    clientVersion: "2.20240530.02.00",
-    userAgent: "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/125.0.0.0 Safari/537.36",
+    clientVersion: "2.20250615.01.00",
+    userAgent: "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/137.0.0.0 Safari/537.36",
     apiKey: "AIzaSyAO_FJ2SlqU8Q4STEHLGCilw_Y9_11qcW8",
   },
   ANDROID: {
     clientName: "ANDROID",
-    clientVersion: "19.29.37",
-    userAgent: "com.google.android.youtube/19.29.37 (Linux; U; Android 14) gzip",
+    clientVersion: "19.44.38",
+    userAgent: "com.google.android.youtube/19.44.38 (Linux; U; Android 14) gzip",
     apiKey: "AIzaSyA8eiZmM1FaDVjRy-df2KTyQ_vz_yYM39w",
     clientId: 3,
   },