npm - @phi-code-admin/camofox-browser - Versions diffs - 1.0.0 → 1.0.2 - Mend

@phi-code-admin/camofox-browser 1.0.0 → 1.0.2

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (53) hide show

package/AGENTS.md +571 -571
package/Dockerfile +86 -86
package/LICENSE +21 -21
package/README.md +691 -691
package/camofox.config.json +10 -10
package/lib/auth.js +134 -134
package/lib/camoufox-executable.js +189 -189
package/lib/config.js +153 -153
package/lib/cookies.js +119 -119
package/lib/downloads.js +168 -168
package/lib/extract.js +74 -74
package/lib/fly.js +54 -54
package/lib/images.js +88 -88
package/lib/inflight.js +16 -16
package/lib/launcher.js +47 -47
package/lib/macros.js +31 -31
package/lib/metrics.js +184 -184
package/lib/openapi.js +105 -105
package/lib/persistence.js +89 -89
package/lib/plugins.js +178 -175
package/lib/proxy.js +277 -277
package/lib/reporter.js +1102 -1102
package/lib/request-utils.js +59 -59
package/lib/resources.js +76 -76
package/lib/snapshot.js +41 -41
package/lib/tmp-cleanup.js +108 -108
package/lib/tracing.js +137 -137
package/openclaw.plugin.json +268 -268
package/package.json +148 -148
package/plugin.ts +758 -758
package/plugins/persistence/AGENTS.md +37 -37
package/plugins/persistence/README.md +48 -48
package/plugins/persistence/index.js +124 -124
package/plugins/vnc/AGENTS.md +42 -42
package/plugins/vnc/README.md +165 -165
package/plugins/vnc/apt.txt +7 -7
package/plugins/vnc/index.js +142 -142
package/plugins/vnc/spawn.js +8 -8
package/plugins/vnc/vnc-launcher.js +64 -64
package/plugins/vnc/vnc-watcher.sh +82 -82
package/plugins/youtube/AGENTS.md +25 -25
package/plugins/youtube/apt.txt +1 -1
package/plugins/youtube/index.js +206 -206
package/plugins/youtube/post-install.sh +5 -5
package/plugins/youtube/youtube.js +301 -301
package/run.sh +37 -37
package/scripts/exec.js +8 -8
package/scripts/generate-openapi.js +24 -24
package/scripts/install-plugin-deps.sh +63 -63
package/scripts/plugin.js +342 -342
package/scripts/sync-version.js +25 -25
package/server.js +6062 -6059
package/tsconfig.json +12 -12

package/plugins/youtube/index.js CHANGED Viewed

@@ -1,206 +1,206 @@
-/**
- * YouTube transcript plugin.
- *
- * Extracts video transcripts via yt-dlp (preferred) with browser fallback.
- * Registers POST /youtube/transcript.
- */
-import { detectYtDlp, hasYtDlp, ensureYtDlp, ytDlpTranscript, parseJson3, parseVtt, parseXml } from './youtube.js';
-import { classifyError } from '../../lib/request-utils.js';
-export async function register(app, ctx, pluginConfig = {}) {
-  const { log, config, sessions, ensureBrowser, getSession,
-          withUserLimit, safePageClose, normalizeUserId,
-          validateUrl, safeError, buildProxyUrl, proxyPool,
-          failuresTotal } = ctx;
-  const NAVIGATE_TIMEOUT_MS = config.navigateTimeoutMs;
-  // Detect yt-dlp binary at load time
-  await detectYtDlp(log);
-  // Auth is on by default; set { "auth": false } in camofox.config.json to disable
-  // Auth off by default -- matches pre-plugin behavior. Set { "auth": true } to require auth.
-  const middleware = pluginConfig.auth === true ? ctx.auth() : (_req, _res, next) => next();
-  app.post('/youtube/transcript', middleware, async (req, res) => {
-    const reqId = req.reqId;
-    try {
-      const { url, languages = ['en'] } = req.body;
-      if (!url) return res.status(400).json({ error: 'url is required' });
-      const urlErr = validateUrl(url);
-      if (urlErr) return res.status(400).json({ error: urlErr });
-      const videoIdMatch = url.match(
-        /(?:youtube\.com\/watch\?v=|youtu\.be\/|youtube\.com\/embed\/|youtube\.com\/shorts\/)([a-zA-Z0-9_-]{11})/
-      );
-      if (!videoIdMatch) {
-        return res.status(400).json({ error: 'Could not extract YouTube video ID from URL' });
-      }
-      const videoId = videoIdMatch[1];
-      const lang = languages[0] || 'en';
-      // Re-detect yt-dlp if startup detection failed (transient issue)
-      await ensureYtDlp(log);
-      const ytDlpProxyUrl = buildProxyUrl(proxyPool, config.proxy);
-      log('info', 'youtube transcript: starting', { reqId, videoId, lang, method: hasYtDlp() ? 'yt-dlp' : 'browser', hasProxy: !!ytDlpProxyUrl });
-      let result;
-      if (hasYtDlp()) {
-        try {
-          result = await ytDlpTranscript(reqId, url, videoId, lang, ytDlpProxyUrl);
-        } catch (ytErr) {
-          log('warn', 'yt-dlp threw, falling back to browser', { reqId, error: ytErr.message });
-          result = null;
-        }
-        // If yt-dlp returned an error result (e.g. no captions) or threw, try browser
-        if (!result || result.status !== 'ok') {
-          if (result) log('warn', 'yt-dlp returned error, falling back to browser', { reqId, status: result.status, code: result.code });
-          result = await browserTranscript(reqId, url, videoId, lang);
-        }
-      } else {
-        result = await browserTranscript(reqId, url, videoId, lang);
-      }
-      log('info', 'youtube transcript: done', { reqId, videoId, status: result.status, words: result.total_words });
-      res.json(result);
-    } catch (err) {
-      failuresTotal.labels(classifyError(err), 'youtube_transcript').inc();
-      log('error', 'youtube transcript failed', { reqId, error: err.message, stack: err.stack });
-      res.status(500).json({ error: safeError(err) });
-    }
-  });
-  // Browser fallback -- play video, intercept timedtext network response
-  async function browserTranscript(reqId, url, videoId, lang) {
-    return await withUserLimit('__yt_transcript__', async () => {
-      await ensureBrowser();
-      const session = await getSession('__yt_transcript__');
-      const page = await session.context.newPage();
-      try {
-        await page.addInitScript(() => {
-          const origPlay = HTMLMediaElement.prototype.play;
-          HTMLMediaElement.prototype.play = function() { this.volume = 0; this.muted = true; return origPlay.call(this); };
-        });
-        let interceptedCaptions = null;
-        page.on('response', async (response) => {
-          const respUrl = response.url();
-          if (respUrl.includes('/api/timedtext') && respUrl.includes(`v=${videoId}`) && !interceptedCaptions) {
-            try {
-              const body = await response.text();
-              if (body && body.length > 0) interceptedCaptions = body;
-            } catch {}
-          }
-        });
-        await page.goto(url, { waitUntil: 'domcontentloaded', timeout: NAVIGATE_TIMEOUT_MS });
-        await page.waitForTimeout(2000);
-        // Extract caption track URLs and metadata from ytInitialPlayerResponse
-        const meta = await page.evaluate(() => {
-          const r = window.ytInitialPlayerResponse || (typeof ytInitialPlayerResponse !== 'undefined' ? ytInitialPlayerResponse : null);
-          if (!r) return { title: '', tracks: [] };
-          const tracks = r?.captions?.playerCaptionsTracklistRenderer?.captionTracks || [];
-          return {
-            title: r?.videoDetails?.title || '',
-            tracks: tracks.map(t => ({ code: t.languageCode, name: t.name?.simpleText || t.languageCode, kind: t.kind || 'manual', url: t.baseUrl })),
-          };
-        });
-        log('info', 'youtube transcript: extracted caption tracks', { reqId, title: meta.title, trackCount: meta.tracks.length, tracks: meta.tracks.map(t => t.code) });
-        // Strategy A: Fetch caption track URL directly from ytInitialPlayerResponse
-        if (meta.tracks && meta.tracks.length > 0) {
-          const track = meta.tracks.find(t => t.code === lang) || meta.tracks[0];
-          if (track && track.url) {
-            const captionUrl = track.url + (track.url.includes('?') ? '&' : '?') + 'fmt=json3';
-            log('info', 'youtube transcript: fetching caption track', { reqId, lang: track.code, url: captionUrl.substring(0, 100) });
-            try {
-              const captionResp = await page.evaluate(async (fetchUrl) => {
-                const resp = await fetch(fetchUrl);
-                return resp.ok ? await resp.text() : null;
-              }, captionUrl);
-              if (captionResp && captionResp.length > 0) {
-                let transcriptText = null;
-                if (captionResp.trimStart().startsWith('{')) transcriptText = parseJson3(captionResp);
-                else if (captionResp.includes('WEBVTT')) transcriptText = parseVtt(captionResp);
-                else if (captionResp.includes('<text')) transcriptText = parseXml(captionResp);
-                if (transcriptText && transcriptText.trim()) {
-                  return {
-                    status: 'ok', transcript: transcriptText,
-                    video_url: url, video_id: videoId, video_title: meta.title,
-                    language: track.code, total_words: transcriptText.split(/\s+/).length,
-                    available_languages: meta.tracks.map(t => ({ code: t.code, name: t.name, kind: t.kind })),
-                  };
-                }
-              }
-            } catch (fetchErr) {
-              log('warn', 'youtube transcript: caption track fetch failed', { reqId, error: fetchErr.message });
-            }
-          }
-        }
-        // Strategy B: Play video and intercept timedtext network response
-        await page.evaluate(() => {
-          const v = document.querySelector('video');
-          if (v) { v.muted = true; v.play().catch(() => {}); }
-        }).catch(() => {});
-        for (let i = 0; i < 40 && !interceptedCaptions; i++) {
-          await page.waitForTimeout(500);
-        }
-        if (!interceptedCaptions) {
-          return {
-            status: 'error', code: 404,
-            message: 'No captions available for this video',
-            video_url: url, video_id: videoId, title: meta.title,
-          };
-        }
-        log('info', 'youtube transcript: intercepted captions', { reqId, len: interceptedCaptions.length });
-        let transcriptText = null;
-        if (interceptedCaptions.trimStart().startsWith('{')) transcriptText = parseJson3(interceptedCaptions);
-        else if (interceptedCaptions.includes('WEBVTT')) transcriptText = parseVtt(interceptedCaptions);
-        else if (interceptedCaptions.includes('<text')) transcriptText = parseXml(interceptedCaptions);
-        if (!transcriptText || !transcriptText.trim()) {
-          return {
-            status: 'error', code: 404,
-            message: 'Caption data intercepted but could not be parsed',
-            video_url: url, video_id: videoId, title: meta.title,
-          };
-        }
-        return {
-          status: 'ok', transcript: transcriptText,
-          video_url: url, video_id: videoId, video_title: meta.title,
-          language: lang, total_words: transcriptText.split(/\s+/).length,
-          available_languages: meta.languages,
-        };
-      } finally {
-        await safePageClose(page);
-        // Clean up transcript session if no live pages remain
-        const ytKey = normalizeUserId('__yt_transcript__');
-        const ytSession = sessions.get(ytKey);
-        if (ytSession && !ytSession._closing) {
-          try {
-            const remainingPages = ytSession.context.pages();
-            if (remainingPages.length === 0) {
-              ytSession._closing = true;
-              ytSession.context.close().catch(() => {});
-              sessions.delete(ytKey);
-            }
-          } catch {
-            sessions.delete(ytKey);
-          }
-        }
-      }
-    });
-  }
-}
+/**
+ * YouTube transcript plugin.
+ *
+ * Extracts video transcripts via yt-dlp (preferred) with browser fallback.
+ * Registers POST /youtube/transcript.
+ */
+import { detectYtDlp, hasYtDlp, ensureYtDlp, ytDlpTranscript, parseJson3, parseVtt, parseXml } from './youtube.js';
+import { classifyError } from '../../lib/request-utils.js';
+export async function register(app, ctx, pluginConfig = {}) {
+  const { log, config, sessions, ensureBrowser, getSession,
+          withUserLimit, safePageClose, normalizeUserId,
+          validateUrl, safeError, buildProxyUrl, proxyPool,
+          failuresTotal } = ctx;
+  const NAVIGATE_TIMEOUT_MS = config.navigateTimeoutMs;
+  // Detect yt-dlp binary at load time
+  await detectYtDlp(log);
+  // Auth is on by default; set { "auth": false } in camofox.config.json to disable
+  // Auth off by default -- matches pre-plugin behavior. Set { "auth": true } to require auth.
+  const middleware = pluginConfig.auth === true ? ctx.auth() : (_req, _res, next) => next();
+  app.post('/youtube/transcript', middleware, async (req, res) => {
+    const reqId = req.reqId;
+    try {
+      const { url, languages = ['en'] } = req.body;
+      if (!url) return res.status(400).json({ error: 'url is required' });
+      const urlErr = validateUrl(url);
+      if (urlErr) return res.status(400).json({ error: urlErr });
+      const videoIdMatch = url.match(
+        /(?:youtube\.com\/watch\?v=|youtu\.be\/|youtube\.com\/embed\/|youtube\.com\/shorts\/)([a-zA-Z0-9_-]{11})/
+      );
+      if (!videoIdMatch) {
+        return res.status(400).json({ error: 'Could not extract YouTube video ID from URL' });
+      }
+      const videoId = videoIdMatch[1];
+      const lang = languages[0] || 'en';
+      // Re-detect yt-dlp if startup detection failed (transient issue)
+      await ensureYtDlp(log);
+      const ytDlpProxyUrl = buildProxyUrl(proxyPool, config.proxy);
+      log('info', 'youtube transcript: starting', { reqId, videoId, lang, method: hasYtDlp() ? 'yt-dlp' : 'browser', hasProxy: !!ytDlpProxyUrl });
+      let result;
+      if (hasYtDlp()) {
+        try {
+          result = await ytDlpTranscript(reqId, url, videoId, lang, ytDlpProxyUrl);
+        } catch (ytErr) {
+          log('warn', 'yt-dlp threw, falling back to browser', { reqId, error: ytErr.message });
+          result = null;
+        }
+        // If yt-dlp returned an error result (e.g. no captions) or threw, try browser
+        if (!result || result.status !== 'ok') {
+          if (result) log('warn', 'yt-dlp returned error, falling back to browser', { reqId, status: result.status, code: result.code });
+          result = await browserTranscript(reqId, url, videoId, lang);
+        }
+      } else {
+        result = await browserTranscript(reqId, url, videoId, lang);
+      }
+      log('info', 'youtube transcript: done', { reqId, videoId, status: result.status, words: result.total_words });
+      res.json(result);
+    } catch (err) {
+      failuresTotal.labels(classifyError(err), 'youtube_transcript').inc();
+      log('error', 'youtube transcript failed', { reqId, error: err.message, stack: err.stack });
+      res.status(500).json({ error: safeError(err) });
+    }
+  });
+  // Browser fallback -- play video, intercept timedtext network response
+  async function browserTranscript(reqId, url, videoId, lang) {
+    return await withUserLimit('__yt_transcript__', async () => {
+      await ensureBrowser();
+      const session = await getSession('__yt_transcript__');
+      const page = await session.context.newPage();
+      try {
+        await page.addInitScript(() => {
+          const origPlay = HTMLMediaElement.prototype.play;
+          HTMLMediaElement.prototype.play = function() { this.volume = 0; this.muted = true; return origPlay.call(this); };
+        });
+        let interceptedCaptions = null;
+        page.on('response', async (response) => {
+          const respUrl = response.url();
+          if (respUrl.includes('/api/timedtext') && respUrl.includes(`v=${videoId}`) && !interceptedCaptions) {
+            try {
+              const body = await response.text();
+              if (body && body.length > 0) interceptedCaptions = body;
+            } catch {}
+          }
+        });
+        await page.goto(url, { waitUntil: 'domcontentloaded', timeout: NAVIGATE_TIMEOUT_MS });
+        await page.waitForTimeout(2000);
+        // Extract caption track URLs and metadata from ytInitialPlayerResponse
+        const meta = await page.evaluate(() => {
+          const r = window.ytInitialPlayerResponse || (typeof ytInitialPlayerResponse !== 'undefined' ? ytInitialPlayerResponse : null);
+          if (!r) return { title: '', tracks: [] };
+          const tracks = r?.captions?.playerCaptionsTracklistRenderer?.captionTracks || [];
+          return {
+            title: r?.videoDetails?.title || '',
+            tracks: tracks.map(t => ({ code: t.languageCode, name: t.name?.simpleText || t.languageCode, kind: t.kind || 'manual', url: t.baseUrl })),
+          };
+        });
+        log('info', 'youtube transcript: extracted caption tracks', { reqId, title: meta.title, trackCount: meta.tracks.length, tracks: meta.tracks.map(t => t.code) });
+        // Strategy A: Fetch caption track URL directly from ytInitialPlayerResponse
+        if (meta.tracks && meta.tracks.length > 0) {
+          const track = meta.tracks.find(t => t.code === lang) || meta.tracks[0];
+          if (track && track.url) {
+            const captionUrl = track.url + (track.url.includes('?') ? '&' : '?') + 'fmt=json3';
+            log('info', 'youtube transcript: fetching caption track', { reqId, lang: track.code, url: captionUrl.substring(0, 100) });
+            try {
+              const captionResp = await page.evaluate(async (fetchUrl) => {
+                const resp = await fetch(fetchUrl);
+                return resp.ok ? await resp.text() : null;
+              }, captionUrl);
+              if (captionResp && captionResp.length > 0) {
+                let transcriptText = null;
+                if (captionResp.trimStart().startsWith('{')) transcriptText = parseJson3(captionResp);
+                else if (captionResp.includes('WEBVTT')) transcriptText = parseVtt(captionResp);
+                else if (captionResp.includes('<text')) transcriptText = parseXml(captionResp);
+                if (transcriptText && transcriptText.trim()) {
+                  return {
+                    status: 'ok', transcript: transcriptText,
+                    video_url: url, video_id: videoId, video_title: meta.title,
+                    language: track.code, total_words: transcriptText.split(/\s+/).length,
+                    available_languages: meta.tracks.map(t => ({ code: t.code, name: t.name, kind: t.kind })),
+                  };
+                }
+              }
+            } catch (fetchErr) {
+              log('warn', 'youtube transcript: caption track fetch failed', { reqId, error: fetchErr.message });
+            }
+          }
+        }
+        // Strategy B: Play video and intercept timedtext network response
+        await page.evaluate(() => {
+          const v = document.querySelector('video');
+          if (v) { v.muted = true; v.play().catch(() => {}); }
+        }).catch(() => {});
+        for (let i = 0; i < 40 && !interceptedCaptions; i++) {
+          await page.waitForTimeout(500);
+        }
+        if (!interceptedCaptions) {
+          return {
+            status: 'error', code: 404,
+            message: 'No captions available for this video',
+            video_url: url, video_id: videoId, title: meta.title,
+          };
+        }
+        log('info', 'youtube transcript: intercepted captions', { reqId, len: interceptedCaptions.length });
+        let transcriptText = null;
+        if (interceptedCaptions.trimStart().startsWith('{')) transcriptText = parseJson3(interceptedCaptions);
+        else if (interceptedCaptions.includes('WEBVTT')) transcriptText = parseVtt(interceptedCaptions);
+        else if (interceptedCaptions.includes('<text')) transcriptText = parseXml(interceptedCaptions);
+        if (!transcriptText || !transcriptText.trim()) {
+          return {
+            status: 'error', code: 404,
+            message: 'Caption data intercepted but could not be parsed',
+            video_url: url, video_id: videoId, title: meta.title,
+          };
+        }
+        return {
+          status: 'ok', transcript: transcriptText,
+          video_url: url, video_id: videoId, video_title: meta.title,
+          language: lang, total_words: transcriptText.split(/\s+/).length,
+          available_languages: meta.languages,
+        };
+      } finally {
+        await safePageClose(page);
+        // Clean up transcript session if no live pages remain
+        const ytKey = normalizeUserId('__yt_transcript__');
+        const ytSession = sessions.get(ytKey);
+        if (ytSession && !ytSession._closing) {
+          try {
+            const remainingPages = ytSession.context.pages();
+            if (remainingPages.length === 0) {
+              ytSession._closing = true;
+              ytSession.context.close().catch(() => {});
+              sessions.delete(ytKey);
+            }
+          } catch {
+            sessions.delete(ytKey);
+          }
+        }
+      }
+    });
+  }
+}

package/plugins/youtube/post-install.sh CHANGED Viewed

@@ -1,5 +1,5 @@
-#!/bin/sh
-# Install yt-dlp binary (not available via apt)
-set -e
-curl -fL https://github.com/yt-dlp/yt-dlp/releases/latest/download/yt-dlp -o /usr/local/bin/yt-dlp
-chmod +x /usr/local/bin/yt-dlp
+#!/bin/sh
+# Install yt-dlp binary (not available via apt)
+set -e
+curl -fL https://github.com/yt-dlp/yt-dlp/releases/latest/download/yt-dlp -o /usr/local/bin/yt-dlp
+chmod +x /usr/local/bin/yt-dlp