npm - @mux/ai - Versions diffs - 0.7.3 → 0.7.5 - Mend

@mux/ai 0.7.3 → 0.7.5

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (14) hide show

package/README.md +113 -390
package/dist/{index-BMqnP1RV.d.ts → index-B0U9upb4.d.ts} +13 -3
package/dist/{index-DZlygsvb.d.ts → index-Nxf6BaBO.d.ts} +1 -1
package/dist/index.d.ts +5 -5
package/dist/index.js +133 -22
package/dist/index.js.map +1 -1
package/dist/primitives/index.d.ts +2 -2
package/dist/primitives/index.js +96 -8
package/dist/primitives/index.js.map +1 -1
package/dist/{types-BQVi_wnh.d.ts → types-BRbaGW3t.d.ts} +2 -0
package/dist/workflows/index.d.ts +2 -2
package/dist/workflows/index.js +132 -21
package/dist/workflows/index.js.map +1 -1
package/package.json +3 -3

package/dist/workflows/index.js CHANGED Viewed

@@ -156,6 +156,9 @@ var EnvSchema = z.object({
   ),
   MUX_TEST_ASSET_ID_AUDIO_ONLY: optionalString("Mux test asset ID for audio-only assets.", "Mux test asset id for audio-only assets for testing"),
   MUX_TEST_ASSET_ID_VIOLENT_AUDIO_ONLY: optionalString("Mux test asset ID for audio-only assets with violent content.", "Mux test asset id for audio-only assets with violent content for testing"),
+  // Eval config
+  MUX_AI_EVAL_MODEL_SET: optionalString("Eval model selection mode.", "Choose between 'default' (provider defaults only) or 'all' (all configured models)"),
+  MUX_AI_EVAL_MODELS: optionalString("Comma-separated eval model pairs.", "Comma-separated provider:model pairs (e.g. 'openai:gpt-5.1,anthropic:claude-sonnet-4-5,google:gemini-3-flash-preview')"),
   // AI Providers
   OPENAI_API_KEY: optionalString("OpenAI API key for OpenAI-backed workflows.", "OpenAI API key"),
   ANTHROPIC_API_KEY: optionalString("Anthropic API key for Claude-backed workflows.", "Anthropic API key"),
@@ -421,12 +424,13 @@ function readString(record, key) {
 function resolveDirectMuxCredentials(record) {
   const tokenId = readString(record, "muxTokenId");
   const tokenSecret = readString(record, "muxTokenSecret");
+  const authorizationToken = readString(record, "muxAuthorizationToken");
   const signingKey = readString(record, "muxSigningKey");
   const privateKey = readString(record, "muxPrivateKey");
-  if (!tokenId && !tokenSecret && !signingKey && !privateKey) {
+  if (!tokenId && !tokenSecret && !authorizationToken && !signingKey && !privateKey) {
     return void 0;
   }
-  if (!tokenId || !tokenSecret) {
+  if ((!tokenId || !tokenSecret) && !authorizationToken) {
     throw new Error(
       "Both muxTokenId and muxTokenSecret are required when passing direct Mux workflow credentials."
     );
@@ -434,6 +438,7 @@ function resolveDirectMuxCredentials(record) {
   return {
     tokenId,
     tokenSecret,
+    authorizationToken,
     signingKey,
     privateKey
   };
@@ -444,7 +449,8 @@ function createWorkflowMuxClient(options) {
       const { default: MuxClient } = await import("@mux/mux-node");
       return new MuxClient({
         tokenId: options.tokenId,
-        tokenSecret: options.tokenSecret
+        tokenSecret: options.tokenSecret,
+        authorizationToken: options.authorizationToken
       });
     },
     getSigningKey() {
@@ -530,6 +536,81 @@ var DEFAULT_EMBEDDING_MODELS = {
   openai: "text-embedding-3-small",
   google: "gemini-embedding-001"
 };
+var LANGUAGE_MODELS = {
+  openai: ["gpt-5.1", "gpt-5-mini"],
+  anthropic: ["claude-sonnet-4-5"],
+  google: ["gemini-3-flash-preview", "gemini-2.5-flash"]
+};
+function getDefaultEvalModelConfigs() {
+  return Object.entries(DEFAULT_LANGUAGE_MODELS).map(([provider, modelId]) => ({ provider, modelId }));
+}
+function getAllEvalModelConfigs() {
+  return Object.entries(LANGUAGE_MODELS).flatMap(([provider, models]) => models.map((modelId) => ({ provider, modelId })));
+}
+function isSupportedProvider(value) {
+  return value === "openai" || value === "anthropic" || value === "google";
+}
+function parseEvalModelPair(value) {
+  const trimmed = value.trim();
+  const [providerRaw, modelIdRaw] = trimmed.split(":", 2);
+  const provider = providerRaw?.trim();
+  const modelId = modelIdRaw?.trim();
+  if (!provider || !modelId) {
+    throw new Error(
+      `Invalid eval model pair "${value}". Use "provider:model" (example: "openai:gpt-5.1").`
+    );
+  }
+  if (!isSupportedProvider(provider)) {
+    throw new Error(
+      `Unsupported eval provider "${provider}" in "${value}". Supported providers: ${Object.keys(LANGUAGE_MODELS).join(", ")}.`
+    );
+  }
+  const supportedModels = LANGUAGE_MODELS[provider];
+  if (!supportedModels.includes(modelId)) {
+    throw new Error(
+      `Unsupported eval model "${modelId}" for provider "${provider}". Supported models: ${supportedModels.join(", ")}.`
+    );
+  }
+  return {
+    provider,
+    modelId
+  };
+}
+function resolveEvalModelConfigs(options = {}) {
+  const explicitPairs = options.modelPairs?.map((value) => value.trim()).filter(Boolean) ?? [];
+  if (explicitPairs.length > 0) {
+    const dedupedPairs = Array.from(new Set(explicitPairs));
+    return dedupedPairs.map(parseEvalModelPair);
+  }
+  const selection = options.selection ?? "default";
+  if (selection === "all") {
+    return getAllEvalModelConfigs();
+  }
+  return getDefaultEvalModelConfigs();
+}
+function resolveEvalModelConfigsFromEnv(environment = env_default) {
+  const rawSelection = environment.MUX_AI_EVAL_MODEL_SET?.trim();
+  const rawModelPairs = environment.MUX_AI_EVAL_MODELS?.trim();
+  let selection;
+  if (!rawSelection || rawSelection === "default") {
+    selection = "default";
+  } else if (rawSelection === "all") {
+    selection = "all";
+  } else {
+    throw new Error(
+      `Invalid MUX_AI_EVAL_MODEL_SET="${rawSelection}". Expected "default" or "all".`
+    );
+  }
+  let modelPairs;
+  if (rawModelPairs) {
+    modelPairs = rawModelPairs.split(",").map((value) => value.trim()).filter(Boolean);
+  }
+  return resolveEvalModelConfigs({
+    selection,
+    modelPairs
+  });
+}
+var EVAL_MODEL_CONFIGS = resolveEvalModelConfigsFromEnv();
 function resolveLanguageModelConfig(options = {}) {
   const provider = options.provider || "openai";
   const modelId = options.model || DEFAULT_LANGUAGE_MODELS[provider];
@@ -778,9 +859,9 @@ async function signPlaybackId(playbackId, context, type = "video", params) {
     params: stringParams
   });
 }
-async function signUrl(url, playbackId, context, type = "video", params, credentials) {
+async function signUrl(url, playbackId, type = "video", params, credentials) {
   "use step";
-  const resolvedContext = context ?? await resolveMuxSigningContext(credentials);
+  const resolvedContext = await resolveMuxSigningContext(credentials);
   if (!resolvedContext) {
     throw new Error(
       "Signed playback ID requires signing credentials. Provide muxSigningKey and muxPrivateKey via workflow credentials or set MUX_SIGNING_KEY and MUX_PRIVATE_KEY environment variables."
@@ -797,7 +878,7 @@ async function getStoryboardUrl(playbackId, width = DEFAULT_STORYBOARD_WIDTH, sh
   "use step";
   const baseUrl = `https://image.mux.com/${playbackId}/storyboard.png`;
   if (shouldSign) {
-    return signUrl(baseUrl, playbackId, void 0, "storyboard", { width }, credentials);
+    return signUrl(baseUrl, playbackId, "storyboard", { width }, credentials);
   }
   return `${baseUrl}?width=${width}`;
 }
@@ -914,7 +995,7 @@ async function buildTranscriptUrl(playbackId, trackId, shouldSign = false, crede
   "use step";
   const baseUrl = `https://stream.mux.com/${playbackId}/text/${trackId}.vtt`;
   if (shouldSign) {
-    return signUrl(baseUrl, playbackId, void 0, "video", void 0, credentials);
+    return signUrl(baseUrl, playbackId, "video", void 0, credentials);
   }
   return baseUrl;
 }
@@ -2007,7 +2088,7 @@ async function getThumbnailUrls(playbackId, duration, options = {}) {
   const baseUrl = `https://image.mux.com/${playbackId}/thumbnail.png`;
   const urlPromises = timestamps.map(async (time) => {
     if (shouldSign) {
-      return signUrl(baseUrl, playbackId, void 0, "thumbnail", { time, width }, credentials);
+      return signUrl(baseUrl, playbackId, "thumbnail", { time, width }, credentials);
     }
     return `${baseUrl}?time=${time}&width=${width}`;
   });
@@ -2023,11 +2104,10 @@ var DEFAULT_PROVIDER2 = "openai";
 var HIVE_ENDPOINT = "https://api.thehive.ai/api/v2/task/sync";
 var HIVE_SEXUAL_CATEGORIES = [
   "general_nsfw",
-  "general_suggestive",
   "yes_sexual_activity",
-  "sex_toys",
-  "nudity_female",
-  "nudity_male"
+  "yes_sex_toy",
+  "yes_female_nudity",
+  "yes_male_nudity"
 ];
 var HIVE_VIOLENCE_CATEGORIES = [
   "gun_in_hand",
@@ -2038,10 +2118,8 @@ var HIVE_VIOLENCE_CATEGORIES = [
   "hanging",
   "noose",
   "human_corpse",
-  "emaciated_body",
-  "self_harm",
-  "animal_abuse",
-  "fights",
+  "yes_emaciated_body",
+  "yes_self_harm",
   "garm_death_injury_or_military_conflict"
 ];
 async function processConcurrently(items, processor, maxConcurrent = 5) {
@@ -2185,6 +2263,12 @@ function getHiveCategoryScores(classes, categoryNames) {
   const scoreMap = Object.fromEntries(
     classes.map((c) => [c.class, c.score])
   );
+  const missingCategories = categoryNames.filter((category) => !(category in scoreMap));
+  if (missingCategories.length > 0) {
+    console.warn(
+      `Hive response missing expected categories: ${missingCategories.join(", ")}`
+    );
+  }
   const scores = categoryNames.map((category) => scoreMap[category] || 0);
   return Math.max(...scores, 0);
 }
@@ -2282,7 +2366,7 @@ async function getThumbnailUrlsFromTimestamps(playbackId, timestampsMs, options)
   const urlPromises = timestampsMs.map(async (tsMs) => {
     const time = Number((tsMs / 1e3).toFixed(2));
     if (shouldSign) {
-      return signUrl(baseUrl, playbackId, void 0, "thumbnail", { time, width }, credentials);
+      return signUrl(baseUrl, playbackId, "thumbnail", { time, width }, credentials);
     }
     return `${baseUrl}?time=${time}&width=${width}`;
   });
@@ -3307,6 +3391,18 @@ function getReadyAudioStaticRendition(asset) {
   );
 }
 var hasReadyAudioStaticRendition = (asset) => Boolean(getReadyAudioStaticRendition(asset));
+function getAudioStaticRenditionStatus(asset) {
+  const files = asset.static_renditions?.files;
+  const audioRendition = files?.find((rendition) => rendition.name === "audio.m4a");
+  if (typeof audioRendition?.status === "string" && audioRendition.status.length > 0) {
+    return audioRendition.status;
+  }
+  const aggregateStatus = asset.static_renditions?.status;
+  if (typeof aggregateStatus === "string" && aggregateStatus.length > 0) {
+    return aggregateStatus;
+  }
+  return asset.static_renditions ? "requested" : "not_requested";
+}
 async function requestStaticRenditionCreation(assetId, credentials) {
   "use step";
   const muxClient = await resolveMuxClient(credentials);
@@ -3352,7 +3448,7 @@ async function waitForAudioStaticRendition({
     if (hasReadyAudioStaticRendition(currentAsset)) {
       return currentAsset;
     }
-    const currentStatus = currentAsset.static_renditions?.status || "unknown";
+    const currentStatus = getAudioStaticRenditionStatus(currentAsset);
     console.warn(
       `\u231B Waiting for static rendition (attempt ${attempt}/${STATIC_RENDITION_MAX_ATTEMPTS}) \u2192 ${currentStatus}`
     );
@@ -3378,6 +3474,7 @@ async function createElevenLabsDubbingJob({
   audioBuffer,
   assetId,
   elevenLabsLangCode,
+  elevenLabsSourceLangCode,
   numSpeakers,
   credentials
 }) {
@@ -3387,8 +3484,14 @@ async function createElevenLabsDubbingJob({
   const formData = new FormData();
   formData.append("file", audioBlob);
   formData.append("target_lang", elevenLabsLangCode);
+  if (elevenLabsSourceLangCode) {
+    formData.append("source_lang", elevenLabsSourceLangCode);
+  }
   formData.append("num_speakers", numSpeakers.toString());
-  formData.append("name", `Mux Asset ${assetId} - auto to ${elevenLabsLangCode}`);
+  formData.append(
+    "name",
+    `Mux Asset ${assetId} - ${elevenLabsSourceLangCode ?? "auto"} to ${elevenLabsLangCode}`
+  );
   const dubbingResponse = await fetch("https://api.elevenlabs.io/v1/dubbing", {
     method: "POST",
     headers: {
@@ -3497,6 +3600,7 @@ async function translateAudio(assetId, toLanguageCode, options = {}) {
   "use workflow";
   const {
     provider = "elevenlabs",
+    fromLanguageCode,
     numSpeakers = 0,
     // 0 = auto-detect
     uploadToMux = true,
@@ -3535,7 +3639,7 @@ async function translateAudio(assetId, toLanguageCode, options = {}) {
   }
   let audioUrl = `https://stream.mux.com/${playbackId}/audio.m4a`;
   if (policy === "signed") {
-    audioUrl = await signUrl(audioUrl, playbackId, void 0, "video", void 0, credentials);
+    audioUrl = await signUrl(audioUrl, playbackId, "video", void 0, credentials);
   }
   console.warn("\u{1F399}\uFE0F Fetching audio from Mux...");
   let audioBuffer;
@@ -3546,13 +3650,18 @@ async function translateAudio(assetId, toLanguageCode, options = {}) {
   }
   console.warn("\u{1F399}\uFE0F Creating dubbing job in ElevenLabs...");
   const elevenLabsLangCode = toISO639_3(toLanguageCode);
-  console.warn(`\u{1F50D} Creating dubbing job for asset ${assetId} with language code: ${elevenLabsLangCode}`);
+  const normalizedFromLanguageCode = fromLanguageCode?.trim();
+  const elevenLabsSourceLangCode = normalizedFromLanguageCode ? toISO639_3(normalizedFromLanguageCode) : void 0;
+  console.warn(
+    `\u{1F50D} Creating dubbing job for asset ${assetId}: ${elevenLabsSourceLangCode ?? "auto"} -> ${elevenLabsLangCode}`
+  );
   let dubbingId;
   try {
     dubbingId = await createElevenLabsDubbingJob({
       audioBuffer,
       assetId,
       elevenLabsLangCode,
+      elevenLabsSourceLangCode,
       numSpeakers,
       credentials
     });
@@ -3910,6 +4019,8 @@ async function translateCaptions(assetId, fromLanguageCode, toLanguageCode, opti
   };
 }
 export {
+  HIVE_SEXUAL_CATEGORIES,
+  HIVE_VIOLENCE_CATEGORIES,
   SUMMARY_KEYWORD_LIMIT,
   askQuestions,
   burnedInCaptionsSchema,