npm - @storyteller-platform/ghost-story - Versions diffs - 0.1.9 → 0.1.11 - Mend

@storyteller-platform/ghost-story 0.1.9 → 0.1.11

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (13) hide show

package/dist/cli/bin.cjs +47 -47
package/dist/cli/bin.js +3 -3
package/dist/cli/config.d.cts +59 -9
package/dist/cli/config.d.ts +59 -9
package/dist/index.cjs +7 -0
package/dist/index.d.cts +1 -0
package/dist/index.d.ts +1 -0
package/dist/index.js +8 -0
package/dist/recognition/WhisperServerSTT.cjs +46 -4
package/dist/recognition/WhisperServerSTT.js +47 -4
package/dist/utilities/WhisperTimeline.cjs +22 -8
package/dist/utilities/WhisperTimeline.js +22 -8
package/package.json +2 -2

package/dist/cli/bin.cjs CHANGED Viewed

@@ -25,14 +25,14 @@ var __toESM = (mod, isNodeMode, target) => (target = mod != null ? __create(__ge
 var import_zli = require("@robingenz/zli");
 var import_cli_progress = require("cli-progress");
 var import_fs_extra = require("fs-extra");
-var import_zod = require("zod");
+var import_v4 = require("zod/v4");
 var import_constants = require("../constants.cjs");
 var import_config = require("./config.cjs");
 var import_install = require("./install.cjs");
 var import_whisper_server = require("./whisper-server.cjs");
-const recognitionEngineSchema = import_zod.z.enum(import_constants.RECOGNITION_ENGINES);
-const whisperModelSchema = import_zod.z.enum(import_constants.WHISPER_MODELS);
-const buildVariantSchema = import_zod.z.enum(import_constants.BUILD_VARIANTS);
+const recognitionEngineSchema = import_v4.z.enum(import_constants.RECOGNITION_ENGINES);
+const whisperModelSchema = import_v4.z.enum(import_constants.WHISPER_MODELS);
+const buildVariantSchema = import_v4.z.enum(import_constants.BUILD_VARIANTS);
 function isInstallTarget(value) {
   return ["binary", "model", "vad", "all"].includes(value);
 }
@@ -44,19 +44,19 @@ Usage:
   ghost-story install model <model>     - Install a whisper model
   ghost-story install vad               - Install Silero VAD model
   ghost-story install all               - Install binary, all models, and VAD`,
-  args: import_zod.z.union([
-    import_zod.z.tuple([
-      import_zod.z.enum(["binary", "model", "vad", "all"]).describe("What to install: binary, model, vad, or all")
+  args: import_v4.z.union([
+    import_v4.z.tuple([
+      import_v4.z.enum(["binary", "model", "vad", "all"]).describe("What to install: binary, model, vad, or all")
     ]),
-    import_zod.z.tuple([
-      import_zod.z.enum(["binary", "model", "vad", "all"]).describe("What to install: binary, model, vad, or all"),
-      import_zod.z.string().optional().describe("Variant (for binary) or model name (for model)")
+    import_v4.z.tuple([
+      import_v4.z.enum(["binary", "model", "vad", "all"]).describe("What to install: binary, model, vad, or all"),
+      import_v4.z.string().optional().describe("Variant (for binary) or model name (for model)")
     ])
   ]),
   options: (0, import_zli.defineOptions)(
-    import_zod.z.object({
-      force: import_zod.z.boolean().default(false).describe("Force installation even if platform doesn't match"),
-      list: import_zod.z.boolean().default(false).describe("List available variants or models")
+    import_v4.z.object({
+      force: import_v4.z.boolean().default(false).describe("Force installation even if platform doesn't match"),
+      list: import_v4.z.boolean().default(false).describe("List available variants or models")
     }),
     { f: "force", l: "list" }
   ),
@@ -156,8 +156,8 @@ const statusCommand = (0, import_zli.defineCommand)({
 });
 const transcribeCommand = (0, import_zli.defineCommand)({
   description: "Transcribe a single file with whisper.cpp",
-  args: import_zod.z.tuple([import_zod.z.string().describe("Input audio file path")], {
-    errorMap: (issue) => {
+  args: import_v4.z.tuple([import_v4.z.string().describe("Input audio file path")], {
+    error: (issue) => {
       if (issue.code === "too_small") {
         return {
           message: "Input audio file path is required"
@@ -169,23 +169,23 @@ const transcribeCommand = (0, import_zli.defineCommand)({
     }
   }),
   options: (0, import_zli.defineOptions)(
-    import_zod.z.object({
-      output: import_zod.z.string().optional().describe("Output file path for transcription (JSON)"),
-      language: import_zod.z.string().default("en-US").describe(
+    import_v4.z.object({
+      output: import_v4.z.string().optional().describe("Output file path for transcription (JSON)"),
+      language: import_v4.z.string().default("en-US").describe(
         "BCP 47 language tag representing the primary language of the audio (e.g. en-US)"
       ),
       engine: recognitionEngineSchema.default("whisper.cpp").describe("Speech-to-text engine"),
-      model: import_zod.z.string().default("tiny.en").describe("Transcription model"),
-      threads: import_zod.z.coerce.number().default(4).describe("Number of threads"),
-      processors: import_zod.z.coerce.number().default(1).describe("Number of processors"),
-      noProgress: import_zod.z.boolean().default(false).describe("Disable the progress bar"),
-      noAutoInstall: import_zod.z.boolean().default(false).describe("Don't auto-install missing binary/model"),
-      deepgramApiKey: import_zod.z.string().optional().describe("Deepgram API key"),
-      googleApiKey: import_zod.z.string().optional().describe("Google Cloud API key"),
-      amazonRegion: import_zod.z.string().optional().describe("AWS region code"),
-      amazonBucketName: import_zod.z.string().optional().describe("The AWS s3 bucket to upload the provided audio to"),
-      amazonAccessKeyId: import_zod.z.string().optional().describe("AWS access key ID"),
-      amazonSecretAccessKey: import_zod.z.string().optional().describe("AWS secret access key")
+      model: import_v4.z.string().default("tiny.en").describe("Transcription model"),
+      threads: import_v4.z.coerce.number().default(4).describe("Number of threads"),
+      processors: import_v4.z.coerce.number().default(1).describe("Number of processors"),
+      noProgress: import_v4.z.boolean().default(false).describe("Disable the progress bar"),
+      noAutoInstall: import_v4.z.boolean().default(false).describe("Don't auto-install missing binary/model"),
+      deepgramApiKey: import_v4.z.string().optional().describe("Deepgram API key"),
+      googleApiKey: import_v4.z.string().optional().describe("Google Cloud API key"),
+      amazonRegion: import_v4.z.string().optional().describe("AWS region code"),
+      amazonBucketName: import_v4.z.string().optional().describe("The AWS s3 bucket to upload the provided audio to"),
+      amazonAccessKeyId: import_v4.z.string().optional().describe("AWS access key ID"),
+      amazonSecretAccessKey: import_v4.z.string().optional().describe("AWS secret access key")
     }),
     { m: "model", p: "processors", t: "threads" }
   ),
@@ -248,18 +248,18 @@ Transcription written to ${outputPath}`);
 const serverCommand = (0, import_zli.defineCommand)({
   description: "Start a whisper.cpp transcription server",
   options: (0, import_zli.defineOptions)(
-    import_zod.z.object({
+    import_v4.z.object({
       model: whisperModelSchema.default("tiny.en").describe("Whisper model"),
-      port: import_zod.z.coerce.number().default(8080).describe("Port to listen on"),
-      host: import_zod.z.string().default("0.0.0.0").describe("Host to bind to"),
-      threads: import_zod.z.coerce.number().default(4).describe("Number of threads"),
-      processors: import_zod.z.coerce.number().default(1).describe("Number of processors"),
-      noConvert: import_zod.z.boolean().default(false).describe("Disable automatic audio conversion"),
-      noAutoInstall: import_zod.z.boolean().default(false).describe("Don't auto-install missing binary/model"),
+      port: import_v4.z.coerce.number().default(8080).describe("Port to listen on"),
+      host: import_v4.z.string().default("0.0.0.0").describe("Host to bind to"),
+      threads: import_v4.z.coerce.number().default(4).describe("Number of threads"),
+      processors: import_v4.z.coerce.number().default(1).describe("Number of processors"),
+      noConvert: import_v4.z.boolean().default(false).describe("Disable automatic audio conversion"),
+      noAutoInstall: import_v4.z.boolean().default(false).describe("Don't auto-install missing binary/model"),
       variant: buildVariantSchema.optional().describe("Use specific binary variant"),
-      force: import_zod.z.boolean().default(false).describe("Force running even if platform doesn't match"),
-      vadModel: import_zod.z.string().optional().describe("Path to VAD model for voice activity detection"),
-      vadThreshold: import_zod.z.coerce.number().optional().describe("VAD threshold probability (0.0-1.0)")
+      force: import_v4.z.boolean().default(false).describe("Force running even if platform doesn't match"),
+      vadModel: import_v4.z.string().optional().describe("Path to VAD model for voice activity detection"),
+      vadThreshold: import_v4.z.coerce.number().optional().describe("VAD threshold probability (0.0-1.0)")
     }),
     { m: "model", p: "port", t: "threads", f: "force" }
   ),
@@ -293,8 +293,8 @@ const serverCommand = (0, import_zli.defineCommand)({
 });
 const vadCommand = (0, import_zli.defineCommand)({
   description: "Run voice activity detection on an audio file",
-  args: import_zod.z.tuple([import_zod.z.string().describe("Input audio file path")], {
-    errorMap: (issue) => {
+  args: import_v4.z.tuple([import_v4.z.string().describe("Input audio file path")], {
+    error: (issue) => {
       if (issue.code === "too_small") {
         return {
           message: "Input audio file path is required"
@@ -306,12 +306,12 @@ const vadCommand = (0, import_zli.defineCommand)({
     }
   }),
   options: (0, import_zli.defineOptions)(
-    import_zod.z.object({
-      output: import_zod.z.string().optional().describe("Output file path for VAD segments (JSON)"),
-      threshold: import_zod.z.coerce.number().default(0.5).describe("Speech detection threshold (0.0-1.0)"),
-      minSpeechDuration: import_zod.z.coerce.number().default(250).describe("Minimum speech duration in ms"),
-      minSilenceDuration: import_zod.z.coerce.number().default(100).describe("Minimum silence duration in ms"),
-      speechPad: import_zod.z.coerce.number().default(30).describe("Speech padding in ms")
+    import_v4.z.object({
+      output: import_v4.z.string().optional().describe("Output file path for VAD segments (JSON)"),
+      threshold: import_v4.z.coerce.number().default(0.5).describe("Speech detection threshold (0.0-1.0)"),
+      minSpeechDuration: import_v4.z.coerce.number().default(250).describe("Minimum speech duration in ms"),
+      minSilenceDuration: import_v4.z.coerce.number().default(100).describe("Minimum silence duration in ms"),
+      speechPad: import_v4.z.coerce.number().default(30).describe("Speech padding in ms")
     }),
     { o: "output" }
   ),

package/dist/cli/bin.js CHANGED Viewed

@@ -7,7 +7,7 @@ import {
 } from "@robingenz/zli";
 import { Presets, SingleBar } from "cli-progress";
 import { ensureDirSync } from "fs-extra";
-import { z } from "zod";
+import { z } from "zod/v4";
 import {
   BUILD_VARIANTS,
   RECOGNITION_ENGINES,
@@ -157,7 +157,7 @@ const statusCommand = defineCommand({
 const transcribeCommand = defineCommand({
   description: "Transcribe a single file with whisper.cpp",
   args: z.tuple([z.string().describe("Input audio file path")], {
-    errorMap: (issue) => {
+    error: (issue) => {
       if (issue.code === "too_small") {
         return {
           message: "Input audio file path is required"
@@ -294,7 +294,7 @@ const serverCommand = defineCommand({
 const vadCommand = defineCommand({
   description: "Run voice activity detection on an audio file",
   args: z.tuple([z.string().describe("Input audio file path")], {
-    errorMap: (issue) => {
+    error: (issue) => {
       if (issue.code === "too_small") {
         return {
           message: "Input audio file path is required"

package/dist/cli/config.d.cts CHANGED Viewed

@@ -48,15 +48,65 @@ declare function resolveVariant(requestedVariant?: BuildVariant): BuildVariant;
 declare function isValidModel(model: string): model is WhisperModel;
 declare function isValidVariant(variant: string): variant is BuildVariant;
 declare const cliConfigSchema: z.ZodObject<{
-    lastUsedModel: z.ZodNullable<z.ZodEnum<["tiny", "tiny.en", "tiny-q5_1", "tiny.en-q5_1", "tiny-q8_0", "base", "base.en", "base-q5_1", "base.en-q5_1", "base-q8_0", "small", "small.en", "small-q5_1", "small.en-q5_1", "small-q8_0", "medium", "medium.en", "medium-q5_0", "medium.en-q5_0", "medium-q8_0", "large-v1", "large-v2", "large-v2-q5_0", "large-v2-q8_0", "large-v3", "large-v3-q5_0", "large-v3-turbo", "large-v3-turbo-q5_0", "large-v3-turbo-q8_0"]>>;
-    installedVariant: z.ZodNullable<z.ZodEnum<["darwin-arm64-coreml", "darwin-arm64-cpu", "darwin-x64-cpu", "linux-x64-blas", "linux-x64-cpu", "linux-x64-cuda-13.1.0", "linux-x64-cuda-12.9.0", "linux-x64-cuda-11.8.0", "linux-x64-sycl", "linux-x64-vulkan", "linux-x64-rocm", "linux-x64-cuda-13.1.0-legacy", "linux-x64-cuda-12.9.0-legacy", "linux-x64-cuda-11.8.0-legacy", "linux-x64-sycl-legacy", "linux-x64-vulkan-legacy", "linux-x64-rocm-legacy", "linux-x64-blas-legacy", "linux-x64-cpu-legacy", "linux-arm64-cpu", "windows-x64-cpu", "windows-x64-cuda-13.1.0", "windows-x64-cuda-12.9.0", "windows-x64-cuda-11.8.0", "windows-x64-vulkan"]>>;
-}, "strip", z.ZodTypeAny, {
-    lastUsedModel: "tiny" | "tiny.en" | "tiny-q5_1" | "tiny.en-q5_1" | "tiny-q8_0" | "base" | "base.en" | "base-q5_1" | "base.en-q5_1" | "base-q8_0" | "small" | "small.en" | "small-q5_1" | "small.en-q5_1" | "small-q8_0" | "medium" | "medium.en" | "medium-q5_0" | "medium.en-q5_0" | "medium-q8_0" | "large-v1" | "large-v2" | "large-v2-q5_0" | "large-v2-q8_0" | "large-v3" | "large-v3-q5_0" | "large-v3-turbo" | "large-v3-turbo-q5_0" | "large-v3-turbo-q8_0" | null;
-    installedVariant: "darwin-arm64-coreml" | "darwin-arm64-cpu" | "darwin-x64-cpu" | "linux-x64-blas" | "linux-x64-cpu" | "linux-x64-cuda-13.1.0" | "linux-x64-cuda-12.9.0" | "linux-x64-cuda-11.8.0" | "linux-x64-sycl" | "linux-x64-vulkan" | "linux-x64-rocm" | "linux-x64-cuda-13.1.0-legacy" | "linux-x64-cuda-12.9.0-legacy" | "linux-x64-cuda-11.8.0-legacy" | "linux-x64-sycl-legacy" | "linux-x64-vulkan-legacy" | "linux-x64-rocm-legacy" | "linux-x64-blas-legacy" | "linux-x64-cpu-legacy" | "linux-arm64-cpu" | "windows-x64-cpu" | "windows-x64-cuda-13.1.0" | "windows-x64-cuda-12.9.0" | "windows-x64-cuda-11.8.0" | "windows-x64-vulkan" | null;
-}, {
-    lastUsedModel: "tiny" | "tiny.en" | "tiny-q5_1" | "tiny.en-q5_1" | "tiny-q8_0" | "base" | "base.en" | "base-q5_1" | "base.en-q5_1" | "base-q8_0" | "small" | "small.en" | "small-q5_1" | "small.en-q5_1" | "small-q8_0" | "medium" | "medium.en" | "medium-q5_0" | "medium.en-q5_0" | "medium-q8_0" | "large-v1" | "large-v2" | "large-v2-q5_0" | "large-v2-q8_0" | "large-v3" | "large-v3-q5_0" | "large-v3-turbo" | "large-v3-turbo-q5_0" | "large-v3-turbo-q8_0" | null;
-    installedVariant: "darwin-arm64-coreml" | "darwin-arm64-cpu" | "darwin-x64-cpu" | "linux-x64-blas" | "linux-x64-cpu" | "linux-x64-cuda-13.1.0" | "linux-x64-cuda-12.9.0" | "linux-x64-cuda-11.8.0" | "linux-x64-sycl" | "linux-x64-vulkan" | "linux-x64-rocm" | "linux-x64-cuda-13.1.0-legacy" | "linux-x64-cuda-12.9.0-legacy" | "linux-x64-cuda-11.8.0-legacy" | "linux-x64-sycl-legacy" | "linux-x64-vulkan-legacy" | "linux-x64-rocm-legacy" | "linux-x64-blas-legacy" | "linux-x64-cpu-legacy" | "linux-arm64-cpu" | "windows-x64-cpu" | "windows-x64-cuda-13.1.0" | "windows-x64-cuda-12.9.0" | "windows-x64-cuda-11.8.0" | "windows-x64-vulkan" | null;
-}>;
+    lastUsedModel: z.ZodNullable<z.ZodEnum<{
+        tiny: "tiny";
+        "tiny.en": "tiny.en";
+        "tiny-q5_1": "tiny-q5_1";
+        "tiny.en-q5_1": "tiny.en-q5_1";
+        "tiny-q8_0": "tiny-q8_0";
+        base: "base";
+        "base.en": "base.en";
+        "base-q5_1": "base-q5_1";
+        "base.en-q5_1": "base.en-q5_1";
+        "base-q8_0": "base-q8_0";
+        small: "small";
+        "small.en": "small.en";
+        "small-q5_1": "small-q5_1";
+        "small.en-q5_1": "small.en-q5_1";
+        "small-q8_0": "small-q8_0";
+        medium: "medium";
+        "medium.en": "medium.en";
+        "medium-q5_0": "medium-q5_0";
+        "medium.en-q5_0": "medium.en-q5_0";
+        "medium-q8_0": "medium-q8_0";
+        "large-v1": "large-v1";
+        "large-v2": "large-v2";
+        "large-v2-q5_0": "large-v2-q5_0";
+        "large-v2-q8_0": "large-v2-q8_0";
+        "large-v3": "large-v3";
+        "large-v3-q5_0": "large-v3-q5_0";
+        "large-v3-turbo": "large-v3-turbo";
+        "large-v3-turbo-q5_0": "large-v3-turbo-q5_0";
+        "large-v3-turbo-q8_0": "large-v3-turbo-q8_0";
+    }>>;
+    installedVariant: z.ZodNullable<z.ZodEnum<{
+        "darwin-arm64-coreml": "darwin-arm64-coreml";
+        "darwin-arm64-cpu": "darwin-arm64-cpu";
+        "darwin-x64-cpu": "darwin-x64-cpu";
+        "linux-x64-blas": "linux-x64-blas";
+        "linux-x64-cpu": "linux-x64-cpu";
+        "linux-x64-cuda-13.1.0": "linux-x64-cuda-13.1.0";
+        "linux-x64-cuda-12.9.0": "linux-x64-cuda-12.9.0";
+        "linux-x64-cuda-11.8.0": "linux-x64-cuda-11.8.0";
+        "linux-x64-sycl": "linux-x64-sycl";
+        "linux-x64-vulkan": "linux-x64-vulkan";
+        "linux-x64-rocm": "linux-x64-rocm";
+        "linux-x64-cuda-13.1.0-legacy": "linux-x64-cuda-13.1.0-legacy";
+        "linux-x64-cuda-12.9.0-legacy": "linux-x64-cuda-12.9.0-legacy";
+        "linux-x64-cuda-11.8.0-legacy": "linux-x64-cuda-11.8.0-legacy";
+        "linux-x64-sycl-legacy": "linux-x64-sycl-legacy";
+        "linux-x64-vulkan-legacy": "linux-x64-vulkan-legacy";
+        "linux-x64-rocm-legacy": "linux-x64-rocm-legacy";
+        "linux-x64-blas-legacy": "linux-x64-blas-legacy";
+        "linux-x64-cpu-legacy": "linux-x64-cpu-legacy";
+        "linux-arm64-cpu": "linux-arm64-cpu";
+        "windows-x64-cpu": "windows-x64-cpu";
+        "windows-x64-cuda-13.1.0": "windows-x64-cuda-13.1.0";
+        "windows-x64-cuda-12.9.0": "windows-x64-cuda-12.9.0";
+        "windows-x64-cuda-11.8.0": "windows-x64-cuda-11.8.0";
+        "windows-x64-vulkan": "windows-x64-vulkan";
+    }>>;
+}, z.z.core.$strip>;
 /**
  * Only to be used by the CLI, not the API/programmatic use.
  * Mostly to remember the last used model and variant.

package/dist/cli/config.d.ts CHANGED Viewed

@@ -48,15 +48,65 @@ declare function resolveVariant(requestedVariant?: BuildVariant): BuildVariant;
 declare function isValidModel(model: string): model is WhisperModel;
 declare function isValidVariant(variant: string): variant is BuildVariant;
 declare const cliConfigSchema: z.ZodObject<{
-    lastUsedModel: z.ZodNullable<z.ZodEnum<["tiny", "tiny.en", "tiny-q5_1", "tiny.en-q5_1", "tiny-q8_0", "base", "base.en", "base-q5_1", "base.en-q5_1", "base-q8_0", "small", "small.en", "small-q5_1", "small.en-q5_1", "small-q8_0", "medium", "medium.en", "medium-q5_0", "medium.en-q5_0", "medium-q8_0", "large-v1", "large-v2", "large-v2-q5_0", "large-v2-q8_0", "large-v3", "large-v3-q5_0", "large-v3-turbo", "large-v3-turbo-q5_0", "large-v3-turbo-q8_0"]>>;
-    installedVariant: z.ZodNullable<z.ZodEnum<["darwin-arm64-coreml", "darwin-arm64-cpu", "darwin-x64-cpu", "linux-x64-blas", "linux-x64-cpu", "linux-x64-cuda-13.1.0", "linux-x64-cuda-12.9.0", "linux-x64-cuda-11.8.0", "linux-x64-sycl", "linux-x64-vulkan", "linux-x64-rocm", "linux-x64-cuda-13.1.0-legacy", "linux-x64-cuda-12.9.0-legacy", "linux-x64-cuda-11.8.0-legacy", "linux-x64-sycl-legacy", "linux-x64-vulkan-legacy", "linux-x64-rocm-legacy", "linux-x64-blas-legacy", "linux-x64-cpu-legacy", "linux-arm64-cpu", "windows-x64-cpu", "windows-x64-cuda-13.1.0", "windows-x64-cuda-12.9.0", "windows-x64-cuda-11.8.0", "windows-x64-vulkan"]>>;
-}, "strip", z.ZodTypeAny, {
-    lastUsedModel: "tiny" | "tiny.en" | "tiny-q5_1" | "tiny.en-q5_1" | "tiny-q8_0" | "base" | "base.en" | "base-q5_1" | "base.en-q5_1" | "base-q8_0" | "small" | "small.en" | "small-q5_1" | "small.en-q5_1" | "small-q8_0" | "medium" | "medium.en" | "medium-q5_0" | "medium.en-q5_0" | "medium-q8_0" | "large-v1" | "large-v2" | "large-v2-q5_0" | "large-v2-q8_0" | "large-v3" | "large-v3-q5_0" | "large-v3-turbo" | "large-v3-turbo-q5_0" | "large-v3-turbo-q8_0" | null;
-    installedVariant: "darwin-arm64-coreml" | "darwin-arm64-cpu" | "darwin-x64-cpu" | "linux-x64-blas" | "linux-x64-cpu" | "linux-x64-cuda-13.1.0" | "linux-x64-cuda-12.9.0" | "linux-x64-cuda-11.8.0" | "linux-x64-sycl" | "linux-x64-vulkan" | "linux-x64-rocm" | "linux-x64-cuda-13.1.0-legacy" | "linux-x64-cuda-12.9.0-legacy" | "linux-x64-cuda-11.8.0-legacy" | "linux-x64-sycl-legacy" | "linux-x64-vulkan-legacy" | "linux-x64-rocm-legacy" | "linux-x64-blas-legacy" | "linux-x64-cpu-legacy" | "linux-arm64-cpu" | "windows-x64-cpu" | "windows-x64-cuda-13.1.0" | "windows-x64-cuda-12.9.0" | "windows-x64-cuda-11.8.0" | "windows-x64-vulkan" | null;
-}, {
-    lastUsedModel: "tiny" | "tiny.en" | "tiny-q5_1" | "tiny.en-q5_1" | "tiny-q8_0" | "base" | "base.en" | "base-q5_1" | "base.en-q5_1" | "base-q8_0" | "small" | "small.en" | "small-q5_1" | "small.en-q5_1" | "small-q8_0" | "medium" | "medium.en" | "medium-q5_0" | "medium.en-q5_0" | "medium-q8_0" | "large-v1" | "large-v2" | "large-v2-q5_0" | "large-v2-q8_0" | "large-v3" | "large-v3-q5_0" | "large-v3-turbo" | "large-v3-turbo-q5_0" | "large-v3-turbo-q8_0" | null;
-    installedVariant: "darwin-arm64-coreml" | "darwin-arm64-cpu" | "darwin-x64-cpu" | "linux-x64-blas" | "linux-x64-cpu" | "linux-x64-cuda-13.1.0" | "linux-x64-cuda-12.9.0" | "linux-x64-cuda-11.8.0" | "linux-x64-sycl" | "linux-x64-vulkan" | "linux-x64-rocm" | "linux-x64-cuda-13.1.0-legacy" | "linux-x64-cuda-12.9.0-legacy" | "linux-x64-cuda-11.8.0-legacy" | "linux-x64-sycl-legacy" | "linux-x64-vulkan-legacy" | "linux-x64-rocm-legacy" | "linux-x64-blas-legacy" | "linux-x64-cpu-legacy" | "linux-arm64-cpu" | "windows-x64-cpu" | "windows-x64-cuda-13.1.0" | "windows-x64-cuda-12.9.0" | "windows-x64-cuda-11.8.0" | "windows-x64-vulkan" | null;
-}>;
+    lastUsedModel: z.ZodNullable<z.ZodEnum<{
+        tiny: "tiny";
+        "tiny.en": "tiny.en";
+        "tiny-q5_1": "tiny-q5_1";
+        "tiny.en-q5_1": "tiny.en-q5_1";
+        "tiny-q8_0": "tiny-q8_0";
+        base: "base";
+        "base.en": "base.en";
+        "base-q5_1": "base-q5_1";
+        "base.en-q5_1": "base.en-q5_1";
+        "base-q8_0": "base-q8_0";
+        small: "small";
+        "small.en": "small.en";
+        "small-q5_1": "small-q5_1";
+        "small.en-q5_1": "small.en-q5_1";
+        "small-q8_0": "small-q8_0";
+        medium: "medium";
+        "medium.en": "medium.en";
+        "medium-q5_0": "medium-q5_0";
+        "medium.en-q5_0": "medium.en-q5_0";
+        "medium-q8_0": "medium-q8_0";
+        "large-v1": "large-v1";
+        "large-v2": "large-v2";
+        "large-v2-q5_0": "large-v2-q5_0";
+        "large-v2-q8_0": "large-v2-q8_0";
+        "large-v3": "large-v3";
+        "large-v3-q5_0": "large-v3-q5_0";
+        "large-v3-turbo": "large-v3-turbo";
+        "large-v3-turbo-q5_0": "large-v3-turbo-q5_0";
+        "large-v3-turbo-q8_0": "large-v3-turbo-q8_0";
+    }>>;
+    installedVariant: z.ZodNullable<z.ZodEnum<{
+        "darwin-arm64-coreml": "darwin-arm64-coreml";
+        "darwin-arm64-cpu": "darwin-arm64-cpu";
+        "darwin-x64-cpu": "darwin-x64-cpu";
+        "linux-x64-blas": "linux-x64-blas";
+        "linux-x64-cpu": "linux-x64-cpu";
+        "linux-x64-cuda-13.1.0": "linux-x64-cuda-13.1.0";
+        "linux-x64-cuda-12.9.0": "linux-x64-cuda-12.9.0";
+        "linux-x64-cuda-11.8.0": "linux-x64-cuda-11.8.0";
+        "linux-x64-sycl": "linux-x64-sycl";
+        "linux-x64-vulkan": "linux-x64-vulkan";
+        "linux-x64-rocm": "linux-x64-rocm";
+        "linux-x64-cuda-13.1.0-legacy": "linux-x64-cuda-13.1.0-legacy";
+        "linux-x64-cuda-12.9.0-legacy": "linux-x64-cuda-12.9.0-legacy";
+        "linux-x64-cuda-11.8.0-legacy": "linux-x64-cuda-11.8.0-legacy";
+        "linux-x64-sycl-legacy": "linux-x64-sycl-legacy";
+        "linux-x64-vulkan-legacy": "linux-x64-vulkan-legacy";
+        "linux-x64-rocm-legacy": "linux-x64-rocm-legacy";
+        "linux-x64-blas-legacy": "linux-x64-blas-legacy";
+        "linux-x64-cpu-legacy": "linux-x64-cpu-legacy";
+        "linux-arm64-cpu": "linux-arm64-cpu";
+        "windows-x64-cpu": "windows-x64-cpu";
+        "windows-x64-cuda-13.1.0": "windows-x64-cuda-13.1.0";
+        "windows-x64-cuda-12.9.0": "windows-x64-cuda-12.9.0";
+        "windows-x64-cuda-11.8.0": "windows-x64-cuda-11.8.0";
+        "windows-x64-vulkan": "windows-x64-vulkan";
+    }>>;
+}, z.z.core.$strip>;
 /**
  * Only to be used by the CLI, not the API/programmatic use.
  * Mostly to remember the last used model and variant.

package/dist/index.cjs CHANGED Viewed

@@ -72,6 +72,9 @@ __export(index_exports, {
   serviceCapabilities: () => import_audio.serviceCapabilities,
   setConversionMode: () => import_config2.setConversionMode,
   setTimingEnabled: () => import_config2.setTimingEnabled,
+  spacelessScriptPattern: () => import_SpacelessScripts.spacelessScriptPattern,
+  spacelessScripts: () => import_SpacelessScripts.spacelessScripts,
+  startsWithSpacelessScript: () => import_SpacelessScripts.startsWithSpacelessScript,
   toBuffer: () => import_audio.toBuffer,
   toFilePath: () => import_audio.toFilePath,
   toReadStream: () => import_audio.toReadStream,
@@ -87,6 +90,7 @@ var import_config2 = require("./config.cjs");
 var import_OpenAICloudSTT = require("./recognition/OpenAICloudSTT.cjs");
 var import_WhisperCppSTT = require("./recognition/WhisperCppSTT.cjs");
 var import_WhisperServerSTT = require("./recognition/WhisperServerSTT.cjs");
+var import_SpacelessScripts = require("./utilities/SpacelessScripts.cjs");
 var import_Timing = require("./utilities/Timing.cjs");
 var import_Silero = require("./vad/Silero.cjs");
 // Annotate the CommonJS export names for ESM import in node:
@@ -145,6 +149,9 @@ var import_Silero = require("./vad/Silero.cjs");
   serviceCapabilities,
   setConversionMode,
   setTimingEnabled,
+  spacelessScriptPattern,
+  spacelessScripts,
+  startsWithSpacelessScript,
   toBuffer,
   toFilePath,
   toReadStream,

package/dist/index.d.cts CHANGED Viewed

@@ -9,6 +9,7 @@ export { OpenAICloudSTTOptions, RecognitionResult as OpenAIResult, inputPreferen
 export { WhisperCppModelId, WhisperCppOptions, RecognitionResult as WhisperCppResult, recognize as recognizeWhisperCpp, inputPreference as whisperCppInputPreference } from './recognition/WhisperCppSTT.cjs';
 export { WhisperServerOptions, RecognitionResult as WhisperServerResult, recognize as recognizeWhisperServer, inputPreference as whisperServerInputPreference } from './recognition/WhisperServerSTT.cjs';
 export { Timeline, TimelineEntry, TimelineEntryType } from './utilities/Timeline.cjs';
+export { spacelessScriptPattern, spacelessScripts, startsWithSpacelessScript } from './utilities/SpacelessScripts.cjs';
 export { AggregatedStats, PhaseTiming, Timing, TimingAggregator, TimingSpan, TimingSummary, createAggregator, createTiming, formatDuration, formatPercentage, formatSingleReport, printSingleReport } from './utilities/Timing.cjs';
 export { SileroOptions, VadSegment, detectVoiceActivity, ensureVadInstalled, segmentsToTimeline } from './vad/Silero.cjs';
 import 'node:fs';

package/dist/index.d.ts CHANGED Viewed

@@ -9,6 +9,7 @@ export { OpenAICloudSTTOptions, RecognitionResult as OpenAIResult, inputPreferen
 export { WhisperCppModelId, WhisperCppOptions, RecognitionResult as WhisperCppResult, recognize as recognizeWhisperCpp, inputPreference as whisperCppInputPreference } from './recognition/WhisperCppSTT.js';
 export { WhisperServerOptions, RecognitionResult as WhisperServerResult, recognize as recognizeWhisperServer, inputPreference as whisperServerInputPreference } from './recognition/WhisperServerSTT.js';
 export { Timeline, TimelineEntry, TimelineEntryType } from './utilities/Timeline.js';
+export { spacelessScriptPattern, spacelessScripts, startsWithSpacelessScript } from './utilities/SpacelessScripts.js';
 export { AggregatedStats, PhaseTiming, Timing, TimingAggregator, TimingSpan, TimingSummary, createAggregator, createTiming, formatDuration, formatPercentage, formatSingleReport, printSingleReport } from './utilities/Timing.js';
 export { SileroOptions, VadSegment, detectVoiceActivity, ensureVadInstalled, segmentsToTimeline } from './vad/Silero.js';
 import 'node:fs';

package/dist/index.js CHANGED Viewed

@@ -62,6 +62,11 @@ import {
   inputPreference as inputPreference3,
   recognize as recognize4
 } from "./recognition/WhisperServerSTT.js";
+import {
+  spacelessScriptPattern,
+  spacelessScripts,
+  startsWithSpacelessScript
+} from "./utilities/SpacelessScripts.js";
 import {
   Timing,
   TimingAggregator,
@@ -132,6 +137,9 @@ export {
   serviceCapabilities,
   setConversionMode,
   setTimingEnabled,
+  spacelessScriptPattern,
+  spacelessScripts,
+  startsWithSpacelessScript,
   toBuffer,
   toFilePath,
   toReadStream,

package/dist/recognition/WhisperServerSTT.cjs CHANGED Viewed

@@ -59,11 +59,49 @@ async function recognize(input, languageCode, timing, options) {
     if (languageCode) {
       form.append("language", languageCode);
     }
-    const url = `${opts.baseURL}${opts.inferencePath}`;
+    const baseUrl = opts.baseURL.replace(/\/+$/g, "");
+    const url = `${baseUrl}${opts.inferencePath}`;
     const headers = {};
     if (opts.apiKey) {
       headers["Authorization"] = `Bearer ${opts.apiKey}`;
     }
+    const configResponse = await fetch(`${baseUrl}/config`, {
+      headers,
+      dispatcher: (0, import_fetch.createTimeoutAgent)(opts.timeout)
+    });
+    let whisperConfig = null;
+    if (configResponse.ok) {
+      try {
+        const [config, audioLength] = await Promise.all([
+          configResponse.json(),
+          (0, import_audio.getAudioDuration)(filePath)
+        ]);
+        whisperConfig = {
+          ...config,
+          audioDuration: audioLength
+        };
+        const effectiveProcessors = (0, import_WhisperTimeline.calculateEffectiveProcessors)(
+          audioLength,
+          whisperConfig.maxProcessors
+        );
+        if (effectiveProcessors !== whisperConfig.processors) {
+          const configForm = new FormData();
+          configForm.append("processors", String(effectiveProcessors));
+          configForm.append("threads", String(whisperConfig.threads));
+          await fetch(`${baseUrl}/config`, {
+            method: "POST",
+            headers,
+            body: configForm
+          });
+          whisperConfig.processors = effectiveProcessors;
+        }
+      } catch (e) {
+        console.warn(
+          `Failed to get config from Whisper server, continuing with default config. If you aren't using ghost-story server, this is expected`,
+          e
+        );
+      }
+    }
     const response = await timing.timeAsync(
       "upload",
       async () => fetch(url, {
@@ -81,7 +119,8 @@ async function recognize(input, languageCode, timing, options) {
     const data = await response.json();
     const { timeline, transcript } = await extractTimelineAndTranscript(
       data,
-      filePath
+      filePath,
+      whisperConfig
     );
     if (!timeline) {
       throw new Error(
@@ -93,7 +132,7 @@ async function recognize(input, languageCode, timing, options) {
     await prepared.cleanup();
   }
 }
-async function extractTimelineAndTranscript(response, audioPath) {
+async function extractTimelineAndTranscript(response, audioPath, whisperConfig) {
   var _a, _b, _c, _d;
   if (response.segments.length === 0) {
     return { timeline: [], transcript: ((_a = response.text) == null ? void 0 : _a.trim()) ?? "" };
@@ -101,7 +140,10 @@ async function extractTimelineAndTranscript(response, audioPath) {
   const hasNestedWords = (((_c = (_b = response.segments[0]) == null ? void 0 : _b.words) == null ? void 0 : _c.length) ?? 0) > 0;
   if (hasNestedWords) {
     const rawSegments = (0, import_WhisperTimeline.parseWhisperServerOutput)(response.segments);
-    const splitBoundaries = await detectSplitBoundaries(rawSegments, audioPath);
+    const splitBoundaries = (whisperConfig == null ? void 0 : whisperConfig.audioDuration) ? (0, import_WhisperTimeline.calculateWhisperSplits)(
+      whisperConfig.audioDuration,
+      whisperConfig.processors
+    ) : await detectSplitBoundaries(rawSegments, audioPath);
     const timeline2 = (0, import_WhisperTimeline.extractCorrectedTimeline)(rawSegments, { splitBoundaries });
     const transcript = timeline2.map((entry) => entry.text).join(" ");
     return { timeline: timeline2, transcript };

package/dist/recognition/WhisperServerSTT.js CHANGED Viewed

@@ -9,6 +9,7 @@ import {
 } from "../audio/index.js";
 import { createTimeoutAgent } from "../fetch.js";
 import {
+  calculateEffectiveProcessors,
   calculateWhisperSplits,
   countProcessorBoundaries,
   extractCorrectedTimeline,
@@ -46,11 +47,49 @@ async function recognize(input, languageCode, timing, options) {
     if (languageCode) {
       form.append("language", languageCode);
     }
-    const url = `${opts.baseURL}${opts.inferencePath}`;
+    const baseUrl = opts.baseURL.replace(/\/+$/g, "");
+    const url = `${baseUrl}${opts.inferencePath}`;
     const headers = {};
     if (opts.apiKey) {
       headers["Authorization"] = `Bearer ${opts.apiKey}`;
     }
+    const configResponse = await fetch(`${baseUrl}/config`, {
+      headers,
+      dispatcher: createTimeoutAgent(opts.timeout)
+    });
+    let whisperConfig = null;
+    if (configResponse.ok) {
+      try {
+        const [config, audioLength] = await Promise.all([
+          configResponse.json(),
+          getAudioDuration(filePath)
+        ]);
+        whisperConfig = {
+          ...config,
+          audioDuration: audioLength
+        };
+        const effectiveProcessors = calculateEffectiveProcessors(
+          audioLength,
+          whisperConfig.maxProcessors
+        );
+        if (effectiveProcessors !== whisperConfig.processors) {
+          const configForm = new FormData();
+          configForm.append("processors", String(effectiveProcessors));
+          configForm.append("threads", String(whisperConfig.threads));
+          await fetch(`${baseUrl}/config`, {
+            method: "POST",
+            headers,
+            body: configForm
+          });
+          whisperConfig.processors = effectiveProcessors;
+        }
+      } catch (e) {
+        console.warn(
+          `Failed to get config from Whisper server, continuing with default config. If you aren't using ghost-story server, this is expected`,
+          e
+        );
+      }
+    }
     const response = await timing.timeAsync(
       "upload",
       async () => fetch(url, {
@@ -68,7 +107,8 @@ async function recognize(input, languageCode, timing, options) {
     const data = await response.json();
     const { timeline, transcript } = await extractTimelineAndTranscript(
       data,
-      filePath
+      filePath,
+      whisperConfig
     );
     if (!timeline) {
       throw new Error(
@@ -80,7 +120,7 @@ async function recognize(input, languageCode, timing, options) {
     await prepared.cleanup();
   }
 }
-async function extractTimelineAndTranscript(response, audioPath) {
+async function extractTimelineAndTranscript(response, audioPath, whisperConfig) {
   var _a, _b, _c, _d;
   if (response.segments.length === 0) {
     return { timeline: [], transcript: ((_a = response.text) == null ? void 0 : _a.trim()) ?? "" };
@@ -88,7 +128,10 @@ async function extractTimelineAndTranscript(response, audioPath) {
   const hasNestedWords = (((_c = (_b = response.segments[0]) == null ? void 0 : _b.words) == null ? void 0 : _c.length) ?? 0) > 0;
   if (hasNestedWords) {
     const rawSegments = parseWhisperServerOutput(response.segments);
-    const splitBoundaries = await detectSplitBoundaries(rawSegments, audioPath);
+    const splitBoundaries = (whisperConfig == null ? void 0 : whisperConfig.audioDuration) ? calculateWhisperSplits(
+      whisperConfig.audioDuration,
+      whisperConfig.processors
+    ) : await detectSplitBoundaries(rawSegments, audioPath);
     const timeline2 = extractCorrectedTimeline(rawSegments, { splitBoundaries });
     const transcript = timeline2.map((entry) => entry.text).join(" ");
     return { timeline: timeline2, transcript };

package/dist/utilities/WhisperTimeline.cjs CHANGED Viewed

@@ -302,14 +302,28 @@ function extractCorrectedTimeline(segments, options = {}) {
     if (!segment) continue;
     const segmentStart = segment.segmentStart;
     const segmentEnd = segment.segmentEnd < segment.segmentStart ? segment.segmentStart : segment.segmentEnd;
-    const boundary = detectProcessorBoundary(segment, state);
-    if (boundary.isBoundary) {
-      state.cumulativeOffset = getBetterCumulativeOffset(
-        state,
-        segment,
-        splitBoundaries,
-        usedSplits
-      );
+    if (splitBoundaries.length > 0) {
+      const boundary = splitBoundaries.find((boundary2) => {
+        return Math.abs(boundary2 - segmentStart) < 2;
+      });
+      if (boundary) {
+        state.cumulativeOffset = getBetterCumulativeOffset(
+          state,
+          segment,
+          splitBoundaries,
+          usedSplits
+        );
+      }
+    } else {
+      const boundary = detectProcessorBoundary(segment, state);
+      if (boundary.isBoundary) {
+        state.cumulativeOffset = getBetterCumulativeOffset(
+          state,
+          segment,
+          splitBoundaries,
+          usedSplits
+        );
+      }
     }
     const nextSegment = segments[i + 1] ?? null;
     if (nextSegment && isTimeTravelingSegment(nextSegment)) {

package/dist/utilities/WhisperTimeline.js CHANGED Viewed

@@ -272,14 +272,28 @@ function extractCorrectedTimeline(segments, options = {}) {
     if (!segment) continue;
     const segmentStart = segment.segmentStart;
     const segmentEnd = segment.segmentEnd < segment.segmentStart ? segment.segmentStart : segment.segmentEnd;
-    const boundary = detectProcessorBoundary(segment, state);
-    if (boundary.isBoundary) {
-      state.cumulativeOffset = getBetterCumulativeOffset(
-        state,
-        segment,
-        splitBoundaries,
-        usedSplits
-      );
+    if (splitBoundaries.length > 0) {
+      const boundary = splitBoundaries.find((boundary2) => {
+        return Math.abs(boundary2 - segmentStart) < 2;
+      });
+      if (boundary) {
+        state.cumulativeOffset = getBetterCumulativeOffset(
+          state,
+          segment,
+          splitBoundaries,
+          usedSplits
+        );
+      }
+    } else {
+      const boundary = detectProcessorBoundary(segment, state);
+      if (boundary.isBoundary) {
+        state.cumulativeOffset = getBetterCumulativeOffset(
+          state,
+          segment,
+          splitBoundaries,
+          usedSplits
+        );
+      }
     }
     const nextSegment = segments[i + 1] ?? null;
     if (nextSegment && isTimeTravelingSegment(nextSegment)) {

package/package.json CHANGED Viewed

@@ -1,6 +1,6 @@
 {
   "name": "@storyteller-platform/ghost-story",
-  "version": "0.1.9",
+  "version": "0.1.11",
   "description": "An easy-to-use speech toolset. Fork of the original echogarden project.",
   "author": "Thomas F. K. Jorna",
   "license": "GPL-3.0",
@@ -81,7 +81,7 @@
     "openai": "~4.103.0",
     "tar": "^7.4.3",
     "undici": "7.14.0",
-    "zod": "^3.25.0"
+    "zod": "^4.3.6"
   },
   "devDependencies": {
     "@storyteller-platform/eslint": "0.1.0",