npm - @reverbia/sdk - Versions diffs - 1.0.0-next.20251202090922 → 1.0.0-next.20251202092727 - Mend

@reverbia/sdk 1.0.0-next.20251202090922 → 1.0.0-next.20251202092727

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (5) hide show

package/dist/react/index.cjs CHANGED Viewed

@@ -47500,6 +47500,54 @@ var createClientConfig = (config) => ({
 // src/client/client.gen.ts
 var client = createClient(createClientConfig(createConfig()));
+// src/lib/chat/constants.ts
+var DEFAULT_LOCAL_CHAT_MODEL = "onnx-community/Qwen2.5-0.5B-Instruct";
+// src/lib/chat/generation.ts
+var chatPipeline = null;
+var currentModel = null;
+async function generateLocalChatCompletion(messages, options = {}) {
+  const {
+    model = DEFAULT_LOCAL_CHAT_MODEL,
+    temperature = 0.7,
+    max_tokens = 1024,
+    top_p = 0.9,
+    onToken,
+    signal
+  } = options;
+  const { pipeline, TextStreamer } = await Promise.resolve().then(() => (init_transformers_node(), transformers_node_exports));
+  if (!chatPipeline || currentModel !== model) {
+    chatPipeline = await pipeline("text-generation", model, {
+      dtype: "fp16"
+    });
+    currentModel = model;
+  }
+  class CallbackStreamer extends TextStreamer {
+    constructor(tokenizer, cb) {
+      super(tokenizer, {
+        skip_prompt: true,
+        skip_special_tokens: true
+      });
+      this.cb = cb;
+    }
+    on_finalized_text(text) {
+      if (signal?.aborted) {
+        throw new Error("AbortError");
+      }
+      this.cb(text);
+    }
+  }
+  const streamer = onToken ? new CallbackStreamer(chatPipeline.tokenizer, onToken) : void 0;
+  const output = await chatPipeline(messages, {
+    max_new_tokens: max_tokens,
+    temperature,
+    top_p,
+    streamer,
+    return_full_text: false
+  });
+  return output;
+}
 // src/react/useChat.ts
 function useChat(options) {
   const {
@@ -47507,7 +47555,9 @@ function useChat(options) {
     baseUrl = BASE_URL,
     onData: globalOnData,
     onFinish,
-    onError
+    onError,
+    chatProvider = "api",
+    localModel = DEFAULT_LOCAL_CHAT_MODEL
   } = options || {};
   const [isLoading, setIsLoading] = (0, import_react.useState)(false);
   const abortControllerRef = (0, import_react.useRef)(null);
@@ -47536,16 +47586,6 @@ function useChat(options) {
         if (onError) onError(new Error(errorMsg));
         return { data: null, error: errorMsg };
       }
-      if (!model) {
-        const errorMsg = "model is required to call sendMessage.";
-        if (onError) onError(new Error(errorMsg));
-        return { data: null, error: errorMsg };
-      }
-      if (!getToken) {
-        const errorMsg = "Token getter function is required.";
-        if (onError) onError(new Error(errorMsg));
-        return { data: null, error: errorMsg };
-      }
       if (abortControllerRef.current) {
         abortControllerRef.current.abort();
       }
@@ -47553,88 +47593,141 @@ function useChat(options) {
       abortControllerRef.current = abortController;
       setIsLoading(true);
       try {
-        const token = await getToken();
-        if (!token) {
-          const errorMsg = "No access token available.";
-          setIsLoading(false);
-          if (onError) onError(new Error(errorMsg));
-          return { data: null, error: errorMsg };
-        }
-        const sseResult = await client.sse.post({
-          baseUrl,
-          url: "/api/v1/chat/completions",
-          body: {
-            messages,
-            model,
-            stream: true
-          },
-          headers: {
-            "Content-Type": "application/json",
-            Authorization: `Bearer ${token}`
-          },
-          signal: abortController.signal
-        });
-        let accumulatedContent = "";
-        let completionId = "";
-        let completionModel = "";
-        let accumulatedUsage = {};
-        let finishReason;
-        for await (const chunk of sseResult.stream) {
-          if (typeof chunk === "string" && (chunk.trim() === "[DONE]" || chunk.includes("[DONE]"))) {
-            continue;
-          }
-          if (chunk && typeof chunk === "object") {
-            const chunkData = chunk;
-            if (chunkData.id && !completionId) {
-              completionId = chunkData.id;
+        if (chatProvider === "local") {
+          let accumulatedContent = "";
+          const usedModel = localModel;
+          const formattedMessages = messages.map((m) => ({
+            role: m.role || "user",
+            content: m.content || ""
+          }));
+          await generateLocalChatCompletion(formattedMessages, {
+            model: usedModel,
+            signal: abortController.signal,
+            onToken: (token) => {
+              accumulatedContent += token;
+              if (onData) onData(token);
+              if (globalOnData) globalOnData(token);
             }
-            if (chunkData.model && !completionModel) {
-              completionModel = chunkData.model;
-            }
-            if (chunkData.usage) {
-              accumulatedUsage = {
-                ...accumulatedUsage,
-                ...chunkData.usage
-              };
+          });
+          const completion = {
+            id: `local-${Date.now()}`,
+            model: usedModel,
+            choices: [
+              {
+                index: 0,
+                message: {
+                  role: "assistant",
+                  content: accumulatedContent
+                },
+                finish_reason: "stop"
+              }
+            ],
+            usage: {
+              prompt_tokens: 0,
+              // Not easily available from simple pipeline usage
+              completion_tokens: 0,
+              total_tokens: 0
             }
-            if (chunkData.choices && Array.isArray(chunkData.choices) && chunkData.choices.length > 0) {
-              const choice = chunkData.choices[0];
-              if (choice.delta?.content) {
-                const content = choice.delta.content;
-                accumulatedContent += content;
-                if (onData) {
-                  onData(content);
+          };
+          setIsLoading(false);
+          if (onFinish) {
+            onFinish(completion);
+          }
+          return { data: completion, error: null };
+        } else {
+          if (!model) {
+            const errorMsg = "model is required to call sendMessage.";
+            if (onError) onError(new Error(errorMsg));
+            return { data: null, error: errorMsg };
+          }
+          if (!getToken) {
+            const errorMsg = "Token getter function is required.";
+            if (onError) onError(new Error(errorMsg));
+            return { data: null, error: errorMsg };
+          }
+          const token = await getToken();
+          if (!token) {
+            const errorMsg = "No access token available.";
+            setIsLoading(false);
+            if (onError) onError(new Error(errorMsg));
+            return { data: null, error: errorMsg };
+          }
+          const sseResult = await client.sse.post({
+            baseUrl,
+            url: "/api/v1/chat/completions",
+            body: {
+              messages,
+              model,
+              stream: true
+            },
+            headers: {
+              "Content-Type": "application/json",
+              Authorization: `Bearer ${token}`
+            },
+            signal: abortController.signal
+          });
+          let accumulatedContent = "";
+          let completionId = "";
+          let completionModel = "";
+          let accumulatedUsage = {};
+          let finishReason;
+          for await (const chunk of sseResult.stream) {
+            if (typeof chunk === "string" && (chunk.trim() === "[DONE]" || chunk.includes("[DONE]"))) {
+              continue;
+            }
+            if (chunk && typeof chunk === "object") {
+              const chunkData = chunk;
+              if (chunkData.id && !completionId) {
+                completionId = chunkData.id;
+              }
+              if (chunkData.model && !completionModel) {
+                completionModel = chunkData.model;
+              }
+              if (chunkData.usage) {
+                accumulatedUsage = {
+                  ...accumulatedUsage,
+                  ...chunkData.usage
+                };
+              }
+              if (chunkData.choices && Array.isArray(chunkData.choices) && chunkData.choices.length > 0) {
+                const choice = chunkData.choices[0];
+                if (choice.delta?.content) {
+                  const content = choice.delta.content;
+                  accumulatedContent += content;
+                  if (onData) {
+                    onData(content);
+                  }
+                  if (globalOnData) {
+                    globalOnData(content);
+                  }
                 }
-                if (globalOnData) {
-                  globalOnData(content);
+                if (choice.finish_reason) {
+                  finishReason = choice.finish_reason;
                 }
               }
-              if (choice.finish_reason) {
-                finishReason = choice.finish_reason;
-              }
             }
           }
+          const completion = {
+            id: completionId,
+            model: completionModel,
+            choices: [
+              {
+                index: 0,
+                message: {
+                  role: "assistant",
+                  content: accumulatedContent
+                },
+                finish_reason: finishReason
+              }
+            ],
+            usage: Object.keys(accumulatedUsage).length > 0 ? accumulatedUsage : void 0
+          };
+          setIsLoading(false);
+          if (onFinish) {
+            onFinish(completion);
+          }
+          return { data: completion, error: null };
         }
-        const completion = {
-          id: completionId,
-          model: completionModel,
-          choices: [
-            {
-              index: 0,
-              message: {
-                role: "assistant",
-                content: accumulatedContent
-              },
-              finish_reason: finishReason
-            }
-          ],
-          usage: Object.keys(accumulatedUsage).length > 0 ? accumulatedUsage : void 0
-        };
-        setIsLoading(false);
-        if (onFinish) {
-          onFinish(completion);
-        }
-        return { data: completion, error: null };
       } catch (err) {
         if (err instanceof Error && err.name === "AbortError") {
           setIsLoading(false);
@@ -47653,7 +47746,15 @@ function useChat(options) {
         }
       }
     },
-    [getToken, baseUrl, globalOnData, onFinish, onError]
+    [
+      getToken,
+      baseUrl,
+      globalOnData,
+      onFinish,
+      onError,
+      chatProvider,
+      localModel
+    ]
   );
   return {
     isLoading,

package/dist/react/index.d.mts CHANGED Viewed

@@ -177,7 +177,7 @@ type LlmapiRole = string;
 type SendMessageArgs = {
     messages: LlmapiMessage[];
-    model: string;
+    model?: string;
     /**
      * Per-request callback for data chunks. Called in addition to the global
      * `onData` callback if provided in `useChat` options.
@@ -215,6 +215,17 @@ type UseChatOptions = {
      * @param error - The error that occurred (never an AbortError)
      */
     onError?: (error: Error) => void;
+    /**
+     * The provider to use for chat completions (default: "api")
+     * "local": Uses a local HuggingFace model (in-browser)
+     * "api": Uses the backend API
+     */
+    chatProvider?: "api" | "local";
+    /**
+     * The model to use for local chat completions
+     * Default is "ibm-granite/Granite-4.0-Nano-WebGPU"
+     */
+    localModel?: string;
 };
 type UseChatResult = {
     isLoading: boolean;
@@ -244,6 +255,8 @@ type UseChatResult = {
  * @param options.onFinish - Callback function to be called when the chat completion finishes successfully.
  * @param options.onError - Callback function to be called when an unexpected error
  *   is encountered. Note: This is NOT called for aborted requests (see `stop()`).
+ * @param options.chatProvider - The provider to use for chat completions (default: "api").
+ * @param options.localModel - The model to use for local chat completions.
  *
  * @returns An object containing:
  *   - `isLoading`: A boolean indicating whether a request is currently in progress

package/dist/react/index.d.ts CHANGED Viewed

@@ -177,7 +177,7 @@ type LlmapiRole = string;
 type SendMessageArgs = {
     messages: LlmapiMessage[];
-    model: string;
+    model?: string;
     /**
      * Per-request callback for data chunks. Called in addition to the global
      * `onData` callback if provided in `useChat` options.
@@ -215,6 +215,17 @@ type UseChatOptions = {
      * @param error - The error that occurred (never an AbortError)
      */
     onError?: (error: Error) => void;
+    /**
+     * The provider to use for chat completions (default: "api")
+     * "local": Uses a local HuggingFace model (in-browser)
+     * "api": Uses the backend API
+     */
+    chatProvider?: "api" | "local";
+    /**
+     * The model to use for local chat completions
+     * Default is "ibm-granite/Granite-4.0-Nano-WebGPU"
+     */
+    localModel?: string;
 };
 type UseChatResult = {
     isLoading: boolean;
@@ -244,6 +255,8 @@ type UseChatResult = {
  * @param options.onFinish - Callback function to be called when the chat completion finishes successfully.
  * @param options.onError - Callback function to be called when an unexpected error
  *   is encountered. Note: This is NOT called for aborted requests (see `stop()`).
+ * @param options.chatProvider - The provider to use for chat completions (default: "api").
+ * @param options.localModel - The model to use for local chat completions.
  *
  * @returns An object containing:
  *   - `isLoading`: A boolean indicating whether a request is currently in progress

package/dist/react/index.mjs CHANGED Viewed

@@ -818,6 +818,54 @@ var createClientConfig = (config) => ({
 // src/client/client.gen.ts
 var client = createClient(createClientConfig(createConfig()));
+// src/lib/chat/constants.ts
+var DEFAULT_LOCAL_CHAT_MODEL = "onnx-community/Qwen2.5-0.5B-Instruct";
+// src/lib/chat/generation.ts
+var chatPipeline = null;
+var currentModel = null;
+async function generateLocalChatCompletion(messages, options = {}) {
+  const {
+    model = DEFAULT_LOCAL_CHAT_MODEL,
+    temperature = 0.7,
+    max_tokens = 1024,
+    top_p = 0.9,
+    onToken,
+    signal
+  } = options;
+  const { pipeline, TextStreamer } = await import("./transformers.node-BSHUG7OY.mjs");
+  if (!chatPipeline || currentModel !== model) {
+    chatPipeline = await pipeline("text-generation", model, {
+      dtype: "fp16"
+    });
+    currentModel = model;
+  }
+  class CallbackStreamer extends TextStreamer {
+    constructor(tokenizer, cb) {
+      super(tokenizer, {
+        skip_prompt: true,
+        skip_special_tokens: true
+      });
+      this.cb = cb;
+    }
+    on_finalized_text(text) {
+      if (signal?.aborted) {
+        throw new Error("AbortError");
+      }
+      this.cb(text);
+    }
+  }
+  const streamer = onToken ? new CallbackStreamer(chatPipeline.tokenizer, onToken) : void 0;
+  const output = await chatPipeline(messages, {
+    max_new_tokens: max_tokens,
+    temperature,
+    top_p,
+    streamer,
+    return_full_text: false
+  });
+  return output;
+}
 // src/react/useChat.ts
 function useChat(options) {
   const {
@@ -825,7 +873,9 @@ function useChat(options) {
     baseUrl = BASE_URL,
     onData: globalOnData,
     onFinish,
-    onError
+    onError,
+    chatProvider = "api",
+    localModel = DEFAULT_LOCAL_CHAT_MODEL
   } = options || {};
   const [isLoading, setIsLoading] = useState(false);
   const abortControllerRef = useRef(null);
@@ -854,16 +904,6 @@ function useChat(options) {
         if (onError) onError(new Error(errorMsg));
         return { data: null, error: errorMsg };
       }
-      if (!model) {
-        const errorMsg = "model is required to call sendMessage.";
-        if (onError) onError(new Error(errorMsg));
-        return { data: null, error: errorMsg };
-      }
-      if (!getToken) {
-        const errorMsg = "Token getter function is required.";
-        if (onError) onError(new Error(errorMsg));
-        return { data: null, error: errorMsg };
-      }
       if (abortControllerRef.current) {
         abortControllerRef.current.abort();
       }
@@ -871,88 +911,141 @@ function useChat(options) {
       abortControllerRef.current = abortController;
       setIsLoading(true);
       try {
-        const token = await getToken();
-        if (!token) {
-          const errorMsg = "No access token available.";
-          setIsLoading(false);
-          if (onError) onError(new Error(errorMsg));
-          return { data: null, error: errorMsg };
-        }
-        const sseResult = await client.sse.post({
-          baseUrl,
-          url: "/api/v1/chat/completions",
-          body: {
-            messages,
-            model,
-            stream: true
-          },
-          headers: {
-            "Content-Type": "application/json",
-            Authorization: `Bearer ${token}`
-          },
-          signal: abortController.signal
-        });
-        let accumulatedContent = "";
-        let completionId = "";
-        let completionModel = "";
-        let accumulatedUsage = {};
-        let finishReason;
-        for await (const chunk of sseResult.stream) {
-          if (typeof chunk === "string" && (chunk.trim() === "[DONE]" || chunk.includes("[DONE]"))) {
-            continue;
-          }
-          if (chunk && typeof chunk === "object") {
-            const chunkData = chunk;
-            if (chunkData.id && !completionId) {
-              completionId = chunkData.id;
+        if (chatProvider === "local") {
+          let accumulatedContent = "";
+          const usedModel = localModel;
+          const formattedMessages = messages.map((m) => ({
+            role: m.role || "user",
+            content: m.content || ""
+          }));
+          await generateLocalChatCompletion(formattedMessages, {
+            model: usedModel,
+            signal: abortController.signal,
+            onToken: (token) => {
+              accumulatedContent += token;
+              if (onData) onData(token);
+              if (globalOnData) globalOnData(token);
             }
-            if (chunkData.model && !completionModel) {
-              completionModel = chunkData.model;
+          });
+          const completion = {
+            id: `local-${Date.now()}`,
+            model: usedModel,
+            choices: [
+              {
+                index: 0,
+                message: {
+                  role: "assistant",
+                  content: accumulatedContent
+                },
+                finish_reason: "stop"
+              }
+            ],
+            usage: {
+              prompt_tokens: 0,
+              // Not easily available from simple pipeline usage
+              completion_tokens: 0,
+              total_tokens: 0
             }
-            if (chunkData.usage) {
-              accumulatedUsage = {
-                ...accumulatedUsage,
-                ...chunkData.usage
-              };
+          };
+          setIsLoading(false);
+          if (onFinish) {
+            onFinish(completion);
+          }
+          return { data: completion, error: null };
+        } else {
+          if (!model) {
+            const errorMsg = "model is required to call sendMessage.";
+            if (onError) onError(new Error(errorMsg));
+            return { data: null, error: errorMsg };
+          }
+          if (!getToken) {
+            const errorMsg = "Token getter function is required.";
+            if (onError) onError(new Error(errorMsg));
+            return { data: null, error: errorMsg };
+          }
+          const token = await getToken();
+          if (!token) {
+            const errorMsg = "No access token available.";
+            setIsLoading(false);
+            if (onError) onError(new Error(errorMsg));
+            return { data: null, error: errorMsg };
+          }
+          const sseResult = await client.sse.post({
+            baseUrl,
+            url: "/api/v1/chat/completions",
+            body: {
+              messages,
+              model,
+              stream: true
+            },
+            headers: {
+              "Content-Type": "application/json",
+              Authorization: `Bearer ${token}`
+            },
+            signal: abortController.signal
+          });
+          let accumulatedContent = "";
+          let completionId = "";
+          let completionModel = "";
+          let accumulatedUsage = {};
+          let finishReason;
+          for await (const chunk of sseResult.stream) {
+            if (typeof chunk === "string" && (chunk.trim() === "[DONE]" || chunk.includes("[DONE]"))) {
+              continue;
             }
-            if (chunkData.choices && Array.isArray(chunkData.choices) && chunkData.choices.length > 0) {
-              const choice = chunkData.choices[0];
-              if (choice.delta?.content) {
-                const content = choice.delta.content;
-                accumulatedContent += content;
-                if (onData) {
-                  onData(content);
+            if (chunk && typeof chunk === "object") {
+              const chunkData = chunk;
+              if (chunkData.id && !completionId) {
+                completionId = chunkData.id;
+              }
+              if (chunkData.model && !completionModel) {
+                completionModel = chunkData.model;
+              }
+              if (chunkData.usage) {
+                accumulatedUsage = {
+                  ...accumulatedUsage,
+                  ...chunkData.usage
+                };
+              }
+              if (chunkData.choices && Array.isArray(chunkData.choices) && chunkData.choices.length > 0) {
+                const choice = chunkData.choices[0];
+                if (choice.delta?.content) {
+                  const content = choice.delta.content;
+                  accumulatedContent += content;
+                  if (onData) {
+                    onData(content);
+                  }
+                  if (globalOnData) {
+                    globalOnData(content);
+                  }
                 }
-                if (globalOnData) {
-                  globalOnData(content);
+                if (choice.finish_reason) {
+                  finishReason = choice.finish_reason;
                 }
               }
-              if (choice.finish_reason) {
-                finishReason = choice.finish_reason;
-              }
             }
           }
+          const completion = {
+            id: completionId,
+            model: completionModel,
+            choices: [
+              {
+                index: 0,
+                message: {
+                  role: "assistant",
+                  content: accumulatedContent
+                },
+                finish_reason: finishReason
+              }
+            ],
+            usage: Object.keys(accumulatedUsage).length > 0 ? accumulatedUsage : void 0
+          };
+          setIsLoading(false);
+          if (onFinish) {
+            onFinish(completion);
+          }
+          return { data: completion, error: null };
         }
-        const completion = {
-          id: completionId,
-          model: completionModel,
-          choices: [
-            {
-              index: 0,
-              message: {
-                role: "assistant",
-                content: accumulatedContent
-              },
-              finish_reason: finishReason
-            }
-          ],
-          usage: Object.keys(accumulatedUsage).length > 0 ? accumulatedUsage : void 0
-        };
-        setIsLoading(false);
-        if (onFinish) {
-          onFinish(completion);
-        }
-        return { data: completion, error: null };
       } catch (err) {
         if (err instanceof Error && err.name === "AbortError") {
           setIsLoading(false);
@@ -971,7 +1064,15 @@ function useChat(options) {
         }
       }
     },
-    [getToken, baseUrl, globalOnData, onFinish, onError]
+    [
+      getToken,
+      baseUrl,
+      globalOnData,
+      onFinish,
+      onError,
+      chatProvider,
+      localModel
+    ]
   );
   return {
     isLoading,

package/package.json CHANGED Viewed

@@ -1,6 +1,6 @@
 {
   "name": "@reverbia/sdk",
-  "version": "1.0.0-next.20251202090922",
+  "version": "1.0.0-next.20251202092727",
   "description": "",
   "main": "./dist/index.cjs",
   "module": "./dist/index.mjs",