npm - @providerprotocol/ai - Versions diffs - 0.0.23 → 0.0.25 - Mend

@providerprotocol/ai 0.0.23 → 0.0.25

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (35) hide show

package/dist/anthropic/index.d.ts +1 -1
package/dist/anthropic/index.js +66 -12
package/dist/anthropic/index.js.map +1 -1
package/dist/{chunk-MF5ETY5O.js → chunk-6AZVUI6H.js} +8 -1
package/dist/chunk-6AZVUI6H.js.map +1 -0
package/dist/{chunk-NWS5IKNR.js → chunk-TOJCZMVU.js} +3 -12
package/dist/chunk-TOJCZMVU.js.map +1 -0
package/dist/google/index.d.ts +34 -3
package/dist/google/index.js +62 -22
package/dist/google/index.js.map +1 -1
package/dist/http/index.d.ts +2 -2
package/dist/http/index.js +1 -1
package/dist/index.d.ts +5 -5
package/dist/index.js +12 -2
package/dist/index.js.map +1 -1
package/dist/ollama/index.d.ts +1 -1
package/dist/ollama/index.js +14 -8
package/dist/ollama/index.js.map +1 -1
package/dist/openai/index.d.ts +1 -1
package/dist/openai/index.js +60 -4
package/dist/openai/index.js.map +1 -1
package/dist/openrouter/index.d.ts +60 -1
package/dist/openrouter/index.js +116 -21
package/dist/openrouter/index.js.map +1 -1
package/dist/{provider-DR1yins0.d.ts → provider-x4RocsnK.d.ts} +52 -3
package/dist/proxy/index.d.ts +2 -2
package/dist/proxy/index.js +1 -1
package/dist/{retry-DJiqAslw.d.ts → retry-DTfjXXPh.d.ts} +1 -1
package/dist/{stream-BuTrqt_j.d.ts → stream-ITNFNnO4.d.ts} +6 -1
package/dist/xai/index.d.ts +1 -1
package/dist/xai/index.js +151 -32
package/dist/xai/index.js.map +1 -1
package/package.json +1 -1
package/dist/chunk-MF5ETY5O.js.map +0 -1
package/dist/chunk-NWS5IKNR.js.map +0 -1

package/dist/{chunk-NWS5IKNR.js → chunk-TOJCZMVU.js} RENAMED Viewed

@@ -1,24 +1,15 @@
 // src/http/sse.ts
-var MAX_SSE_BUFFER_CHARS = 1024 * 1024;
 async function* parseSSEStream(body) {
   const reader = body.getReader();
   const decoder = new TextDecoder();
   let buffer = "";
-  const appendToBuffer = (chunk) => {
-    if (buffer.length + chunk.length > MAX_SSE_BUFFER_CHARS) {
-      throw new Error(
-        `SSE buffer exceeded maximum size (${MAX_SSE_BUFFER_CHARS} chars)`
-      );
-    }
-    buffer += chunk;
-  };
   try {
     while (true) {
       const { done, value } = await reader.read();
       if (done) {
         const tail = decoder.decode();
         if (tail) {
-          appendToBuffer(tail);
+          buffer += tail;
         }
         if (buffer.trim()) {
           const event = parseSSEEvent(buffer);
@@ -30,7 +21,7 @@ async function* parseSSEStream(body) {
       }
       const chunk = decoder.decode(value, { stream: true });
       if (chunk) {
-        appendToBuffer(chunk);
+        buffer += chunk;
       }
       const events = buffer.split(/\r?\n\r?\n/);
       buffer = events.pop() ?? "";
@@ -113,4 +104,4 @@ export {
   parseSSEStream,
   parseSimpleTextStream
 };
-//# sourceMappingURL=chunk-NWS5IKNR.js.map
+//# sourceMappingURL=chunk-TOJCZMVU.js.map

package/dist/chunk-TOJCZMVU.js.map ADDED Viewed

@@ -0,0 +1 @@

+ {"version":3,"sources":["../src/http/sse.ts"],"sourcesContent":["/**\n * Server-Sent Events (SSE) stream parsing utilities.\n * @module http/sse\n */\n\n/**\n * Parses a Server-Sent Events stream into JSON objects.\n *\n * This async generator handles the standard SSE wire format:\n * - Lines prefixed with \"data:\" contain event data\n * - Lines prefixed with \"event:\" specify event types\n * - Lines prefixed with \":\" are comments (used for keep-alive)\n * - Events are separated by double newlines\n * - Stream terminates on \"[DONE]\" message (OpenAI convention)\n *\n * Also handles non-standard formats used by some providers:\n * - Raw JSON without \"data:\" prefix (Google)\n * - Multi-line data fields\n *\n * @param body - ReadableStream from fetch response body\n * @yields Parsed JSON objects from each SSE event\n *\n * @example\n * ```typescript\n * const response = await doStreamFetch(url, init, config, 'openai', 'llm');\n *\n * for await (const event of parseSSEStream(response.body!)) {\n * // event is parsed JSON from each SSE data field\n * const chunk = event as OpenAIStreamChunk;\n * const delta = chunk.choices[0]?.delta?.content;\n * if (delta) {\n * process.stdout.write(delta);\n * }\n * }\n * ```\n */\nexport async function* parseSSEStream(\n body: ReadableStream<Uint8Array>\n): AsyncGenerator<unknown, void, unknown> {\n const reader = body.getReader();\n const decoder = new TextDecoder();\n let buffer = '';\n\n try {\n while (true) {\n const { done, value } = await reader.read();\n\n if (done) {\n const tail = decoder.decode();\n if (tail) {\n buffer += tail;\n }\n // Process any remaining data in buffer\n if (buffer.trim()) {\n const event = parseSSEEvent(buffer);\n if (event !== null && event !== undefined) {\n yield event;\n }\n }\n break;\n }\n\n const chunk = decoder.decode(value, { stream: true });\n if (chunk) {\n buffer += chunk;\n }\n\n // Process complete events (separated by double newlines or \\r\\n\\r\\n)\n const events = buffer.split(/\\r?\\n\\r?\\n/);\n\n // Keep the last partial event in the buffer\n buffer = events.pop() ?? '';\n\n for (const eventText of events) {\n if (!eventText.trim()) continue;\n\n const event = parseSSEEvent(eventText);\n if (event === 'DONE') {\n return;\n }\n if (event !== null && event !== undefined) {\n yield event;\n }\n }\n }\n } finally {\n reader.releaseLock();\n }\n}\n\n/**\n * Parses a single SSE event block into a JSON object.\n *\n * Handles the following line prefixes:\n * - \"data:\" - Event data (multiple data lines are concatenated)\n * - \"event:\" - Event type (added to result as _eventType)\n * - \":\" - Comment (ignored, often used for keep-alive)\n * - Raw JSON starting with { or [ (provider-specific fallback)\n *\n * @param eventText - Raw text of a single SSE event block\n * @returns Parsed JSON object, 'DONE' for termination signal, or null for invalid/empty events\n */\nfunction parseSSEEvent(eventText: string): unknown | 'DONE' | null {\n const lines = eventText.split('\\n');\n let data = '';\n let eventType = '';\n\n for (const line of lines) {\n const normalizedLine = line.endsWith('\\r') ? line.slice(0, -1) : line;\n if (normalizedLine.startsWith('event:')) {\n let value = normalizedLine.slice(6);\n if (value.startsWith(' ')) value = value.slice(1);\n eventType = value;\n } else if (normalizedLine.startsWith('data:')) {\n let value = normalizedLine.slice(5);\n if (value.startsWith(' ')) value = value.slice(1);\n data += (data ? '\\n' : '') + value;\n } else if (normalizedLine.startsWith(':')) {\n continue;\n } else {\n const trimmedStart = normalizedLine.trimStart();\n if (trimmedStart.startsWith('{') || trimmedStart.startsWith('[')) {\n data += (data ? '\\n' : '') + trimmedStart;\n }\n }\n }\n\n if (!data) {\n return null;\n }\n\n if (data === '[DONE]') {\n return 'DONE';\n }\n\n try {\n const parsed = JSON.parse(data);\n\n if (eventType) {\n return { _eventType: eventType, ...parsed };\n }\n\n return parsed;\n } catch {\n return null;\n }\n}\n\n/**\n * Parses a simple text stream without SSE formatting.\n *\n * This is a simpler alternative to {@link parseSSEStream} for providers\n * that stream raw text deltas without SSE event wrappers. Each chunk\n * from the response body is decoded and yielded as-is.\n *\n * Use this for:\n * - Plain text streaming responses\n * - Providers with custom streaming formats\n * - Testing and debugging stream handling\n *\n * @param body - ReadableStream from fetch response body\n * @yields Decoded text strings from each stream chunk\n *\n * @example\n * ```typescript\n * const response = await doStreamFetch(url, init, config, 'custom', 'llm');\n *\n * for await (const text of parseSimpleTextStream(response.body!)) {\n * process.stdout.write(text);\n * }\n * ```\n */\nexport async function* parseSimpleTextStream(\n body: ReadableStream<Uint8Array>\n): AsyncGenerator<string, void, unknown> {\n const reader = body.getReader();\n const decoder = new TextDecoder();\n\n try {\n while (true) {\n const { done, value } = await reader.read();\n\n if (done) break;\n\n const text = decoder.decode(value, { stream: true });\n if (text) {\n yield text;\n }\n }\n const remaining = decoder.decode();\n if (remaining) {\n yield remaining;\n }\n } finally {\n reader.releaseLock();\n }\n}\n"],"mappings":";AAoCA,gBAAuB,eACrB,MACwC;AACxC,QAAM,SAAS,KAAK,UAAU;AAC9B,QAAM,UAAU,IAAI,YAAY;AAChC,MAAI,SAAS;AAEb,MAAI;AACF,WAAO,MAAM;AACX,YAAM,EAAE,MAAM,MAAM,IAAI,MAAM,OAAO,KAAK;AAE1C,UAAI,MAAM;AACR,cAAM,OAAO,QAAQ,OAAO;AAC5B,YAAI,MAAM;AACR,oBAAU;AAAA,QACZ;AAEA,YAAI,OAAO,KAAK,GAAG;AACjB,gBAAM,QAAQ,cAAc,MAAM;AAClC,cAAI,UAAU,QAAQ,UAAU,QAAW;AACzC,kBAAM;AAAA,UACR;AAAA,QACF;AACA;AAAA,MACF;AAEA,YAAM,QAAQ,QAAQ,OAAO,OAAO,EAAE,QAAQ,KAAK,CAAC;AACpD,UAAI,OAAO;AACT,kBAAU;AAAA,MACZ;AAGA,YAAM,SAAS,OAAO,MAAM,YAAY;AAGxC,eAAS,OAAO,IAAI,KAAK;AAEzB,iBAAW,aAAa,QAAQ;AAC9B,YAAI,CAAC,UAAU,KAAK,EAAG;AAEvB,cAAM,QAAQ,cAAc,SAAS;AACrC,YAAI,UAAU,QAAQ;AACpB;AAAA,QACF;AACA,YAAI,UAAU,QAAQ,UAAU,QAAW;AACzC,gBAAM;AAAA,QACR;AAAA,MACF;AAAA,IACF;AAAA,EACF,UAAE;AACA,WAAO,YAAY;AAAA,EACrB;AACF;AAcA,SAAS,cAAc,WAA4C;AACjE,QAAM,QAAQ,UAAU,MAAM,IAAI;AAClC,MAAI,OAAO;AACX,MAAI,YAAY;AAEhB,aAAW,QAAQ,OAAO;AACxB,UAAM,iBAAiB,KAAK,SAAS,IAAI,IAAI,KAAK,MAAM,GAAG,EAAE,IAAI;AACjE,QAAI,eAAe,WAAW,QAAQ,GAAG;AACvC,UAAI,QAAQ,eAAe,MAAM,CAAC;AAClC,UAAI,MAAM,WAAW,GAAG,EAAG,SAAQ,MAAM,MAAM,CAAC;AAChD,kBAAY;AAAA,IACd,WAAW,eAAe,WAAW,OAAO,GAAG;AAC7C,UAAI,QAAQ,eAAe,MAAM,CAAC;AAClC,UAAI,MAAM,WAAW,GAAG,EAAG,SAAQ,MAAM,MAAM,CAAC;AAChD,eAAS,OAAO,OAAO,MAAM;AAAA,IAC/B,WAAW,eAAe,WAAW,GAAG,GAAG;AACzC;AAAA,IACF,OAAO;AACL,YAAM,eAAe,eAAe,UAAU;AAC9C,UAAI,aAAa,WAAW,GAAG,KAAK,aAAa,WAAW,GAAG,GAAG;AAChE,iBAAS,OAAO,OAAO,MAAM;AAAA,MAC/B;AAAA,IACF;AAAA,EACF;AAEA,MAAI,CAAC,MAAM;AACT,WAAO;AAAA,EACT;AAEA,MAAI,SAAS,UAAU;AACrB,WAAO;AAAA,EACT;AAEA,MAAI;AACF,UAAM,SAAS,KAAK,MAAM,IAAI;AAE9B,QAAI,WAAW;AACb,aAAO,EAAE,YAAY,WAAW,GAAG,OAAO;AAAA,IAC5C;AAEA,WAAO;AAAA,EACT,QAAQ;AACN,WAAO;AAAA,EACT;AACF;AA0BA,gBAAuB,sBACrB,MACuC;AACvC,QAAM,SAAS,KAAK,UAAU;AAC9B,QAAM,UAAU,IAAI,YAAY;AAEhC,MAAI;AACF,WAAO,MAAM;AACX,YAAM,EAAE,MAAM,MAAM,IAAI,MAAM,OAAO,KAAK;AAE1C,UAAI,KAAM;AAEV,YAAM,OAAO,QAAQ,OAAO,OAAO,EAAE,QAAQ,KAAK,CAAC;AACnD,UAAI,MAAM;AACR,cAAM;AAAA,MACR;AAAA,IACF;AACA,UAAM,YAAY,QAAQ,OAAO;AACjC,QAAI,WAAW;AACb,YAAM;AAAA,IACR;AAAA,EACF,UAAE;AACA,WAAO,YAAY;AAAA,EACrB;AACF;","names":[]}

package/dist/google/index.d.ts CHANGED Viewed

@@ -1,4 +1,4 @@
-import { a as ProviderConfig, g as Provider } from '../provider-DR1yins0.js';
+import { a as ProviderConfig, g as Provider } from '../provider-x4RocsnK.js';
 /**
  * Provider-specific parameters for Google Gemini API requests.
@@ -125,14 +125,37 @@ interface GoogleLLMParams {
     toolConfig?: GoogleToolConfig;
 }
 /**
- * Configuration for extended thinking/reasoning in Gemini 3+ models.
+ * Configuration for extended thinking/reasoning in Gemini 2.5+ and 3+ models.
  *
  * Enables models to spend additional compute on reasoning before
  * generating a response, improving quality for complex tasks.
+ *
+ * For Gemini 2.5 models: Use `thinkingBudget` to control token allocation.
+ * For Gemini 3+ models: Use `thinkingLevel` (recommended) to set reasoning depth.
+ *
+ * Set `includeThoughts: true` to receive thought/reasoning content in the response.
  */
 interface GoogleThinkingConfig {
-    /** Token budget allocated for model thinking/reasoning before response generation. */
+    /**
+     * Token budget allocated for model thinking/reasoning (Gemini 2.5 models).
+     * - `-1`: Dynamic thinking (default)
+     * - `0`: Disable thinking (Flash models only)
+     * - `128-32768`: Specific token budget
+     */
     thinkingBudget?: number;
+    /**
+     * Thinking level for Gemini 3+ models (recommended over thinkingBudget).
+     * - `"minimal"`: Likely prevents thinking (Gemini 3 Flash only)
+     * - `"low"`: Minimizes latency and cost
+     * - `"medium"`: Balanced (Gemini 3 Flash only)
+     * - `"high"`: Maximizes reasoning depth (default for Gemini 3)
+     */
+    thinkingLevel?: 'minimal' | 'low' | 'medium' | 'high';
+    /**
+     * Whether to include thought summaries in the response.
+     * When true, response parts with `thought: true` contain reasoning content.
+     */
+    includeThoughts?: boolean;
 }
 /**
  * A single content turn in the Google conversation format.
@@ -160,6 +183,14 @@ type GooglePart = GoogleTextPart | GoogleImagePart | GoogleFunctionCallPart | Go
 interface GoogleTextPart {
     /** The text content. */
     text: string;
+    /** If true, this part contains thinking/reasoning content (Gemini 2.5+/3+). */
+    thought?: boolean;
+    /**
+     * Encrypted thought signature for Gemini 3+ models.
+     * Must be forwarded back in subsequent requests to maintain reasoning context.
+     * Required for Gemini 3 multi-turn conversations; recommended for Gemini 2.5.
+     */
+    thoughtSignature?: string;
 }
 /**
  * Inline image content part with base64-encoded data.

package/dist/google/index.js CHANGED Viewed

@@ -13,10 +13,10 @@ import {
   isAssistantMessage,
   isToolResultMessage,
   isUserMessage
-} from "../chunk-MF5ETY5O.js";
+} from "../chunk-6AZVUI6H.js";
 import {
   parseSSEStream
-} from "../chunk-NWS5IKNR.js";
+} from "../chunk-TOJCZMVU.js";
 import {
   resolveApiKey
 } from "../chunk-55X3W2MN.js";
@@ -147,8 +147,18 @@ function transformMessages(messages) {
       });
     } else if (isAssistantMessage(msg)) {
       const validContent = filterValidContent(msg.content);
-      const parts = validContent.map(transformContentBlock);
+      const nonReasoningContent = validContent.filter((c) => c.type !== "reasoning");
+      const parts = nonReasoningContent.map(transformContentBlock);
       const googleMeta = msg.metadata?.google;
+      if (googleMeta?.thoughtSignature) {
+        for (let i = parts.length - 1; i >= 0; i--) {
+          const part = parts[i];
+          if (part && "text" in part) {
+            part.thoughtSignature = googleMeta.thoughtSignature;
+            break;
+          }
+        }
+      }
       if (googleMeta?.functionCallParts && googleMeta.functionCallParts.length > 0) {
         for (const fc of googleMeta.functionCallParts) {
           const part = {
@@ -236,17 +246,26 @@ function transformResponse(data) {
   if (!candidate) {
     throw new Error("No candidates in Google response");
   }
-  const textContent = [];
+  const content = [];
   const toolCalls = [];
   let structuredData;
+  let lastThoughtSignature;
   const functionCallParts = [];
   for (const part of candidate.content.parts) {
     if ("text" in part) {
-      textContent.push({ type: "text", text: part.text });
-      if (structuredData === void 0) {
-        try {
-          structuredData = JSON.parse(part.text);
-        } catch {
+      const textPart = part;
+      if (textPart.thoughtSignature) {
+        lastThoughtSignature = textPart.thoughtSignature;
+      }
+      if (textPart.thought) {
+        content.push({ type: "reasoning", text: textPart.text });
+      } else {
+        content.push({ type: "text", text: textPart.text });
+        if (structuredData === void 0) {
+          try {
+            structuredData = JSON.parse(textPart.text);
+          } catch {
+          }
         }
       }
     } else if ("functionCall" in part) {
@@ -265,7 +284,7 @@ function transformResponse(data) {
     } else if ("codeExecutionResult" in part) {
       const codeResult = part;
       if (codeResult.codeExecutionResult.output) {
-        textContent.push({ type: "text", text: `
+        content.push({ type: "text", text: `
 \`\`\`
 ${codeResult.codeExecutionResult.output}\`\`\`
 ` });
@@ -273,14 +292,16 @@ ${codeResult.codeExecutionResult.output}\`\`\`
     }
   }
   const message = new AssistantMessage(
-    textContent,
+    content,
     toolCalls.length > 0 ? toolCalls : void 0,
     {
       metadata: {
         google: {
           finishReason: candidate.finishReason,
           safetyRatings: candidate.safetyRatings,
-          functionCallParts: functionCallParts.length > 0 ? functionCallParts : void 0
+          functionCallParts: functionCallParts.length > 0 ? functionCallParts : void 0,
+          // Store thoughtSignature for multi-turn context preservation (Gemini 3+)
+          thoughtSignature: lastThoughtSignature
         }
       }
     }
@@ -302,6 +323,8 @@ ${codeResult.codeExecutionResult.output}\`\`\`
 function createStreamState() {
   return {
     content: "",
+    reasoning: "",
+    thoughtSignature: void 0,
     toolCalls: [],
     finishReason: null,
     inputTokens: 0,
@@ -327,12 +350,25 @@ function transformStreamChunk(chunk, state) {
   }
   for (const part of candidate.content?.parts ?? []) {
     if ("text" in part) {
-      state.content += part.text;
-      events.push({
-        type: StreamEventType.TextDelta,
-        index: 0,
-        delta: { text: part.text }
-      });
+      const textPart = part;
+      if (textPart.thoughtSignature) {
+        state.thoughtSignature = textPart.thoughtSignature;
+      }
+      if (textPart.thought) {
+        state.reasoning += textPart.text;
+        events.push({
+          type: StreamEventType.ReasoningDelta,
+          index: 0,
+          delta: { text: textPart.text }
+        });
+      } else {
+        state.content += textPart.text;
+        events.push({
+          type: StreamEventType.TextDelta,
+          index: 0,
+          delta: { text: textPart.text }
+        });
+      }
     } else if ("functionCall" in part) {
       const fc = part;
       const toolCallId = createGoogleToolCallId(fc.functionCall.name, state.toolCalls.length);
@@ -374,12 +410,15 @@ ${codeResult.codeExecutionResult.output}\`\`\`
   return events;
 }
 function buildResponseFromState(state) {
-  const textContent = [];
+  const content = [];
   const toolCalls = [];
   let structuredData;
   const functionCallParts = [];
+  if (state.reasoning) {
+    content.push({ type: "reasoning", text: state.reasoning });
+  }
   if (state.content) {
-    textContent.push({ type: "text", text: state.content });
+    content.push({ type: "text", text: state.content });
     try {
       structuredData = JSON.parse(state.content);
     } catch {
@@ -399,13 +438,14 @@ function buildResponseFromState(state) {
     });
   }
   const message = new AssistantMessage(
-    textContent,
+    content,
     toolCalls.length > 0 ? toolCalls : void 0,
     {
       metadata: {
         google: {
           finishReason: state.finishReason,
-          functionCallParts: functionCallParts.length > 0 ? functionCallParts : void 0
+          functionCallParts: functionCallParts.length > 0 ? functionCallParts : void 0,
+          thoughtSignature: state.thoughtSignature
         }
       }
     }