npm - @elizaos/plugin-ollama - Versions diffs - 2.0.0-beta.1 → 2.0.3-beta.3 - Mend

@elizaos/plugin-ollama 2.0.0-beta.1 → 2.0.3-beta.3

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (15) hide show

package/README.md +12 -27
package/dist/browser/index.browser.js +78 -61
package/dist/browser/index.browser.js.map +7 -7
package/dist/cjs/index.node.cjs +78 -61
package/dist/cjs/index.node.cjs.map +7 -7
package/dist/node/index.node.js +78 -61
package/dist/node/index.node.js.map +7 -7
package/dist/node/models/embedding.d.ts.map +1 -1
package/dist/node/models/text.d.ts.map +1 -1
package/dist/node/plugin.d.ts.map +1 -1
package/dist/node/utils/ai-sdk-wire.d.ts +1 -1
package/dist/node/utils/config.d.ts +1 -1
package/dist/node/utils/config.d.ts.map +1 -1
package/package.json +16 -10
package/registry-entry.json +96 -0

package/dist/cjs/index.node.cjs CHANGED Viewed

@@ -71,7 +71,7 @@ var import_ollama_ai_provider_v2 = require("ollama-ai-provider-v2");
 // utils/config.ts
 var DEFAULT_OLLAMA_URL = "http://localhost:11434";
 var DEFAULT_SMALL_MODEL = "eliza-1-2b";
-var DEFAULT_LARGE_MODEL = "eliza-1-9b";
+var DEFAULT_LARGE_MODEL = "eliza-1-4b";
 var DEFAULT_EMBEDDING_MODEL = "eliza-1-2b";
 function getEnvValue(key) {
   if (typeof process === "undefined" || !process.env) {
@@ -83,12 +83,12 @@ function getEnvValue(key) {
 function getSetting(runtime, key, defaultValue) {
   const value = runtime.getSetting(key);
   if (value !== undefined && value !== null) {
-    return String(value);
+    return String(value).trim();
   }
-  return getEnvValue(key) ?? defaultValue;
+  return getEnvValue(key)?.trim() ?? defaultValue;
 }
 function getBaseURL(runtime) {
-  const apiEndpoint = getSetting(runtime, "OLLAMA_API_ENDPOINT") || getSetting(runtime, "OLLAMA_API_URL") || DEFAULT_OLLAMA_URL;
+  const apiEndpoint = getSetting(runtime, "OLLAMA_API_ENDPOINT") || getSetting(runtime, "OLLAMA_API_URL") || getSetting(runtime, "OLLAMA_BASE_URL") || DEFAULT_OLLAMA_URL;
   if (!apiEndpoint.endsWith("/api")) {
     return apiEndpoint.endsWith("/") ? `${apiEndpoint}api` : `${apiEndpoint}/api`;
   }
@@ -236,39 +236,53 @@ async function ensureModelAvailable(model, providedBaseURL, customFetch) {
 }
 // models/embedding.ts
+var INIT_PROBE_TEXT = "dimension probe";
+function extractText(params) {
+  if (params === null) {
+    return null;
+  }
+  if (typeof params === "string") {
+    return params;
+  }
+  if (typeof params === "object" && typeof params.text === "string") {
+    return params.text;
+  }
+  throw new Error("Invalid input format for embedding: expected string or { text: string }");
+}
 async function handleTextEmbedding(runtime, params) {
+  const text = extractText(params);
+  const isInitProbe = text === null;
+  if (!isInitProbe && !text.trim()) {
+    throw new Error("Cannot generate embedding for empty text");
+  }
   try {
     const baseURL = getBaseURL(runtime);
     const customFetch = runtime.fetch ?? undefined;
     const ollama = import_ollama_ai_provider_v2.createOllama({
-      fetch: customFetch,
+      ...customFetch ? { fetch: customFetch } : {},
       baseURL
     });
     const modelName = getEmbeddingModel(runtime);
     import_core3.logger.log(`[Ollama] Using TEXT_EMBEDDING model: ${modelName}`);
     await ensureModelAvailable(modelName, baseURL, customFetch);
-    let text = typeof params === "string" ? params : params ? params.text || "" : "";
     const maxChars = 8000 * 4;
-    if (text.length > maxChars) {
-      import_core3.logger.warn(`[Ollama] Embedding input too long (~${Math.ceil(text.length / 4)} tokens), truncating to ~8000 tokens`);
-      text = text.slice(0, maxChars);
+    let embeddingText = isInitProbe ? INIT_PROBE_TEXT : text;
+    if (embeddingText.length > maxChars) {
+      import_core3.logger.warn(`[Ollama] Embedding input too long (~${Math.ceil(embeddingText.length / 4)} tokens), truncating to ~8000 tokens`);
+      embeddingText = embeddingText.slice(0, maxChars);
     }
-    const embeddingText = text || "test";
-    try {
-      const embedParams = {
-        model: ollama.embedding(modelName),
-        value: embeddingText
-      };
-      const { embedding, usage } = await import_ai.embed(embedParams);
+    const embedParams = {
+      model: ollama.embedding(modelName),
+      value: embeddingText
+    };
+    const { embedding, usage } = await import_ai.embed(embedParams);
+    if (!isInitProbe) {
       emitModelUsed(runtime, import_core3.ModelType.TEXT_EMBEDDING, modelName, normalizeTokenUsage(usage) ?? estimateEmbeddingUsage(embeddingText));
-      return embedding;
-    } catch (embeddingError) {
-      import_core3.logger.error({ error: embeddingError }, "Error generating embedding");
-      return Array(1536).fill(0);
     }
+    return embedding;
   } catch (error) {
     import_core3.logger.error({ error }, "Error in TEXT_EMBEDDING model");
-    return Array(1536).fill(0);
+    throw error instanceof Error ? error : new Error(String(error));
   }
 }
@@ -548,11 +562,11 @@ function firstString(...values) {
 }
 // models/text.ts
-var TEXT_NANO_MODEL_TYPE = import_core4.ModelType.TEXT_NANO ?? "TEXT_NANO";
-var TEXT_MEDIUM_MODEL_TYPE = import_core4.ModelType.TEXT_MEDIUM ?? "TEXT_MEDIUM";
-var TEXT_MEGA_MODEL_TYPE = import_core4.ModelType.TEXT_MEGA ?? "TEXT_MEGA";
-var RESPONSE_HANDLER_MODEL_TYPE = import_core4.ModelType.RESPONSE_HANDLER ?? "RESPONSE_HANDLER";
-var ACTION_PLANNER_MODEL_TYPE = import_core4.ModelType.ACTION_PLANNER ?? "ACTION_PLANNER";
+var TEXT_NANO_MODEL_TYPE = import_core4.ModelType.TEXT_NANO;
+var TEXT_MEDIUM_MODEL_TYPE = import_core4.ModelType.TEXT_MEDIUM;
+var TEXT_MEGA_MODEL_TYPE = import_core4.ModelType.TEXT_MEGA;
+var RESPONSE_HANDLER_MODEL_TYPE = import_core4.ModelType.RESPONSE_HANDLER;
+var ACTION_PLANNER_MODEL_TYPE = import_core4.ModelType.ACTION_PLANNER;
 function summarizeAiSdkErrorForLogs(error, depth = 0) {
   if (depth > 4) {
     return { note: "max depth summarizing nested error" };
@@ -613,7 +627,7 @@ function serializeStructuredGenerateTextResult(result) {
   if (result.output !== undefined && result.output !== null) {
     return typeof result.output === "string" ? result.output : JSON.stringify(result.output);
   }
-  const trimmed = result.text?.trim() ?? "";
+  const trimmed = result.text.trim();
   if (trimmed)
     return trimmed;
   throw new Error("[Ollama] Structured generation returned no text or output.");
@@ -622,7 +636,7 @@ function buildNativeResultCast(result, modelName, usage) {
   const payload = {
     text: result.text,
     toolCalls: mapAiSdkToolCallsToCore(result.toolCalls),
-    finishReason: String(result.finishReason ?? ""),
+    finishReason: String(result.finishReason),
     usage,
     providerMetadata: { modelName }
   };
@@ -636,9 +650,7 @@ function buildOllamaStreamTextResult(args) {
   });
   const usagePromise = Promise.resolve(streamResult.usage).then(async (usage) => {
     const fullText = await textPromise;
-    const normalized = normalizeTokenUsage(usage) ?? estimateUsage(args.promptForEstimate, fullText);
-    emitModelUsed(args.runtime, args.modelType, args.model, normalized);
-    return normalized;
+    return normalizeTokenUsage(usage) ?? estimateUsage(args.promptForEstimate, fullText);
   }).catch(() => {
     return;
   });
@@ -654,9 +666,12 @@ function buildOllamaStreamTextResult(args) {
       throw streamErr;
     } finally {
       if (completed) {
-        await usagePromise.catch(() => {
+        const usage = await usagePromise.catch(() => {
           return;
         });
+        if (usage) {
+          emitModelUsed(args.runtime, args.modelType, args.model, usage);
+        }
       }
     }
   }
@@ -682,9 +697,7 @@ function buildOllamaStreamWithToolsResult(args) {
   const toolCallsPromise = Promise.resolve(streamResult.toolCalls).then((calls) => mapAiSdkToolCallsToCore(calls)).catch(() => []);
   const usagePromise = Promise.resolve(streamResult.usage).then(async (usage) => {
     const fullText = await sdkTextPromise;
-    const normalized = normalizeTokenUsage(usage) ?? estimateUsage(args.promptForEstimate, fullText);
-    emitModelUsed(args.runtime, args.modelType, args.model, normalized);
-    return normalized;
+    return normalizeTokenUsage(usage) ?? estimateUsage(args.promptForEstimate, fullText);
   }).catch(() => {
     return;
   });
@@ -705,6 +718,11 @@ function buildOllamaStreamWithToolsResult(args) {
         const first = mapped[0];
         if (first) {
           yield stringifyPlannerToolArgs(first.arguments);
+        } else {
+          const fallbackText = await sdkTextPromise;
+          if (fallbackText) {
+            yield fallbackText;
+          }
         }
       } else {
         for await (const chunk of streamResult.textStream) {
@@ -717,9 +735,12 @@ function buildOllamaStreamWithToolsResult(args) {
       throw streamErr;
     } finally {
       if (completed) {
-        await usagePromise.catch(() => {
+        const usage = await usagePromise.catch(() => {
           return;
         });
+        if (usage) {
+          emitModelUsed(args.runtime, args.modelType, args.model, usage);
+        }
       }
     }
   }
@@ -753,26 +774,21 @@ function getModelNameForType(runtime, modelType) {
 }
 async function handleTextWithModelType(runtime, modelType, params) {
   const extended = params;
-  const structuredDisabled = isOllamaStructuredOutputDisabled(runtime);
-  let responseSchema = extended.responseSchema;
-  if (structuredDisabled && extended.responseSchema) {
-    import_core4.logger.debug("[Ollama] OLLAMA_DISABLE_STRUCTURED_OUTPUT is set — ignoring responseSchema for this call.");
-    responseSchema = undefined;
-  }
-  const tools = normalizeNativeTools(extended.tools);
-  const {
-    prompt,
-    maxTokens = 8192,
-    temperature = 0.7,
-    frequencyPenalty = 0.7,
-    presencePenalty = 0.7
-  } = params;
+  const { prompt, temperature = 0.7, frequencyPenalty = 0.7, presencePenalty = 0.7 } = params;
+  const maxTokens = params.omitMaxTokens ? undefined : params.maxTokens ?? 8192;
   let modelIdForLog = "";
   try {
+    const structuredDisabled = isOllamaStructuredOutputDisabled(runtime);
+    let responseSchema = extended.responseSchema;
+    if (structuredDisabled && extended.responseSchema) {
+      import_core4.logger.debug("[Ollama] OLLAMA_DISABLE_STRUCTURED_OUTPUT is set — ignoring responseSchema for this call.");
+      responseSchema = undefined;
+    }
+    const tools = normalizeNativeTools(extended.tools);
     const baseURL = getBaseURL(runtime);
     const customFetch = runtime.fetch ?? undefined;
     const ollama = import_ollama_ai_provider_v22.createOllama({
-      fetch: customFetch,
+      ...customFetch ? { fetch: customFetch } : {},
       baseURL
     });
     const model = getModelNameForType(runtime, modelType);
@@ -794,7 +810,7 @@ async function handleTextWithModelType(runtime, modelType, params) {
     const toolChoice = tools ? normalizeToolChoice(extended.toolChoice) : undefined;
     const shouldReturnNative = Boolean(hasChatMessages || tools || extended.toolChoice || outputSpec !== undefined);
     const renderedPrompt = hasChatMessages ? "" : import_core4.renderChatMessagesForPrompt(params.messages, {
-      omitDuplicateSystem: system
+      ...system ? { omitDuplicateSystem: system } : {}
     }) ?? prompt ?? "";
     const promptOrMessages = hasChatMessages ? { messages: normalizedMessages } : { prompt: renderedPrompt };
     const resolvedStopSequences = Array.isArray(params.stopSequences) && params.stopSequences.length > 0 ? params.stopSequences : undefined;
@@ -804,9 +820,9 @@ async function handleTextWithModelType(runtime, modelType, params) {
       ...promptOrMessages,
       system,
       temperature,
-      maxOutputTokens: maxTokens,
       frequencyPenalty,
       presencePenalty,
+      ...typeof maxTokens === "number" ? { maxOutputTokens: maxTokens } : {},
       ...resolvedStopSequences ? { stopSequences: resolvedStopSequences } : {},
       ...tools ? { tools, ...toolChoice ? { toolChoice } : {} } : {},
       ...outputSpec ? { output: outputSpec } : {}
@@ -854,7 +870,7 @@ async function handleTextWithModelType(runtime, modelType, params) {
       endpoint = getBaseURL(runtime);
     } catch {}
     logOllamaTextFailure("generateText", String(modelType), modelIdForLog || "(unknown)", endpoint, error);
-    return "Error generating text. Please try again later.";
+    throw error;
   }
 }
 async function handleTextSmall(runtime, params) {
@@ -889,11 +905,11 @@ function getProcessEnv() {
   return process.env;
 }
 var env = getProcessEnv();
-var TEXT_NANO_MODEL_TYPE2 = import_core5.ModelType.TEXT_NANO ?? "TEXT_NANO";
-var TEXT_MEDIUM_MODEL_TYPE2 = import_core5.ModelType.TEXT_MEDIUM ?? "TEXT_MEDIUM";
-var TEXT_MEGA_MODEL_TYPE2 = import_core5.ModelType.TEXT_MEGA ?? "TEXT_MEGA";
-var RESPONSE_HANDLER_MODEL_TYPE2 = import_core5.ModelType.RESPONSE_HANDLER ?? "RESPONSE_HANDLER";
-var ACTION_PLANNER_MODEL_TYPE2 = import_core5.ModelType.ACTION_PLANNER ?? "ACTION_PLANNER";
+var TEXT_NANO_MODEL_TYPE2 = import_core5.ModelType.TEXT_NANO;
+var TEXT_MEDIUM_MODEL_TYPE2 = import_core5.ModelType.TEXT_MEDIUM;
+var TEXT_MEGA_MODEL_TYPE2 = import_core5.ModelType.TEXT_MEGA;
+var RESPONSE_HANDLER_MODEL_TYPE2 = import_core5.ModelType.RESPONSE_HANDLER;
+var ACTION_PLANNER_MODEL_TYPE2 = import_core5.ModelType.ACTION_PLANNER;
 var ollamaPlugin = {
   name: "ollama",
   description: "Ollama plugin for local LLM inference",
@@ -933,7 +949,8 @@ var ollamaPlugin = {
       }
     }
     try {
-      const response = await fetch(`${apiBase}/api/tags`, {
+      const fetchImpl = runtime.fetch ?? fetch;
+      const response = await fetchImpl(`${apiBase}/api/tags`, {
         method: "GET",
         headers: { "Content-Type": "application/json" }
       });
@@ -1087,5 +1104,5 @@ var ollamaPlugin = {
 var defaultOllamaPlugin = ollamaPlugin;
 var index_node_default = defaultOllamaPlugin;
-//# debugId=067D163DA297C55B64756E2164756E21
+//# debugId=88040C7A9C8949A364756E2164756E21
 //# sourceMappingURL=index.node.cjs.map