npm - promptfoo - Versions diffs - 0.18.1 → 0.18.3 - Mend

promptfoo 0.18.1 → 0.18.3

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (60) hide show

package/dist/package.json +1 -1
package/dist/src/assertions.d.ts +2 -2
package/dist/src/assertions.d.ts.map +1 -1
package/dist/src/assertions.js +42 -11
package/dist/src/assertions.js.map +1 -1
package/dist/src/cache.d.ts +1 -1
package/dist/src/cache.d.ts.map +1 -1
package/dist/src/cache.js +4 -4
package/dist/src/cache.js.map +1 -1
package/dist/src/evaluator.d.ts.map +1 -1
package/dist/src/evaluator.js +5 -2
package/dist/src/evaluator.js.map +1 -1
package/dist/src/main.js +4 -4
package/dist/src/main.js.map +1 -1
package/dist/src/providers/azureopenai.d.ts +2 -2
package/dist/src/providers/azureopenai.d.ts.map +1 -1
package/dist/src/providers/azureopenai.js +7 -5
package/dist/src/providers/azureopenai.js.map +1 -1
package/dist/src/providers/llama.js +1 -1
package/dist/src/providers/llama.js.map +1 -1
package/dist/src/providers/localai.js +2 -2
package/dist/src/providers/localai.js.map +1 -1
package/dist/src/providers/ollama.d.ts +9 -0
package/dist/src/providers/ollama.d.ts.map +1 -0
package/dist/src/providers/ollama.js +66 -0
package/dist/src/providers/ollama.js.map +1 -0
package/dist/src/providers/openai.d.ts +2 -2
package/dist/src/providers/openai.d.ts.map +1 -1
package/dist/src/providers/openai.js +7 -5
package/dist/src/providers/openai.js.map +1 -1
package/dist/src/providers.d.ts.map +1 -1
package/dist/src/providers.js +11 -5
package/dist/src/providers.js.map +1 -1
package/dist/src/types.d.ts +6 -2
package/dist/src/types.d.ts.map +1 -1
package/dist/src/util.d.ts +2 -0
package/dist/src/util.d.ts.map +1 -1
package/dist/src/util.js +24 -12
package/dist/src/util.js.map +1 -1
package/dist/src/web/client/assets/index-6d2a3573.js +200 -0
package/dist/src/web/client/index.html +1 -1
package/package.json +1 -1
package/src/assertions.ts +45 -11
package/src/cache.ts +3 -2
package/src/evaluator.ts +5 -1
package/src/main.ts +4 -4
package/src/providers/azureopenai.ts +18 -6
package/src/providers/llama.ts +2 -2
package/src/providers/localai.ts +3 -3
package/src/providers/ollama.ts +88 -0
package/src/providers/openai.ts +8 -6
package/src/providers.ts +20 -5
package/src/types.ts +6 -2
package/src/util.ts +25 -17
package/src/web/client/package-lock.json +5726 -0
package/src/web/client/src/EvalOutputPromptDialog.tsx +78 -16
package/src/web/client/src/ResultsTable.tsx +32 -9
package/src/web/client/src/ResultsView.tsx +1 -1
package/src/web/client/src/types.ts +3 -1
package/dist/src/web/client/assets/index-8388d689.js +0 -199

package/dist/src/web/client/index.html CHANGED Viewed

@@ -5,7 +5,7 @@
     <link rel="icon" type="image/svg+xml" href="favicon.ico" />
     <meta name="viewport" content="width=device-width, initial-scale=1.0" />
     <title>promptfoo web viewer</title>
-    <script type="module" crossorigin src="/assets/index-8388d689.js"></script>
+    <script type="module" crossorigin src="/assets/index-6d2a3573.js"></script>
     <link rel="stylesheet" href="/assets/index-d2b6a160.css">
   </head>
   <body>

package/package.json CHANGED Viewed

@@ -2,7 +2,7 @@
   "name": "promptfoo",
   "description": "LLM eval & testing toolkit",
   "author": "Ian Webster",
-  "version": "0.18.1",
+  "version": "0.18.3",
   "license": "MIT",
   "type": "commonjs",
   "main": "dist/src/index.js",

package/src/assertions.ts CHANGED Viewed

@@ -1,10 +1,9 @@
 import rouge from 'rouge';
 import invariant from 'tiny-invariant';
-import nunjucks from 'nunjucks';
 import telemetry from './telemetry';
 import { DefaultEmbeddingProvider, DefaultGradingProvider } from './providers/openai';
-import { cosineSimilarity, fetchWithRetries } from './util';
+import { cosineSimilarity, fetchWithRetries, getNunjucksEngine } from './util';
 import { loadApiProvider } from './providers';
 import { DEFAULT_GRADING_PROMPT } from './prompts';
@@ -18,6 +17,8 @@ import type {
 const DEFAULT_SEMANTIC_SIMILARITY_THRESHOLD = 0.8;
+const nunjucks = getNunjucksEngine();
 function handleRougeScore(
   baseType: 'rouge-n',
   assertion: Assertion,
@@ -40,6 +41,7 @@ function handleRougeScore(
       : `${baseType.toUpperCase()} score ${score} is less than threshold ${
           assertion.threshold || 0.75
         }`,
+    assertion,
   };
 }
@@ -51,17 +53,23 @@ export async function runAssertions(test: AtomicTestCase, output: string): Promi
   };
   if (!test.assert || test.assert.length < 1) {
-    return { pass: true, score: 1, reason: 'No assertions', tokensUsed };
+    return { pass: true, score: 1, reason: 'No assertions', tokensUsed, assertion: null };
   }
   let totalScore = 0;
   let totalWeight = 0;
+  let allPass = true;
+  let failedReason = '';
+  const componentResults: GradingResult[] = [];
   for (const assertion of test.assert) {
     const weight = assertion.weight || 1;
     totalWeight += weight;
     const result = await runAssertion(assertion, test, output);
     totalScore += result.score * weight;
+    componentResults.push(result);
     if (result.tokensUsed) {
       tokensUsed.total += result.tokensUsed.total;
       tokensUsed.prompt += result.tokensUsed.prompt;
@@ -69,16 +77,21 @@ export async function runAssertions(test: AtomicTestCase, output: string): Promi
     }
     if (!result.pass) {
-      // Short-circuit assertions
-      return result;
+      allPass = false;
+      failedReason = result.reason;
+      if (process.env.PROMPTFOO_SHORT_CIRCUIT_TEST_FAILURES) {
+        return result;
+      }
     }
   }
   return {
-    pass: true,
+    pass: allPass,
     score: totalScore / totalWeight,
-    reason: 'All assertions passed',
+    reason: allPass ? 'All assertions passed' : failedReason,
     tokensUsed,
+    componentResults,
+    assertion: null,
   };
 }
@@ -114,6 +127,7 @@ export async function runAssertion(
       pass,
       score: pass ? 1 : 0,
       reason: pass ? 'Assertion passed' : `Expected output "${renderedValue}"`,
+      assertion,
     };
   }
@@ -128,6 +142,7 @@ export async function runAssertion(
       pass,
       score: pass ? 1 : 0,
       reason: pass ? 'Assertion passed' : 'Expected output to be valid JSON',
+      assertion,
     };
   }
@@ -144,6 +159,7 @@ export async function runAssertion(
       reason: pass
         ? 'Assertion passed'
         : `Expected output to ${inverse ? 'not ' : ''}contain "${renderedValue}"`,
+      assertion,
     };
   }
@@ -160,6 +176,7 @@ export async function runAssertion(
       reason: pass
         ? 'Assertion passed'
         : `Expected output to ${inverse ? 'not ' : ''}contain one of "${renderedValue.join(', ')}"`,
+      assertion,
     };
   }
@@ -176,6 +193,7 @@ export async function runAssertion(
       reason: pass
         ? 'Assertion passed'
         : `Expected output to ${inverse ? 'not ' : ''}contain all of "${renderedValue.join(', ')}"`,
+      assertion,
     };
   }
@@ -193,6 +211,7 @@ export async function runAssertion(
       reason: pass
         ? 'Assertion passed'
         : `Expected output to ${inverse ? 'not ' : ''}match regex "${renderedValue}"`,
+      assertion,
     };
   }
@@ -209,6 +228,7 @@ export async function runAssertion(
       reason: pass
         ? 'Assertion passed'
         : `Expected output to ${inverse ? 'not ' : ''}contain "${renderedValue}"`,
+      assertion,
     };
   }
@@ -225,6 +245,7 @@ export async function runAssertion(
       reason: pass
         ? 'Assertion passed'
         : `Expected output to ${inverse ? 'not ' : ''}start with "${renderedValue}"`,
+      assertion,
     };
   }
@@ -236,6 +257,7 @@ export async function runAssertion(
       reason: pass
         ? 'Assertion passed'
         : `Expected output to ${inverse ? 'not ' : ''}contain valid JSON`,
+      assertion,
     };
   }
@@ -265,6 +287,7 @@ export async function runAssertion(
         score: 0,
         reason: `Custom function threw error: ${(err as Error).message}
 ${renderedValue}`,
+        assertion,
       };
     }
     return {
@@ -274,6 +297,7 @@ ${renderedValue}`,
         ? 'Assertion passed'
         : `Custom function returned ${inverse ? 'true' : 'false'}
 ${renderedValue}`,
+      assertion,
     };
   }
@@ -309,6 +333,7 @@ ${renderedValue}`,
         pass: false,
         score: 0,
         reason: `Python code execution failed: ${(err as Error).message}`,
+        assertion,
       };
     }
     return {
@@ -318,6 +343,7 @@ ${renderedValue}`,
         ? 'Assertion passed'
         : `Python code returned ${pass ? 'true' : 'false'}
 ${assertion.value}`,
+      assertion,
     };
   }
@@ -327,7 +353,10 @@ ${assertion.value}`,
       typeof renderedValue === 'string',
       '"contains" assertion type must have a string value',
     );
-    return matchesSimilarity(renderedValue, output, assertion.threshold || 0.75, inverse);
+    return {
+      assertion,
+      ...(await matchesSimilarity(renderedValue, output, assertion.threshold || 0.75, inverse)),
+    };
   }
   if (baseType === 'llm-rubric') {
@@ -336,7 +365,10 @@ ${assertion.value}`,
       typeof renderedValue === 'string',
       '"contains" assertion type must have a string value',
     );
-    return matchesLlmRubric(renderedValue, output, test.options);
+    return {
+      assertion,
+      ...(await matchesLlmRubric(renderedValue, output, test.options)),
+    };
   }
   if (baseType === 'webhook') {
@@ -378,6 +410,7 @@ ${assertion.value}`,
         pass: false,
         score: 0,
         reason: `Webhook error: ${(err as Error).message}`,
+        assertion,
       };
     }
@@ -385,6 +418,7 @@ ${assertion.value}`,
       pass,
       score,
       reason: pass ? 'Assertion passed' : `Webhook returned ${inverse ? 'true' : 'false'}`,
+      assertion,
     };
   }
@@ -422,7 +456,7 @@ export async function matchesSimilarity(
   output: string,
   threshold: number,
   inverse: boolean = false,
-): Promise<GradingResult> {
+): Promise<Omit<GradingResult, 'assertion'>> {
   const expectedEmbedding = await DefaultEmbeddingProvider.callEmbeddingApi(expected);
   const outputEmbedding = await DefaultEmbeddingProvider.callEmbeddingApi(output);
@@ -477,7 +511,7 @@ export async function matchesLlmRubric(
   expected: string,
   output: string,
   options?: GradingConfig,
-): Promise<GradingResult> {
+): Promise<Omit<GradingResult, 'assertion'>> {
   if (!options) {
     throw new Error(
       'Cannot grade output without grading config. Specify --grader option or grading config.',

package/src/cache.ts CHANGED Viewed

@@ -42,10 +42,11 @@ export function getCache() {
   return cacheInstance;
 }
-export async function fetchJsonWithCache(
+export async function fetchWithCache(
   url: RequestInfo,
   options: RequestInit = {},
   timeout: number,
+  format: 'json' | 'text' = 'json',
 ): Promise<{ data: any; cached: boolean }> {
   if (!enabled) {
     const resp = await fetchWithRetries(url, options, timeout);
@@ -75,7 +76,7 @@ export async function fetchJsonWithCache(
   // Fetch the actual data and store it in the cache
   const response = await fetchWithRetries(url, options, timeout);
   try {
-    const data = await response.json();
+    const data = format === 'json' ? await response.json() : await response.text();
     if (response.ok) {
       logger.debug(`Storing ${url} response in cache: ${JSON.stringify(data)}`);
       await cache.set(cacheKey, JSON.stringify(data));

package/src/evaluator.ts CHANGED Viewed

@@ -2,13 +2,13 @@ import readline from 'readline';
 import async from 'async';
 import chalk from 'chalk';
-import nunjucks from 'nunjucks';
 import invariant from 'tiny-invariant';
 import logger from './logger';
 import telemetry from './telemetry';
 import { runAssertions } from './assertions';
 import { generatePrompts } from './suggestions';
+import { getNunjucksEngine } from './util';
 import type { SingleBar } from 'cli-progress';
 import type {
@@ -39,6 +39,8 @@ interface RunEvalOptions {
 const DEFAULT_MAX_CONCURRENCY = 4;
+const nunjucks = getNunjucksEngine();
 function generateVarCombinations(
   vars: Record<string, string | string[] | any>,
 ): Record<string, string | any[]>[] {
@@ -156,6 +158,7 @@ class Evaluator {
           this.stats.tokenUsage.completion += checkResult.tokensUsed.completion;
         }
         ret.response = processedResponse;
+        ret.gradingResult = checkResult;
       } else {
         ret.success = false;
         ret.score = 0;
@@ -464,6 +467,7 @@ class Evaluator {
           prompt: row.prompt.raw,
           latencyMs: row.latencyMs,
           tokenUsage: row.response?.tokenUsage,
+          gradingResult: row.gradingResult,
         };
       },
     );

package/src/main.ts CHANGED Viewed

@@ -286,7 +286,7 @@ async function main() {
           process.env.PROMPTFOO_DISABLE_SHARING === '1'
             ? false
             : fileConfig.sharing ?? defaultConfig.sharing ?? true,
-        defaultTest: fileConfig.defaultTest,
+        defaultTest: fileConfig.defaultTest || defaultConfig.defaultTest,
       };
       // Validation
@@ -312,7 +312,7 @@ async function main() {
         cmdObj.tests ? undefined : basePath,
       );
-      //parse testCases for each scenario
+      // Parse testCases for each scenario
       if (fileConfig.scenarios) {
         for (const scenario of fileConfig.scenarios) {
           const parsedScenarioTests: TestCase[] = await readTests(
@@ -335,8 +335,8 @@ async function main() {
           prefix: cmdObj.promptPrefix,
           suffix: cmdObj.promptSuffix,
           provider: cmdObj.grader,
-          // rubricPrompt:
-          // postprocess
+          // rubricPrompt
+          ...(config.defaultTest?.options || {}),
         },
         ...config.defaultTest,
       };

package/src/providers/azureopenai.ts CHANGED Viewed

@@ -1,5 +1,5 @@
 import logger from '../logger';
-import { fetchJsonWithCache } from '../cache';
+import { fetchWithCache } from '../cache';
 import { REQUEST_TIMEOUT_MS, parseChatPrompt } from './shared';
 import type { ApiProvider, ProviderEmbeddingResponse, ProviderResponse } from '../types.js';
@@ -61,7 +61,7 @@ export class AzureOpenAiEmbeddingProvider extends AzureOpenAiGenericProvider {
     let data,
       cached = false;
     try {
-      ({ data, cached } = (await fetchJsonWithCache(
+      ({ data, cached } = (await fetchWithCache(
         `https://${this.apiHost}/openai/deployments/${this.deploymentName}/embeddings?api-version=2023-07-01-preview`,
         {
           method: 'POST',
@@ -117,9 +117,15 @@ export class AzureOpenAiEmbeddingProvider extends AzureOpenAiGenericProvider {
 export class AzureOpenAiCompletionProvider extends AzureOpenAiGenericProvider {
   options: AzureOpenAiCompletionOptions;
-  constructor(deploymentName: string, apiKey?: string, context?: AzureOpenAiCompletionOptions) {
+  constructor(
+    deploymentName: string,
+    apiKey?: string,
+    context?: AzureOpenAiCompletionOptions,
+    id?: string,
+  ) {
     super(deploymentName, apiKey);
     this.options = context || {};
+    this.id = id ? () => id : this.id;
   }
   async callApi(prompt: string, options?: AzureOpenAiCompletionOptions): Promise<ProviderResponse> {
@@ -165,7 +171,7 @@ export class AzureOpenAiCompletionProvider extends AzureOpenAiGenericProvider {
     let data,
       cached = false;
     try {
-      ({ data, cached } = (await fetchJsonWithCache(
+      ({ data, cached } = (await fetchWithCache(
         `https://${this.apiHost}/openai/deployments/${this.deploymentName}/completions?api-version=2023-07-01-preview`,
         {
           method: 'POST',
@@ -205,9 +211,15 @@ export class AzureOpenAiCompletionProvider extends AzureOpenAiGenericProvider {
 export class AzureOpenAiChatCompletionProvider extends AzureOpenAiGenericProvider {
   options: AzureOpenAiCompletionOptions;
-  constructor(deploymentName: string, apiKey?: string, context?: AzureOpenAiCompletionOptions) {
+  constructor(
+    deploymentName: string,
+    apiKey?: string,
+    context?: AzureOpenAiCompletionOptions,
+    id?: string,
+  ) {
     super(deploymentName, apiKey);
     this.options = context || {};
+    this.id = id ? () => id : this.id;
   }
   async callApi(prompt: string, options?: AzureOpenAiCompletionOptions): Promise<ProviderResponse> {
@@ -246,7 +258,7 @@ export class AzureOpenAiChatCompletionProvider extends AzureOpenAiGenericProvide
     let data,
       cached = false;
     try {
-      ({ data, cached } = (await fetchJsonWithCache(
+      ({ data, cached } = (await fetchWithCache(
         `https://${this.apiHost}/openai/deployments/${this.deploymentName}/chat/completions?api-version=2023-07-01-preview`,
         {
           method: 'POST',

package/src/providers/llama.ts CHANGED Viewed

@@ -1,4 +1,4 @@
-import { fetchJsonWithCache } from '../cache';
+import { fetchWithCache } from '../cache';
 import { REQUEST_TIMEOUT_MS } from './shared';
 import type { ApiProvider, ProviderResponse } from '../types.js';
@@ -65,7 +65,7 @@ export class LlamaProvider implements ApiProvider {
     let response;
     try {
-      response = await fetchJsonWithCache(
+      response = await fetchWithCache(
         `${process.env.LLAMA_BASE_URL || 'http://localhost:8080'}/completion`,
         {
           method: 'POST',

package/src/providers/localai.ts CHANGED Viewed

@@ -1,5 +1,5 @@
 import logger from '../logger';
-import { fetchJsonWithCache } from '../cache';
+import { fetchWithCache } from '../cache';
 import { REQUEST_TIMEOUT_MS, parseChatPrompt } from './shared';
 import type { ApiProvider, ProviderResponse } from '../types.js';
@@ -40,7 +40,7 @@ export class LocalAiChatProvider extends LocalAiGenericProvider {
     let data,
       cached = false;
     try {
-      ({ data, cached } = (await fetchJsonWithCache(
+      ({ data, cached } = (await fetchWithCache(
         `${this.apiBaseUrl}/chat/completions`,
         {
           method: 'POST',
@@ -81,7 +81,7 @@ export class LocalAiCompletionProvider extends LocalAiGenericProvider {
     let data,
       cached = false;
     try {
-      ({ data, cached } = (await fetchJsonWithCache(
+      ({ data, cached } = (await fetchWithCache(
         `${this.apiBaseUrl}/completions`,
         {
           method: 'POST',

package/src/providers/ollama.ts ADDED Viewed

@@ -0,0 +1,88 @@
+import logger from '../logger';
+import { fetchWithCache } from '../cache';
+import type { ApiProvider, ProviderResponse } from '../types.js';
+import { REQUEST_TIMEOUT_MS } from './shared';
+interface OllamaJsonL {
+  model: string;
+  created_at: string;
+  response?: string;
+  done: boolean;
+  context?: number[];
+  total_duration?: number;
+  load_duration?: number;
+  sample_count?: number;
+  sample_duration?: number;
+  prompt_eval_count?: number;
+  prompt_eval_duration?: number;
+  eval_count?: number;
+  eval_duration?: number;
+}
+export class OllamaProvider implements ApiProvider {
+  modelName: string;
+  constructor(modelName: string) {
+    this.modelName = modelName;
+  }
+  id(): string {
+    return `ollama:${this.modelName}`;
+  }
+  toString(): string {
+    return `[Ollama Provider ${this.modelName}]`;
+  }
+  async callApi(prompt: string): Promise<ProviderResponse> {
+    const params = {
+      model: this.modelName,
+      prompt,
+    };
+    logger.debug(`Calling Ollama API: ${JSON.stringify(params)}`);
+    let response;
+    try {
+      response = await fetchWithCache(
+        `${process.env.OLLAMA_BASE_URL || 'http://localhost:11434'}/api/generate`,
+        {
+          method: 'POST',
+          headers: {
+            'Content-Type': 'application/json',
+          },
+          body: JSON.stringify(params),
+        },
+        REQUEST_TIMEOUT_MS,
+        'text',
+      );
+    } catch (err) {
+      return {
+        error: `API call error: ${String(err)}`,
+      };
+    }
+    logger.debug(`\tOllama API response: ${response.data}`);
+    try {
+      const output = response.data
+        .split('\n')
+        .map((line: string) => {
+          const parsed = JSON.parse(line) as OllamaJsonL;
+          if (parsed.response) {
+            return parsed.response;
+          }
+          return null;
+        })
+        .filter((s: string | null) => s !== null)
+        .join('');
+      return {
+        output,
+      };
+    } catch (err) {
+      return {
+        error: `API response error: ${String(err)}: ${JSON.stringify(response.data)}`,
+      };
+    }
+  }
+}

package/src/providers/openai.ts CHANGED Viewed

@@ -1,5 +1,5 @@
 import logger from '../logger';
-import { fetchJsonWithCache } from '../cache';
+import { fetchWithCache } from '../cache';
 import { REQUEST_TIMEOUT_MS, parseChatPrompt } from './shared';
 import type { ApiProvider, ProviderEmbeddingResponse, ProviderResponse } from '../types.js';
@@ -61,7 +61,7 @@ export class OpenAiEmbeddingProvider extends OpenAiGenericProvider {
     let data,
       cached = false;
     try {
-      ({ data, cached } = (await fetchJsonWithCache(
+      ({ data, cached } = (await fetchWithCache(
         `https://${this.apiHost}/v1/embeddings`,
         {
           method: 'POST',
@@ -125,12 +125,13 @@ export class OpenAiCompletionProvider extends OpenAiGenericProvider {
   options: OpenAiCompletionOptions;
-  constructor(modelName: string, apiKey?: string, context?: OpenAiCompletionOptions) {
+  constructor(modelName: string, apiKey?: string, context?: OpenAiCompletionOptions, id?: string) {
     if (!OpenAiCompletionProvider.OPENAI_COMPLETION_MODELS.includes(modelName)) {
       logger.warn(`Using unknown OpenAI completion model: ${modelName}`);
     }
     super(modelName, apiKey);
     this.options = context || {};
+    this.id = id ? () => id : this.id;
   }
   async callApi(prompt: string, options?: OpenAiCompletionOptions): Promise<ProviderResponse> {
@@ -176,7 +177,7 @@ export class OpenAiCompletionProvider extends OpenAiGenericProvider {
     let data,
       cached = false;
     try {
-      ({ data, cached } = (await fetchJsonWithCache(
+      ({ data, cached } = (await fetchWithCache(
         `https://${this.apiHost}/v1/completions`,
         {
           method: 'POST',
@@ -229,12 +230,13 @@ export class OpenAiChatCompletionProvider extends OpenAiGenericProvider {
   options: OpenAiCompletionOptions;
-  constructor(modelName: string, apiKey?: string, context?: OpenAiCompletionOptions) {
+  constructor(modelName: string, apiKey?: string, context?: OpenAiCompletionOptions, id?: string) {
     if (!OpenAiChatCompletionProvider.OPENAI_CHAT_MODELS.includes(modelName)) {
       logger.warn(`Using unknown OpenAI chat model: ${modelName}`);
     }
     super(modelName, apiKey);
     this.options = context || {};
+    this.id = id ? () => id : this.id;
   }
   async callApi(prompt: string, options?: OpenAiCompletionOptions): Promise<ProviderResponse> {
@@ -273,7 +275,7 @@ export class OpenAiChatCompletionProvider extends OpenAiGenericProvider {
     let data,
       cached = false;
     try {
-      ({ data, cached } = (await fetchJsonWithCache(
+      ({ data, cached } = (await fetchWithCache(
         `https://${this.apiHost}/v1/chat/completions`,
         {
           method: 'POST',

package/src/providers.ts CHANGED Viewed

@@ -5,6 +5,7 @@ import { AnthropicCompletionProvider } from './providers/anthropic';
 import { ReplicateProvider } from './providers/replicate';
 import { LocalAiCompletionProvider, LocalAiChatProvider } from './providers/localai';
 import { LlamaProvider } from './providers/llama';
+import { OllamaProvider } from './providers/ollama';
 import { ScriptCompletionProvider } from './providers/scriptCompletion';
 import {
   AzureOpenAiChatCompletionProvider,
@@ -44,7 +45,8 @@ export async function loadApiProviders(
           };
         } else {
           const id = Object.keys(provider)[0];
-          const context = { ...provider[id], id };
+          const providerObject = provider[id];
+          const context = { ...providerObject, id: providerObject.id || id };
           return loadApiProvider(id, context, basePath);
         }
       }),
@@ -84,9 +86,9 @@ export async function loadApiProvider(
         context?.config,
       );
     } else if (OpenAiChatCompletionProvider.OPENAI_CHAT_MODELS.includes(modelType)) {
-      return new OpenAiChatCompletionProvider(modelType, undefined, context?.config);
+      return new OpenAiChatCompletionProvider(modelType, undefined, context?.config, context?.id);
     } else if (OpenAiCompletionProvider.OPENAI_COMPLETION_MODELS.includes(modelType)) {
-      return new OpenAiCompletionProvider(modelType, undefined, context?.config);
+      return new OpenAiCompletionProvider(modelType, undefined, context?.config, context?.id);
     } else {
       throw new Error(
         `Unknown OpenAI model type: ${modelType}. Use one of the following providers: openai:chat:<model name>, openai:completion:<model name>`,
@@ -99,9 +101,19 @@ export async function loadApiProvider(
     const deploymentName = options[2];
     if (modelType === 'chat') {
-      return new AzureOpenAiChatCompletionProvider(deploymentName, undefined, context?.config);
+      return new AzureOpenAiChatCompletionProvider(
+        deploymentName,
+        undefined,
+        context?.config,
+        context?.id,
+      );
     } else if (modelType === 'completion') {
-      return new AzureOpenAiCompletionProvider(deploymentName, undefined, context?.config);
+      return new AzureOpenAiCompletionProvider(
+        deploymentName,
+        undefined,
+        context?.config,
+        context?.id,
+      );
     } else {
       throw new Error(
         `Unknown Azure OpenAI model type: ${modelType}. Use one of the following providers: openai:chat:<model name>, openai:completion:<model name>`,
@@ -137,6 +149,9 @@ export async function loadApiProvider(
   if (providerPath === 'llama' || providerPath.startsWith('llama:')) {
     const modelName = providerPath.split(':')[1];
     return new LlamaProvider(modelName, context?.config);
+  } else if (providerPath.startsWith('ollama:')) {
+    const modelName = providerPath.split(':')[1];
+    return new OllamaProvider(modelName);
   } else if (providerPath?.startsWith('localai:')) {
     const options = providerPath.split(':');
     const modelType = options[1];