npm - @ryanfw/prompt-orchestration-pipeline - Versions diffs - 0.5.0 → 0.7.0 - Mend

@ryanfw/prompt-orchestration-pipeline 0.5.0 → 0.7.0

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (67) hide show

package/README.md +1 -2
package/package.json +1 -2
package/src/api/validators/json.js +39 -0
package/src/components/DAGGrid.jsx +392 -303
package/src/components/JobCard.jsx +14 -12
package/src/components/JobDetail.jsx +54 -51
package/src/components/JobTable.jsx +72 -23
package/src/components/Layout.jsx +145 -42
package/src/components/LiveText.jsx +47 -0
package/src/components/PageSubheader.jsx +75 -0
package/src/components/TaskDetailSidebar.jsx +216 -0
package/src/components/TimerText.jsx +82 -0
package/src/components/UploadSeed.jsx +0 -70
package/src/components/ui/Logo.jsx +16 -0
package/src/components/ui/RestartJobModal.jsx +140 -0
package/src/components/ui/toast.jsx +138 -0
package/src/config/models.js +322 -0
package/src/config/statuses.js +119 -0
package/src/core/config.js +4 -34
package/src/core/file-io.js +13 -28
package/src/core/module-loader.js +54 -40
package/src/core/pipeline-runner.js +65 -26
package/src/core/status-writer.js +213 -58
package/src/core/symlink-bridge.js +57 -0
package/src/core/symlink-utils.js +94 -0
package/src/core/task-runner.js +321 -437
package/src/llm/index.js +258 -86
package/src/pages/Code.jsx +351 -0
package/src/pages/PipelineDetail.jsx +124 -15
package/src/pages/PromptPipelineDashboard.jsx +20 -88
package/src/providers/anthropic.js +83 -69
package/src/providers/base.js +52 -0
package/src/providers/deepseek.js +20 -21
package/src/providers/gemini.js +226 -0
package/src/providers/openai.js +36 -106
package/src/providers/zhipu.js +136 -0
package/src/ui/client/adapters/job-adapter.js +42 -28
package/src/ui/client/api.js +134 -0
package/src/ui/client/hooks/useJobDetailWithUpdates.js +65 -179
package/src/ui/client/index.css +15 -0
package/src/ui/client/index.html +2 -1
package/src/ui/client/main.jsx +19 -14
package/src/ui/client/time-store.js +161 -0
package/src/ui/config-bridge.js +15 -24
package/src/ui/config-bridge.node.js +15 -24
package/src/ui/dist/assets/{index-CxcrauYR.js → index-DqkbzXZ1.js} +2132 -1086
package/src/ui/dist/assets/style-DBF9NQGk.css +62 -0
package/src/ui/dist/index.html +4 -3
package/src/ui/job-reader.js +0 -108
package/src/ui/public/favicon.svg +12 -0
package/src/ui/server.js +252 -0
package/src/ui/sse-enhancer.js +0 -1
package/src/ui/transformers/list-transformer.js +32 -12
package/src/ui/transformers/status-transformer.js +29 -42
package/src/utils/dag.js +8 -4
package/src/utils/duration.js +13 -19
package/src/utils/formatters.js +27 -0
package/src/utils/geometry-equality.js +83 -0
package/src/utils/pipelines.js +5 -1
package/src/utils/time-utils.js +40 -0
package/src/utils/token-cost-calculator.js +294 -0
package/src/utils/ui.jsx +18 -20
package/src/components/ui/select.jsx +0 -27
package/src/lib/utils.js +0 -6
package/src/ui/client/hooks/useTicker.js +0 -26
package/src/ui/config-bridge.browser.js +0 -149
package/src/ui/dist/assets/style-D6K_oQ12.css +0 -62

package/src/llm/index.js CHANGED Viewed

@@ -1,7 +1,15 @@
 import { openaiChat } from "../providers/openai.js";
 import { deepseekChat } from "../providers/deepseek.js";
+import { anthropicChat } from "../providers/anthropic.js";
+import { geminiChat } from "../providers/gemini.js";
+import { zhipuChat } from "../providers/zhipu.js";
 import { EventEmitter } from "node:events";
 import { getConfig } from "../core/config.js";
+import {
+  MODEL_CONFIG,
+  DEFAULT_MODEL_BY_PROVIDER,
+  aliasToFunctionName,
+} from "../config/models.js";
 import fs from "node:fs";
 // Global mock provider instance (for demo/testing)
@@ -18,8 +26,12 @@ export function registerMockProvider(provider) {
 // Auto-register mock provider in test mode when default provider is "mock"
 function autoRegisterMockProvider() {
-  const config = getConfig();
-  if (config.llm.defaultProvider === "mock" && !mockProviderInstance) {
+  // Skip config check in tests to avoid PO_ROOT requirement
+  const isTest =
+    process.env.NODE_ENV === "test" || process.env.VITEST === "true";
+  const defaultProvider = isTest ? "mock" : getConfig().llm.defaultProvider;
+  if (defaultProvider === "mock" && !mockProviderInstance) {
     // Auto-register a basic mock provider for testing
     mockProviderInstance = {
       chat: async () => ({
@@ -40,6 +52,8 @@ export function getAvailableProviders() {
     openai: !!process.env.OPENAI_API_KEY,
     deepseek: !!process.env.DEEPSEEK_API_KEY,
     anthropic: !!process.env.ANTHROPIC_API_KEY,
+    gemini: !!process.env.GEMINI_API_KEY,
+    zhipu: !!process.env.ZHIPU_API_KEY,
     mock: !!mockProviderInstance,
   };
 }
@@ -49,36 +63,28 @@ export function estimateTokens(text) {
   return Math.ceil((text || "").length / 4);
 }
-// Calculate cost based on provider and model
+// Calculate cost based on provider and model, derived from config
 export function calculateCost(provider, model, usage) {
-  const pricing = {
-    mock: {
-      "gpt-3.5-turbo": { prompt: 0.0005, completion: 0.0015 },
-      "gpt-4": { prompt: 0.03, completion: 0.06 },
-      "gpt-4-turbo": { prompt: 0.01, completion: 0.03 },
-    },
-    openai: {
-      "gpt-5-chat-latest": { prompt: 0.015, completion: 0.06 },
-      "gpt-4": { prompt: 0.03, completion: 0.06 },
-      "gpt-4-turbo": { prompt: 0.01, completion: 0.03 },
-      "gpt-3.5-turbo": { prompt: 0.0005, completion: 0.0015 },
-    },
-    deepseek: {
-      "deepseek-reasoner": { prompt: 0.001, completion: 0.002 },
-      "deepseek-chat": { prompt: 0.0005, completion: 0.001 },
-    },
-    anthropic: {
-      "claude-3-opus": { prompt: 0.015, completion: 0.075 },
-      "claude-3-sonnet": { prompt: 0.003, completion: 0.015 },
-    },
-  };
+  if (!usage) {
+    // Fallback for missing usage
+    return 0;
+  }
+  const modelConfig = Object.values(MODEL_CONFIG).find(
+    (cfg) => cfg.provider === provider && cfg.model === model
+  );
+  if (!modelConfig) {
+    return 0;
+  }
-  const modelPricing = pricing[provider]?.[model];
-  if (!modelPricing || !usage) return 0;
+  // Convert per-million pricing to per-1k for calculation
+  const promptCostPer1k = modelConfig.tokenCostInPerMillion / 1000;
+  const completionCostPer1k = modelConfig.tokenCostOutPerMillion / 1000;
-  const promptCost = ((usage.promptTokens || 0) / 1000) * modelPricing.prompt;
+  const promptCost = ((usage.promptTokens || 0) / 1000) * promptCostPer1k;
   const completionCost =
-    ((usage.completionTokens || 0) / 1000) * modelPricing.completion;
+    ((usage.completionTokens || 0) / 1000) * completionCostPer1k;
   return promptCost + completionCost;
 }
@@ -92,6 +98,11 @@ export async function chat(options) {
     temperature,
     maxTokens,
     metadata = {},
+    topP,
+    frequencyPenalty,
+    presencePenalty,
+    stop,
+    responseFormat,
     ...rest
   } = options;
@@ -107,12 +118,15 @@ export async function chat(options) {
   const startTime = Date.now();
   const requestId = `req_${Date.now()}_${Math.random().toString(36).substring(7)}`;
+  // Default to JSON mode if not specified
+  const finalResponseFormat = responseFormat ?? "json";
   // Extract system and user messages
   const systemMsg = messages.find((m) => m.role === "system")?.content || "";
   const userMessages = messages.filter((m) => m.role === "user");
   const userMsg = userMessages.map((m) => m.content).join("\n");
-  // DEBUG write the messages to /tmp/messages.log for debugging
+  // DEBUG write_to_file messages to /tmp/messages.log for debugging
   fs.writeFileSync(
     "/tmp/messages.log",
     JSON.stringify({ messages, systemMsg, userMsg, provider, model }, null, 2)
@@ -157,52 +171,210 @@ export async function chat(options) {
         totalTokens: result.usage.total_tokens,
       };
     } else if (provider === "openai") {
-      const result = await openaiChat({
+      const openaiArgs = {
         messages,
         model: model || "gpt-5-chat-latest",
+        temperature,
         maxTokens,
+        ...rest,
+      };
+      openaiArgs.responseFormat = finalResponseFormat;
+      if (topP !== undefined) openaiArgs.topP = topP;
+      if (frequencyPenalty !== undefined)
+        openaiArgs.frequencyPenalty = frequencyPenalty;
+      if (presencePenalty !== undefined)
+        openaiArgs.presencePenalty = presencePenalty;
+      if (stop !== undefined) openaiArgs.stop = stop;
+      const result = await openaiChat(openaiArgs);
+      response = {
+        content:
+          result?.content ??
+          (typeof result === "string" ? result : String(result)),
+        raw: result?.raw ?? result,
+      };
+      // Use provider usage if available; otherwise estimate tokens
+      if (result?.usage) {
+        const { prompt_tokens, completion_tokens, total_tokens } = result.usage;
+        usage = {
+          promptTokens: prompt_tokens,
+          completionTokens: completion_tokens,
+          totalTokens: total_tokens,
+        };
+      } else {
+        const promptTokens = estimateTokens(systemMsg + userMsg);
+        const completionTokens = estimateTokens(response.content);
+        usage = {
+          promptTokens,
+          completionTokens,
+          totalTokens: promptTokens + completionTokens,
+        };
+      }
+    } else if (provider === "deepseek") {
+      const deepseekArgs = {
+        messages,
+        model: model || "deepseek-reasoner",
         temperature,
+        maxTokens,
         ...rest,
-      });
+      };
+      if (topP !== undefined) deepseekArgs.topP = topP;
+      if (frequencyPenalty !== undefined)
+        deepseekArgs.frequencyPenalty = frequencyPenalty;
+      if (presencePenalty !== undefined)
+        deepseekArgs.presencePenalty = presencePenalty;
+      if (stop !== undefined) deepseekArgs.stop = stop;
+      deepseekArgs.responseFormat = finalResponseFormat;
+      const result = await deepseekChat(deepseekArgs);
       response = {
-        content: typeof result === "string" ? result : JSON.stringify(result),
-        raw: result,
+        content: result.content,
       };
-      // Estimate tokens since GPT-5 responses API might not return usage
-      const promptTokens = estimateTokens(systemMsg + userMsg);
-      const completionTokens = estimateTokens(response.content);
-      usage = {
-        promptTokens,
-        completionTokens,
-        totalTokens: promptTokens + completionTokens,
+      // Use actual usage from deepseek API if available; otherwise estimate
+      if (result?.usage) {
+        const { prompt_tokens, completion_tokens, total_tokens } = result.usage;
+        usage = {
+          promptTokens: prompt_tokens,
+          completionTokens: completion_tokens,
+          totalTokens: total_tokens,
+        };
+      } else {
+        const promptTokens = estimateTokens(systemMsg + userMsg);
+        const completionTokens = estimateTokens(
+          typeof result === "string" ? result : JSON.stringify(result)
+        );
+        usage = {
+          promptTokens,
+          completionTokens,
+          totalTokens: promptTokens + completionTokens,
+        };
+      }
+    } else if (provider === "anthropic") {
+      const defaultAlias = DEFAULT_MODEL_BY_PROVIDER.anthropic;
+      const defaultModelConfig = MODEL_CONFIG[defaultAlias];
+      const defaultModel = defaultModelConfig?.model;
+      const anthropicArgs = {
+        messages,
+        model: model || defaultModel,
+        temperature,
+        maxTokens,
+        ...rest,
       };
-    } else if (provider === "deepseek") {
-      const result = await deepseekChat(
-        {
-          messages,
-          model: "deepseek-chat",
-        }
-        // systemMsg,
-        // userMsg,
-        // model || "deepseek-reasoner"
-      );
+      if (topP !== undefined) anthropicArgs.topP = topP;
+      if (stop !== undefined) anthropicArgs.stop = stop;
+      anthropicArgs.responseFormat = finalResponseFormat;
+      const result = await anthropicChat(anthropicArgs);
       response = {
         content: result.content,
+        raw: result.raw,
       };
-      const promptTokens = estimateTokens(systemMsg + userMsg);
-      const completionTokens = estimateTokens(
-        typeof result === "string" ? result : JSON.stringify(result)
-      );
-      usage = {
-        promptTokens,
-        completionTokens,
-        totalTokens: promptTokens + completionTokens,
+      // Use actual usage from anthropic API if available; otherwise estimate
+      if (result?.usage) {
+        const { prompt_tokens, completion_tokens, total_tokens } = result.usage;
+        usage = {
+          promptTokens: prompt_tokens,
+          completionTokens: completion_tokens,
+          totalTokens: total_tokens,
+        };
+      } else {
+        const promptTokens = estimateTokens(systemMsg + userMsg);
+        const completionTokens = estimateTokens(
+          typeof result === "string" ? result : JSON.stringify(result)
+        );
+        usage = {
+          promptTokens,
+          completionTokens,
+          totalTokens: promptTokens + completionTokens,
+        };
+      }
+    } else if (provider === "gemini") {
+      const geminiArgs = {
+        messages,
+        model: model || "gemini-2.5-flash",
+        temperature,
+        maxTokens,
+        ...rest,
       };
+      if (topP !== undefined) geminiArgs.topP = topP;
+      if (stop !== undefined) geminiArgs.stop = stop;
+      geminiArgs.responseFormat = finalResponseFormat;
+      const result = await geminiChat(geminiArgs);
+      response = {
+        content: result.content,
+        raw: result.raw,
+      };
+      // Use actual usage from gemini API if available; otherwise estimate
+      if (result?.usage) {
+        const { prompt_tokens, completion_tokens, total_tokens } = result.usage;
+        usage = {
+          promptTokens: prompt_tokens,
+          completionTokens: completion_tokens,
+          totalTokens: total_tokens,
+        };
+      } else {
+        const promptTokens = estimateTokens(systemMsg + userMsg);
+        const completionTokens = estimateTokens(
+          typeof result === "string" ? result : JSON.stringify(result)
+        );
+        usage = {
+          promptTokens,
+          completionTokens,
+          totalTokens: promptTokens + completionTokens,
+        };
+      }
+    } else if (provider === "zhipu") {
+      const defaultAlias = DEFAULT_MODEL_BY_PROVIDER.zhipu;
+      const defaultModelConfig = MODEL_CONFIG[defaultAlias];
+      const defaultModel = defaultModelConfig?.model;
+      const zhipuArgs = {
+        messages,
+        model: model || defaultModel,
+        temperature,
+        maxTokens,
+        ...rest,
+      };
+      if (topP !== undefined) zhipuArgs.topP = topP;
+      if (stop !== undefined) zhipuArgs.stop = stop;
+      zhipuArgs.responseFormat = finalResponseFormat;
+      const result = await zhipuChat(zhipuArgs);
+      response = {
+        content: result.content,
+        raw: result.raw,
+      };
+      // Use actual usage from zhipu API if available; otherwise estimate
+      if (result?.usage) {
+        const { prompt_tokens, completion_tokens, total_tokens } = result.usage;
+        usage = {
+          promptTokens: prompt_tokens,
+          completionTokens: completion_tokens,
+          totalTokens: total_tokens,
+        };
+      } else {
+        const promptTokens = estimateTokens(systemMsg + userMsg);
+        const completionTokens = estimateTokens(
+          typeof result === "string" ? result : JSON.stringify(result)
+        );
+        usage = {
+          promptTokens,
+          completionTokens,
+          totalTokens: promptTokens + completionTokens,
+        };
+      }
     } else {
       throw new Error(`Provider ${provider} not yet implemented`);
     }
@@ -222,8 +394,11 @@ export async function chat(options) {
       timestamp: new Date().toISOString(),
     });
-    // Return clean response - no metrics attached!
-    return response;
+    // Return clean response with usage - no metrics attached!
+    return {
+      ...response,
+      usage,
+    };
   } catch (error) {
     const duration = Date.now() - startTime;
@@ -242,19 +417,6 @@ export async function chat(options) {
   }
 }
-// Helper to convert model alias to camelCase function name
-function toCamelCase(alias) {
-  const [provider, ...modelParts] = alias.split(":");
-  const model = modelParts.join("-");
-  // Convert to camelCase (handle both letters and numbers after hyphens)
-  const camelModel = model.replace(/-([a-z0-9])/g, (match, char) =>
-    char.toUpperCase()
-  );
-  return camelModel;
-}
 // Build provider-grouped functions from registry
 function buildProviderFunctions(models) {
   const functions = {};
@@ -274,7 +436,7 @@ function buildProviderFunctions(models) {
     functions[provider] = {};
     for (const [alias, modelConfig] of Object.entries(providerModels)) {
-      const functionName = toCamelCase(alias);
+      const functionName = aliasToFunctionName(alias);
       functions[provider][functionName] = (options = {}) => {
         // Respect provider overrides in options (last-write-wins)
@@ -299,8 +461,11 @@ function buildProviderFunctions(models) {
 // Helper function for single prompt completion
 export async function complete(prompt, options = {}) {
-  const config = getConfig();
-  const defaultProvider = options.provider || config.llm.defaultProvider;
+  // Skip config check in tests to avoid PO_ROOT requirement
+  const isTest =
+    process.env.NODE_ENV === "test" || process.env.VITEST === "true";
+  const defaultProvider =
+    options.provider || (isTest ? "openai" : getConfig().llm.defaultProvider);
   return chat({
     provider: defaultProvider,
@@ -407,21 +572,28 @@ export async function parallel(workerFn, items, concurrency = 5) {
 // Create a bound LLM interface - for named-models tests, only return provider functions
 export function createLLM() {
-  const config = getConfig();
-  // Build functions from registry
-  const providerFunctions = buildProviderFunctions(config.llm.models);
+  // Build functions from centralized registry
+  const providerFunctions = buildProviderFunctions(MODEL_CONFIG);
   return providerFunctions;
 }
+// Create named models API (explicit function for clarity)
+export function createNamedModelsAPI() {
+  return buildProviderFunctions(MODEL_CONFIG);
+}
 // Separate function for high-level LLM interface (used by llm.test.js)
 export function createHighLevelLLM(options = {}) {
-  const config = getConfig();
-  const defaultProvider = options.defaultProvider || config.llm.defaultProvider;
-  // Build functions from registry
-  const providerFunctions = buildProviderFunctions(config.llm.models);
+  // Skip config check in tests to avoid PO_ROOT requirement
+  const isTest =
+    process.env.NODE_ENV === "test" || process.env.VITEST === "true";
+  const config = isTest ? { llm: { defaultProvider: "openai" } } : getConfig();
+  const defaultProvider =
+    options.defaultProvider || (isTest ? "openai" : config.llm.defaultProvider);
+  // Build functions from centralized registry
+  const providerFunctions = buildProviderFunctions(MODEL_CONFIG);
   return {
     // High-level interface methods