npm - @llmops/app - Versions diffs - 0.3.3 → 0.3.4-beta.1 - Mend

@llmops/app 0.3.3 → 0.3.4-beta.1

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (3) hide show

package/dist/index.cjs CHANGED Viewed

@@ -16432,7 +16432,8 @@ async function handleDirectProviderRequest(c, next, originalBody, providerSlug,
 		...originalBody,
 		model: modelName
 	};
-	delete updatedBody.input;
+	const path$1 = c.req.path;
+	if (path$1.endsWith("/chat/completions") || path$1.endsWith("/completions")) delete updatedBody.input;
 	const newHeaders = new Headers(c.req.raw.headers);
 	newHeaders.set("x-llmops-config", JSON.stringify(portkeyConfig));
 	if (portkeyConfig.default_input_guardrails) newHeaders.set("x-portkey-default-input-guardrails", JSON.stringify(portkeyConfig.default_input_guardrails));
@@ -16474,7 +16475,7 @@ const createGatewayAdapterMiddleware = () => {
 		const method = c.req.method;
 		const contentType = c.req.header("content-type")?.split(";")[0];
 		const isChatRequest = method === "POST" && contentType === "application/json" && (path$1.endsWith("/chat/completions") || path$1.endsWith("/completions"));
-		if (!configId && isChatRequest) {
+		if (!configId && method === "POST" && contentType === "application/json") {
 			try {
 				const body = await c.req.json();
 				const model = body.model;
@@ -16643,13 +16644,17 @@ function createStreamingCostExtractor() {
 				};
 			}
 			const usageData = parsed;
-			if (usageData.usage) extractedUsage = {
-				promptTokens: usageData.usage.prompt_tokens ?? 0,
-				completionTokens: usageData.usage.completion_tokens ?? 0,
-				totalTokens: usageData.usage.total_tokens ?? 0,
-				cachedTokens: usageData.usage.prompt_tokens_details?.cached_tokens,
-				hookResults: extractedHookResults
-			};
+			if (usageData.usage) {
+				const promptTokens = usageData.usage.prompt_tokens ?? usageData.usage.input_tokens ?? 0;
+				const completionTokens = usageData.usage.completion_tokens ?? usageData.usage.output_tokens ?? 0;
+				extractedUsage = {
+					promptTokens,
+					completionTokens,
+					totalTokens: usageData.usage.total_tokens ?? promptTokens + completionTokens,
+					cachedTokens: usageData.usage.prompt_tokens_details?.cached_tokens ?? usageData.usage.input_tokens_details?.cached_tokens,
+					hookResults: extractedHookResults
+				};
+			}
 		} catch {}
 	}
 	return {
@@ -16965,7 +16970,18 @@ function createCostTrackingMiddleware(config$1 = {}) {
 	return async (c, next) => {
 		if (!enabled) return next();
 		const path$1 = c.req.path;
-		if (!path$1.endsWith("/chat/completions") && !path$1.endsWith("/completions")) return next();
+		if (![
+			"/chat/completions",
+			"/completions",
+			"/responses",
+			"/embeddings",
+			"/images/generations",
+			"/images/edits",
+			"/audio/speech",
+			"/audio/transcriptions",
+			"/audio/translations",
+			"/messages"
+		].some((endpoint) => path$1.endsWith(endpoint) || endpoint === "/responses" && path$1.match(/\/responses\/[^/]+$/))) return next();
 		const requestId = (0, node_crypto.randomUUID)();
 		const startTime = Date.now();
 		c.header("x-llmops-request-id", requestId);
@@ -17061,12 +17077,16 @@ function createCostTrackingMiddleware(config$1 = {}) {
 			let guardrailResults = null;
 			try {
 				const responseBody = await response.clone().json();
-				if (responseBody.usage) usage = {
-					promptTokens: responseBody.usage.prompt_tokens || 0,
-					completionTokens: responseBody.usage.completion_tokens || 0,
-					totalTokens: responseBody.usage.total_tokens || 0,
-					cachedTokens: responseBody.usage.prompt_tokens_details?.cached_tokens
-				};
+				if (responseBody.usage) {
+					const promptTokens = responseBody.usage.prompt_tokens ?? responseBody.usage.input_tokens ?? 0;
+					const completionTokens = responseBody.usage.completion_tokens ?? responseBody.usage.output_tokens ?? 0;
+					usage = {
+						promptTokens,
+						completionTokens,
+						totalTokens: responseBody.usage.total_tokens || promptTokens + completionTokens,
+						cachedTokens: responseBody.usage.prompt_tokens_details?.cached_tokens ?? responseBody.usage.input_tokens_details?.cached_tokens
+					};
+				}
 				if (responseBody.hook_results) {
 					const wasBlocked = statusCode === 446;
 					guardrailResults = transformHookResultsToGuardrailResults(responseBody.hook_results, wasBlocked);

package/dist/index.mjs CHANGED Viewed

@@ -16404,7 +16404,8 @@ async function handleDirectProviderRequest(c, next, originalBody, providerSlug,
 		...originalBody,
 		model: modelName
 	};
-	delete updatedBody.input;
+	const path = c.req.path;
+	if (path.endsWith("/chat/completions") || path.endsWith("/completions")) delete updatedBody.input;
 	const newHeaders = new Headers(c.req.raw.headers);
 	newHeaders.set("x-llmops-config", JSON.stringify(portkeyConfig));
 	if (portkeyConfig.default_input_guardrails) newHeaders.set("x-portkey-default-input-guardrails", JSON.stringify(portkeyConfig.default_input_guardrails));
@@ -16446,7 +16447,7 @@ const createGatewayAdapterMiddleware = () => {
 		const method = c.req.method;
 		const contentType = c.req.header("content-type")?.split(";")[0];
 		const isChatRequest = method === "POST" && contentType === "application/json" && (path.endsWith("/chat/completions") || path.endsWith("/completions"));
-		if (!configId && isChatRequest) {
+		if (!configId && method === "POST" && contentType === "application/json") {
 			try {
 				const body = await c.req.json();
 				const model = body.model;
@@ -16615,13 +16616,17 @@ function createStreamingCostExtractor() {
 				};
 			}
 			const usageData = parsed;
-			if (usageData.usage) extractedUsage = {
-				promptTokens: usageData.usage.prompt_tokens ?? 0,
-				completionTokens: usageData.usage.completion_tokens ?? 0,
-				totalTokens: usageData.usage.total_tokens ?? 0,
-				cachedTokens: usageData.usage.prompt_tokens_details?.cached_tokens,
-				hookResults: extractedHookResults
-			};
+			if (usageData.usage) {
+				const promptTokens = usageData.usage.prompt_tokens ?? usageData.usage.input_tokens ?? 0;
+				const completionTokens = usageData.usage.completion_tokens ?? usageData.usage.output_tokens ?? 0;
+				extractedUsage = {
+					promptTokens,
+					completionTokens,
+					totalTokens: usageData.usage.total_tokens ?? promptTokens + completionTokens,
+					cachedTokens: usageData.usage.prompt_tokens_details?.cached_tokens ?? usageData.usage.input_tokens_details?.cached_tokens,
+					hookResults: extractedHookResults
+				};
+			}
 		} catch {}
 	}
 	return {
@@ -16937,7 +16942,18 @@ function createCostTrackingMiddleware(config$1 = {}) {
 	return async (c, next) => {
 		if (!enabled) return next();
 		const path = c.req.path;
-		if (!path.endsWith("/chat/completions") && !path.endsWith("/completions")) return next();
+		if (![
+			"/chat/completions",
+			"/completions",
+			"/responses",
+			"/embeddings",
+			"/images/generations",
+			"/images/edits",
+			"/audio/speech",
+			"/audio/transcriptions",
+			"/audio/translations",
+			"/messages"
+		].some((endpoint) => path.endsWith(endpoint) || endpoint === "/responses" && path.match(/\/responses\/[^/]+$/))) return next();
 		const requestId = randomUUID();
 		const startTime = Date.now();
 		c.header("x-llmops-request-id", requestId);
@@ -17033,12 +17049,16 @@ function createCostTrackingMiddleware(config$1 = {}) {
 			let guardrailResults = null;
 			try {
 				const responseBody = await response.clone().json();
-				if (responseBody.usage) usage = {
-					promptTokens: responseBody.usage.prompt_tokens || 0,
-					completionTokens: responseBody.usage.completion_tokens || 0,
-					totalTokens: responseBody.usage.total_tokens || 0,
-					cachedTokens: responseBody.usage.prompt_tokens_details?.cached_tokens
-				};
+				if (responseBody.usage) {
+					const promptTokens = responseBody.usage.prompt_tokens ?? responseBody.usage.input_tokens ?? 0;
+					const completionTokens = responseBody.usage.completion_tokens ?? responseBody.usage.output_tokens ?? 0;
+					usage = {
+						promptTokens,
+						completionTokens,
+						totalTokens: responseBody.usage.total_tokens || promptTokens + completionTokens,
+						cachedTokens: responseBody.usage.prompt_tokens_details?.cached_tokens ?? responseBody.usage.input_tokens_details?.cached_tokens
+					};
+				}
 				if (responseBody.hook_results) {
 					const wasBlocked = statusCode === 446;
 					guardrailResults = transformHookResultsToGuardrailResults(responseBody.hook_results, wasBlocked);

package/package.json CHANGED Viewed

@@ -1,6 +1,6 @@
 {
   "name": "@llmops/app",
-  "version": "0.3.3",
+  "version": "0.3.4-beta.1",
   "description": "LLMOps application with server and client",
   "type": "module",
   "license": "Apache-2.0",
@@ -67,8 +67,8 @@
     "react-aria-components": "^1.13.0",
     "react-hook-form": "^7.68.0",
     "recharts": "^3.6.0",
-    "@llmops/core": "^0.3.3",
-    "@llmops/gateway": "^0.3.3"
+    "@llmops/core": "^0.3.4-beta.1",
+    "@llmops/gateway": "^0.3.4-beta.1"
   },
   "peerDependencies": {
     "react": "^19.2.1",