npm - compress-lightreach - Versions diffs - 1.0.8 → 1.0.9 - Mend

compress-lightreach 1.0.8 → 1.0.9

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (6) hide show

package/README.md CHANGED Viewed

@@ -1,6 +1,6 @@
 # Compress Light Reach
-**AI cost management SDK with intelligent model routing, prompt compression, and real-time token tracking**
+**OpenAI-compatible LLM routing + compression SDK (superset responses with LightReach metadata)**
 [![npm version](https://badge.fury.io/js/compress-lightreach.svg)](https://badge.fury.io/js/compress-lightreach)
 [![Node.js 14+](https://img.shields.io/badge/node-14+-blue.svg)](https://nodejs.org/)
@@ -52,7 +52,7 @@ const result = await client.complete({
   tags: { team: 'backend', environment: 'production' },
 });
-console.log(result.decompressed_response);
+console.log(result.choices[0].message.content);
 console.log(`Selected: ${result.routing_info?.selected_model}`);
 console.log(`Token savings: ${result.compression_stats.token_savings}`);
 ```
@@ -162,7 +162,7 @@ const result = await client.complete({
   compress_output: true,
 });
-console.log(result.decompressed_response);
+console.log(result.choices[0].message.content);
 ```
 ### With Compression Config
@@ -189,7 +189,7 @@ const result = await client.complete({
   tags: { team: 'backend', environment: 'production' },
 });
-console.log(result.decompressed_response);
+console.log(result.choices[0].message.content);
 console.log(`Model used: ${result.routing_info?.selected_model}`);
 ```
@@ -276,8 +276,21 @@ For direct synchronous calls, use `completeSync()` instead.
 ```typescript
 {
-  content: string;                   // Final response content
-  decompressed_response: string;     // Final decompressed LLM response
+  id: string;                        // OpenAI-style completion id
+  object: "chat.completion";
+  created: number;                   // Unix timestamp
+  model: string;
+  choices: Array<{
+    index: number;
+    message: { role: "assistant"; content: string | null; tool_calls?: any[] };
+    finish_reason: string | null;
+  }>;
+  usage: {
+    prompt_tokens: number;
+    completion_tokens: number;
+    total_tokens: number;
+  };
+  content: string;                   // Alias of choices[0].message.content
   compression_stats: {
     compression_enabled: boolean;
     original_tokens: number;
@@ -307,6 +320,12 @@ For direct synchronous calls, use `completeSync()` instead.
     hle_source: 'tag' | 'global' | 'none';
   };
   warnings?: string[];
+  lightreach?: {                     // Namespaced LightReach metadata extension
+    compression_stats?: object;
+    llm_stats?: object;
+    routing_info?: object;
+    latency_ms?: number | null;
+  };
   // Convenience aliases
   tokens_saved?: number;
@@ -454,7 +473,7 @@ const result = await client.complete({
   tags: { team: 'content', environment: 'production' },
 });
-console.log(result.decompressed_response);
+console.log(result.choices[0].message.content);
 console.log(`Model used: ${result.routing_info?.selected_model}`);
 console.log(`Token savings: ${result.compression_stats.token_savings} tokens`);
 console.log(`Compression ratio: ${(result.compression_stats.compression_ratio * 100).toFixed(2)}%`);
@@ -472,7 +491,7 @@ const result = await client.complete({
   compress_output: true,
 });
-console.log(result.decompressed_response);
+console.log(result.choices[0].message.content);
 ```
 ### Example 3: Multi-turn Conversation

package/dist/api-client.d.ts CHANGED Viewed

@@ -28,7 +28,27 @@ export interface DecompressResponse {
     processing_time_ms: number;
 }
 export interface CompleteResponse {
+    id: string;
+    object: 'chat.completion';
+    created: number;
+    model: string;
+    choices: Array<{
+        index: number;
+        message: {
+            role: 'assistant';
+            content: string | null;
+            tool_calls?: Array<Record<string, any>>;
+        };
+        finish_reason: string | null;
+    }>;
+    usage: {
+        prompt_tokens: number;
+        completion_tokens: number;
+        total_tokens: number;
+    };
     content: string;
+    decompressed_response?: string;
+    text?: string;
     compression_stats: {
         compression_enabled: boolean;
         original_tokens: number;
@@ -75,6 +95,7 @@ export interface CompleteResponse {
     model_hle?: number | null;
     input_price_per_million?: number | null;
     output_price_per_million?: number | null;
+    lightreach?: Record<string, any>;
 }
 export type MessageRole = 'system' | 'developer' | 'user' | 'assistant';
 export interface Message {
@@ -152,6 +173,7 @@ export declare class PcompresslrAPIClient {
     private session;
     constructor(apiKey?: string, apiUrl?: string, timeout?: number);
     private makeRequest;
+    private toOpenAISupersetResponse;
     /**
      * Create async /complete job (POST /api/v1/complete/jobs).
      */

package/dist/api-client.js CHANGED Viewed

@@ -141,6 +141,65 @@ class PcompresslrAPIClient {
             throw new APIRequestError(`Request failed: ${errorMessage}`);
         }
     }
+    toOpenAISupersetResponse(raw) {
+        const response = (raw && typeof raw === 'object') ? { ...raw } : {};
+        const llmStats = (response.llm_stats && typeof response.llm_stats === 'object') ? response.llm_stats : {};
+        const routingInfo = (response.routing_info && typeof response.routing_info === 'object') ? response.routing_info : {};
+        const content = (typeof response.content === 'string' && response.content) ||
+            (typeof response.decompressed_response === 'string' && response.decompressed_response) ||
+            (typeof response.text === 'string' && response.text) ||
+            '';
+        const model = response.model ||
+            response.model_used ||
+            routingInfo.selected_model ||
+            llmStats.model ||
+            'lightreach';
+        const promptTokens = Number(llmStats.input_tokens ?? 0) || 0;
+        const completionTokens = Number(llmStats.output_tokens ?? 0) || 0;
+        const totalTokens = Number(llmStats.total_tokens ?? (promptTokens + completionTokens)) || (promptTokens + completionTokens);
+        const finishReason = llmStats.finish_reason ?? 'stop';
+        const message = { role: 'assistant', content };
+        if (Array.isArray(response.tool_calls) && response.tool_calls.length > 0) {
+            message.tool_calls = response.tool_calls;
+            if (!content)
+                message.content = null;
+        }
+        response.id = String(response.id || `chatcmpl-${Math.random().toString(16).slice(2)}${Date.now().toString(16)}`);
+        response.object = 'chat.completion';
+        response.created = Number(response.created || Math.floor(Date.now() / 1000));
+        response.model = String(model);
+        response.choices = Array.isArray(response.choices)
+            ? response.choices
+            : [{ index: 0, message, finish_reason: finishReason }];
+        response.usage = (response.usage && typeof response.usage === 'object')
+            ? response.usage
+            : {
+                prompt_tokens: promptTokens,
+                completion_tokens: completionTokens,
+                total_tokens: totalTokens,
+            };
+        response.content = content;
+        if (response.decompressed_response === undefined)
+            response.decompressed_response = content;
+        if (response.text === undefined)
+            response.text = content;
+        response.lightreach = {
+            content,
+            compression_stats: response.compression_stats,
+            llm_stats: response.llm_stats,
+            routing_info: response.routing_info,
+            warnings: response.warnings,
+            tokens_saved: response.tokens_saved,
+            tokens_used: response.tokens_used,
+            compression_ratio: response.compression_ratio,
+            cost_estimate: response.cost_estimate,
+            savings_estimate: response.savings_estimate,
+            provider_used: response.provider_used,
+            model_used: response.model_used,
+            latency_ms: llmStats.latency_ms ?? null,
+        };
+        return response;
+    }
     /**
      * Create async /complete job (POST /api/v1/complete/jobs).
      */
@@ -193,7 +252,7 @@ class PcompresslrAPIClient {
             const st = await this.getCompleteJob(jobId);
             if (st.status === 'succeeded') {
                 if (st.result)
-                    return st.result;
+                    return this.toOpenAISupersetResponse(st.result);
                 throw new APIRequestError('Async job succeeded but result was missing.');
             }
             if (st.status === 'failed' || st.status === 'canceled') {
@@ -285,7 +344,8 @@ class PcompresslrAPIClient {
             data.auto_select_by_hle = request.auto_select_by_hle;
         if (request.same_provider_only !== undefined)
             data.same_provider_only = request.same_provider_only;
-        return this.makeRequest('/api/v2/complete', data, 'POST');
+        const raw = await this.makeRequest('/api/v2/complete', data, 'POST');
+        return this.toOpenAISupersetResponse(raw);
     }
     /**
      * Messages-first complete with intelligent model selection.

package/dist/index.d.ts CHANGED Viewed

@@ -1,5 +1,5 @@
 /**
- * Compress Light Reach - Intelligent compression algorithms for LLM prompts.
+ * Compress Light Reach - OpenAI-compatible routing + compression SDK.
  */
 export { __version__ } from './version';
 export { LightReach, Pcompresslr } from './core';

package/dist/index.js CHANGED Viewed

@@ -1,6 +1,6 @@
 "use strict";
 /**
- * Compress Light Reach - Intelligent compression algorithms for LLM prompts.
+ * Compress Light Reach - OpenAI-compatible routing + compression SDK.
  */
 Object.defineProperty(exports, "__esModule", { value: true });
 exports.PcompresslrAPIError = exports.APIRequestError = exports.RateLimitError = exports.APIKeyError = exports.PcompresslrAPIClient = exports.Pcompresslr = exports.LightReach = exports.__version__ = void 0;

package/package.json CHANGED Viewed

@@ -1,7 +1,7 @@
 {
   "name": "compress-lightreach",
-  "version": "1.0.8",
-  "description": "AI cost management SDK with intelligent model routing, prompt compression, and real-time token tracking",
+  "version": "1.0.9",
+  "description": "OpenAI-compatible LLM routing and compression SDK with LightReach metadata extensions",
   "main": "dist/index.js",
   "types": "dist/index.d.ts",
   "bin": {