npm - lynkr - Versions diffs - 8.0.0 → 9.0.1 - Mend

lynkr 8.0.0 → 9.0.1

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (128) hide show

package/.lynkr/telemetry.db +0 -0
package/.lynkr/telemetry.db-shm +0 -0
package/.lynkr/telemetry.db-wal +0 -0
package/README.md +196 -322
package/lynkr-skill.tar.gz +0 -0
package/package.json +4 -3
package/src/api/openai-router.js +64 -13
package/src/api/providers-handler.js +171 -3
package/src/api/router.js +9 -2
package/src/clients/circuit-breaker.js +10 -247
package/src/clients/codex-process.js +342 -0
package/src/clients/codex-utils.js +143 -0
package/src/clients/databricks.js +210 -63
package/src/clients/resilience.js +540 -0
package/src/clients/retry.js +22 -167
package/src/clients/standard-tools.js +23 -0
package/src/config/index.js +77 -0
package/src/context/compression.js +42 -9
package/src/context/distill.js +492 -0
package/src/orchestrator/index.js +48 -8
package/src/routing/complexity-analyzer.js +258 -5
package/src/routing/index.js +12 -2
package/src/routing/latency-tracker.js +148 -0
package/src/routing/model-tiers.js +2 -0
package/src/routing/quality-scorer.js +113 -0
package/src/routing/telemetry.js +464 -0
package/src/server.js +13 -12
package/src/tools/code-graph.js +538 -0
package/src/tools/code-mode.js +304 -0
package/src/tools/index.js +4 -0
package/src/tools/lazy-loader.js +18 -0
package/src/tools/mcp-remote.js +7 -0
package/src/tools/smart-selection.js +11 -0
package/src/tools/tinyfish.js +358 -0
package/src/tools/truncate.js +1 -0
package/src/utils/payload.js +206 -0
package/src/utils/perf-timer.js +80 -0
package/.github/FUNDING.yml +0 -15
package/.github/workflows/README.md +0 -215
package/.github/workflows/ci.yml +0 -69
package/.github/workflows/index.yml +0 -62
package/.github/workflows/web-tools-tests.yml +0 -56
package/CITATIONS.bib +0 -6
package/DEPLOYMENT.md +0 -1001
package/LYNKR-TUI-PLAN.md +0 -984
package/PERFORMANCE-REPORT.md +0 -866
package/PLAN-per-client-model-routing.md +0 -252
package/docs/42642f749da6234f41b6b425c3bb07c9.txt +0 -1
package/docs/BingSiteAuth.xml +0 -4
package/docs/docs-style.css +0 -478
package/docs/docs.html +0 -198
package/docs/google5be250e608e6da39.html +0 -1
package/docs/index.html +0 -577
package/docs/index.md +0 -584
package/docs/robots.txt +0 -4
package/docs/sitemap.xml +0 -44
package/docs/style.css +0 -1223
package/docs/toon-integration-spec.md +0 -130
package/documentation/README.md +0 -101
package/documentation/api.md +0 -806
package/documentation/claude-code-cli.md +0 -679
package/documentation/codex-cli.md +0 -397
package/documentation/contributing.md +0 -571
package/documentation/cursor-integration.md +0 -734
package/documentation/docker.md +0 -874
package/documentation/embeddings.md +0 -762
package/documentation/faq.md +0 -713
package/documentation/features.md +0 -403
package/documentation/headroom.md +0 -519
package/documentation/installation.md +0 -758
package/documentation/memory-system.md +0 -476
package/documentation/production.md +0 -636
package/documentation/providers.md +0 -1009
package/documentation/routing.md +0 -476
package/documentation/testing.md +0 -629
package/documentation/token-optimization.md +0 -325
package/documentation/tools.md +0 -697
package/documentation/troubleshooting.md +0 -969
package/final-test.js +0 -33
package/headroom-sidecar/config.py +0 -93
package/headroom-sidecar/requirements.txt +0 -14
package/headroom-sidecar/server.py +0 -451
package/monitor-agents.sh +0 -31
package/scripts/audit-log-reader.js +0 -399
package/scripts/compact-dictionary.js +0 -204
package/scripts/test-deduplication.js +0 -448
package/src/db/database.sqlite +0 -0
package/te +0 -11622
package/test/README.md +0 -212
package/test/azure-openai-config.test.js +0 -213
package/test/azure-openai-error-resilience.test.js +0 -238
package/test/azure-openai-format-conversion.test.js +0 -354
package/test/azure-openai-integration.test.js +0 -287
package/test/azure-openai-routing.test.js +0 -175
package/test/azure-openai-streaming.test.js +0 -171
package/test/bedrock-integration.test.js +0 -457
package/test/comprehensive-test-suite.js +0 -928
package/test/config-validation.test.js +0 -207
package/test/cursor-integration.test.js +0 -484
package/test/format-conversion.test.js +0 -578
package/test/hybrid-routing-integration.test.js +0 -269
package/test/hybrid-routing-performance.test.js +0 -428
package/test/llamacpp-integration.test.js +0 -882
package/test/lmstudio-integration.test.js +0 -347
package/test/memory/extractor.test.js +0 -398
package/test/memory/retriever.test.js +0 -613
package/test/memory/retriever.test.js.bak +0 -585
package/test/memory/search.test.js +0 -537
package/test/memory/search.test.js.bak +0 -389
package/test/memory/store.test.js +0 -344
package/test/memory/store.test.js.bak +0 -312
package/test/memory/surprise.test.js +0 -300
package/test/memory-performance.test.js +0 -472
package/test/openai-integration.test.js +0 -683
package/test/openrouter-error-resilience.test.js +0 -418
package/test/passthrough-mode.test.js +0 -385
package/test/performance-benchmark.js +0 -351
package/test/performance-tests.js +0 -528
package/test/routing.test.js +0 -225
package/test/toon-compression.test.js +0 -131
package/test/web-tools.test.js +0 -329
package/test-agents-simple.js +0 -43
package/test-cli-connection.sh +0 -33
package/test-learning-unit.js +0 -126
package/test-learning.js +0 -112
package/test-parallel-agents.sh +0 -124
package/test-parallel-direct.js +0 -155
package/test-subagents.sh +0 -117

package/final-test.js DELETED Viewed

@@ -1,33 +0,0 @@
-const http = require('http');
-const data = JSON.stringify({
-  model: "claude-sonnet-4-5",
-  max_tokens: 100,
-  messages: [{ role: "user", content: "Say hello" }]
-});
-const req = http.request({
-  hostname: 'localhost',
-  port: 8081,
-  path: '/v1/messages',
-  method: 'POST',
-  headers: { 'Content-Type': 'application/json', 'Content-Length': data.length }
-}, (res) => {
-  let body = '';
-  res.on('data', chunk => body += chunk);
-  res.on('end', () => {
-    console.log('Status:', res.statusCode);
-    if (res.statusCode === 200) {
-      const json = JSON.parse(body);
-      console.log('✅ SUCCESS!');
-      console.log('Model:', json.model);
-      console.log('Response:', json.content[0].text.substring(0, 150));
-    } else {
-      console.log('❌ Error:', body.substring(0, 300));
-    }
-  });
-});
-req.on('error', e => console.error('Request failed:', e.message));
-req.write(data);
-req.end();

package/headroom-sidecar/config.py DELETED Viewed

@@ -1,93 +0,0 @@
-"""
-Headroom Sidecar Configuration
-Loads settings from environment variables
-"""
-import os
-from typing import Optional
-def str_to_bool(value: str) -> bool:
-    """Convert string to boolean"""
-    return value.lower() in ("true", "1", "yes", "on")
-class HeadroomConfig:
-    """Configuration for Headroom sidecar"""
-    def __init__(self):
-        # Server settings
-        self.host = os.environ.get("HEADROOM_HOST", "0.0.0.0")
-        self.port = int(os.environ.get("HEADROOM_PORT", "8787"))
-        self.log_level = os.environ.get("HEADROOM_LOG_LEVEL", "info")
-        # Operating mode
-        self.mode = os.environ.get("HEADROOM_MODE", "optimize")
-        self.provider = os.environ.get("HEADROOM_PROVIDER", "anthropic")
-        # Smart Crusher settings
-        self.smart_crusher_enabled = str_to_bool(
-            os.environ.get("HEADROOM_SMART_CRUSHER", "true")
-        )
-        self.smart_crusher_min_tokens = int(
-            os.environ.get("HEADROOM_SMART_CRUSHER_MIN_TOKENS", "200")
-        )
-        self.smart_crusher_max_items = int(
-            os.environ.get("HEADROOM_SMART_CRUSHER_MAX_ITEMS", "15")
-        )
-        # Tool Crusher settings
-        self.tool_crusher_enabled = str_to_bool(
-            os.environ.get("HEADROOM_TOOL_CRUSHER", "true")
-        )
-        # Cache Aligner settings
-        self.cache_aligner_enabled = str_to_bool(
-            os.environ.get("HEADROOM_CACHE_ALIGNER", "true")
-        )
-        # Rolling Window settings
-        self.rolling_window_enabled = str_to_bool(
-            os.environ.get("HEADROOM_ROLLING_WINDOW", "true")
-        )
-        self.keep_turns = int(os.environ.get("HEADROOM_KEEP_TURNS", "3"))
-        # CCR settings
-        self.ccr_enabled = str_to_bool(os.environ.get("HEADROOM_CCR", "true"))
-        self.ccr_ttl = int(os.environ.get("HEADROOM_CCR_TTL", "300"))
-        # LLMLingua settings
-        self.llmlingua_enabled = str_to_bool(
-            os.environ.get("HEADROOM_LLMLINGUA", "false")
-        )
-        self.llmlingua_device = os.environ.get("HEADROOM_LLMLINGUA_DEVICE", "auto")
-    def to_dict(self) -> dict:
-        """Return configuration as dictionary"""
-        return {
-            "host": self.host,
-            "port": self.port,
-            "log_level": self.log_level,
-            "mode": self.mode,
-            "provider": self.provider,
-            "smart_crusher": {
-                "enabled": self.smart_crusher_enabled,
-                "min_tokens": self.smart_crusher_min_tokens,
-                "max_items": self.smart_crusher_max_items,
-            },
-            "tool_crusher": {"enabled": self.tool_crusher_enabled},
-            "cache_aligner": {"enabled": self.cache_aligner_enabled},
-            "rolling_window": {
-                "enabled": self.rolling_window_enabled,
-                "keep_turns": self.keep_turns,
-            },
-            "ccr": {"enabled": self.ccr_enabled, "ttl": self.ccr_ttl},
-            "llmlingua": {
-                "enabled": self.llmlingua_enabled,
-                "device": self.llmlingua_device,
-            },
-        }
-# Global config instance
-config = HeadroomConfig()

package/headroom-sidecar/requirements.txt DELETED Viewed

@@ -1,14 +0,0 @@
-# Headroom Sidecar Dependencies
-# Core framework
-fastapi>=0.109.0
-uvicorn[standard]>=0.27.0
-pydantic>=2.5.0
-# Headroom SDK
-headroom-ai>=0.1.0
-# Optional: LLMLingua support (uncomment for ML compression)
-# llmlingua>=0.2.0
-# torch>=2.0.0
-# transformers>=4.36.0

package/headroom-sidecar/server.py DELETED Viewed

@@ -1,451 +0,0 @@
-"""
-Headroom Sidecar Server
-FastAPI application providing context compression via HTTP API
-"""
-import logging
-import time
-import hashlib
-import json
-from typing import Any, Dict, List, Optional
-from datetime import datetime
-from fastapi import FastAPI, HTTPException
-from fastapi.responses import JSONResponse
-from pydantic import BaseModel
-import uvicorn
-from config import config
-# Setup logging
-logging.basicConfig(
-    level=getattr(logging, config.log_level.upper()),
-    format="%(asctime)s - %(name)s - %(levelname)s - %(message)s",
-)
-logger = logging.getLogger("headroom-sidecar")
-# Initialize FastAPI app
-app = FastAPI(
-    title="Headroom Sidecar",
-    description="Context compression service for LLM requests",
-    version="1.0.0",
-)
-# Try to import headroom, fallback to basic compression if not available
-try:
-    from headroom import (
-        TransformPipeline,
-        SmartCrusher,
-        SmartCrusherConfig,
-        ToolCrusher,
-        ToolCrusherConfig,
-        RollingWindow,
-        RollingWindowConfig,
-        AnthropicProvider,
-        OpenAIProvider,
-    )
-    import warnings
-    warnings.filterwarnings("ignore", message=".*tiktoken approximation.*")
-    # Create transforms based on config
-    transforms = []
-    if config.smart_crusher_enabled:
-        transforms.append(SmartCrusher(SmartCrusherConfig(
-            enabled=True,
-            min_tokens_to_crush=config.smart_crusher_min_tokens,
-            max_items_after_crush=config.smart_crusher_max_items,
-        )))
-        logger.info("SmartCrusher enabled")
-    if config.tool_crusher_enabled:
-        transforms.append(ToolCrusher(ToolCrusherConfig(
-            enabled=True,
-        )))
-        logger.info("ToolCrusher enabled")
-    if config.rolling_window_enabled:
-        transforms.append(RollingWindow(RollingWindowConfig(
-            enabled=True,
-            keep_last_turns=config.keep_turns,
-        )))
-        logger.info("RollingWindow enabled")
-    # Create provider based on config
-    if config.provider == "openai":
-        headroom_provider = OpenAIProvider()
-    else:
-        headroom_provider = AnthropicProvider()
-    headroom_pipeline = TransformPipeline(transforms=transforms, provider=headroom_provider) if transforms else None
-    HEADROOM_AVAILABLE = headroom_pipeline is not None
-    logger.info(f"Headroom SDK loaded successfully with {len(transforms)} transforms (provider: {config.provider})")
-except ImportError as e:
-    logger.warning(f"Headroom SDK not available: {e}. Using basic compression.")
-    headroom_pipeline = None
-    HEADROOM_AVAILABLE = False
-# CCR Store (in-memory with TTL)
-ccr_store: Dict[str, Dict[str, Any]] = {}
-# Metrics
-metrics = {
-    "requests_total": 0,
-    "compressions_applied": 0,
-    "compressions_skipped": 0,
-    "errors": 0,
-    "ccr_stores": 0,
-    "ccr_retrievals": 0,
-    "total_tokens_before": 0,
-    "total_tokens_after": 0,
-    "start_time": datetime.utcnow().isoformat(),
-}
-# Request/Response models
-class CompressRequest(BaseModel):
-    messages: List[Dict[str, Any]]
-    tools: Optional[List[Dict[str, Any]]] = None
-    model: Optional[str] = "claude-3-5-sonnet-20241022"
-    model_limit: Optional[int] = 200000
-    mode: Optional[str] = None
-    token_budget: Optional[int] = None
-    query_context: Optional[str] = None
-    preserve_recent_turns: Optional[int] = None
-    target_ratio: Optional[float] = None
-class CompressResponse(BaseModel):
-    messages: List[Dict[str, Any]]
-    tools: Optional[List[Dict[str, Any]]] = None
-    compressed: bool
-    stats: Dict[str, Any]
-class CCRRetrieveRequest(BaseModel):
-    hash: str
-    query: Optional[str] = None
-    max_results: Optional[int] = 20
-class CCRRetrieveResponse(BaseModel):
-    success: bool
-    content: Optional[Any] = None
-    items_retrieved: int = 0
-    was_search: bool = False
-    error: Optional[str] = None
-def estimate_tokens(data: Any) -> int:
-    """Estimate token count (rough approximation: ~4 chars per token)"""
-    text = json.dumps(data) if not isinstance(data, str) else data
-    return len(text) // 4
-def generate_hash(content: Any) -> str:
-    """Generate hash for CCR storage"""
-    text = json.dumps(content, sort_keys=True)
-    return hashlib.sha256(text.encode()).hexdigest()[:12]
-def cleanup_expired_ccr():
-    """Remove expired CCR entries"""
-    now = time.time()
-    expired = [k for k, v in ccr_store.items() if now - v["timestamp"] > config.ccr_ttl]
-    for key in expired:
-        del ccr_store[key]
-def basic_compress(messages: List[Dict], tools: Optional[List] = None) -> Dict:
-    """Basic compression when Headroom SDK is not available"""
-    tokens_before = estimate_tokens(messages)
-    compressed_messages = []
-    for msg in messages:
-        compressed_msg = msg.copy()
-        # Compress large tool results
-        if msg.get("role") == "user" and isinstance(msg.get("content"), list):
-            new_content = []
-            for block in msg["content"]:
-                if block.get("type") == "tool_result":
-                    content = block.get("content", "")
-                    if isinstance(content, str) and len(content) > 2000:
-                        # Store in CCR and replace with reference
-                        hash_key = generate_hash(content)
-                        ccr_store[hash_key] = {
-                            "content": content,
-                            "timestamp": time.time(),
-                            "tool_name": block.get("tool_use_id", "unknown"),
-                        }
-                        metrics["ccr_stores"] += 1
-                        block = block.copy()
-                        block["content"] = (
-                            f"[CCR:{hash_key}] Content compressed ({len(content)} chars). "
-                            f"Use ccr_retrieve to access full content."
-                        )
-                new_content.append(block)
-            compressed_msg["content"] = new_content
-        compressed_messages.append(compressed_msg)
-    tokens_after = estimate_tokens(compressed_messages)
-    return {
-        "messages": compressed_messages,
-        "tools": tools,
-        "compressed": tokens_after < tokens_before,
-        "stats": {
-            "tokens_before": tokens_before,
-            "tokens_after": tokens_after,
-            "tokens_saved": tokens_before - tokens_after,
-            "savings_percent": round(
-                (1 - tokens_after / tokens_before) * 100, 1
-            ) if tokens_before > 0 else 0,
-            "transforms_applied": ["basic_ccr"] if tokens_after < tokens_before else [],
-            "latency_ms": 0,
-        },
-    }
-@app.get("/health")
-async def health_check():
-    """Health check endpoint"""
-    cleanup_expired_ccr()
-    return {
-        "status": "healthy",
-        "headroom_loaded": HEADROOM_AVAILABLE,
-        "ccr_enabled": config.ccr_enabled,
-        "llmlingua_enabled": config.llmlingua_enabled,
-        "entries_cached": len(ccr_store),
-        "config": config.to_dict(),
-    }
-@app.get("/metrics")
-async def get_metrics():
-    """Get compression metrics"""
-    return {
-        **metrics,
-        "average_compression_ratio": (
-            round(metrics["total_tokens_after"] / metrics["total_tokens_before"], 3)
-            if metrics["total_tokens_before"] > 0
-            else 1.0
-        ),
-        "ccr_entries": len(ccr_store),
-        "uptime_seconds": (
-            datetime.utcnow() - datetime.fromisoformat(metrics["start_time"])
-        ).total_seconds(),
-    }
-@app.post("/compress", response_model=CompressResponse)
-async def compress_messages(request: CompressRequest):
-    """Compress messages and tools"""
-    start_time = time.time()
-    metrics["requests_total"] += 1
-    try:
-        tokens_before = estimate_tokens(request.messages)
-        metrics["total_tokens_before"] += tokens_before
-        # Skip if below minimum tokens
-        if tokens_before < config.smart_crusher_min_tokens:
-            metrics["compressions_skipped"] += 1
-            return CompressResponse(
-                messages=request.messages,
-                tools=request.tools,
-                compressed=False,
-                stats={
-                    "skipped": True,
-                    "reason": f"Below threshold ({tokens_before} < {config.smart_crusher_min_tokens})",
-                },
-            )
-        # Use Headroom SDK if available
-        if HEADROOM_AVAILABLE and headroom_pipeline:
-            try:
-                result = headroom_pipeline.apply(
-                    request.messages,
-                    model=request.model,
-                    model_limit=request.model_limit,
-                )
-                # Extract messages from TransformResult
-                if hasattr(result, 'messages'):
-                    compressed_messages = result.messages
-                    # transforms_applied may be strings or objects with .name
-                    if hasattr(result, 'transforms_applied'):
-                        transforms_applied = [t if isinstance(t, str) else getattr(t, 'name', str(t)) for t in result.transforms_applied]
-                    else:
-                        transforms_applied = []
-                elif isinstance(result, dict):
-                    compressed_messages = result.get("messages", request.messages)
-                    transforms_applied = result.get("transforms", [])
-                else:
-                    compressed_messages = result if isinstance(result, list) else request.messages
-                    transforms_applied = []
-                tokens_after = estimate_tokens(compressed_messages)
-                metrics["total_tokens_after"] += tokens_after
-                metrics["compressions_applied"] += 1
-                return CompressResponse(
-                    messages=compressed_messages,
-                    tools=request.tools,  # Tools not modified by current transforms
-                    compressed=tokens_after < tokens_before,
-                    stats={
-                        "tokens_before": tokens_before,
-                        "tokens_after": tokens_after,
-                        "tokens_saved": tokens_before - tokens_after,
-                        "savings_percent": round(
-                            (1 - tokens_after / tokens_before) * 100, 1
-                        ) if tokens_before > 0 else 0,
-                        "transforms_applied": transforms_applied,
-                        "latency_ms": round((time.time() - start_time) * 1000, 1),
-                    },
-                )
-            except Exception as e:
-                logger.warning(f"Headroom SDK error, falling back to basic: {e}")
-        # Fallback to basic compression
-        result = basic_compress(request.messages, request.tools)
-        metrics["total_tokens_after"] += result["stats"]["tokens_after"]
-        if result["compressed"]:
-            metrics["compressions_applied"] += 1
-        else:
-            metrics["compressions_skipped"] += 1
-        result["stats"]["latency_ms"] = round((time.time() - start_time) * 1000, 1)
-        return CompressResponse(**result)
-    except Exception as e:
-        metrics["errors"] += 1
-        logger.error(f"Compression error: {e}")
-        raise HTTPException(status_code=500, detail=str(e))
-@app.post("/ccr/retrieve", response_model=CCRRetrieveResponse)
-async def ccr_retrieve(request: CCRRetrieveRequest):
-    """Retrieve content from CCR store"""
-    cleanup_expired_ccr()
-    if request.hash not in ccr_store:
-        return CCRRetrieveResponse(
-            success=False,
-            error=f"Hash {request.hash} not found or expired",
-        )
-    entry = ccr_store[request.hash]
-    content = entry["content"]
-    metrics["ccr_retrievals"] += 1
-    # If query provided, search within content
-    if request.query:
-        if isinstance(content, list):
-            # Filter list items by query
-            filtered = [
-                item
-                for item in content
-                if request.query.lower() in json.dumps(item).lower()
-            ][: request.max_results]
-            return CCRRetrieveResponse(
-                success=True,
-                content=filtered,
-                items_retrieved=len(filtered),
-                was_search=True,
-            )
-        elif isinstance(content, str):
-            # Return content if query matches
-            if request.query.lower() in content.lower():
-                return CCRRetrieveResponse(
-                    success=True,
-                    content=content,
-                    items_retrieved=1,
-                    was_search=True,
-                )
-            return CCRRetrieveResponse(
-                success=False,
-                error="Query not found in content",
-            )
-    # Return full content
-    return CCRRetrieveResponse(
-        success=True,
-        content=content,
-        items_retrieved=1 if not isinstance(content, list) else len(content),
-        was_search=False,
-    )
-@app.post("/ccr/track")
-async def ccr_track(
-    hash_key: str,
-    turn_number: int,
-    tool_name: str,
-    sample: str,
-):
-    """Track compression for proactive expansion"""
-    return {"tracked": True, "hash_key": hash_key}
-@app.post("/ccr/analyze")
-async def ccr_analyze(query: str, turn_number: int):
-    """Analyze query for proactive CCR expansion"""
-    # Simple keyword matching for expansion suggestions
-    expansions = []
-    for hash_key, entry in ccr_store.items():
-        if query.lower() in json.dumps(entry["content"]).lower():
-            expansions.append(
-                {
-                    "hash": hash_key,
-                    "tool_name": entry.get("tool_name", "unknown"),
-                    "relevance": 0.8,
-                }
-            )
-    return {"expansions": expansions[:5]}
-@app.post("/compress/llmlingua")
-async def llmlingua_compress(
-    text: str,
-    target_ratio: float = 0.5,
-    force_tokens: Optional[str] = None,
-):
-    """Compress text using LLMLingua (if available)"""
-    if not config.llmlingua_enabled:
-        raise HTTPException(status_code=400, detail="LLMLingua is not enabled")
-    try:
-        # Try to import and use llmlingua
-        from llmlingua import PromptCompressor
-        compressor = PromptCompressor(device_map=config.llmlingua_device)
-        result = compressor.compress_prompt(
-            text,
-            rate=target_ratio,
-            force_tokens=json.loads(force_tokens) if force_tokens else None,
-        )
-        return {
-            "compressed": result["compressed_prompt"],
-            "original_tokens": result.get("origin_tokens", len(text) // 4),
-            "compressed_tokens": result.get("compressed_tokens", len(result["compressed_prompt"]) // 4),
-            "ratio": result.get("rate", target_ratio),
-        }
-    except ImportError:
-        raise HTTPException(
-            status_code=501,
-            detail="LLMLingua not installed. Add llmlingua to requirements.txt",
-        )
-    except Exception as e:
-        raise HTTPException(status_code=500, detail=str(e))
-if __name__ == "__main__":
-    logger.info(f"Starting Headroom sidecar on {config.host}:{config.port}")
-    logger.info(f"Configuration: {json.dumps(config.to_dict(), indent=2)}")
-    uvicorn.run(
-        app,
-        host=config.host,
-        port=config.port,
-        log_level=config.log_level,
-    )

package/monitor-agents.sh DELETED Viewed

@@ -1,31 +0,0 @@
-#!/bin/bash
-# Monitor agent activity in real-time
-echo "🔍 Monitoring Agent Activity"
-echo "=============================="
-echo ""
-while true; do
-  clear
-  echo "🔍 Agent Statistics (refreshing every 3s)"
-  echo "=========================================="
-  echo ""
-  # Get stats
-  curl -s http://localhost:8080/v1/agents/stats | jq -r '.stats[] |
-    "Agent: \(.agent_type)
-    Executions: \(.total_executions) (\(.completed) completed, \(.failed) failed)
-    Avg Duration: \(.avg_duration_ms)ms
-    Tokens: \(.total_input_tokens) in / \(.total_output_tokens) out
-    "' || echo "Proxy not responding..."
-  echo ""
-  echo "Latest transcripts:"
-  ls -lt data/agent-transcripts/*.jsonl 2>/dev/null | head -3 || echo "No transcripts yet"
-  echo ""
-  echo "Press Ctrl+C to stop monitoring"
-  sleep 3
-done