npm - lynkr - Versions diffs - 7.2.5 → 8.0.1 - Mend

lynkr 7.2.5 → 8.0.1

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (124) hide show

package/README.md +3 -3
package/config/model-tiers.json +89 -0
package/install.sh +6 -1
package/package.json +4 -2
package/scripts/setup.js +0 -1
package/src/agents/executor.js +14 -6
package/src/api/middleware/session.js +15 -2
package/src/api/openai-router.js +162 -37
package/src/api/providers-handler.js +15 -1
package/src/api/router.js +107 -2
package/src/budget/index.js +4 -3
package/src/clients/databricks.js +431 -234
package/src/clients/gpt-utils.js +181 -0
package/src/clients/ollama-utils.js +66 -140
package/src/clients/routing.js +0 -1
package/src/clients/standard-tools.js +99 -3
package/src/config/index.js +133 -35
package/src/context/toon.js +173 -0
package/src/logger/index.js +23 -0
package/src/orchestrator/index.js +688 -213
package/src/routing/agentic-detector.js +320 -0
package/src/routing/complexity-analyzer.js +202 -2
package/src/routing/cost-optimizer.js +305 -0
package/src/routing/index.js +168 -159
package/src/routing/model-tiers.js +365 -0
package/src/server.js +4 -14
package/src/sessions/cleanup.js +3 -3
package/src/sessions/record.js +10 -1
package/src/sessions/store.js +7 -2
package/src/tools/agent-task.js +48 -1
package/src/tools/index.js +19 -2
package/src/tools/lazy-loader.js +7 -0
package/src/tools/tinyfish.js +358 -0
package/src/tools/truncate.js +1 -0
package/.github/FUNDING.yml +0 -15
package/.github/workflows/README.md +0 -215
package/.github/workflows/ci.yml +0 -69
package/.github/workflows/index.yml +0 -62
package/.github/workflows/web-tools-tests.yml +0 -56
package/CITATIONS.bib +0 -6
package/CLAWROUTER_ROUTING_PLAN.md +0 -910
package/DEPLOYMENT.md +0 -1001
package/LYNKR-TUI-PLAN.md +0 -984
package/PERFORMANCE-REPORT.md +0 -866
package/PLAN-per-client-model-routing.md +0 -252
package/ROUTER_COMPARISON.md +0 -173
package/TIER_ROUTING_PLAN.md +0 -771
package/docs/42642f749da6234f41b6b425c3bb07c9.txt +0 -1
package/docs/BingSiteAuth.xml +0 -4
package/docs/docs-style.css +0 -478
package/docs/docs.html +0 -197
package/docs/google5be250e608e6da39.html +0 -1
package/docs/index.html +0 -577
package/docs/index.md +0 -577
package/docs/robots.txt +0 -4
package/docs/sitemap.xml +0 -44
package/docs/style.css +0 -1223
package/documentation/README.md +0 -100
package/documentation/api.md +0 -806
package/documentation/claude-code-cli.md +0 -672
package/documentation/codex-cli.md +0 -397
package/documentation/contributing.md +0 -571
package/documentation/cursor-integration.md +0 -731
package/documentation/docker.md +0 -867
package/documentation/embeddings.md +0 -760
package/documentation/faq.md +0 -659
package/documentation/features.md +0 -396
package/documentation/headroom.md +0 -519
package/documentation/installation.md +0 -706
package/documentation/memory-system.md +0 -476
package/documentation/production.md +0 -601
package/documentation/providers.md +0 -906
package/documentation/testing.md +0 -629
package/documentation/token-optimization.md +0 -323
package/documentation/tools.md +0 -697
package/documentation/troubleshooting.md +0 -893
package/final-test.js +0 -33
package/headroom-sidecar/config.py +0 -93
package/headroom-sidecar/requirements.txt +0 -14
package/headroom-sidecar/server.py +0 -451
package/monitor-agents.sh +0 -31
package/scripts/audit-log-reader.js +0 -399
package/scripts/compact-dictionary.js +0 -204
package/scripts/test-deduplication.js +0 -448
package/src/db/database.sqlite +0 -0
package/test/README.md +0 -212
package/test/azure-openai-config.test.js +0 -204
package/test/azure-openai-error-resilience.test.js +0 -238
package/test/azure-openai-format-conversion.test.js +0 -354
package/test/azure-openai-integration.test.js +0 -281
package/test/azure-openai-routing.test.js +0 -177
package/test/azure-openai-streaming.test.js +0 -171
package/test/bedrock-integration.test.js +0 -471
package/test/comprehensive-test-suite.js +0 -928
package/test/config-validation.test.js +0 -207
package/test/cursor-integration.test.js +0 -484
package/test/format-conversion.test.js +0 -578
package/test/hybrid-routing-integration.test.js +0 -254
package/test/hybrid-routing-performance.test.js +0 -418
package/test/llamacpp-integration.test.js +0 -863
package/test/lmstudio-integration.test.js +0 -335
package/test/memory/extractor.test.js +0 -398
package/test/memory/retriever.test.js +0 -613
package/test/memory/retriever.test.js.bak +0 -585
package/test/memory/search.test.js +0 -537
package/test/memory/search.test.js.bak +0 -389
package/test/memory/store.test.js +0 -344
package/test/memory/store.test.js.bak +0 -312
package/test/memory/surprise.test.js +0 -300
package/test/memory-performance.test.js +0 -472
package/test/openai-integration.test.js +0 -686
package/test/openrouter-error-resilience.test.js +0 -418
package/test/passthrough-mode.test.js +0 -385
package/test/performance-benchmark.js +0 -351
package/test/performance-tests.js +0 -528
package/test/routing.test.js +0 -219
package/test/web-tools.test.js +0 -329
package/test-agents-simple.js +0 -43
package/test-cli-connection.sh +0 -33
package/test-learning-unit.js +0 -126
package/test-learning.js +0 -112
package/test-parallel-agents.sh +0 -124
package/test-parallel-direct.js +0 -155
package/test-subagents.sh +0 -117

package/final-test.js DELETED Viewed

@@ -1,33 +0,0 @@
-const http = require('http');
-const data = JSON.stringify({
-  model: "claude-sonnet-4-5",
-  max_tokens: 100,
-  messages: [{ role: "user", content: "Say hello" }]
-});
-const req = http.request({
-  hostname: 'localhost',
-  port: 8081,
-  path: '/v1/messages',
-  method: 'POST',
-  headers: { 'Content-Type': 'application/json', 'Content-Length': data.length }
-}, (res) => {
-  let body = '';
-  res.on('data', chunk => body += chunk);
-  res.on('end', () => {
-    console.log('Status:', res.statusCode);
-    if (res.statusCode === 200) {
-      const json = JSON.parse(body);
-      console.log('✅ SUCCESS!');
-      console.log('Model:', json.model);
-      console.log('Response:', json.content[0].text.substring(0, 150));
-    } else {
-      console.log('❌ Error:', body.substring(0, 300));
-    }
-  });
-});
-req.on('error', e => console.error('Request failed:', e.message));
-req.write(data);
-req.end();

package/headroom-sidecar/config.py DELETED Viewed

@@ -1,93 +0,0 @@
-"""
-Headroom Sidecar Configuration
-Loads settings from environment variables
-"""
-import os
-from typing import Optional
-def str_to_bool(value: str) -> bool:
-    """Convert string to boolean"""
-    return value.lower() in ("true", "1", "yes", "on")
-class HeadroomConfig:
-    """Configuration for Headroom sidecar"""
-    def __init__(self):
-        # Server settings
-        self.host = os.environ.get("HEADROOM_HOST", "0.0.0.0")
-        self.port = int(os.environ.get("HEADROOM_PORT", "8787"))
-        self.log_level = os.environ.get("HEADROOM_LOG_LEVEL", "info")
-        # Operating mode
-        self.mode = os.environ.get("HEADROOM_MODE", "optimize")
-        self.provider = os.environ.get("HEADROOM_PROVIDER", "anthropic")
-        # Smart Crusher settings
-        self.smart_crusher_enabled = str_to_bool(
-            os.environ.get("HEADROOM_SMART_CRUSHER", "true")
-        )
-        self.smart_crusher_min_tokens = int(
-            os.environ.get("HEADROOM_SMART_CRUSHER_MIN_TOKENS", "200")
-        )
-        self.smart_crusher_max_items = int(
-            os.environ.get("HEADROOM_SMART_CRUSHER_MAX_ITEMS", "15")
-        )
-        # Tool Crusher settings
-        self.tool_crusher_enabled = str_to_bool(
-            os.environ.get("HEADROOM_TOOL_CRUSHER", "true")
-        )
-        # Cache Aligner settings
-        self.cache_aligner_enabled = str_to_bool(
-            os.environ.get("HEADROOM_CACHE_ALIGNER", "true")
-        )
-        # Rolling Window settings
-        self.rolling_window_enabled = str_to_bool(
-            os.environ.get("HEADROOM_ROLLING_WINDOW", "true")
-        )
-        self.keep_turns = int(os.environ.get("HEADROOM_KEEP_TURNS", "3"))
-        # CCR settings
-        self.ccr_enabled = str_to_bool(os.environ.get("HEADROOM_CCR", "true"))
-        self.ccr_ttl = int(os.environ.get("HEADROOM_CCR_TTL", "300"))
-        # LLMLingua settings
-        self.llmlingua_enabled = str_to_bool(
-            os.environ.get("HEADROOM_LLMLINGUA", "false")
-        )
-        self.llmlingua_device = os.environ.get("HEADROOM_LLMLINGUA_DEVICE", "auto")
-    def to_dict(self) -> dict:
-        """Return configuration as dictionary"""
-        return {
-            "host": self.host,
-            "port": self.port,
-            "log_level": self.log_level,
-            "mode": self.mode,
-            "provider": self.provider,
-            "smart_crusher": {
-                "enabled": self.smart_crusher_enabled,
-                "min_tokens": self.smart_crusher_min_tokens,
-                "max_items": self.smart_crusher_max_items,
-            },
-            "tool_crusher": {"enabled": self.tool_crusher_enabled},
-            "cache_aligner": {"enabled": self.cache_aligner_enabled},
-            "rolling_window": {
-                "enabled": self.rolling_window_enabled,
-                "keep_turns": self.keep_turns,
-            },
-            "ccr": {"enabled": self.ccr_enabled, "ttl": self.ccr_ttl},
-            "llmlingua": {
-                "enabled": self.llmlingua_enabled,
-                "device": self.llmlingua_device,
-            },
-        }
-# Global config instance
-config = HeadroomConfig()

package/headroom-sidecar/requirements.txt DELETED Viewed

@@ -1,14 +0,0 @@
-# Headroom Sidecar Dependencies
-# Core framework
-fastapi>=0.109.0
-uvicorn[standard]>=0.27.0
-pydantic>=2.5.0
-# Headroom SDK
-headroom-ai>=0.1.0
-# Optional: LLMLingua support (uncomment for ML compression)
-# llmlingua>=0.2.0
-# torch>=2.0.0
-# transformers>=4.36.0

package/headroom-sidecar/server.py DELETED Viewed

@@ -1,451 +0,0 @@
-"""
-Headroom Sidecar Server
-FastAPI application providing context compression via HTTP API
-"""
-import logging
-import time
-import hashlib
-import json
-from typing import Any, Dict, List, Optional
-from datetime import datetime
-from fastapi import FastAPI, HTTPException
-from fastapi.responses import JSONResponse
-from pydantic import BaseModel
-import uvicorn
-from config import config
-# Setup logging
-logging.basicConfig(
-    level=getattr(logging, config.log_level.upper()),
-    format="%(asctime)s - %(name)s - %(levelname)s - %(message)s",
-)
-logger = logging.getLogger("headroom-sidecar")
-# Initialize FastAPI app
-app = FastAPI(
-    title="Headroom Sidecar",
-    description="Context compression service for LLM requests",
-    version="1.0.0",
-)
-# Try to import headroom, fallback to basic compression if not available
-try:
-    from headroom import (
-        TransformPipeline,
-        SmartCrusher,
-        SmartCrusherConfig,
-        ToolCrusher,
-        ToolCrusherConfig,
-        RollingWindow,
-        RollingWindowConfig,
-        AnthropicProvider,
-        OpenAIProvider,
-    )
-    import warnings
-    warnings.filterwarnings("ignore", message=".*tiktoken approximation.*")
-    # Create transforms based on config
-    transforms = []
-    if config.smart_crusher_enabled:
-        transforms.append(SmartCrusher(SmartCrusherConfig(
-            enabled=True,
-            min_tokens_to_crush=config.smart_crusher_min_tokens,
-            max_items_after_crush=config.smart_crusher_max_items,
-        )))
-        logger.info("SmartCrusher enabled")
-    if config.tool_crusher_enabled:
-        transforms.append(ToolCrusher(ToolCrusherConfig(
-            enabled=True,
-        )))
-        logger.info("ToolCrusher enabled")
-    if config.rolling_window_enabled:
-        transforms.append(RollingWindow(RollingWindowConfig(
-            enabled=True,
-            keep_last_turns=config.keep_turns,
-        )))
-        logger.info("RollingWindow enabled")
-    # Create provider based on config
-    if config.provider == "openai":
-        headroom_provider = OpenAIProvider()
-    else:
-        headroom_provider = AnthropicProvider()
-    headroom_pipeline = TransformPipeline(transforms=transforms, provider=headroom_provider) if transforms else None
-    HEADROOM_AVAILABLE = headroom_pipeline is not None
-    logger.info(f"Headroom SDK loaded successfully with {len(transforms)} transforms (provider: {config.provider})")
-except ImportError as e:
-    logger.warning(f"Headroom SDK not available: {e}. Using basic compression.")
-    headroom_pipeline = None
-    HEADROOM_AVAILABLE = False
-# CCR Store (in-memory with TTL)
-ccr_store: Dict[str, Dict[str, Any]] = {}
-# Metrics
-metrics = {
-    "requests_total": 0,
-    "compressions_applied": 0,
-    "compressions_skipped": 0,
-    "errors": 0,
-    "ccr_stores": 0,
-    "ccr_retrievals": 0,
-    "total_tokens_before": 0,
-    "total_tokens_after": 0,
-    "start_time": datetime.utcnow().isoformat(),
-}
-# Request/Response models
-class CompressRequest(BaseModel):
-    messages: List[Dict[str, Any]]
-    tools: Optional[List[Dict[str, Any]]] = None
-    model: Optional[str] = "claude-3-5-sonnet-20241022"
-    model_limit: Optional[int] = 200000
-    mode: Optional[str] = None
-    token_budget: Optional[int] = None
-    query_context: Optional[str] = None
-    preserve_recent_turns: Optional[int] = None
-    target_ratio: Optional[float] = None
-class CompressResponse(BaseModel):
-    messages: List[Dict[str, Any]]
-    tools: Optional[List[Dict[str, Any]]] = None
-    compressed: bool
-    stats: Dict[str, Any]
-class CCRRetrieveRequest(BaseModel):
-    hash: str
-    query: Optional[str] = None
-    max_results: Optional[int] = 20
-class CCRRetrieveResponse(BaseModel):
-    success: bool
-    content: Optional[Any] = None
-    items_retrieved: int = 0
-    was_search: bool = False
-    error: Optional[str] = None
-def estimate_tokens(data: Any) -> int:
-    """Estimate token count (rough approximation: ~4 chars per token)"""
-    text = json.dumps(data) if not isinstance(data, str) else data
-    return len(text) // 4
-def generate_hash(content: Any) -> str:
-    """Generate hash for CCR storage"""
-    text = json.dumps(content, sort_keys=True)
-    return hashlib.sha256(text.encode()).hexdigest()[:12]
-def cleanup_expired_ccr():
-    """Remove expired CCR entries"""
-    now = time.time()
-    expired = [k for k, v in ccr_store.items() if now - v["timestamp"] > config.ccr_ttl]
-    for key in expired:
-        del ccr_store[key]
-def basic_compress(messages: List[Dict], tools: Optional[List] = None) -> Dict:
-    """Basic compression when Headroom SDK is not available"""
-    tokens_before = estimate_tokens(messages)
-    compressed_messages = []
-    for msg in messages:
-        compressed_msg = msg.copy()
-        # Compress large tool results
-        if msg.get("role") == "user" and isinstance(msg.get("content"), list):
-            new_content = []
-            for block in msg["content"]:
-                if block.get("type") == "tool_result":
-                    content = block.get("content", "")
-                    if isinstance(content, str) and len(content) > 2000:
-                        # Store in CCR and replace with reference
-                        hash_key = generate_hash(content)
-                        ccr_store[hash_key] = {
-                            "content": content,
-                            "timestamp": time.time(),
-                            "tool_name": block.get("tool_use_id", "unknown"),
-                        }
-                        metrics["ccr_stores"] += 1
-                        block = block.copy()
-                        block["content"] = (
-                            f"[CCR:{hash_key}] Content compressed ({len(content)} chars). "
-                            f"Use ccr_retrieve to access full content."
-                        )
-                new_content.append(block)
-            compressed_msg["content"] = new_content
-        compressed_messages.append(compressed_msg)
-    tokens_after = estimate_tokens(compressed_messages)
-    return {
-        "messages": compressed_messages,
-        "tools": tools,
-        "compressed": tokens_after < tokens_before,
-        "stats": {
-            "tokens_before": tokens_before,
-            "tokens_after": tokens_after,
-            "tokens_saved": tokens_before - tokens_after,
-            "savings_percent": round(
-                (1 - tokens_after / tokens_before) * 100, 1
-            ) if tokens_before > 0 else 0,
-            "transforms_applied": ["basic_ccr"] if tokens_after < tokens_before else [],
-            "latency_ms": 0,
-        },
-    }
-@app.get("/health")
-async def health_check():
-    """Health check endpoint"""
-    cleanup_expired_ccr()
-    return {
-        "status": "healthy",
-        "headroom_loaded": HEADROOM_AVAILABLE,
-        "ccr_enabled": config.ccr_enabled,
-        "llmlingua_enabled": config.llmlingua_enabled,
-        "entries_cached": len(ccr_store),
-        "config": config.to_dict(),
-    }
-@app.get("/metrics")
-async def get_metrics():
-    """Get compression metrics"""
-    return {
-        **metrics,
-        "average_compression_ratio": (
-            round(metrics["total_tokens_after"] / metrics["total_tokens_before"], 3)
-            if metrics["total_tokens_before"] > 0
-            else 1.0
-        ),
-        "ccr_entries": len(ccr_store),
-        "uptime_seconds": (
-            datetime.utcnow() - datetime.fromisoformat(metrics["start_time"])
-        ).total_seconds(),
-    }
-@app.post("/compress", response_model=CompressResponse)
-async def compress_messages(request: CompressRequest):
-    """Compress messages and tools"""
-    start_time = time.time()
-    metrics["requests_total"] += 1
-    try:
-        tokens_before = estimate_tokens(request.messages)
-        metrics["total_tokens_before"] += tokens_before
-        # Skip if below minimum tokens
-        if tokens_before < config.smart_crusher_min_tokens:
-            metrics["compressions_skipped"] += 1
-            return CompressResponse(
-                messages=request.messages,
-                tools=request.tools,
-                compressed=False,
-                stats={
-                    "skipped": True,
-                    "reason": f"Below threshold ({tokens_before} < {config.smart_crusher_min_tokens})",
-                },
-            )
-        # Use Headroom SDK if available
-        if HEADROOM_AVAILABLE and headroom_pipeline:
-            try:
-                result = headroom_pipeline.apply(
-                    request.messages,
-                    model=request.model,
-                    model_limit=request.model_limit,
-                )
-                # Extract messages from TransformResult
-                if hasattr(result, 'messages'):
-                    compressed_messages = result.messages
-                    # transforms_applied may be strings or objects with .name
-                    if hasattr(result, 'transforms_applied'):
-                        transforms_applied = [t if isinstance(t, str) else getattr(t, 'name', str(t)) for t in result.transforms_applied]
-                    else:
-                        transforms_applied = []
-                elif isinstance(result, dict):
-                    compressed_messages = result.get("messages", request.messages)
-                    transforms_applied = result.get("transforms", [])
-                else:
-                    compressed_messages = result if isinstance(result, list) else request.messages
-                    transforms_applied = []
-                tokens_after = estimate_tokens(compressed_messages)
-                metrics["total_tokens_after"] += tokens_after
-                metrics["compressions_applied"] += 1
-                return CompressResponse(
-                    messages=compressed_messages,
-                    tools=request.tools,  # Tools not modified by current transforms
-                    compressed=tokens_after < tokens_before,
-                    stats={
-                        "tokens_before": tokens_before,
-                        "tokens_after": tokens_after,
-                        "tokens_saved": tokens_before - tokens_after,
-                        "savings_percent": round(
-                            (1 - tokens_after / tokens_before) * 100, 1
-                        ) if tokens_before > 0 else 0,
-                        "transforms_applied": transforms_applied,
-                        "latency_ms": round((time.time() - start_time) * 1000, 1),
-                    },
-                )
-            except Exception as e:
-                logger.warning(f"Headroom SDK error, falling back to basic: {e}")
-        # Fallback to basic compression
-        result = basic_compress(request.messages, request.tools)
-        metrics["total_tokens_after"] += result["stats"]["tokens_after"]
-        if result["compressed"]:
-            metrics["compressions_applied"] += 1
-        else:
-            metrics["compressions_skipped"] += 1
-        result["stats"]["latency_ms"] = round((time.time() - start_time) * 1000, 1)
-        return CompressResponse(**result)
-    except Exception as e:
-        metrics["errors"] += 1
-        logger.error(f"Compression error: {e}")
-        raise HTTPException(status_code=500, detail=str(e))
-@app.post("/ccr/retrieve", response_model=CCRRetrieveResponse)
-async def ccr_retrieve(request: CCRRetrieveRequest):
-    """Retrieve content from CCR store"""
-    cleanup_expired_ccr()
-    if request.hash not in ccr_store:
-        return CCRRetrieveResponse(
-            success=False,
-            error=f"Hash {request.hash} not found or expired",
-        )
-    entry = ccr_store[request.hash]
-    content = entry["content"]
-    metrics["ccr_retrievals"] += 1
-    # If query provided, search within content
-    if request.query:
-        if isinstance(content, list):
-            # Filter list items by query
-            filtered = [
-                item
-                for item in content
-                if request.query.lower() in json.dumps(item).lower()
-            ][: request.max_results]
-            return CCRRetrieveResponse(
-                success=True,
-                content=filtered,
-                items_retrieved=len(filtered),
-                was_search=True,
-            )
-        elif isinstance(content, str):
-            # Return content if query matches
-            if request.query.lower() in content.lower():
-                return CCRRetrieveResponse(
-                    success=True,
-                    content=content,
-                    items_retrieved=1,
-                    was_search=True,
-                )
-            return CCRRetrieveResponse(
-                success=False,
-                error="Query not found in content",
-            )
-    # Return full content
-    return CCRRetrieveResponse(
-        success=True,
-        content=content,
-        items_retrieved=1 if not isinstance(content, list) else len(content),
-        was_search=False,
-    )
-@app.post("/ccr/track")
-async def ccr_track(
-    hash_key: str,
-    turn_number: int,
-    tool_name: str,
-    sample: str,
-):
-    """Track compression for proactive expansion"""
-    return {"tracked": True, "hash_key": hash_key}
-@app.post("/ccr/analyze")
-async def ccr_analyze(query: str, turn_number: int):
-    """Analyze query for proactive CCR expansion"""
-    # Simple keyword matching for expansion suggestions
-    expansions = []
-    for hash_key, entry in ccr_store.items():
-        if query.lower() in json.dumps(entry["content"]).lower():
-            expansions.append(
-                {
-                    "hash": hash_key,
-                    "tool_name": entry.get("tool_name", "unknown"),
-                    "relevance": 0.8,
-                }
-            )
-    return {"expansions": expansions[:5]}
-@app.post("/compress/llmlingua")
-async def llmlingua_compress(
-    text: str,
-    target_ratio: float = 0.5,
-    force_tokens: Optional[str] = None,
-):
-    """Compress text using LLMLingua (if available)"""
-    if not config.llmlingua_enabled:
-        raise HTTPException(status_code=400, detail="LLMLingua is not enabled")
-    try:
-        # Try to import and use llmlingua
-        from llmlingua import PromptCompressor
-        compressor = PromptCompressor(device_map=config.llmlingua_device)
-        result = compressor.compress_prompt(
-            text,
-            rate=target_ratio,
-            force_tokens=json.loads(force_tokens) if force_tokens else None,
-        )
-        return {
-            "compressed": result["compressed_prompt"],
-            "original_tokens": result.get("origin_tokens", len(text) // 4),
-            "compressed_tokens": result.get("compressed_tokens", len(result["compressed_prompt"]) // 4),
-            "ratio": result.get("rate", target_ratio),
-        }
-    except ImportError:
-        raise HTTPException(
-            status_code=501,
-            detail="LLMLingua not installed. Add llmlingua to requirements.txt",
-        )
-    except Exception as e:
-        raise HTTPException(status_code=500, detail=str(e))
-if __name__ == "__main__":
-    logger.info(f"Starting Headroom sidecar on {config.host}:{config.port}")
-    logger.info(f"Configuration: {json.dumps(config.to_dict(), indent=2)}")
-    uvicorn.run(
-        app,
-        host=config.host,
-        port=config.port,
-        log_level=config.log_level,
-    )

package/monitor-agents.sh DELETED Viewed

@@ -1,31 +0,0 @@
-#!/bin/bash
-# Monitor agent activity in real-time
-echo "🔍 Monitoring Agent Activity"
-echo "=============================="
-echo ""
-while true; do
-  clear
-  echo "🔍 Agent Statistics (refreshing every 3s)"
-  echo "=========================================="
-  echo ""
-  # Get stats
-  curl -s http://localhost:8080/v1/agents/stats | jq -r '.stats[] |
-    "Agent: \(.agent_type)
-    Executions: \(.total_executions) (\(.completed) completed, \(.failed) failed)
-    Avg Duration: \(.avg_duration_ms)ms
-    Tokens: \(.total_input_tokens) in / \(.total_output_tokens) out
-    "' || echo "Proxy not responding..."
-  echo ""
-  echo "Latest transcripts:"
-  ls -lt data/agent-transcripts/*.jsonl 2>/dev/null | head -3 || echo "No transcripts yet"
-  echo ""
-  echo "Press Ctrl+C to stop monitoring"
-  sleep 3
-done