PyPI - kalibr - Versions diffs - 1.2.5__py3-none-any.whl → 1.2.8__py3-none-any.whl - Mend

kalibr 1.2.5py3-none-any.whl → 1.2.8py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (24) hide show

kalibr/__init__.py +2 -2
kalibr/cli/capsule_cmd.py +3 -3
kalibr/cli/run.py +2 -2
kalibr/client.py +1 -1
kalibr/collector.py +227 -48
kalibr/cost_adapter.py +36 -104
kalibr/instrumentation/anthropic_instr.py +34 -40
kalibr/instrumentation/base.py +27 -9
kalibr/instrumentation/google_instr.py +34 -39
kalibr/instrumentation/openai_instr.py +34 -28
kalibr/instrumentation/registry.py +38 -13
kalibr/intelligence.py +28 -16
kalibr/middleware/auto_tracer.py +1 -1
kalibr/pricing.py +245 -0
kalibr/router.py +139 -53
kalibr/simple_tracer.py +16 -15
kalibr/trace_capsule.py +19 -12
kalibr/utils.py +2 -2
{kalibr-1.2.5.dist-info → kalibr-1.2.8.dist-info}/METADATA +115 -15
{kalibr-1.2.5.dist-info → kalibr-1.2.8.dist-info}/RECORD +24 -23
{kalibr-1.2.5.dist-info → kalibr-1.2.8.dist-info}/LICENSE +0 -0
{kalibr-1.2.5.dist-info → kalibr-1.2.8.dist-info}/WHEEL +0 -0
{kalibr-1.2.5.dist-info → kalibr-1.2.8.dist-info}/entry_points.txt +0 -0
{kalibr-1.2.5.dist-info → kalibr-1.2.8.dist-info}/top_level.txt +0 -0

kalibr/__init__.py CHANGED Viewed

@@ -1,4 +1,4 @@
-"""Kalibr SDK v1.2.0 - LLM Observability & Tracing Framework
+"""Kalibr SDK v1.2.7 - LLM Observability & Tracing Framework
 Features:
 - **Auto-Instrumentation**: Zero-config tracing of OpenAI, Anthropic, Google SDK calls
@@ -36,7 +36,7 @@ CLI Usage:
     kalibr version                       # Show version
 """
-__version__ = "1.2.0"
+__version__ = "1.2.7"
 # Auto-instrument LLM SDKs on import (can be disabled via env var)
 import os

kalibr/cli/capsule_cmd.py CHANGED Viewed

@@ -23,7 +23,7 @@ def capsule(
         None,
         "--api-url",
         "-u",
-        help="Kalibr API base URL (default: from env KALIBR_API_URL or https://api.kalibr.systems)",
+        help="Kalibr API base URL (default: from env KALIBR_API_URL or https://kalibr-backend.fly.dev)",
         envvar="KALIBR_API_URL",
     ),
     output: Optional[Path] = typer.Option(
@@ -63,10 +63,10 @@ def capsule(
         kalibr capsule abc-123-def --export --output capsule.json
         # Specify custom API URL
-        kalibr capsule abc-123-def -u https://api.kalibr.systems
+        kalibr capsule abc-123-def -u https://kalibr-backend.fly.dev
     """
     # Determine API base URL
-    base_url = api_url or "https://api.kalibr.systems"
+    base_url = api_url or "https://kalibr-backend.fly.dev"
     base_url = base_url.rstrip("/")
     # Build endpoint URL

kalibr/cli/run.py CHANGED Viewed

@@ -47,7 +47,7 @@ def run(
         kalibr run weather.py --runtime fly.io
         # Custom backend
-        kalibr run weather.py --backend-url https://api.kalibr.systems
+        kalibr run weather.py --backend-url https://kalibr-backend.fly.dev
     """
     # Validate file exists
     agent_path = Path(file_path).resolve()
@@ -56,7 +56,7 @@ def run(
         raise typer.Exit(1)
     # Configure backend
-    backend = backend_url or os.getenv("KALIBR_BACKEND_URL", "https://api.kalibr.systems")
+    backend = backend_url or os.getenv("KALIBR_BACKEND_URL", "https://kalibr-backend.fly.dev")
     api_key = os.getenv("KALIBR_API_KEY")
     if not api_key:
         console.print("[yellow]⚠️  KALIBR_API_KEY not set. Set it for trace authentication.[/yellow]")

kalibr/client.py CHANGED Viewed

@@ -70,7 +70,7 @@ class KalibrClient:
         self.api_key = api_key or env_config.get("auth_token", "")
         self.endpoint = endpoint or env_config.get(
-            "api_endpoint", "https://api.kalibr.systems/api/v1/traces"
+            "api_endpoint", "https://kalibr-backend.fly.dev/api/v1/traces"
         )
         self.tenant_id = tenant_id or env_config.get("tenant_id", "default")
         self.environment = environment or env_config.get("environment", "prod")

kalibr/collector.py CHANGED Viewed

@@ -3,14 +3,21 @@ OpenTelemetry Collector Setup
 Configures OpenTelemetry tracer provider with multiple exporters:
 1. OTLP exporter for sending to OpenTelemetry collectors
-2. File exporter for local JSONL fallback
+2. Kalibr HTTP exporter for sending to Kalibr backend
+3. File exporter for local JSONL fallback
+Thread-safe singleton pattern for collector setup.
 """
 import json
 import os
+import threading
+from datetime import datetime, timezone
 from pathlib import Path
 from typing import Optional
+import requests
 from opentelemetry import trace
 from opentelemetry.exporter.otlp.proto.grpc.trace_exporter import OTLPSpanExporter
 from opentelemetry.sdk.resources import SERVICE_NAME, Resource
@@ -21,6 +28,7 @@ from opentelemetry.sdk.trace.export import (
     SpanExporter,
     SpanExportResult,
 )
+from opentelemetry.trace import StatusCode
 try:
     from opentelemetry.sdk.trace import ReadableSpan
@@ -81,8 +89,156 @@ class FileSpanExporter(SpanExporter):
         }
+class KalibrHTTPSpanExporter(SpanExporter):
+    """Export spans to Kalibr backend via HTTP POST"""
+    DEFAULT_URL = "https://kalibr-backend.fly.dev/api/ingest"
+    def __init__(
+        self,
+        url: Optional[str] = None,
+        api_key: Optional[str] = None,
+        tenant_id: Optional[str] = None,
+    ):
+        """Initialize the Kalibr HTTP exporter.
+        Args:
+            url: Kalibr collector URL (default: from KALIBR_COLLECTOR_URL env var)
+            api_key: API key (default: from KALIBR_API_KEY env var)
+            tenant_id: Tenant ID (default: from KALIBR_TENANT_ID env var)
+        """
+        self.url = url or os.getenv("KALIBR_COLLECTOR_URL", self.DEFAULT_URL)
+        self.api_key = api_key or os.getenv("KALIBR_API_KEY")
+        self.tenant_id = tenant_id or os.getenv("KALIBR_TENANT_ID", "default")
+        self.environment = os.getenv("KALIBR_ENVIRONMENT", "production")
+    def export(self, spans) -> SpanExportResult:
+        """Export spans to Kalibr backend"""
+        if not self.api_key:
+            print("[Kalibr SDK] ⚠️  KALIBR_API_KEY not set, spans will not be sent to backend")
+            return SpanExportResult.SUCCESS
+        try:
+            events = [self._convert_span(span) for span in spans]
+            headers = {
+                "X-API-Key": self.api_key,
+                "X-Tenant-ID": self.tenant_id,
+                "Content-Type": "application/json",
+            }
+            payload = {"events": events}
+            response = requests.post(
+                self.url,
+                headers=headers,
+                json=payload,
+                timeout=30,
+            )
+            if not response.ok:
+                print(
+                    f"[Kalibr SDK] ❌ Backend rejected spans: {response.status_code} - {response.text}"
+                )
+                return SpanExportResult.FAILURE
+            return SpanExportResult.SUCCESS
+        except Exception as e:
+            print(f"[Kalibr SDK] ❌ Failed to export spans to backend: {e}")
+            return SpanExportResult.FAILURE
+    def shutdown(self):
+        """Shutdown the exporter"""
+        pass
+    def _nanos_to_iso(self, nanos: int) -> str:
+        """Convert nanoseconds since epoch to ISO format timestamp"""
+        if nanos is None:
+            return datetime.now(timezone.utc).isoformat()
+        seconds = nanos / 1_000_000_000
+        dt = datetime.fromtimestamp(seconds, tz=timezone.utc)
+        return dt.isoformat()
+    def _get_attr(self, span, *keys, default=None):
+        """Get attribute value from span, trying multiple keys"""
+        attrs = dict(span.attributes) if span.attributes else {}
+        for key in keys:
+            if key in attrs:
+                return attrs[key]
+        return default
+    def _convert_span(self, span) -> dict:
+        """Convert OTel span to Kalibr event format"""
+        # Calculate duration from span times (nanoseconds to milliseconds)
+        duration_ms = 0
+        if span.start_time and span.end_time:
+            duration_ms = int((span.end_time - span.start_time) / 1_000_000)
+        # Determine status
+        is_error = (
+            hasattr(span.status, "status_code") and span.status.status_code == StatusCode.ERROR
+        )
+        status = "error" if is_error else "success"
+        # Extract provider and model
+        provider = self._get_attr(span, "llm.vendor", "llm.system", "gen_ai.system", default="")
+        model_id = self._get_attr(
+            span, "llm.request.model", "llm.response.model", "gen_ai.request.model", default=""
+        )
+        # Extract token counts
+        input_tokens = self._get_attr(
+            span, "llm.usage.prompt_tokens", "gen_ai.usage.prompt_tokens", default=0
+        )
+        output_tokens = self._get_attr(
+            span, "llm.usage.completion_tokens", "gen_ai.usage.completion_tokens", default=0
+        )
+        total_tokens = self._get_attr(
+            span, "llm.usage.total_tokens", "gen_ai.usage.total_tokens", default=0
+        )
+        # If total_tokens not provided, calculate it
+        if not total_tokens and (input_tokens or output_tokens):
+            total_tokens = (input_tokens or 0) + (output_tokens or 0)
+        # Build event payload
+        event = {
+            "schema_version": "1.0",
+            "trace_id": format(span.context.trace_id, "032x"),
+            "span_id": format(span.context.span_id, "016x"),
+            "parent_id": format(span.parent.span_id, "016x") if span.parent else None,
+            "tenant_id": self.tenant_id,
+            "provider": provider,
+            "model_id": model_id,
+            "model_name": model_id,
+            "operation": span.name,
+            "endpoint": span.name,
+            "input_tokens": input_tokens or 0,
+            "output_tokens": output_tokens or 0,
+            "total_tokens": total_tokens or 0,
+            "cost_usd": self._get_attr(span, "llm.cost_usd", "gen_ai.usage.cost", default=0.0),
+            "latency_ms": self._get_attr(span, "llm.latency_ms", default=duration_ms),
+            "duration_ms": duration_ms,
+            "status": status,
+            "error_type": self._get_attr(span, "error.type", default=None) if is_error else None,
+            "error_message": (
+                self._get_attr(span, "error.message", default=None) if is_error else None
+            ),
+            "timestamp": self._nanos_to_iso(span.end_time),
+            "ts_start": self._nanos_to_iso(span.start_time),
+            "ts_end": self._nanos_to_iso(span.end_time),
+            "goal": self._get_attr(span, "kalibr.goal", default=""),
+            "environment": self.environment,
+        }
+        return event
 _tracer_provider: Optional[TracerProvider] = None
 _is_configured = False
+_collector_lock = threading.Lock()
 def setup_collector(
@@ -94,6 +250,8 @@ def setup_collector(
     """
     Setup OpenTelemetry collector with multiple exporters
+    Thread-safe: Uses double-checked locking to ensure single initialization.
     Args:
         service_name: Service name for the tracer provider
         otlp_endpoint: OTLP collector endpoint (e.g., "http://localhost:4317")
@@ -106,50 +264,67 @@ def setup_collector(
     """
     global _tracer_provider, _is_configured
+    # First check without lock (fast path)
     if _is_configured and _tracer_provider:
         return _tracer_provider
-    # Create resource with service name
-    resource = Resource(attributes={SERVICE_NAME: service_name})
-    # Create tracer provider
-    provider = TracerProvider(resource=resource)
-    # Add OTLP exporter if endpoint is configured
-    otlp_endpoint = otlp_endpoint or os.getenv("OTEL_EXPORTER_OTLP_ENDPOINT")
-    if otlp_endpoint:
-        try:
-            otlp_exporter = OTLPSpanExporter(endpoint=otlp_endpoint)
-            provider.add_span_processor(BatchSpanProcessor(otlp_exporter))
-            print(f"✅ OTLP exporter configured: {otlp_endpoint}")
-        except Exception as e:
-            print(f"⚠️  Failed to configure OTLP exporter: {e}")
-    # Add file exporter for local fallback
-    if file_export:
-        try:
-            file_exporter = FileSpanExporter("/tmp/kalibr_otel_spans.jsonl")
-            provider.add_span_processor(BatchSpanProcessor(file_exporter))
-            print("✅ File exporter configured: /tmp/kalibr_otel_spans.jsonl")
-        except Exception as e:
-            print(f"⚠️  Failed to configure file exporter: {e}")
-    # Add console exporter for debugging
-    if console_export:
-        try:
-            console_exporter = ConsoleSpanExporter()
-            provider.add_span_processor(BatchSpanProcessor(console_exporter))
-            print("✅ Console exporter configured")
-        except Exception as e:
-            print(f"⚠️  Failed to configure console exporter: {e}")
-    # Set as global tracer provider
-    trace.set_tracer_provider(provider)
-    _tracer_provider = provider
-    _is_configured = True
-    return provider
+    # Acquire lock for initialization
+    with _collector_lock:
+        # Double-check inside lock
+        if _is_configured and _tracer_provider:
+            return _tracer_provider
+        # Create resource with service name
+        resource = Resource(attributes={SERVICE_NAME: service_name})
+        # Create tracer provider
+        provider = TracerProvider(resource=resource)
+        # Add OTLP exporter if endpoint is configured
+        otlp_endpoint = otlp_endpoint or os.getenv("OTEL_EXPORTER_OTLP_ENDPOINT")
+        if otlp_endpoint:
+            try:
+                otlp_exporter = OTLPSpanExporter(endpoint=otlp_endpoint)
+                provider.add_span_processor(BatchSpanProcessor(otlp_exporter))
+                print(f"✅ OTLP exporter configured: {otlp_endpoint}")
+            except Exception as e:
+                print(f"⚠️  Failed to configure OTLP exporter: {e}")
+        # Add Kalibr HTTP exporter if API key is configured
+        kalibr_api_key = os.getenv("KALIBR_API_KEY")
+        if kalibr_api_key:
+            try:
+                kalibr_exporter = KalibrHTTPSpanExporter()
+                provider.add_span_processor(BatchSpanProcessor(kalibr_exporter))
+                print(f"✅ Kalibr backend exporter configured: {kalibr_exporter.url}")
+            except Exception as e:
+                print(f"⚠️  Failed to configure Kalibr backend exporter: {e}")
+        # Add file exporter for local fallback
+        if file_export:
+            try:
+                file_exporter = FileSpanExporter("/tmp/kalibr_otel_spans.jsonl")
+                provider.add_span_processor(BatchSpanProcessor(file_exporter))
+                print("✅ File exporter configured: /tmp/kalibr_otel_spans.jsonl")
+            except Exception as e:
+                print(f"⚠️  Failed to configure file exporter: {e}")
+        # Add console exporter for debugging
+        if console_export:
+            try:
+                console_exporter = ConsoleSpanExporter()
+                provider.add_span_processor(BatchSpanProcessor(console_exporter))
+                print("✅ Console exporter configured")
+            except Exception as e:
+                print(f"⚠️  Failed to configure console exporter: {e}")
+        # Set as global tracer provider
+        trace.set_tracer_provider(provider)
+        _tracer_provider = provider
+        _is_configured = True
+        return provider
 def get_tracer_provider() -> Optional[TracerProvider]:
@@ -163,11 +338,15 @@ def is_configured() -> bool:
 def shutdown_collector():
-    """Shutdown the tracer provider and flush all spans"""
+    """Shutdown the tracer provider and flush all spans.
+    Thread-safe: Uses lock to protect shutdown operation.
+    """
     global _tracer_provider, _is_configured
-    if _tracer_provider:
-        _tracer_provider.shutdown()
-        _tracer_provider = None
-        _is_configured = False
-        print("✅ Tracer provider shutdown")
+    with _collector_lock:
+        if _tracer_provider:
+            _tracer_provider.shutdown()
+            _tracer_provider = None
+            _is_configured = False
+            print("✅ Tracer provider shutdown")

kalibr/cost_adapter.py CHANGED Viewed

@@ -10,6 +10,8 @@ Supports:
 - OpenAI (GPT-4, GPT-3.5, etc.)
 - Anthropic (Claude models)
 - Extensible for other vendors
+Note: All adapters now use centralized pricing from kalibr.pricing module.
 """
 import json
@@ -17,6 +19,8 @@ import os
 from abc import ABC, abstractmethod
 from typing import Dict, Optional
+from kalibr.pricing import get_pricing, normalize_model_name
 class BaseCostAdapter(ABC):
     """Base class for vendor cost adapters."""
@@ -42,43 +46,27 @@ class BaseCostAdapter(ABC):
 class OpenAICostAdapter(BaseCostAdapter):
-    """Cost adapter for OpenAI models."""
-    # OpenAI pricing as of 2025 (per 1M tokens)
-    # Source: https://openai.com/pricing
-    PRICING = {
-        "gpt-4": {
-            "input": 30.00,  # $30/1M input tokens
-            "output": 60.00,  # $60/1M output tokens
-        },
-        "gpt-4-turbo": {
-            "input": 10.00,
-            "output": 30.00,
-        },
-        "gpt-4o": {
-            "input": 2.50,
-            "output": 10.00,
-        },
-        "gpt-3.5-turbo": {
-            "input": 0.50,
-            "output": 1.50,
-        },
-        "gpt-4o-mini": {
-            "input": 0.15,
-            "output": 0.60,
-        },
-    }
+    """Cost adapter for OpenAI models.
+    Uses centralized pricing from kalibr.pricing module.
+    """
     def get_vendor_name(self) -> str:
         return "openai"
     def compute_cost(self, model_name: str, tokens_in: int, tokens_out: int) -> float:
-        """Compute cost for OpenAI models."""
-        # Normalize model name
-        model_key = self._normalize_model_name(model_name)
-        # Get pricing (default to gpt-4 if unknown)
-        pricing = self.PRICING.get(model_key, self.PRICING["gpt-4"])
+        """Compute cost for OpenAI models.
+        Args:
+            model_name: Model identifier (e.g., "gpt-4o", "gpt-4")
+            tokens_in: Input token count
+            tokens_out: Output token count
+        Returns:
+            Cost in USD (rounded to 6 decimal places)
+        """
+        # Get pricing from centralized module
+        pricing, _ = get_pricing("openai", model_name)
         # Calculate cost (pricing is per 1M tokens)
         input_cost = (tokens_in / 1_000_000) * pricing["input"]
@@ -86,64 +74,29 @@ class OpenAICostAdapter(BaseCostAdapter):
         return round(input_cost + output_cost, 6)
-    def _normalize_model_name(self, model_name: str) -> str:
-        """Normalize model name to match pricing table."""
-        model_lower = model_name.lower()
-        # Direct matches
-        if model_lower in self.PRICING:
-            return model_lower
-        # Fuzzy matches
-        if "gpt-4o-mini" in model_lower:
-            return "gpt-4o-mini"
-        elif "gpt-4o" in model_lower:
-            return "gpt-4o"
-        elif "gpt-4-turbo" in model_lower:
-            return "gpt-4-turbo"
-        elif "gpt-4" in model_lower:
-            return "gpt-4"
-        elif "gpt-3.5" in model_lower:
-            return "gpt-3.5-turbo"
-        # Default to gpt-4 for unknown models
-        return "gpt-4"
 class AnthropicCostAdapter(BaseCostAdapter):
-    """Cost adapter for Anthropic Claude models."""
-    # Anthropic pricing as of 2025 (per 1M tokens)
-    # Source: https://www.anthropic.com/pricing
-    PRICING = {
-        "claude-3-opus": {
-            "input": 15.00,
-            "output": 75.00,
-        },
-        "claude-3-sonnet": {
-            "input": 3.00,
-            "output": 15.00,
-        },
-        "claude-3-haiku": {
-            "input": 0.25,
-            "output": 1.25,
-        },
-        "claude-3.5-sonnet": {
-            "input": 3.00,
-            "output": 15.00,
-        },
-    }
+    """Cost adapter for Anthropic Claude models.
+    Uses centralized pricing from kalibr.pricing module.
+    """
     def get_vendor_name(self) -> str:
         return "anthropic"
     def compute_cost(self, model_name: str, tokens_in: int, tokens_out: int) -> float:
-        """Compute cost for Anthropic models."""
-        # Normalize model name
-        model_key = self._normalize_model_name(model_name)
-        # Get pricing (default to opus if unknown)
-        pricing = self.PRICING.get(model_key, self.PRICING["claude-3-opus"])
+        """Compute cost for Anthropic models.
+        Args:
+            model_name: Model identifier (e.g., "claude-3-opus", "claude-3-5-sonnet")
+            tokens_in: Input token count
+            tokens_out: Output token count
+        Returns:
+            Cost in USD (rounded to 6 decimal places)
+        """
+        # Get pricing from centralized module
+        pricing, _ = get_pricing("anthropic", model_name)
         # Calculate cost (pricing is per 1M tokens)
         input_cost = (tokens_in / 1_000_000) * pricing["input"]
@@ -151,27 +104,6 @@ class AnthropicCostAdapter(BaseCostAdapter):
         return round(input_cost + output_cost, 6)
-    def _normalize_model_name(self, model_name: str) -> str:
-        """Normalize model name to match pricing table."""
-        model_lower = model_name.lower()
-        # Direct matches
-        if model_lower in self.PRICING:
-            return model_lower
-        # Fuzzy matches
-        if "claude-3.5-sonnet" in model_lower or "claude-3-5-sonnet" in model_lower:
-            return "claude-3.5-sonnet"
-        elif "claude-3-opus" in model_lower:
-            return "claude-3-opus"
-        elif "claude-3-sonnet" in model_lower:
-            return "claude-3-sonnet"
-        elif "claude-3-haiku" in model_lower:
-            return "claude-3-haiku"
-        # Default to opus for unknown models
-        return "claude-3-opus"
 class CostAdapterFactory:
     """Factory to get appropriate cost adapter for a vendor."""

kalibr 1.2.5__py3-none-any.whl → 1.2.8__py3-none-any.whl

kalibr 1.2.5py3-none-any.whl → 1.2.8py3-none-any.whl