PyPI - lmnr - Versions diffs - 0.6.16__py3-none-any.whl → 0.7.26__py3-none-any.whl - Mend

lmnr 0.6.16py3-none-any.whl → 0.7.26py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (113) hide show

lmnr/__init__.py +6 -15
lmnr/cli/__init__.py +270 -0
lmnr/cli/datasets.py +371 -0
lmnr/{cli.py → cli/evals.py} +20 -102
lmnr/cli/rules.py +42 -0
lmnr/opentelemetry_lib/__init__.py +9 -2
lmnr/opentelemetry_lib/decorators/__init__.py +274 -168
lmnr/opentelemetry_lib/litellm/__init__.py +352 -38
lmnr/opentelemetry_lib/litellm/utils.py +82 -0
lmnr/opentelemetry_lib/opentelemetry/instrumentation/anthropic/__init__.py +849 -0
lmnr/opentelemetry_lib/opentelemetry/instrumentation/anthropic/config.py +13 -0
lmnr/opentelemetry_lib/opentelemetry/instrumentation/anthropic/event_emitter.py +211 -0
lmnr/opentelemetry_lib/opentelemetry/instrumentation/anthropic/event_models.py +41 -0
lmnr/opentelemetry_lib/opentelemetry/instrumentation/anthropic/span_utils.py +401 -0
lmnr/opentelemetry_lib/opentelemetry/instrumentation/anthropic/streaming.py +425 -0
lmnr/opentelemetry_lib/opentelemetry/instrumentation/anthropic/utils.py +332 -0
lmnr/opentelemetry_lib/opentelemetry/instrumentation/anthropic/version.py +1 -0
lmnr/opentelemetry_lib/opentelemetry/instrumentation/claude_agent/__init__.py +451 -0
lmnr/opentelemetry_lib/opentelemetry/instrumentation/claude_agent/proxy.py +144 -0
lmnr/opentelemetry_lib/opentelemetry/instrumentation/cua_agent/__init__.py +100 -0
lmnr/opentelemetry_lib/opentelemetry/instrumentation/cua_computer/__init__.py +476 -0
lmnr/opentelemetry_lib/opentelemetry/instrumentation/cua_computer/utils.py +12 -0
lmnr/opentelemetry_lib/opentelemetry/instrumentation/google_genai/__init__.py +191 -129
lmnr/opentelemetry_lib/opentelemetry/instrumentation/google_genai/schema_utils.py +26 -0
lmnr/opentelemetry_lib/opentelemetry/instrumentation/google_genai/utils.py +126 -41
lmnr/opentelemetry_lib/opentelemetry/instrumentation/groq/__init__.py +488 -0
lmnr/opentelemetry_lib/opentelemetry/instrumentation/groq/config.py +8 -0
lmnr/opentelemetry_lib/opentelemetry/instrumentation/groq/event_emitter.py +143 -0
lmnr/opentelemetry_lib/opentelemetry/instrumentation/groq/event_models.py +41 -0
lmnr/opentelemetry_lib/opentelemetry/instrumentation/groq/span_utils.py +229 -0
lmnr/opentelemetry_lib/opentelemetry/instrumentation/groq/utils.py +92 -0
lmnr/opentelemetry_lib/opentelemetry/instrumentation/groq/version.py +1 -0
lmnr/opentelemetry_lib/opentelemetry/instrumentation/kernel/__init__.py +381 -0
lmnr/opentelemetry_lib/opentelemetry/instrumentation/kernel/utils.py +36 -0
lmnr/opentelemetry_lib/opentelemetry/instrumentation/langgraph/__init__.py +16 -16
lmnr/opentelemetry_lib/opentelemetry/instrumentation/openai/__init__.py +61 -0
lmnr/opentelemetry_lib/opentelemetry/instrumentation/openai/shared/__init__.py +472 -0
lmnr/opentelemetry_lib/opentelemetry/instrumentation/openai/shared/chat_wrappers.py +1185 -0
lmnr/opentelemetry_lib/opentelemetry/instrumentation/openai/shared/completion_wrappers.py +305 -0
lmnr/opentelemetry_lib/opentelemetry/instrumentation/openai/shared/config.py +16 -0
lmnr/opentelemetry_lib/opentelemetry/instrumentation/openai/shared/embeddings_wrappers.py +312 -0
lmnr/opentelemetry_lib/opentelemetry/instrumentation/openai/shared/event_emitter.py +100 -0
lmnr/opentelemetry_lib/opentelemetry/instrumentation/openai/shared/event_models.py +41 -0
lmnr/opentelemetry_lib/opentelemetry/instrumentation/openai/shared/image_gen_wrappers.py +68 -0
lmnr/opentelemetry_lib/opentelemetry/instrumentation/openai/utils.py +197 -0
lmnr/opentelemetry_lib/opentelemetry/instrumentation/openai/v0/__init__.py +176 -0
lmnr/opentelemetry_lib/opentelemetry/instrumentation/openai/v1/__init__.py +368 -0
lmnr/opentelemetry_lib/opentelemetry/instrumentation/openai/v1/assistant_wrappers.py +325 -0
lmnr/opentelemetry_lib/opentelemetry/instrumentation/openai/v1/event_handler_wrapper.py +135 -0
lmnr/opentelemetry_lib/opentelemetry/instrumentation/openai/v1/responses_wrappers.py +786 -0
lmnr/opentelemetry_lib/opentelemetry/instrumentation/openai/version.py +1 -0
lmnr/opentelemetry_lib/opentelemetry/instrumentation/openhands_ai/__init__.py +388 -0
lmnr/opentelemetry_lib/opentelemetry/instrumentation/opentelemetry/__init__.py +69 -0
lmnr/opentelemetry_lib/opentelemetry/instrumentation/skyvern/__init__.py +59 -61
lmnr/opentelemetry_lib/opentelemetry/instrumentation/threading/__init__.py +197 -0
lmnr/opentelemetry_lib/tracing/__init__.py +119 -18
lmnr/opentelemetry_lib/tracing/_instrument_initializers.py +124 -25
lmnr/opentelemetry_lib/tracing/attributes.py +4 -0
lmnr/opentelemetry_lib/tracing/context.py +200 -0
lmnr/opentelemetry_lib/tracing/exporter.py +109 -15
lmnr/opentelemetry_lib/tracing/instruments.py +22 -5
lmnr/opentelemetry_lib/tracing/processor.py +128 -30
lmnr/opentelemetry_lib/tracing/span.py +398 -0
lmnr/opentelemetry_lib/tracing/tracer.py +40 -1
lmnr/opentelemetry_lib/tracing/utils.py +62 -0
lmnr/opentelemetry_lib/utils/package_check.py +9 -0
lmnr/opentelemetry_lib/utils/wrappers.py +11 -0
lmnr/sdk/browser/background_send_events.py +158 -0
lmnr/sdk/browser/browser_use_cdp_otel.py +100 -0
lmnr/sdk/browser/browser_use_otel.py +12 -12
lmnr/sdk/browser/bubus_otel.py +71 -0
lmnr/sdk/browser/cdp_utils.py +518 -0
lmnr/sdk/browser/inject_script.js +514 -0
lmnr/sdk/browser/patchright_otel.py +18 -44
lmnr/sdk/browser/playwright_otel.py +104 -187
lmnr/sdk/browser/pw_utils.py +249 -210
lmnr/sdk/browser/recorder/record.umd.min.cjs +84 -0
lmnr/sdk/browser/utils.py +1 -1
lmnr/sdk/client/asynchronous/async_client.py +47 -15
lmnr/sdk/client/asynchronous/resources/__init__.py +2 -7
lmnr/sdk/client/asynchronous/resources/browser_events.py +1 -0
lmnr/sdk/client/asynchronous/resources/datasets.py +131 -0
lmnr/sdk/client/asynchronous/resources/evals.py +122 -18
lmnr/sdk/client/asynchronous/resources/evaluators.py +85 -0
lmnr/sdk/client/asynchronous/resources/tags.py +4 -10
lmnr/sdk/client/synchronous/resources/__init__.py +2 -2
lmnr/sdk/client/synchronous/resources/datasets.py +131 -0
lmnr/sdk/client/synchronous/resources/evals.py +83 -17
lmnr/sdk/client/synchronous/resources/evaluators.py +85 -0
lmnr/sdk/client/synchronous/resources/tags.py +4 -10
lmnr/sdk/client/synchronous/sync_client.py +47 -15
lmnr/sdk/datasets/__init__.py +94 -0
lmnr/sdk/datasets/file_utils.py +91 -0
lmnr/sdk/decorators.py +103 -23
lmnr/sdk/evaluations.py +122 -33
lmnr/sdk/laminar.py +816 -333
lmnr/sdk/log.py +7 -2
lmnr/sdk/types.py +124 -143
lmnr/sdk/utils.py +115 -2
lmnr/version.py +1 -1
{lmnr-0.6.16.dist-info → lmnr-0.7.26.dist-info}/METADATA +71 -78
lmnr-0.7.26.dist-info/RECORD +116 -0
lmnr-0.7.26.dist-info/WHEEL +4 -0
lmnr-0.7.26.dist-info/entry_points.txt +3 -0
lmnr/opentelemetry_lib/tracing/context_properties.py +0 -65
lmnr/sdk/browser/rrweb/rrweb.umd.min.cjs +0 -98
lmnr/sdk/client/asynchronous/resources/agent.py +0 -329
lmnr/sdk/client/synchronous/resources/agent.py +0 -323
lmnr/sdk/datasets.py +0 -60
lmnr-0.6.16.dist-info/LICENSE +0 -75
lmnr-0.6.16.dist-info/RECORD +0 -61
lmnr-0.6.16.dist-info/WHEEL +0 -4
lmnr-0.6.16.dist-info/entry_points.txt +0 -3

lmnr/opentelemetry_lib/opentelemetry/instrumentation/anthropic/streaming.py ADDED Viewed

@@ -0,0 +1,425 @@
+import logging
+import time
+from typing import Optional
+from opentelemetry._events import EventLogger
+from .config import Config
+from .event_emitter import (
+    emit_streaming_response_events,
+)
+from .span_utils import (
+    set_streaming_response_attributes,
+)
+from .utils import (
+    count_prompt_tokens_from_request,
+    dont_throw,
+    error_metrics_attributes,
+    set_span_attribute,
+    shared_metrics_attributes,
+    should_emit_events,
+)
+from opentelemetry.metrics import Counter, Histogram
+from opentelemetry.semconv._incubating.attributes.gen_ai_attributes import (
+    GEN_AI_RESPONSE_ID,
+)
+from opentelemetry.semconv_ai import SpanAttributes
+from opentelemetry.trace.status import Status, StatusCode
+logger = logging.getLogger(__name__)
+@dont_throw
+def _process_response_item(item, complete_response):
+    if item.type == "message_start":
+        complete_response["model"] = item.message.model
+        usage = dict(item.message.usage)
+        complete_response["usage"] = usage
+        complete_response["service_tier"] = usage.get("service_tier") or None
+        complete_response["id"] = item.message.id
+    elif item.type == "content_block_start":
+        index = item.index
+        if len(complete_response.get("events")) <= index:
+            complete_response["events"].append(
+                {"index": index, "text": "", "type": item.content_block.type}
+            )
+            if item.content_block.type == "tool_use":
+                complete_response["events"][index]["id"] = item.content_block.id
+                complete_response["events"][index]["name"] = item.content_block.name
+                complete_response["events"][index]["input"] = ""
+    elif item.type == "content_block_delta":
+        index = item.index
+        if item.delta.type == "thinking_delta":
+            complete_response["events"][index]["text"] += item.delta.thinking or ""
+        elif item.delta.type == "text_delta":
+            complete_response["events"][index]["text"] += item.delta.text or ""
+        elif item.delta.type == "input_json_delta":
+            complete_response["events"][index]["input"] += item.delta.partial_json
+    elif item.type == "message_delta":
+        for event in complete_response.get("events", []):
+            event["finish_reason"] = item.delta.stop_reason
+        if item.usage:
+            if "usage" in complete_response:
+                item_output_tokens = dict(item.usage).get("output_tokens", 0)
+                existing_output_tokens = complete_response["usage"].get(
+                    "output_tokens", 0
+                )
+                complete_response["usage"]["output_tokens"] = (
+                    item_output_tokens + existing_output_tokens
+                )
+            else:
+                complete_response["usage"] = dict(item.usage)
+    elif item.type in ["message_stop", "message_start"]:
+        # raw stream returns the service_tier in the message_start event
+        # messages.stream returns the service_tier in the message_stop event
+        usage = dict(item.message.usage or {})
+        complete_response["service_tier"] = usage.get("service_tier")
+def _set_token_usage(
+    span,
+    complete_response,
+    prompt_tokens,
+    completion_tokens,
+    metric_attributes: dict = {},
+    token_histogram: Histogram = None,
+    choice_counter: Counter = None,
+):
+    cache_read_tokens = (
+        complete_response.get("usage", {}).get("cache_read_input_tokens", 0) or 0
+    )
+    cache_creation_tokens = (
+        complete_response.get("usage", {}).get("cache_creation_input_tokens", 0) or 0
+    )
+    input_tokens = prompt_tokens + cache_read_tokens + cache_creation_tokens
+    total_tokens = input_tokens + completion_tokens
+    set_span_attribute(span, SpanAttributes.LLM_USAGE_PROMPT_TOKENS, input_tokens)
+    set_span_attribute(
+        span, SpanAttributes.LLM_USAGE_COMPLETION_TOKENS, completion_tokens
+    )
+    set_span_attribute(span, SpanAttributes.LLM_USAGE_TOTAL_TOKENS, total_tokens)
+    set_span_attribute(
+        span, SpanAttributes.LLM_RESPONSE_MODEL, complete_response.get("model")
+    )
+    set_span_attribute(
+        span, SpanAttributes.LLM_USAGE_CACHE_READ_INPUT_TOKENS, cache_read_tokens
+    )
+    set_span_attribute(
+        span,
+        SpanAttributes.LLM_USAGE_CACHE_CREATION_INPUT_TOKENS,
+        cache_creation_tokens,
+    )
+    if token_histogram and type(input_tokens) is int and input_tokens >= 0:
+        token_histogram.record(
+            input_tokens,
+            attributes={
+                **metric_attributes,
+                SpanAttributes.LLM_TOKEN_TYPE: "input",
+            },
+        )
+    if token_histogram and type(completion_tokens) is int and completion_tokens >= 0:
+        token_histogram.record(
+            completion_tokens,
+            attributes={
+                **metric_attributes,
+                SpanAttributes.LLM_TOKEN_TYPE: "output",
+            },
+        )
+    if type(complete_response.get("events")) is list and choice_counter:
+        for event in complete_response.get("events"):
+            choice_counter.add(
+                1,
+                attributes={
+                    **metric_attributes,
+                    SpanAttributes.LLM_RESPONSE_FINISH_REASON: event.get(
+                        "finish_reason"
+                    ),
+                },
+            )
+def _handle_streaming_response(span, event_logger, complete_response):
+    if should_emit_events() and event_logger:
+        emit_streaming_response_events(event_logger, complete_response)
+    else:
+        if not span.is_recording():
+            return
+        set_streaming_response_attributes(span, complete_response.get("events"))
+@dont_throw
+def build_from_streaming_response(
+    span,
+    response,
+    instance,
+    start_time,
+    token_histogram: Histogram = None,
+    choice_counter: Counter = None,
+    duration_histogram: Histogram = None,
+    exception_counter: Counter = None,
+    event_logger: Optional[EventLogger] = None,
+    kwargs: dict = {},
+):
+    complete_response = {
+        "events": [],
+        "model": "",
+        "usage": {},
+        "id": "",
+        "service_tier": None,
+    }
+    for item in response:
+        try:
+            yield item
+        except Exception as e:
+            attributes = error_metrics_attributes(e)
+            if exception_counter:
+                exception_counter.add(1, attributes=attributes)
+            raise e
+        _process_response_item(item, complete_response)
+    metric_attributes = shared_metrics_attributes(complete_response)
+    set_span_attribute(span, GEN_AI_RESPONSE_ID, complete_response.get("id"))
+    set_span_attribute(
+        span,
+        "anthropic.response.service_tier",
+        complete_response.get("service_tier"),
+    )
+    if duration_histogram:
+        duration = time.time() - start_time
+        duration_histogram.record(
+            duration,
+            attributes=metric_attributes,
+        )
+    # calculate token usage
+    if Config.enrich_token_usage:
+        try:
+            completion_tokens = -1
+            # prompt_usage
+            if usage := complete_response.get("usage"):
+                prompt_tokens = usage.get("input_tokens", 0) or 0
+            else:
+                prompt_tokens = count_prompt_tokens_from_request(instance, kwargs)
+            # completion_usage
+            if usage := complete_response.get("usage"):
+                completion_tokens = usage.get("output_tokens", 0) or 0
+            else:
+                completion_content = ""
+                if complete_response.get("events"):
+                    model_name = complete_response.get("model") or None
+                    for event in complete_response.get("events"):
+                        if event.get("text"):
+                            completion_content += event.get("text")
+                    if model_name and hasattr(instance, "count_tokens"):
+                        completion_tokens = instance.count_tokens(completion_content)
+            _set_token_usage(
+                span,
+                complete_response,
+                prompt_tokens,
+                completion_tokens,
+                metric_attributes,
+                token_histogram,
+                choice_counter,
+            )
+        except Exception as e:
+            logger.warning("Failed to set token usage, error: %s", e)
+    _handle_streaming_response(span, event_logger, complete_response)
+    if span.is_recording():
+        span.set_status(Status(StatusCode.OK))
+        span.end()
+@dont_throw
+async def abuild_from_streaming_response(
+    span,
+    response,
+    instance,
+    start_time,
+    token_histogram: Histogram = None,
+    choice_counter: Counter = None,
+    duration_histogram: Histogram = None,
+    exception_counter: Counter = None,
+    event_logger: Optional[EventLogger] = None,
+    kwargs: dict = {},
+):
+    complete_response = {
+        "events": [],
+        "model": "",
+        "usage": {},
+        "id": "",
+        "service_tier": None,
+    }
+    async for item in response:
+        try:
+            yield item
+        except Exception as e:
+            attributes = error_metrics_attributes(e)
+            if exception_counter:
+                exception_counter.add(1, attributes=attributes)
+            raise e
+        _process_response_item(item, complete_response)
+    set_span_attribute(span, GEN_AI_RESPONSE_ID, complete_response.get("id"))
+    set_span_attribute(
+        span,
+        "anthropic.response.service_tier",
+        complete_response.get("service_tier"),
+    )
+    metric_attributes = shared_metrics_attributes(complete_response)
+    if duration_histogram:
+        duration = time.time() - start_time
+        duration_histogram.record(
+            duration,
+            attributes=metric_attributes,
+        )
+    # calculate token usage
+    if Config.enrich_token_usage:
+        try:
+            # prompt_usage
+            if usage := complete_response.get("usage"):
+                prompt_tokens = usage.get("input_tokens", 0)
+            else:
+                prompt_tokens = count_prompt_tokens_from_request(instance, kwargs)
+            # completion_usage
+            if usage := complete_response.get("usage"):
+                completion_tokens = usage.get("output_tokens", 0)
+            else:
+                completion_content = ""
+                if complete_response.get("events"):
+                    model_name = complete_response.get("model") or None
+                    for event in complete_response.get("events"):
+                        if event.get("text"):
+                            completion_content += event.get("text")
+                    if model_name and hasattr(instance, "count_tokens"):
+                        completion_tokens = instance.count_tokens(completion_content)
+            _set_token_usage(
+                span,
+                complete_response,
+                prompt_tokens,
+                completion_tokens,
+                metric_attributes,
+                token_histogram,
+                choice_counter,
+            )
+        except Exception as e:
+            logger.warning("Failed to set token usage, error: %s", str(e))
+    _handle_streaming_response(span, event_logger, complete_response)
+    if span.is_recording():
+        span.set_status(Status(StatusCode.OK))
+        span.end()
+class WrappedMessageStreamManager:
+    """Wrapper for MessageStreamManager that handles instrumentation"""
+    def __init__(
+        self,
+        stream_manager,
+        span,
+        instance,
+        start_time,
+        token_histogram,
+        choice_counter,
+        duration_histogram,
+        exception_counter,
+        event_logger,
+        kwargs,
+    ):
+        self._stream_manager = stream_manager
+        self._span = span
+        self._instance = instance
+        self._start_time = start_time
+        self._token_histogram = token_histogram
+        self._choice_counter = choice_counter
+        self._duration_histogram = duration_histogram
+        self._exception_counter = exception_counter
+        self._event_logger = event_logger
+        self._kwargs = kwargs
+    def __enter__(self):
+        # Call the original stream manager's __enter__ to get the actual stream
+        stream = self._stream_manager.__enter__()
+        # Return the wrapped stream
+        return build_from_streaming_response(
+            self._span,
+            stream,
+            self._instance,
+            self._start_time,
+            self._token_histogram,
+            self._choice_counter,
+            self._duration_histogram,
+            self._exception_counter,
+            self._event_logger,
+            self._kwargs,
+        )
+    def __exit__(self, exc_type, exc_val, exc_tb):
+        return self._stream_manager.__exit__(exc_type, exc_val, exc_tb)
+class WrappedAsyncMessageStreamManager:
+    """Wrapper for AsyncMessageStreamManager that handles instrumentation"""
+    def __init__(
+        self,
+        stream_manager,
+        span,
+        instance,
+        start_time,
+        token_histogram,
+        choice_counter,
+        duration_histogram,
+        exception_counter,
+        event_logger,
+        kwargs,
+    ):
+        self._stream_manager = stream_manager
+        self._span = span
+        self._instance = instance
+        self._start_time = start_time
+        self._token_histogram = token_histogram
+        self._choice_counter = choice_counter
+        self._duration_histogram = duration_histogram
+        self._exception_counter = exception_counter
+        self._event_logger = event_logger
+        self._kwargs = kwargs
+    async def __aenter__(self):
+        # Call the original stream manager's __aenter__ to get the actual stream
+        stream = await self._stream_manager.__aenter__()
+        # Return the wrapped stream
+        return abuild_from_streaming_response(
+            self._span,
+            stream,
+            self._instance,
+            self._start_time,
+            self._token_histogram,
+            self._choice_counter,
+            self._duration_histogram,
+            self._exception_counter,
+            self._event_logger,
+            self._kwargs,
+        )
+    async def __aexit__(self, exc_type, exc_val, exc_tb):
+        return await self._stream_manager.__aexit__(exc_type, exc_val, exc_tb)

lmnr 0.6.16__py3-none-any.whl → 0.7.26__py3-none-any.whl

lmnr 0.6.16py3-none-any.whl → 0.7.26py3-none-any.whl