PyPI - contexttrace - Versions diffs - 0.1.0__py3-none-any.whl - Mend

contexttrace 0.1.0__py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (31) hide show

contexttrace/__init__.py +36 -0
contexttrace/_version.py +1 -0
contexttrace/cli.py +474 -0
contexttrace/client.py +1074 -0
contexttrace/config.py +246 -0
contexttrace/demo.py +311 -0
contexttrace/demo_data.py +257 -0
contexttrace/endpoint_eval.py +314 -0
contexttrace/errors.py +14 -0
contexttrace/evaluator.py +448 -0
contexttrace/integrations/__init__.py +14 -0
contexttrace/integrations/fastapi.py +311 -0
contexttrace/integrations/langchain.py +440 -0
contexttrace/integrations/langgraph.py +197 -0
contexttrace/integrations/llamaindex.py +422 -0
contexttrace/integrations/opentelemetry.py +111 -0
contexttrace/local.py +325 -0
contexttrace/py.typed +1 -0
contexttrace/regression.py +123 -0
contexttrace/reliability.py +284 -0
contexttrace/report.py +550 -0
contexttrace/storage/__init__.py +3 -0
contexttrace/storage/sqlite_store.py +604 -0
contexttrace/thresholds.py +50 -0
contexttrace/transport.py +183 -0
contexttrace/viewer.py +148 -0
contexttrace-0.1.0.dist-info/METADATA +154 -0
contexttrace-0.1.0.dist-info/RECORD +31 -0
contexttrace-0.1.0.dist-info/WHEEL +5 -0
contexttrace-0.1.0.dist-info/entry_points.txt +2 -0
contexttrace-0.1.0.dist-info/top_level.txt +1 -0

contexttrace/integrations/langchain.py ADDED Viewed

@@ -0,0 +1,440 @@
+from __future__ import annotations
+import time
+from collections.abc import Iterable as RuntimeIterable
+from typing import Any, Callable, Dict, Iterable, Optional
+from contexttrace.client import ContextTrace
+try:
+    from langchain_core.callbacks import BaseCallbackHandler
+except Exception:  # pragma: no cover - exercised when langchain is not installed
+    BaseCallbackHandler = object  # type: ignore[assignment]
+QueryExtractor = Callable[[Any], Optional[str]]
+AnswerExtractor = Callable[[Any], Optional[str]]
+CitationExtractor = Callable[[Any], Iterable[Dict[str, Any]]]
+DocumentConverter = Callable[[Any, int], Dict[str, Any]]
+MetadataExtractor = Callable[[Any, Dict[str, Any]], Dict[str, Any]]
+class ContextTraceCallbackHandler(BaseCallbackHandler):  # type: ignore[misc]
+    def __init__(
+        self,
+        *,
+        project: Optional[str] = None,
+        api_key: Optional[str] = None,
+        base_url: str = "http://localhost:8000",
+        client: Optional[ContextTrace] = None,
+        trace_metadata: Optional[dict[str, Any]] = None,
+        selected_context_limit: Optional[int] = None,
+        query_extractor: Optional[QueryExtractor] = None,
+        answer_extractor: Optional[AnswerExtractor] = None,
+        citation_extractor: Optional[CitationExtractor] = None,
+        document_converter: Optional[DocumentConverter] = None,
+        metadata_extractor: Optional[MetadataExtractor] = None,
+        log_agent_events: bool = True,
+    ) -> None:
+        if client is None:
+            kwargs: dict[str, Any] = {"project": project or "default"}
+            if api_key:
+                kwargs.update({"api_key": api_key, "base_url": base_url, "mode": "hosted"})
+            client = ContextTrace(**kwargs)
+        self.client = client
+        self.trace_metadata = trace_metadata or {}
+        self.selected_context_limit = selected_context_limit
+        self.query_extractor = query_extractor or _extract_query
+        self.answer_extractor = answer_extractor or _extract_answer
+        self.citation_extractor = citation_extractor or _extract_citations
+        self.document_converter = document_converter or langchain_document_to_chunk
+        self.metadata_extractor = metadata_extractor
+        self.log_agent_events = log_agent_events
+        self.trace = None
+        self.query: Optional[str] = None
+        self.retrieved_chunks: list[dict[str, Any]] = []
+        self.start_time: Optional[float] = None
+        self.retriever_start_time: Optional[float] = None
+        self.llm_model: Optional[str] = None
+        self.llm_usage: dict[str, Any] = {}
+        self.answer_logged = False
+        self._tool_start_times: dict[str, float] = {}
+        self._tool_names: dict[str, str] = {}
+    def on_chain_start(
+        self,
+        serialized: dict[str, Any],
+        inputs: Any,
+        **kwargs: Any,
+    ) -> None:
+        query = self.query_extractor(inputs)
+        if query:
+            self._ensure_trace(
+                query=query,
+                event="chain_start",
+                metadata=_event_metadata(serialized, kwargs),
+            )
+    def on_retriever_start(
+        self,
+        serialized: dict[str, Any],
+        query: str,
+        **kwargs: Any,
+    ) -> None:
+        self.retriever_start_time = time.perf_counter()
+        self._ensure_trace(
+            query=query,
+            event="retriever_start",
+            metadata=_event_metadata(serialized, kwargs),
+        )
+    def on_retriever_end(self, documents: Iterable[Any], **kwargs: Any) -> None:
+        chunks = [self.document_converter(document, index) for index, document in enumerate(documents)]
+        self.retrieved_chunks = chunks
+        if self.trace is None:
+            self._ensure_trace(
+                query=self.query or "unknown query",
+                event="retriever_end",
+                metadata=_event_metadata(None, kwargs),
+            )
+        if not chunks or self.trace is None:
+            return
+        self.trace.log_retrieval(
+            chunks,
+            retriever_name=_serialized_name(kwargs.get("serialized")) or "langchain_retriever",
+            metadata={
+                **_event_metadata(None, kwargs),
+                "latency_ms": _elapsed_ms(self.retriever_start_time),
+            },
+        )
+        selected = chunks[: self.selected_context_limit] if self.selected_context_limit else chunks
+        self.trace.log_context(
+            selected,
+            metadata={
+                "source": "langchain_retriever_end",
+                "selected_context_limit": self.selected_context_limit,
+            },
+        )
+    def on_llm_start(self, serialized: dict[str, Any], prompts: list[str], **kwargs: Any) -> None:
+        model = _serialized_name(serialized)
+        if model:
+            self.llm_model = model
+        if self.trace is None:
+            query = self.query or (prompts[0] if prompts else "unknown query")
+            self._ensure_trace(
+                query=query,
+                event="llm_start",
+                metadata=_event_metadata(serialized, kwargs),
+            )
+    def on_llm_end(self, response: Any, **kwargs: Any) -> None:
+        self.llm_usage = _extract_token_usage(response)
+        self.llm_model = _extract_model(response) or self.llm_model
+    def on_chain_end(self, outputs: Any, **kwargs: Any) -> None:
+        answer = self.answer_extractor(outputs)
+        if not answer:
+            return
+        if self.trace is None:
+            self._ensure_trace(
+                query=self.query or "unknown query",
+                event="chain_end",
+                metadata=_event_metadata(None, kwargs),
+            )
+        if self.trace is None or self.answer_logged:
+            return
+        self.trace.log_answer(
+            answer,
+            model=self.llm_model,
+            usage=self.llm_usage,
+            metadata=self._merge_metadata(
+                outputs,
+                {
+                "latency_ms": self._latency_ms(),
+                "langchain_output_keys": list(outputs.keys()) if isinstance(outputs, dict) else [],
+                },
+            ),
+        )
+        citations = list(self.citation_extractor(outputs))
+        if citations:
+            self.trace.log_citations(citations)
+        self.answer_logged = True
+    def on_chain_error(self, error: BaseException, **kwargs: Any) -> None:
+        if self.trace is not None and self.log_agent_events:
+            self.trace.log_agent_error(
+                str(error),
+                name="langchain_chain_error",
+                metadata={
+                    "error_type": error.__class__.__name__,
+                    **_event_metadata(None, kwargs),
+                },
+                latency_ms=self._latency_ms(),
+            )
+        if self.trace is not None and not self.answer_logged:
+            self.trace.log_answer(
+                "LangChain run failed before producing an answer.",
+                metadata={
+                    "latency_ms": self._latency_ms(),
+                    "error": str(error),
+                    "error_type": error.__class__.__name__,
+                },
+            )
+            self.answer_logged = True
+    def on_tool_start(self, serialized: dict[str, Any], input_str: str, **kwargs: Any) -> None:
+        if not self.log_agent_events:
+            return
+        if self.trace is None:
+            self._ensure_trace(
+                query=self.query or input_str or "unknown query",
+                event="tool_start",
+                metadata=_event_metadata(serialized, kwargs),
+            )
+        if self.trace is None:
+            return
+        run_id = str(kwargs.get("run_id") or _serialized_name(serialized) or input_str)
+        tool_name = _serialized_name(serialized) or kwargs.get("name") or "langchain_tool"
+        self._tool_start_times[run_id] = time.perf_counter()
+        self._tool_names[run_id] = str(tool_name)
+        self.trace.log_tool_call(
+            str(tool_name),
+            input_json={"input": input_str},
+            metadata=_event_metadata(serialized, kwargs),
+        )
+    def on_tool_end(self, output: Any, **kwargs: Any) -> None:
+        if not self.log_agent_events or self.trace is None:
+            return
+        run_id = str(kwargs.get("run_id") or "langchain_tool")
+        tool_name = self._tool_names.get(run_id) or kwargs.get("name") or "langchain_tool"
+        self.trace.log_tool_result(
+            str(tool_name),
+            output_json=_json_safe(output),
+            metadata=_event_metadata(None, kwargs),
+            latency_ms=_elapsed_ms(self._tool_start_times.get(run_id)),
+        )
+    def on_tool_error(self, error: BaseException, **kwargs: Any) -> None:
+        if not self.log_agent_events or self.trace is None:
+            return
+        run_id = str(kwargs.get("run_id") or "langchain_tool")
+        tool_name = self._tool_names.get(run_id) or kwargs.get("name") or "langchain_tool"
+        self.trace.log_agent_error(
+            str(error),
+            name=str(tool_name),
+            metadata={
+                "error_type": error.__class__.__name__,
+                **_event_metadata(None, kwargs),
+            },
+            latency_ms=_elapsed_ms(self._tool_start_times.get(run_id)),
+        )
+    def _ensure_trace(
+        self,
+        *,
+        query: str,
+        event: str,
+        metadata: dict[str, Any],
+    ) -> None:
+        if self.trace is not None:
+            return
+        self.query = query
+        self.start_time = time.perf_counter()
+        trace_metadata = dict(self.trace_metadata)
+        trace_metadata.update(
+            {
+                "integration": "langchain",
+                "start_event": event,
+                "langchain": metadata,
+            }
+        )
+        self.trace = self.client.trace(query=query, metadata=trace_metadata).__enter__()
+    def _latency_ms(self) -> int:
+        if self.start_time is None:
+            return 0
+        return int((time.perf_counter() - self.start_time) * 1000)
+    def _merge_metadata(self, source: Any, base: dict[str, Any]) -> dict[str, Any]:
+        if not self.metadata_extractor:
+            return base
+        extracted = self.metadata_extractor(source, base)
+        if not extracted:
+            return base
+        merged = dict(base)
+        merged.update(extracted)
+        return merged
+def langchain_document_to_chunk(document: Any, index: int = 0) -> dict[str, Any]:
+    metadata = getattr(document, "metadata", None) or {}
+    if not isinstance(metadata, dict):
+        metadata = {"metadata": metadata}
+    content = (
+        getattr(document, "page_content", None)
+        or getattr(document, "content", None)
+        or getattr(document, "text", None)
+    )
+    if content is None and isinstance(document, dict):
+        content = document.get("page_content") or document.get("content") or document.get("text")
+        metadata = document.get("metadata") or metadata
+    if content is None:
+        raise ValueError("LangChain document must include page_content, content, or text.")
+    chunk_id = (
+        metadata.get("chunk_id")
+        or metadata.get("id")
+        or metadata.get("doc_id")
+        or getattr(document, "id", None)
+        or f"langchain_doc_{index}"
+    )
+    source = metadata.get("source") or metadata.get("url") or metadata.get("path")
+    relevance_score = (
+        metadata.get("relevance_score")
+        or metadata.get("score")
+        or getattr(document, "score", None)
+    )
+    return {
+        "chunk_id": str(chunk_id),
+        "content": str(content),
+        "source": source,
+        "metadata": metadata,
+        "relevance_score": relevance_score,
+    }
+def _extract_query(inputs: Any) -> Optional[str]:
+    if isinstance(inputs, str):
+        return inputs
+    if not isinstance(inputs, dict):
+        return None
+    for key in ("query", "question", "input", "prompt"):
+        value = inputs.get(key)
+        if isinstance(value, str) and value.strip():
+            return value
+    for value in inputs.values():
+        if isinstance(value, str) and value.strip():
+            return value
+    return None
+def _extract_answer(outputs: Any) -> Optional[str]:
+    if isinstance(outputs, str):
+        return outputs
+    if not isinstance(outputs, dict):
+        return None
+    for key in ("answer", "output", "result", "text", "response"):
+        value = outputs.get(key)
+        if isinstance(value, str) and value.strip():
+            return value
+    for value in outputs.values():
+        if isinstance(value, str) and value.strip():
+            return value
+    return None
+def _extract_citations(outputs: Any) -> Iterable[dict[str, Any]]:
+    if not isinstance(outputs, dict):
+        return []
+    raw = outputs.get("citations") or outputs.get("citation_checks") or []
+    if not isinstance(raw, RuntimeIterable) or isinstance(raw, (str, bytes)):
+        return []
+    citations = []
+    for citation in raw:
+        if not isinstance(citation, dict):
+            continue
+        claim = citation.get("claim")
+        source_chunk_id = citation.get("source_chunk_id") or citation.get("chunk_id") or citation.get("source")
+        if claim and source_chunk_id:
+            citations.append({"claim": str(claim), "source_chunk_id": str(source_chunk_id)})
+    return citations
+def _extract_token_usage(response: Any) -> dict[str, Any]:
+    llm_output = getattr(response, "llm_output", None) or {}
+    if isinstance(llm_output, dict):
+        token_usage = llm_output.get("token_usage") or llm_output.get("usage")
+        if isinstance(token_usage, dict):
+            return token_usage
+    return {}
+def _extract_model(response: Any) -> Optional[str]:
+    llm_output = getattr(response, "llm_output", None) or {}
+    if isinstance(llm_output, dict):
+        model = llm_output.get("model_name") or llm_output.get("model")
+        if isinstance(model, str):
+            return model
+    return None
+def _elapsed_ms(start_time: Optional[float]) -> Optional[int]:
+    if start_time is None:
+        return None
+    return int((time.perf_counter() - start_time) * 1000)
+def _json_safe(value: Any) -> Any:
+    if value is None or isinstance(value, (str, int, float, bool)):
+        return value
+    if isinstance(value, dict):
+        return {str(key): _json_safe(item) for key, item in value.items()}
+    if isinstance(value, (list, tuple, set)):
+        return [_json_safe(item) for item in value]
+    return str(value)
+def _event_metadata(serialized: Any, kwargs: dict[str, Any]) -> dict[str, Any]:
+    metadata: dict[str, Any] = {}
+    name = _serialized_name(serialized)
+    if name:
+        metadata["serialized_name"] = name
+    callback_metadata = kwargs.get("metadata")
+    if isinstance(callback_metadata, dict):
+        metadata["metadata"] = callback_metadata
+    tags = kwargs.get("tags")
+    if tags:
+        metadata["tags"] = list(tags)
+    run_id = kwargs.get("run_id")
+    if run_id is not None:
+        metadata["run_id"] = str(run_id)
+    parent_run_id = kwargs.get("parent_run_id")
+    if parent_run_id is not None:
+        metadata["parent_run_id"] = str(parent_run_id)
+    return metadata
+def _serialized_name(serialized: Any) -> Optional[str]:
+    if not isinstance(serialized, dict):
+        return None
+    name = serialized.get("name")
+    if isinstance(name, str):
+        return name
+    serialized_id = serialized.get("id")
+    if isinstance(serialized_id, list) and serialized_id:
+        return str(serialized_id[-1])
+    if isinstance(serialized_id, str):
+        return serialized_id
+    return None

contexttrace/integrations/langgraph.py ADDED Viewed

@@ -0,0 +1,197 @@
+from __future__ import annotations
+import inspect
+import time
+from functools import wraps
+from typing import Any, Callable, Optional
+from contexttrace.client import ContextTrace, TraceSession
+class ContextTraceLangGraphTracer:
+    """Beta LangGraph adapter for logging graph nodes, tools, memory, and errors."""
+    def __init__(
+        self,
+        *,
+        project: Optional[str] = None,
+        api_key: Optional[str] = None,
+        base_url: str = "http://localhost:8000",
+        client: Optional[ContextTrace] = None,
+        trace_metadata: Optional[dict[str, Any]] = None,
+    ) -> None:
+        if client is None:
+            kwargs: dict[str, Any] = {"project": project or "default"}
+            if api_key:
+                kwargs.update({"api_key": api_key, "base_url": base_url, "mode": "hosted"})
+            client = ContextTrace(**kwargs)
+        self.client = client
+        self.trace_metadata = trace_metadata or {}
+        self.trace: Optional[TraceSession] = None
+        self.query: Optional[str] = None
+        self._node_starts: dict[str, float] = {}
+    def start_trace(self, query: str, *, metadata: Optional[dict[str, Any]] = None) -> TraceSession:
+        if self.trace is not None:
+            return self.trace
+        self.query = query
+        trace_metadata = {
+            **self.trace_metadata,
+            **(metadata or {}),
+            "integration": "langgraph",
+        }
+        self.trace = self.client.trace(query=query, metadata=trace_metadata).__enter__()
+        return self.trace
+    def end_trace(
+        self,
+        *,
+        answer: Optional[str] = None,
+        metadata: Optional[dict[str, Any]] = None,
+    ) -> Optional[TraceSession]:
+        if self.trace is None:
+            return None
+        if answer:
+            self.trace.log_answer(answer, metadata=metadata or {})
+            self.trace.log_agent_event(
+                event_type="final_answer",
+                name="final_answer",
+                output_json={"answer": answer},
+                metadata=metadata or {},
+            )
+        trace = self.trace
+        self.trace = None
+        return trace
+    def on_node_start(
+        self,
+        name: str,
+        input_json: Any = None,
+        *,
+        event_type: str = "planner_step",
+        metadata: Optional[dict[str, Any]] = None,
+    ) -> None:
+        trace = self._ensure_trace(input_json)
+        self._node_starts[name] = time.perf_counter()
+        trace.log_agent_event(
+            event_type=event_type,
+            name=name,
+            input_json=input_json,
+            metadata={"phase": "start", **(metadata or {})},
+        )
+    def on_node_end(
+        self,
+        name: str,
+        output_json: Any = None,
+        *,
+        event_type: str = "planner_step",
+        metadata: Optional[dict[str, Any]] = None,
+    ) -> None:
+        trace = self._ensure_trace(output_json)
+        trace.log_agent_event(
+            event_type=event_type,
+            name=name,
+            output_json=output_json,
+            metadata={"phase": "end", **(metadata or {})},
+            latency_ms=_elapsed_ms(self._node_starts.get(name)),
+        )
+    def on_tool_start(self, name: str, input_json: Any = None, *, metadata: Optional[dict[str, Any]] = None) -> None:
+        self._node_starts[name] = time.perf_counter()
+        self._ensure_trace(input_json).log_tool_call(name, input_json=input_json, metadata=metadata)
+    def on_tool_end(
+        self,
+        name: str,
+        output_json: Any = None,
+        *,
+        input_json: Any = None,
+        metadata: Optional[dict[str, Any]] = None,
+    ) -> None:
+        self._ensure_trace(output_json).log_tool_result(
+            name,
+            input_json=input_json,
+            output_json=output_json,
+            metadata=metadata,
+            latency_ms=_elapsed_ms(self._node_starts.get(name)),
+        )
+    def on_error(self, name: str, error: BaseException, *, input_json: Any = None) -> None:
+        self._ensure_trace(input_json).log_agent_error(
+            str(error),
+            name=name,
+            input_json=input_json,
+            metadata={"error_type": error.__class__.__name__},
+            latency_ms=_elapsed_ms(self._node_starts.get(name)),
+        )
+    def wrap_node(
+        self,
+        name: str,
+        func: Callable[..., Any],
+        *,
+        event_type: str = "planner_step",
+    ) -> Callable[..., Any]:
+        if inspect.iscoroutinefunction(func):
+            @wraps(func)
+            async def async_wrapper(*args: Any, **kwargs: Any) -> Any:
+                input_json = {"args": _json_safe(args), "kwargs": _json_safe(kwargs)}
+                self.on_node_start(name, input_json, event_type=event_type)
+                try:
+                    output = await func(*args, **kwargs)
+                    self.on_node_end(name, _json_safe(output), event_type=event_type)
+                    return output
+                except BaseException as exc:
+                    self.on_error(name, exc, input_json=input_json)
+                    raise
+            return async_wrapper
+        @wraps(func)
+        def wrapper(*args: Any, **kwargs: Any) -> Any:
+            input_json = {"args": _json_safe(args), "kwargs": _json_safe(kwargs)}
+            self.on_node_start(name, input_json, event_type=event_type)
+            try:
+                output = func(*args, **kwargs)
+                self.on_node_end(name, _json_safe(output), event_type=event_type)
+                return output
+            except BaseException as exc:
+                self.on_error(name, exc, input_json=input_json)
+                raise
+        return wrapper
+    def _ensure_trace(self, value: Any = None) -> TraceSession:
+        if self.trace is not None:
+            return self.trace
+        query = _query_from_value(value) or self.query or "langgraph run"
+        return self.start_trace(query)
+def _elapsed_ms(start_time: Optional[float]) -> Optional[int]:
+    if start_time is None:
+        return None
+    return int((time.perf_counter() - start_time) * 1000)
+def _query_from_value(value: Any) -> Optional[str]:
+    if isinstance(value, str):
+        return value
+    if isinstance(value, dict):
+        for key in ("query", "question", "input", "prompt"):
+            candidate = value.get(key)
+            if isinstance(candidate, str) and candidate.strip():
+                return candidate
+    return None
+def _json_safe(value: Any) -> Any:
+    if value is None or isinstance(value, (str, int, float, bool)):
+        return value
+    if isinstance(value, dict):
+        return {str(key): _json_safe(item) for key, item in value.items()}
+    if isinstance(value, (list, tuple, set)):
+        return [_json_safe(item) for item in value]
+    return str(value)