PyPI - holmesgpt - Versions diffs - 0.13.3a0__py3-none-any.whl → 0.14.1__py3-none-any.whl - Mend

holmesgpt 0.13.3a0py3-none-any.whl → 0.14.1py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Potentially problematic release.

This version of holmesgpt might be problematic. Click here for more details.

Files changed (86) hide show

holmes/__init__.py +1 -1
holmes/clients/robusta_client.py +15 -4
holmes/common/env_vars.py +8 -1
holmes/config.py +66 -139
holmes/core/investigation.py +1 -2
holmes/core/llm.py +295 -52
holmes/core/models.py +2 -0
holmes/core/safeguards.py +4 -4
holmes/core/supabase_dal.py +14 -8
holmes/core/tool_calling_llm.py +202 -177
holmes/core/tools.py +260 -25
holmes/core/tools_utils/data_types.py +81 -0
holmes/core/tools_utils/tool_context_window_limiter.py +33 -0
holmes/core/tools_utils/tool_executor.py +2 -2
holmes/core/toolset_manager.py +150 -3
holmes/core/tracing.py +6 -1
holmes/core/transformers/__init__.py +23 -0
holmes/core/transformers/base.py +62 -0
holmes/core/transformers/llm_summarize.py +174 -0
holmes/core/transformers/registry.py +122 -0
holmes/core/transformers/transformer.py +31 -0
holmes/main.py +5 -0
holmes/plugins/prompts/_fetch_logs.jinja2 +10 -1
holmes/plugins/toolsets/aks-node-health.yaml +46 -0
holmes/plugins/toolsets/aks.yaml +64 -0
holmes/plugins/toolsets/atlas_mongodb/mongodb_atlas.py +17 -15
holmes/plugins/toolsets/azure_sql/tools/analyze_connection_failures.py +8 -4
holmes/plugins/toolsets/azure_sql/tools/analyze_database_connections.py +7 -3
holmes/plugins/toolsets/azure_sql/tools/analyze_database_health_status.py +3 -3
holmes/plugins/toolsets/azure_sql/tools/analyze_database_performance.py +3 -3
holmes/plugins/toolsets/azure_sql/tools/analyze_database_storage.py +7 -3
holmes/plugins/toolsets/azure_sql/tools/get_active_alerts.py +4 -4
holmes/plugins/toolsets/azure_sql/tools/get_slow_queries.py +7 -3
holmes/plugins/toolsets/azure_sql/tools/get_top_cpu_queries.py +7 -3
holmes/plugins/toolsets/azure_sql/tools/get_top_data_io_queries.py +7 -3
holmes/plugins/toolsets/azure_sql/tools/get_top_log_io_queries.py +7 -3
holmes/plugins/toolsets/bash/bash_toolset.py +6 -6
holmes/plugins/toolsets/bash/common/bash.py +7 -7
holmes/plugins/toolsets/coralogix/toolset_coralogix_logs.py +5 -3
holmes/plugins/toolsets/datadog/datadog_api.py +490 -24
holmes/plugins/toolsets/datadog/datadog_logs_instructions.jinja2 +21 -10
holmes/plugins/toolsets/datadog/toolset_datadog_general.py +345 -207
holmes/plugins/toolsets/datadog/toolset_datadog_logs.py +190 -19
holmes/plugins/toolsets/datadog/toolset_datadog_metrics.py +96 -32
holmes/plugins/toolsets/datadog/toolset_datadog_rds.py +10 -10
holmes/plugins/toolsets/datadog/toolset_datadog_traces.py +21 -22
holmes/plugins/toolsets/git.py +22 -22
holmes/plugins/toolsets/grafana/common.py +14 -2
holmes/plugins/toolsets/grafana/grafana_tempo_api.py +473 -0
holmes/plugins/toolsets/grafana/toolset_grafana.py +4 -4
holmes/plugins/toolsets/grafana/toolset_grafana_loki.py +5 -4
holmes/plugins/toolsets/grafana/toolset_grafana_tempo.jinja2 +246 -11
holmes/plugins/toolsets/grafana/toolset_grafana_tempo.py +662 -290
holmes/plugins/toolsets/grafana/trace_parser.py +1 -1
holmes/plugins/toolsets/internet/internet.py +3 -3
holmes/plugins/toolsets/internet/notion.py +3 -3
holmes/plugins/toolsets/investigator/core_investigation.py +3 -3
holmes/plugins/toolsets/kafka.py +18 -18
holmes/plugins/toolsets/kubernetes.yaml +58 -0
holmes/plugins/toolsets/kubernetes_logs.py +6 -6
holmes/plugins/toolsets/kubernetes_logs.yaml +32 -0
holmes/plugins/toolsets/logging_utils/logging_api.py +1 -1
holmes/plugins/toolsets/mcp/toolset_mcp.py +4 -4
holmes/plugins/toolsets/newrelic.py +8 -8
holmes/plugins/toolsets/opensearch/opensearch.py +5 -5
holmes/plugins/toolsets/opensearch/opensearch_logs.py +7 -7
holmes/plugins/toolsets/opensearch/opensearch_traces.py +10 -10
holmes/plugins/toolsets/prometheus/prometheus.py +841 -351
holmes/plugins/toolsets/prometheus/prometheus_instructions.jinja2 +39 -2
holmes/plugins/toolsets/prometheus/utils.py +28 -0
holmes/plugins/toolsets/rabbitmq/toolset_rabbitmq.py +6 -4
holmes/plugins/toolsets/robusta/robusta.py +10 -10
holmes/plugins/toolsets/runbook/runbook_fetcher.py +4 -4
holmes/plugins/toolsets/servicenow/servicenow.py +6 -6
holmes/plugins/toolsets/utils.py +88 -0
holmes/utils/config_utils.py +91 -0
holmes/utils/env.py +7 -0
holmes/utils/holmes_status.py +2 -1
holmes/utils/sentry_helper.py +41 -0
holmes/utils/stream.py +9 -0
{holmesgpt-0.13.3a0.dist-info → holmesgpt-0.14.1.dist-info}/METADATA +11 -15
{holmesgpt-0.13.3a0.dist-info → holmesgpt-0.14.1.dist-info}/RECORD +85 -75
holmes/plugins/toolsets/grafana/tempo_api.py +0 -124
{holmesgpt-0.13.3a0.dist-info → holmesgpt-0.14.1.dist-info}/LICENSE.txt +0 -0
{holmesgpt-0.13.3a0.dist-info → holmesgpt-0.14.1.dist-info}/WHEEL +0 -0
{holmesgpt-0.13.3a0.dist-info → holmesgpt-0.14.1.dist-info}/entry_points.txt +0 -0

holmes/plugins/toolsets/grafana/grafana_tempo_api.py ADDED Viewed

@@ -0,0 +1,473 @@
+"""Grafana Tempo API wrapper for querying traces and metrics."""
+import logging
+from typing import Any, Dict, Optional, Union
+from urllib.parse import quote
+import backoff
+import requests  # type: ignore
+from holmes.plugins.toolsets.grafana.common import (
+    GrafanaTempoConfig,
+    build_headers,
+    get_base_url,
+)
+logger = logging.getLogger(__name__)
+class TempoAPIError(Exception):
+    """Custom exception for Tempo API errors with detailed response information."""
+    def __init__(self, status_code: int, response_text: str, url: str):
+        self.status_code = status_code
+        self.response_text = response_text
+        self.url = url
+        # Try to extract error message from JSON response
+        try:
+            import json
+            error_data = json.loads(response_text)
+            # Tempo may return errors in different formats
+            error_message = (
+                error_data.get("error")
+                or error_data.get("message")
+                or error_data.get("errorType")
+                or response_text
+            )
+        except (json.JSONDecodeError, TypeError):
+            error_message = response_text
+        super().__init__(f"Tempo API error {status_code}: {error_message}")
+class GrafanaTempoAPI:
+    """Python wrapper for Grafana Tempo REST API.
+    This class provides a clean interface to all Tempo API endpoints,
+    supporting both GET and POST methods based on configuration.
+    """
+    def __init__(self, config: GrafanaTempoConfig, use_post: bool = False):
+        """Initialize the Tempo API wrapper.
+        Args:
+            config: GrafanaTempoConfig instance with connection details
+            use_post: If True, use POST method for API calls. Defaults to False (GET).
+        """
+        self.config = config
+        self.base_url = get_base_url(config)
+        self.headers = build_headers(config.api_key, config.headers)
+        self.use_post = use_post
+    def _make_request(
+        self,
+        endpoint: str,
+        params: Optional[Dict[str, Any]] = None,
+        path_params: Optional[Dict[str, str]] = None,
+        timeout: int = 30,
+        retries: int = 3,
+    ) -> Dict[str, Any]:
+        """Make HTTP request to Tempo API with retry logic.
+        Args:
+            endpoint: API endpoint path (e.g., "/api/echo")
+            params: Query parameters (GET) or body parameters (POST)
+            path_params: Parameters to substitute in the endpoint path
+            timeout: Request timeout in seconds
+            retries: Number of retry attempts
+        Returns:
+            JSON response from the API
+        Raises:
+            Exception: If the request fails after all retries
+        """
+        # Format endpoint with path parameters
+        if path_params:
+            for key, value in path_params.items():
+                endpoint = endpoint.replace(f"{{{key}}}", quote(str(value), safe=""))
+        url = f"{self.base_url}{endpoint}"
+        @backoff.on_exception(
+            backoff.expo,
+            requests.exceptions.RequestException,
+            max_tries=retries,
+            giveup=lambda e: isinstance(e, requests.exceptions.HTTPError)
+            and getattr(e, "response", None) is not None
+            and e.response.status_code < 500,
+        )
+        def make_request():
+            if self.use_post:
+                # POST request with JSON body
+                response = requests.post(
+                    url,
+                    headers=self.headers,
+                    json=params or {},
+                    timeout=timeout,
+                )
+            else:
+                # GET request with query parameters
+                response = requests.get(
+                    url,
+                    headers=self.headers,
+                    params=params,
+                    timeout=timeout,
+                )
+            response.raise_for_status()
+            return response.json()
+        try:
+            return make_request()
+        except requests.exceptions.HTTPError as e:
+            # Extract detailed error message from response
+            response = e.response
+            if response is not None:
+                logger.error(
+                    f"HTTP error {response.status_code} for {url}: {response.text}"
+                )
+                raise TempoAPIError(
+                    status_code=response.status_code,
+                    response_text=response.text,
+                    url=url,
+                )
+            else:
+                logger.error(f"Request failed for {url}: {e}")
+                raise
+        except requests.exceptions.RequestException as e:
+            logger.error(f"Request failed for {url}: {e}")
+            raise
+    def query_echo_endpoint(self) -> bool:
+        """Query the echo endpoint to check Tempo status.
+        API Endpoint: GET /api/echo
+        HTTP Method: GET (or POST if use_post=True)
+        Returns:
+            bool: True if endpoint returns 200 status code, False otherwise
+        """
+        url = f"{self.base_url}/api/echo"
+        try:
+            if self.use_post:
+                response = requests.post(
+                    url,
+                    headers=self.headers,
+                    timeout=30,
+                )
+            else:
+                response = requests.get(
+                    url,
+                    headers=self.headers,
+                    timeout=30,
+                )
+            # Just check status code, don't try to parse JSON
+            return response.status_code == 200
+        except requests.exceptions.RequestException as e:
+            logger.error(f"Request failed for {url}: {e}")
+            return False
+    def query_trace_by_id_v2(
+        self,
+        trace_id: str,
+        start: Optional[int] = None,
+        end: Optional[int] = None,
+    ) -> Dict[str, Any]:
+        """Query a trace by its ID.
+        API Endpoint: GET /api/v2/traces/{trace_id}
+        HTTP Method: GET (or POST if use_post=True)
+        Args:
+            trace_id: The trace ID to retrieve
+            start: Optional start time in Unix epoch seconds
+            end: Optional end time in Unix epoch seconds
+        Returns:
+            dict: OpenTelemetry format trace data
+        """
+        params = {}
+        if start is not None:
+            params["start"] = str(start)
+        if end is not None:
+            params["end"] = str(end)
+        return self._make_request(
+            "/api/v2/traces/{trace_id}",
+            params=params,
+            path_params={"trace_id": trace_id},
+        )
+    def _search_traces_common(
+        self,
+        search_params: Dict[str, Any],
+        limit: Optional[int] = None,
+        start: Optional[int] = None,
+        end: Optional[int] = None,
+        spss: Optional[int] = None,
+    ) -> Dict[str, Any]:
+        """Common search implementation for both tag and TraceQL searches.
+        Args:
+            search_params: The search-specific parameters (tags or q)
+            limit: Optional max number of traces to return
+            start: Optional start time in Unix epoch seconds
+            end: Optional end time in Unix epoch seconds
+            spss: Optional spans per span set
+        Returns:
+            dict: Search results with trace metadata
+        """
+        params = search_params.copy()
+        if limit is not None:
+            params["limit"] = str(limit)
+        if start is not None:
+            params["start"] = str(start)
+        if end is not None:
+            params["end"] = str(end)
+        if spss is not None:
+            params["spss"] = str(spss)
+        return self._make_request("/api/search", params=params)
+    def search_traces_by_tags(
+        self,
+        tags: str,
+        min_duration: Optional[str] = None,
+        max_duration: Optional[str] = None,
+        limit: Optional[int] = None,
+        start: Optional[int] = None,
+        end: Optional[int] = None,
+        spss: Optional[int] = None,
+    ) -> Dict[str, Any]:
+        """Search for traces using tag-based search.
+        API Endpoint: GET /api/search
+        HTTP Method: GET (or POST if use_post=True)
+        Args:
+            tags: logfmt-encoded span/process attributes (required)
+            min_duration: Optional minimum trace duration (e.g., "5s")
+            max_duration: Optional maximum trace duration
+            limit: Optional max number of traces to return
+            start: Optional start time in Unix epoch seconds
+            end: Optional end time in Unix epoch seconds
+            spss: Optional spans per span set
+        Returns:
+            dict: Search results with trace metadata
+        """
+        search_params = {"tags": tags}
+        # minDuration and maxDuration are only supported with tag-based search
+        if min_duration is not None:
+            search_params["minDuration"] = min_duration
+        if max_duration is not None:
+            search_params["maxDuration"] = max_duration
+        return self._search_traces_common(
+            search_params=search_params,
+            limit=limit,
+            start=start,
+            end=end,
+            spss=spss,
+        )
+    def search_traces_by_query(
+        self,
+        q: str,
+        limit: Optional[int] = None,
+        start: Optional[int] = None,
+        end: Optional[int] = None,
+        spss: Optional[int] = None,
+    ) -> Dict[str, Any]:
+        """Search for traces using TraceQL query.
+        API Endpoint: GET /api/search
+        HTTP Method: GET (or POST if use_post=True)
+        Note: minDuration and maxDuration are not supported with TraceQL queries.
+        Use the TraceQL query syntax to filter by duration instead.
+        Args:
+            q: TraceQL query (required)
+            limit: Optional max number of traces to return
+            start: Optional start time in Unix epoch seconds
+            end: Optional end time in Unix epoch seconds
+            spss: Optional spans per span set
+        Returns:
+            dict: Search results with trace metadata
+        """
+        return self._search_traces_common(
+            search_params={"q": q},
+            limit=limit,
+            start=start,
+            end=end,
+            spss=spss,
+        )
+    def search_tag_names_v2(
+        self,
+        scope: Optional[str] = None,
+        q: Optional[str] = None,
+        start: Optional[int] = None,
+        end: Optional[int] = None,
+        limit: Optional[int] = None,
+        max_stale_values: Optional[int] = None,
+    ) -> Dict[str, Any]:
+        """Search for available tag names.
+        API Endpoint: GET /api/v2/search/tags
+        HTTP Method: GET (or POST if use_post=True)
+        Args:
+            scope: Optional scope filter ("resource", "span", or "intrinsic")
+            q: Optional TraceQL query to filter tags
+            start: Optional start time in Unix epoch seconds
+            end: Optional end time in Unix epoch seconds
+            limit: Optional max number of tag names
+            max_stale_values: Optional max stale values parameter
+        Returns:
+            dict: Available tag names organized by scope
+        """
+        params = {}
+        if scope is not None:
+            params["scope"] = scope
+        if q is not None:
+            params["q"] = q
+        if start is not None:
+            params["start"] = str(start)
+        if end is not None:
+            params["end"] = str(end)
+        if limit is not None:
+            params["limit"] = str(limit)
+        if max_stale_values is not None:
+            params["maxStaleValues"] = str(max_stale_values)
+        return self._make_request("/api/v2/search/tags", params=params)
+    def search_tag_values_v2(
+        self,
+        tag: str,
+        q: Optional[str] = None,
+        start: Optional[int] = None,
+        end: Optional[int] = None,
+        limit: Optional[int] = None,
+        max_stale_values: Optional[int] = None,
+    ) -> Dict[str, Any]:
+        """Search for values of a specific tag with optional TraceQL filtering.
+        API Endpoint: GET /api/v2/search/tag/{tag}/values
+        HTTP Method: GET (or POST if use_post=True)
+        Args:
+            tag: The tag name to get values for (required)
+            q: Optional TraceQL query to filter tag values (e.g., '{resource.cluster="us-east-1"}')
+            start: Optional start time in Unix epoch seconds
+            end: Optional end time in Unix epoch seconds
+            limit: Optional max number of values
+            max_stale_values: Optional max stale values parameter
+        Returns:
+            dict: List of discovered values for the tag
+        """
+        params = {}
+        if q is not None:
+            params["q"] = q
+        if start is not None:
+            params["start"] = str(start)
+        if end is not None:
+            params["end"] = str(end)
+        if limit is not None:
+            params["limit"] = str(limit)
+        if max_stale_values is not None:
+            params["maxStaleValues"] = str(max_stale_values)
+        return self._make_request(
+            "/api/v2/search/tag/{tag}/values",
+            params=params,
+            path_params={"tag": tag},
+        )
+    def query_metrics_instant(
+        self,
+        q: str,
+        start: Optional[Union[int, str]] = None,
+        end: Optional[Union[int, str]] = None,
+        since: Optional[str] = None,
+    ) -> Dict[str, Any]:
+        """Query TraceQL metrics for an instant value.
+        Computes a single value across the entire time range.
+        API Endpoint: GET /api/metrics/query
+        HTTP Method: GET (or POST if use_post=True)
+        Args:
+            q: TraceQL metrics query (required)
+            start: Optional start time (Unix seconds/nanoseconds/RFC3339)
+            end: Optional end time (Unix seconds/nanoseconds/RFC3339)
+            since: Optional duration string (e.g., "1h")
+        Returns:
+            dict: Single computed metric value
+        """
+        params = {"q": q}
+        if start is not None:
+            params["start"] = str(start)
+        if end is not None:
+            params["end"] = str(end)
+        if since is not None:
+            params["since"] = since
+        return self._make_request("/api/metrics/query", params=params)
+    def query_metrics_range(
+        self,
+        q: str,
+        step: Optional[str] = None,
+        start: Optional[Union[int, str]] = None,
+        end: Optional[Union[int, str]] = None,
+        since: Optional[str] = None,
+        exemplars: Optional[int] = None,
+    ) -> Dict[str, Any]:
+        """Query TraceQL metrics for a time series range.
+        Returns metrics computed at regular intervals over the time range.
+        API Endpoint: GET /api/metrics/query_range
+        HTTP Method: GET (or POST if use_post=True)
+        Args:
+            q: TraceQL metrics query (required)
+            step: Optional time series granularity (e.g., "1m", "5m")
+            start: Optional start time (Unix seconds/nanoseconds/RFC3339)
+            end: Optional end time (Unix seconds/nanoseconds/RFC3339)
+            since: Optional duration string (e.g., "3h")
+            exemplars: Optional maximum number of exemplars to return
+        Returns:
+            dict: Time series of metric values
+        """
+        params = {"q": q}
+        if step is not None:
+            params["step"] = step
+        if start is not None:
+            params["start"] = str(start)
+        if end is not None:
+            params["end"] = str(end)
+        if since is not None:
+            params["since"] = since
+        if exemplars is not None:
+            params["exemplars"] = str(exemplars)
+        return self._make_request("/api/metrics/query_range", params=params)

holmes/plugins/toolsets/grafana/toolset_grafana.py CHANGED Viewed

@@ -4,7 +4,7 @@ from holmes.core.tools import (
     StructuredToolResult,
     Tool,
     ToolParameter,
-    ToolResultStatus,
+    StructuredToolResultStatus,
 )
 from holmes.plugins.toolsets.grafana.base_grafana_toolset import BaseGrafanaToolset
 import requests  # type: ignore
@@ -90,9 +90,9 @@ class ListAndBuildGrafanaDashboardURLs(Tool):
                 )
             return StructuredToolResult(
-                status=ToolResultStatus.SUCCESS
+                status=StructuredToolResultStatus.SUCCESS
                 if formatted_dashboards
-                else ToolResultStatus.NO_DATA,
+                else StructuredToolResultStatus.NO_DATA,
                 data="\n".join(formatted_dashboards)
                 if formatted_dashboards
                 else "No dashboards found.",
@@ -102,7 +102,7 @@ class ListAndBuildGrafanaDashboardURLs(Tool):
         except requests.RequestException as e:
             logging.error(f"Error fetching dashboards: {str(e)}")
             return StructuredToolResult(
-                status=ToolResultStatus.ERROR,
+                status=StructuredToolResultStatus.ERROR,
                 error=f"Error fetching dashboards: {str(e)}",
                 url=url,
                 params=params,

holmes/plugins/toolsets/grafana/toolset_grafana_loki.py CHANGED Viewed

@@ -14,6 +14,7 @@ from holmes.plugins.toolsets.logging_utils.logging_api import (
     LoggingCapability,
     PodLoggingTool,
     DEFAULT_TIME_SPAN_SECONDS,
+    DEFAULT_LOG_LIMIT,
 )
 from holmes.plugins.toolsets.utils import (
     process_timestamps_to_rfc3339,
@@ -22,7 +23,7 @@ from holmes.plugins.toolsets.utils import (
 from holmes.plugins.toolsets.grafana.loki_api import (
     query_loki_logs_by_label,
 )
-from holmes.core.tools import StructuredToolResult, ToolResultStatus
+from holmes.core.tools import StructuredToolResult, StructuredToolResultStatus
 class GrafanaLokiLabelsConfig(BaseModel):
@@ -94,17 +95,17 @@ class GrafanaLokiToolset(BasePodLoggingToolset):
             label_value=params.pod_name,
             start=start,
             end=end,
-            limit=params.limit or 2000,
+            limit=params.limit or DEFAULT_LOG_LIMIT,
         )
         if logs:
             logs.sort(key=lambda x: x["timestamp"])
             return StructuredToolResult(
-                status=ToolResultStatus.SUCCESS,
+                status=StructuredToolResultStatus.SUCCESS,
                 data="\n".join([format_log(log) for log in logs]),
                 params=params.model_dump(),
             )
         else:
             return StructuredToolResult(
-                status=ToolResultStatus.NO_DATA,
+                status=StructuredToolResultStatus.NO_DATA,
                 params=params.model_dump(),
             )

holmesgpt 0.13.3a0__py3-none-any.whl → 0.14.1__py3-none-any.whl

Potentially problematic release.

holmesgpt 0.13.3a0py3-none-any.whl → 0.14.1py3-none-any.whl