PyPI - dao-ai - Versions diffs - 0.0.28__py3-none-any.whl → 0.1.5__py3-none-any.whl - Mend

dao-ai 0.0.28py3-none-any.whl → 0.1.5py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (70) hide show

dao_ai/__init__.py +29 -0
dao_ai/agent_as_code.py +2 -5
dao_ai/cli.py +342 -58
dao_ai/config.py +1610 -380
dao_ai/genie/__init__.py +38 -0
dao_ai/genie/cache/__init__.py +43 -0
dao_ai/genie/cache/base.py +72 -0
dao_ai/genie/cache/core.py +79 -0
dao_ai/genie/cache/lru.py +347 -0
dao_ai/genie/cache/semantic.py +970 -0
dao_ai/genie/core.py +35 -0
dao_ai/graph.py +27 -253
dao_ai/hooks/__init__.py +9 -6
dao_ai/hooks/core.py +27 -195
dao_ai/logging.py +56 -0
dao_ai/memory/__init__.py +10 -0
dao_ai/memory/core.py +65 -30
dao_ai/memory/databricks.py +402 -0
dao_ai/memory/postgres.py +79 -38
dao_ai/messages.py +6 -4
dao_ai/middleware/__init__.py +158 -0
dao_ai/middleware/assertions.py +806 -0
dao_ai/middleware/base.py +50 -0
dao_ai/middleware/context_editing.py +230 -0
dao_ai/middleware/core.py +67 -0
dao_ai/middleware/guardrails.py +420 -0
dao_ai/middleware/human_in_the_loop.py +233 -0
dao_ai/middleware/message_validation.py +586 -0
dao_ai/middleware/model_call_limit.py +77 -0
dao_ai/middleware/model_retry.py +121 -0
dao_ai/middleware/pii.py +157 -0
dao_ai/middleware/summarization.py +197 -0
dao_ai/middleware/tool_call_limit.py +210 -0
dao_ai/middleware/tool_retry.py +174 -0
dao_ai/models.py +1306 -114
dao_ai/nodes.py +240 -161
dao_ai/optimization.py +674 -0
dao_ai/orchestration/__init__.py +52 -0
dao_ai/orchestration/core.py +294 -0
dao_ai/orchestration/supervisor.py +279 -0
dao_ai/orchestration/swarm.py +271 -0
dao_ai/prompts.py +128 -31
dao_ai/providers/databricks.py +584 -601
dao_ai/state.py +157 -21
dao_ai/tools/__init__.py +13 -5
dao_ai/tools/agent.py +1 -3
dao_ai/tools/core.py +64 -11
dao_ai/tools/email.py +232 -0
dao_ai/tools/genie.py +144 -294
dao_ai/tools/mcp.py +223 -155
dao_ai/tools/memory.py +50 -0
dao_ai/tools/python.py +9 -14
dao_ai/tools/search.py +14 -0
dao_ai/tools/slack.py +22 -10
dao_ai/tools/sql.py +202 -0
dao_ai/tools/time.py +30 -7
dao_ai/tools/unity_catalog.py +165 -88
dao_ai/tools/vector_search.py +331 -221
dao_ai/utils.py +166 -20
dao_ai/vector_search.py +37 -0
dao_ai-0.1.5.dist-info/METADATA +489 -0
dao_ai-0.1.5.dist-info/RECORD +70 -0
dao_ai/chat_models.py +0 -204
dao_ai/guardrails.py +0 -112
dao_ai/tools/human_in_the_loop.py +0 -100
dao_ai-0.0.28.dist-info/METADATA +0 -1168
dao_ai-0.0.28.dist-info/RECORD +0 -41
{dao_ai-0.0.28.dist-info → dao_ai-0.1.5.dist-info}/WHEEL +0 -0
{dao_ai-0.0.28.dist-info → dao_ai-0.1.5.dist-info}/entry_points.txt +0 -0
{dao_ai-0.0.28.dist-info → dao_ai-0.1.5.dist-info}/licenses/LICENSE +0 -0

dao_ai/middleware/message_validation.py ADDED Viewed

@@ -0,0 +1,586 @@
+"""
+Message validation middleware for DAO AI agents.
+These middleware implementations validate incoming messages and context
+before agent processing begins.
+Factory functions are provided for consistent configuration via the
+DAO AI middleware factory pattern.
+"""
+import json
+from typing import Any
+from langchain.agents.middleware import hook_config
+from langchain_core.messages import AIMessage, BaseMessage, HumanMessage, RemoveMessage
+from langgraph.runtime import Runtime
+from loguru import logger
+from dao_ai.messages import last_human_message
+from dao_ai.middleware.base import AgentMiddleware
+from dao_ai.state import AgentState, Context
+__all__ = [
+    "MessageValidationMiddleware",
+    "UserIdValidationMiddleware",
+    "ThreadIdValidationMiddleware",
+    "CustomFieldValidationMiddleware",
+    "RequiredField",
+    "FilterLastHumanMessageMiddleware",
+    "create_user_id_validation_middleware",
+    "create_thread_id_validation_middleware",
+    "create_custom_field_validation_middleware",
+    "create_filter_last_human_message_middleware",
+]
+class MessageValidationMiddleware(AgentMiddleware[AgentState, Context]):
+    """
+    Base middleware for message validation.
+    Subclasses should implement the validate method to perform
+    specific validation logic.
+    """
+    @hook_config(can_jump_to=["end"])
+    def before_agent(
+        self, state: AgentState, runtime: Runtime[Context]
+    ) -> dict[str, Any] | None:
+        """Validate messages before agent processing."""
+        try:
+            return self.validate(state, runtime)
+        except ValueError as e:
+            logger.error("Message validation failed", error=str(e))
+            return {
+                "is_valid": False,
+                "message_error": str(e),
+                "messages": [AIMessage(content=str(e))],
+                "jump_to": "end",
+            }
+    def validate(
+        self, state: AgentState, runtime: Runtime[Context]
+    ) -> dict[str, Any] | None:
+        """
+        Perform validation logic.
+        Override this method in subclasses to implement specific validation.
+        Raise ValueError to indicate validation failure.
+        Args:
+            state: The current agent state
+            runtime: The LangGraph runtime context
+        Returns:
+            Optional dict with state updates
+        Raises:
+            ValueError: If validation fails
+        """
+        return None
+class UserIdValidationMiddleware(MessageValidationMiddleware):
+    """
+    Middleware that validates the presence and format of user_id.
+    Ensures that:
+    - user_id is provided in the context
+    - user_id does not contain invalid characters (like dots)
+    """
+    def validate(
+        self, state: AgentState, runtime: Runtime[Context]
+    ) -> dict[str, Any] | None:
+        """Validate user_id is present and properly formatted."""
+        logger.trace("Executing user_id validation")
+        context: Context = runtime.context or Context()
+        user_id: str | None = context.user_id
+        if not user_id:
+            logger.error("User ID is required but not provided in configuration")
+            thread_val = context.thread_id or "<your_thread_id>"
+            # Get extra fields from context (excluding user_id and thread_id)
+            context_dict = context.model_dump()
+            extra_fields = {
+                k: v
+                for k, v in context_dict.items()
+                if k not in {"user_id", "thread_id"} and v is not None
+            }
+            corrected_config: dict[str, Any] = {
+                "configurable": {
+                    "thread_id": thread_val,
+                    "user_id": "<your_user_id>",
+                    **extra_fields,
+                },
+                "session": {
+                    "conversation_id": thread_val,
+                },
+            }
+            corrected_config_json = json.dumps(corrected_config, indent=2)
+            error_message = f"""
+## Authentication Required
+A **user_id** is required to process your request. Please provide your user ID in the configuration.
+### Required Configuration Format
+Please include the following JSON in your request configuration:
+```json
+{corrected_config_json}
+```
+### Field Descriptions
+- **thread_id**: Thread identifier (required in configurable)
+- **conversation_id**: Alias of thread_id (in session)
+- **user_id**: Your unique user identifier (required)
+Please update your configuration and try again.
+            """.strip()
+            raise ValueError(error_message)
+        if "." in user_id:
+            logger.error("User ID contains invalid character '.'", user_id=user_id)
+            corrected_user_id = user_id.replace(".", "_")
+            thread_val = context.thread_id or "<your_thread_id>"
+            # Get extra fields from context (excluding user_id and thread_id)
+            context_dict = context.model_dump()
+            extra_fields = {
+                k: v
+                for k, v in context_dict.items()
+                if k not in {"user_id", "thread_id"} and v is not None
+            }
+            corrected_config: dict[str, Any] = {
+                "configurable": {
+                    "thread_id": thread_val,
+                    "user_id": corrected_user_id,
+                    **extra_fields,
+                },
+                "session": {
+                    "conversation_id": thread_val,
+                },
+            }
+            corrected_config_json = json.dumps(corrected_config, indent=2)
+            error_message = f"""
+## Invalid User ID Format
+The **user_id** cannot contain a dot character ('.'). Please provide a valid user ID without dots.
+### Corrected Configuration (Copy & Paste This)
+```json
+{corrected_config_json}
+```
+Please update your user_id and try again.
+            """.strip()
+            raise ValueError(error_message)
+        return None
+class ThreadIdValidationMiddleware(MessageValidationMiddleware):
+    """
+    Middleware that validates the presence of thread_id/conversation_id.
+    Note: thread_id and conversation_id are interchangeable in configurable.
+    """
+    def validate(
+        self, state: AgentState, runtime: Runtime[Context]
+    ) -> dict[str, Any] | None:
+        """Validate thread_id/conversation_id is present."""
+        logger.trace("Executing thread_id/conversation_id validation")
+        context: Context = runtime.context or Context()
+        thread_id: str | None = context.thread_id
+        if not thread_id:
+            logger.error("Thread ID / Conversation ID is required but not provided")
+            # Get extra fields from context (excluding user_id and thread_id)
+            context_dict = context.model_dump()
+            extra_fields = {
+                k: v
+                for k, v in context_dict.items()
+                if k not in {"user_id", "thread_id"} and v is not None
+            }
+            corrected_config: dict[str, Any] = {
+                "configurable": {
+                    "thread_id": "<your_thread_id>",
+                    "user_id": context.user_id or "<your_user_id>",
+                    **extra_fields,
+                },
+                "session": {
+                    "conversation_id": "<your_thread_id>",
+                },
+            }
+            corrected_config_json = json.dumps(corrected_config, indent=2)
+            error_message = f"""
+## Configuration Required
+A **thread_id** is required to process your request (or **conversation_id** as an alias).
+### Required Configuration Format
+Please include the following JSON in your request configuration:
+```json
+{corrected_config_json}
+```
+### Field Descriptions
+- **thread_id**: Thread identifier (required in configurable)
+- **conversation_id**: Alias of thread_id (in session)
+- **user_id**: Your unique user identifier (required)
+Please update your configuration and try again.
+            """.strip()
+            raise ValueError(error_message)
+        return None
+class RequiredField:
+    """Definition of a field for validation.
+    Fields are marked as required or optional via the `required` flag:
+    - required=True (default): Field must be provided, validated
+    - required=False: Field is optional, not validated
+    For required fields, an `example_value` can be provided to show in error
+    messages, making it easy for users to copy-paste the configuration.
+    Args:
+        name: The field name (e.g., "store_num", "user_id")
+        description: Human-readable description for error messages
+        required: Whether this field is required (default: True)
+        example_value: Example value to show in error messages for missing fields
+    """
+    def __init__(
+        self,
+        name: str,
+        description: str | None = None,
+        required: bool = True,
+        example_value: Any = None,
+    ):
+        self.name = name
+        self.description = description or f"Your {name}"
+        self.required = required
+        self.example_value = example_value
+    @property
+    def is_required(self) -> bool:
+        """A field is required based on the required flag."""
+        return self.required
+class CustomFieldValidationMiddleware(MessageValidationMiddleware):
+    """
+    Middleware that validates the presence of required custom fields.
+    This is a generic validation middleware that can check for multiple
+    required fields in the context object.
+    Fields are defined in the `fields` list. Each field can have:
+    - name: The field name (required)
+    - description: Human-readable description for error messages
+    - required: Whether field is required (default: True)
+    - example_value: Example value to show in error messages
+    Required fields (required=True) will be validated.
+    The example_value is used in error messages to help users copy-paste
+    the correct configuration format.
+    Args:
+        fields: List of fields to validate/show. Each can be a RequiredField
+            or a dict with 'name', 'description', 'required', and 'example_value' keys.
+    """
+    def __init__(
+        self,
+        fields: list[RequiredField | dict[str, Any]],
+    ):
+        super().__init__()
+        # Convert fields to RequiredField objects
+        self.fields: list[RequiredField] = []
+        for field in fields:
+            if isinstance(field, RequiredField):
+                self.fields.append(field)
+            elif isinstance(field, dict):
+                self.fields.append(RequiredField(**field))
+    def validate(
+        self, state: AgentState, runtime: Runtime[Context]
+    ) -> dict[str, Any] | None:
+        """Validate that all required fields are present.
+        Generates error messages with the new input structure:
+            configurable:
+                conversation_id: "abc-123"
+                user_id: "nate.fleming"
+                <field_name>: <example_value>
+            session: {}
+        """
+        logger.trace("Executing custom field validation")
+        context: Context = runtime.context or Context()
+        # Find all missing required fields
+        missing_fields: list[RequiredField] = []
+        for field in self.fields:
+            if field.is_required:
+                field_value: Any = getattr(context, field.name, None)
+                if field_value is None:
+                    missing_fields.append(field)
+        if not missing_fields:
+            return None
+        # Log the missing fields
+        missing_names = [f.name for f in missing_fields]
+        logger.error("Required fields missing", fields=missing_names)
+        # Build the configurable dict preserving provided values
+        # and using example_value for missing required fields
+        # Note: only thread_id is in configurable (conversation_id goes in session)
+        configurable: dict[str, Any] = {}
+        thread_val = context.thread_id or "<your_thread_id>"
+        configurable["thread_id"] = thread_val
+        if context.user_id:
+            configurable["user_id"] = context.user_id
+        else:
+            configurable["user_id"] = "<your_user_id>"
+        # Add all extra values the user already provided
+        context_dict = context.model_dump()
+        for k, v in context_dict.items():
+            if k not in {"user_id", "thread_id"} and v is not None:
+                configurable[k] = v
+        # Then add our defined fields (provided values take precedence)
+        for field in self.fields:
+            if field.name in configurable:
+                # Field was provided by user - keep their value
+                continue
+            if field.is_required:
+                # Missing required field - use example_value or placeholder
+                configurable[field.name] = (
+                    field.example_value
+                    if field.example_value is not None
+                    else f"<your_{field.name}>"
+                )
+            else:
+                # Optional field not provided - use example_value if available
+                if field.example_value is not None:
+                    configurable[field.name] = field.example_value
+        # Build the corrected config with new structure
+        # Note: conversation_id is in session as an alias of thread_id
+        corrected_config: dict[str, Any] = {
+            "configurable": configurable,
+            "session": {
+                "conversation_id": thread_val,
+            },
+        }
+        corrected_config_json = json.dumps(corrected_config, indent=2)
+        # Build field descriptions
+        field_descriptions: list[str] = [
+            "- **thread_id**: Thread identifier (required in configurable)",
+            "- **conversation_id**: Alias of thread_id (in session)",
+        ]
+        # Add user_id if not in custom fields
+        has_user_id_field = any(f.name == "user_id" for f in self.fields)
+        if not has_user_id_field:
+            field_descriptions.append(
+                "- **user_id**: Your unique user identifier (required)"
+            )
+        # Add custom field descriptions
+        for field in self.fields:
+            required_text = "(required)" if field.is_required else "(optional)"
+            field_descriptions.append(
+                f"- **{field.name}**: {field.description} {required_text}"
+            )
+        field_descriptions_text = "\n".join(field_descriptions)
+        # Build the list of missing field names for the error message
+        missing_names_formatted = ", ".join(f"**{f.name}**" for f in missing_fields)
+        error_message = f"""
+## Configuration Required
+The following required fields are missing: {missing_names_formatted}
+### Required Configuration Format
+Please include the following JSON in your request configuration:
+```json
+{corrected_config_json}
+```
+### Field Descriptions
+{field_descriptions_text}
+Please update your configuration and try again.
+        """.strip()
+        raise ValueError(error_message)
+class FilterLastHumanMessageMiddleware(AgentMiddleware[AgentState, Context]):
+    """
+    Middleware that filters messages to keep only the last human message.
+    This is useful for scenarios where you want to process only the
+    latest user input without conversation history.
+    """
+    def before_model(
+        self, state: AgentState, runtime: Runtime[Context]
+    ) -> dict[str, Any] | None:
+        """Filter messages to keep only the last human message."""
+        logger.trace("Executing filter_last_human_message middleware")
+        messages: list[BaseMessage] = state.get("messages", [])
+        if not messages:
+            logger.trace("No messages found in state")
+            return None
+        last_message: HumanMessage | None = last_human_message(messages)
+        if last_message is None:
+            logger.trace("No human messages found in state")
+            return {"messages": []}
+        logger.trace(
+            "Filtered messages to last human message", original_count=len(messages)
+        )
+        removed_messages = [
+            RemoveMessage(id=message.id)
+            for message in messages
+            if message.id != last_message.id
+        ]
+        return {"messages": removed_messages}
+# =============================================================================
+# Factory Functions
+# =============================================================================
+def create_user_id_validation_middleware() -> UserIdValidationMiddleware:
+    """
+    Create a UserIdValidationMiddleware instance.
+    Factory function for creating middleware that validates the presence
+    and format of user_id in the runtime context.
+    Returns:
+        List containing UserIdValidationMiddleware instance
+    Example:
+        middleware = create_user_id_validation_middleware()
+    """
+    logger.trace("Creating user_id validation middleware")
+    return UserIdValidationMiddleware()
+def create_thread_id_validation_middleware() -> ThreadIdValidationMiddleware:
+    """
+    Create a ThreadIdValidationMiddleware instance.
+    Factory function for creating middleware that validates the presence
+    of thread_id in the runtime context.
+    Returns:
+        List containing ThreadIdValidationMiddleware instance
+    Example:
+        middleware = create_thread_id_validation_middleware()
+    """
+    logger.trace("Creating thread_id validation middleware")
+    return ThreadIdValidationMiddleware()
+def create_custom_field_validation_middleware(
+    fields: list[dict[str, Any]],
+) -> CustomFieldValidationMiddleware:
+    """
+    Create a CustomFieldValidationMiddleware instance.
+    Factory function for creating middleware that validates the presence
+    of required custom fields in the context object.
+    Each field in the list should have:
+    - name: The field name (required)
+    - description: Human-readable description for error messages (optional)
+    - required: Whether field is required (default: True)
+    - example_value: Example value to show in error messages (optional)
+    Required fields (required=True or not specified) will be validated.
+    The example_value is used in error messages to help users copy-paste.
+    Args:
+        fields: List of field definitions. Each dict should have 'name', and
+            optionally 'description', 'required', and 'example_value' keys.
+    Returns:
+        List containing CustomFieldValidationMiddleware configured with the specified fields
+    Example:
+        middleware = create_custom_field_validation_middleware(
+            fields=[
+                # Required field with example value for easy copy-paste
+                {"name": "store_num", "description": "Your store number", "example_value": "12345"},
+                # Optional fields (required=False)
+                {"name": "thread_id", "description": "Thread ID", "required": False, "example_value": "1"},
+                {"name": "user_id", "description": "User ID", "required": False, "example_value": "my_user_id"},
+            ],
+        )
+    """
+    field_names = [f.get("name", "unknown") for f in fields]
+    logger.trace("Creating custom field validation middleware", fields=field_names)
+    return CustomFieldValidationMiddleware(fields=fields)
+def create_filter_last_human_message_middleware() -> FilterLastHumanMessageMiddleware:
+    """
+    Create a FilterLastHumanMessageMiddleware instance.
+    Factory function for creating middleware that filters messages to keep
+    only the last human message, useful for scenarios where you want to
+    process only the latest user input without conversation history.
+    Returns:
+        List containing FilterLastHumanMessageMiddleware instance
+    Example:
+        middleware = create_filter_last_human_message_middleware()
+    """
+    logger.trace("Creating filter_last_human_message middleware")
+    return FilterLastHumanMessageMiddleware()

dao_ai/middleware/model_call_limit.py ADDED Viewed

@@ -0,0 +1,77 @@
+"""
+Model call limit middleware for DAO AI agents.
+Limits the number of model (LLM) calls to prevent infinite loops or excessive costs.
+Example:
+    from dao_ai.middleware import create_model_call_limit_middleware
+    # Limit model calls per run and thread
+    middleware = create_model_call_limit_middleware(
+        thread_limit=10,
+        run_limit=5,
+    )
+"""
+from __future__ import annotations
+from typing import Literal
+from langchain.agents.middleware import ModelCallLimitMiddleware
+from loguru import logger
+__all__ = [
+    "ModelCallLimitMiddleware",
+    "create_model_call_limit_middleware",
+]
+def create_model_call_limit_middleware(
+    thread_limit: int | None = None,
+    run_limit: int | None = None,
+    exit_behavior: Literal["error", "end"] = "end",
+) -> ModelCallLimitMiddleware:
+    """
+    Create a ModelCallLimitMiddleware to limit LLM API calls.
+    Prevents runaway agents from making too many API calls and helps
+    enforce cost controls on production deployments.
+    Args:
+        thread_limit: Max model calls per thread (conversation).
+            Requires checkpointer. None = no limit.
+        run_limit: Max model calls per run (single invocation).
+            None = no limit.
+        exit_behavior: What to do when limit hit:
+            - "end": Stop execution gracefully (default)
+            - "error": Raise ModelCallLimitExceededError immediately
+    Returns:
+        List containing ModelCallLimitMiddleware instance
+    Raises:
+        ValueError: If no limits specified
+    Example:
+        # Limit to 5 model calls per run, 10 per thread
+        limiter = create_model_call_limit_middleware(
+            run_limit=5,
+            thread_limit=10,
+            exit_behavior="end",
+        )
+    """
+    if thread_limit is None and run_limit is None:
+        raise ValueError("At least one of thread_limit or run_limit must be specified.")
+    logger.debug(
+        "Creating model call limit middleware",
+        thread_limit=thread_limit,
+        run_limit=run_limit,
+        exit_behavior=exit_behavior,
+    )
+    return ModelCallLimitMiddleware(
+        thread_limit=thread_limit,
+        run_limit=run_limit,
+        exit_behavior=exit_behavior,
+    )

dao-ai 0.0.28__py3-none-any.whl → 0.1.5__py3-none-any.whl

dao-ai 0.0.28py3-none-any.whl → 0.1.5py3-none-any.whl