PyPI - agno - Versions diffs - 2.2.5__py3-none-any.whl → 2.2.7__py3-none-any.whl - Mend

agno 2.2.5py3-none-any.whl → 2.2.7py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (57) hide show

agno/agent/agent.py +500 -423
agno/api/os.py +1 -1
agno/culture/manager.py +12 -8
agno/guardrails/prompt_injection.py +1 -0
agno/knowledge/chunking/agentic.py +6 -2
agno/knowledge/embedder/vllm.py +262 -0
agno/knowledge/knowledge.py +37 -5
agno/memory/manager.py +9 -4
agno/models/anthropic/claude.py +1 -2
agno/models/azure/ai_foundry.py +31 -14
agno/models/azure/openai_chat.py +12 -4
agno/models/base.py +106 -65
agno/models/cerebras/cerebras.py +11 -6
agno/models/groq/groq.py +7 -4
agno/models/meta/llama.py +12 -6
agno/models/meta/llama_openai.py +5 -1
agno/models/openai/chat.py +26 -17
agno/models/openai/responses.py +11 -63
agno/models/requesty/requesty.py +5 -2
agno/models/utils.py +254 -8
agno/models/vertexai/claude.py +9 -13
agno/os/app.py +13 -12
agno/os/routers/evals/evals.py +8 -8
agno/os/routers/evals/utils.py +1 -0
agno/os/schema.py +56 -38
agno/os/utils.py +27 -0
agno/run/__init__.py +6 -0
agno/run/agent.py +5 -0
agno/run/base.py +18 -1
agno/run/team.py +13 -9
agno/run/workflow.py +39 -0
agno/session/summary.py +8 -2
agno/session/workflow.py +4 -3
agno/team/team.py +302 -369
agno/tools/exa.py +21 -16
agno/tools/file.py +153 -25
agno/tools/function.py +98 -17
agno/tools/mcp/mcp.py +8 -1
agno/tools/notion.py +204 -0
agno/utils/agent.py +78 -0
agno/utils/events.py +2 -0
agno/utils/hooks.py +1 -1
agno/utils/models/claude.py +25 -8
agno/utils/print_response/workflow.py +115 -16
agno/vectordb/__init__.py +2 -1
agno/vectordb/milvus/milvus.py +5 -0
agno/vectordb/redis/__init__.py +5 -0
agno/vectordb/redis/redisdb.py +687 -0
agno/workflow/__init__.py +2 -0
agno/workflow/agent.py +299 -0
agno/workflow/step.py +13 -2
agno/workflow/workflow.py +969 -72
{agno-2.2.5.dist-info → agno-2.2.7.dist-info}/METADATA +10 -3
{agno-2.2.5.dist-info → agno-2.2.7.dist-info}/RECORD +57 -52
{agno-2.2.5.dist-info → agno-2.2.7.dist-info}/WHEEL +0 -0
{agno-2.2.5.dist-info → agno-2.2.7.dist-info}/licenses/LICENSE +0 -0
{agno-2.2.5.dist-info → agno-2.2.7.dist-info}/top_level.txt +0 -0

agno/models/openai/responses.py CHANGED Viewed

@@ -8,7 +8,7 @@ from typing_extensions import Literal
 from agno.exceptions import ModelProviderError
 from agno.media import File
-from agno.models.base import MessageData, Model
+from agno.models.base import Model
 from agno.models.message import Citations, Message, UrlCitation
 from agno.models.metrics import Metrics
 from agno.models.response import ModelResponse
@@ -66,7 +66,7 @@ class OpenAIResponses(Model):
     max_retries: Optional[int] = None
     default_headers: Optional[Dict[str, str]] = None
     default_query: Optional[Dict[str, str]] = None
-    http_client: Optional[httpx.Client] = None
+    http_client: Optional[Union[httpx.Client, httpx.AsyncClient]] = None
     client_params: Optional[Dict[str, Any]] = None
     # Parameters affecting built-in tools
@@ -148,8 +148,11 @@ class OpenAIResponses(Model):
             return self.client
         client_params: Dict[str, Any] = self._get_client_params()
-        if self.http_client is not None:
-            client_params["http_client"] = self.http_client
+        if self.http_client:
+            if isinstance(self.http_client, httpx.Client):
+                client_params["http_client"] = self.http_client
+            else:
+                log_debug("http_client is not an instance of httpx.Client.")
         self.client = OpenAI(**client_params)
         return self.client
@@ -161,13 +164,15 @@ class OpenAIResponses(Model):
         Returns:
             AsyncOpenAI: An instance of the asynchronous OpenAI client.
         """
-        if self.async_client:
+        if self.async_client and not self.async_client.is_closed():
             return self.async_client
         client_params: Dict[str, Any] = self._get_client_params()
-        if self.http_client:
+        if self.http_client and isinstance(self.http_client, httpx.AsyncClient):
             client_params["http_client"] = self.http_client
         else:
+            if self.http_client:
+                log_debug("The current http_client is not async. A default httpx.AsyncClient will be used instead.")
             # Create a new async HTTP client with custom limits
             client_params["http_client"] = httpx.AsyncClient(
                 limits=httpx.Limits(max_connections=1000, max_keepalive_connections=100)
@@ -805,63 +810,6 @@ class OpenAIResponses(Model):
                 _fc_message.tool_call_id = tool_call_ids[_fc_message_index]
                 messages.append(_fc_message)
-    def process_response_stream(
-        self,
-        messages: List[Message],
-        assistant_message: Message,
-        stream_data: MessageData,
-        response_format: Optional[Union[Dict, Type[BaseModel]]] = None,
-        tools: Optional[List[Dict[str, Any]]] = None,
-        tool_choice: Optional[Union[str, Dict[str, Any]]] = None,
-        run_response: Optional[RunOutput] = None,
-    ) -> Iterator[ModelResponse]:
-        """Process the synchronous response stream."""
-        for model_response_delta in self.invoke_stream(
-            messages=messages,
-            assistant_message=assistant_message,
-            tools=tools,
-            response_format=response_format,
-            tool_choice=tool_choice,
-            run_response=run_response,
-        ):
-            yield from self._populate_stream_data_and_assistant_message(
-                stream_data=stream_data,
-                assistant_message=assistant_message,
-                model_response_delta=model_response_delta,
-            )
-        # Add final metrics to assistant message
-        self._populate_assistant_message(assistant_message=assistant_message, provider_response=model_response_delta)
-    async def aprocess_response_stream(
-        self,
-        messages: List[Message],
-        assistant_message: Message,
-        stream_data: MessageData,
-        response_format: Optional[Union[Dict, Type[BaseModel]]] = None,
-        tools: Optional[List[Dict[str, Any]]] = None,
-        tool_choice: Optional[Union[str, Dict[str, Any]]] = None,
-        run_response: Optional[RunOutput] = None,
-    ) -> AsyncIterator[ModelResponse]:
-        """Process the asynchronous response stream."""
-        async for model_response_delta in self.ainvoke_stream(
-            messages=messages,
-            assistant_message=assistant_message,
-            tools=tools,
-            response_format=response_format,
-            tool_choice=tool_choice,
-            run_response=run_response,
-        ):
-            for model_response in self._populate_stream_data_and_assistant_message(
-                stream_data=stream_data,
-                assistant_message=assistant_message,
-                model_response_delta=model_response_delta,
-            ):
-                yield model_response
-        # Add final metrics to assistant message
-        self._populate_assistant_message(assistant_message=assistant_message, provider_response=model_response_delta)
     def _parse_provider_response(self, response: Response, **kwargs) -> ModelResponse:
         """
         Parse the OpenAI response into a ModelResponse.

agno/models/requesty/requesty.py CHANGED Viewed

@@ -6,6 +6,7 @@ from pydantic import BaseModel
 from agno.models.openai.like import OpenAILike
 from agno.run.agent import RunOutput
+from agno.run.team import TeamRunOutput
 @dataclass
@@ -34,9 +35,11 @@ class Requesty(OpenAILike):
         response_format: Optional[Union[Dict, Type[BaseModel]]] = None,
         tools: Optional[List[Dict[str, Any]]] = None,
         tool_choice: Optional[Union[str, Dict[str, Any]]] = None,
-        run_response: Optional[RunOutput] = None,
+        run_response: Optional[Union[RunOutput, TeamRunOutput]] = None,
     ) -> Dict[str, Any]:
-        params = super().get_request_params(response_format=response_format, tools=tools, tool_choice=tool_choice)
+        params = super().get_request_params(
+            response_format=response_format, tools=tools, tool_choice=tool_choice, run_response=run_response
+        )
         if "extra_body" not in params:
             params["extra_body"] = {}

agno/models/utils.py CHANGED Viewed

@@ -1,20 +1,266 @@
+from typing import Optional, Union
 from agno.models.base import Model
-# TODO: add all supported models
-def get_model(model_id: str, model_provider: str) -> Model:
-    """Return the right Agno model instance given a pair of model provider and id"""
-    if model_provider == "openai":
-        from agno.models.openai import OpenAIChat
+def _get_model_class(model_id: str, model_provider: str) -> Model:
+    if model_provider == "aimlapi":
+        from agno.models.aimlapi import AIMLAPI
+        return AIMLAPI(id=model_id)
-        return OpenAIChat(id=model_id)
     elif model_provider == "anthropic":
         from agno.models.anthropic import Claude
         return Claude(id=model_id)
-    elif model_provider == "gemini":
+    elif model_provider == "aws-bedrock":
+        from agno.models.aws import AwsBedrock
+        return AwsBedrock(id=model_id)
+    elif model_provider == "aws-claude":
+        from agno.models.aws import Claude as AWSClaude
+        return AWSClaude(id=model_id)
+    elif model_provider == "azure-ai-foundry":
+        from agno.models.azure import AzureAIFoundry
+        return AzureAIFoundry(id=model_id)
+    elif model_provider == "azure-openai":
+        from agno.models.azure import AzureOpenAI
+        return AzureOpenAI(id=model_id)
+    elif model_provider == "cerebras":
+        from agno.models.cerebras import Cerebras
+        return Cerebras(id=model_id)
+    elif model_provider == "cerebras-openai":
+        from agno.models.cerebras import CerebrasOpenAI
+        return CerebrasOpenAI(id=model_id)
+    elif model_provider == "cohere":
+        from agno.models.cohere import Cohere
+        return Cohere(id=model_id)
+    elif model_provider == "cometapi":
+        from agno.models.cometapi import CometAPI
+        return CometAPI(id=model_id)
+    elif model_provider == "dashscope":
+        from agno.models.dashscope import DashScope
+        return DashScope(id=model_id)
+    elif model_provider == "deepinfra":
+        from agno.models.deepinfra import DeepInfra
+        return DeepInfra(id=model_id)
+    elif model_provider == "deepseek":
+        from agno.models.deepseek import DeepSeek
+        return DeepSeek(id=model_id)
+    elif model_provider == "fireworks":
+        from agno.models.fireworks import Fireworks
+        return Fireworks(id=model_id)
+    elif model_provider == "google":
         from agno.models.google import Gemini
         return Gemini(id=model_id)
+    elif model_provider == "groq":
+        from agno.models.groq import Groq
+        return Groq(id=model_id)
+    elif model_provider == "huggingface":
+        from agno.models.huggingface import HuggingFace
+        return HuggingFace(id=model_id)
+    elif model_provider == "ibm":
+        from agno.models.ibm import WatsonX
+        return WatsonX(id=model_id)
+    elif model_provider == "internlm":
+        from agno.models.internlm import InternLM
+        return InternLM(id=model_id)
+    elif model_provider == "langdb":
+        from agno.models.langdb import LangDB
+        return LangDB(id=model_id)
+    elif model_provider == "litellm":
+        from agno.models.litellm import LiteLLM
+        return LiteLLM(id=model_id)
+    elif model_provider == "litellm-openai":
+        from agno.models.litellm import LiteLLMOpenAI
+        return LiteLLMOpenAI(id=model_id)
+    elif model_provider == "llama-cpp":
+        from agno.models.llama_cpp import LlamaCpp
+        return LlamaCpp(id=model_id)
+    elif model_provider == "llama-openai":
+        from agno.models.meta import LlamaOpenAI
+        return LlamaOpenAI(id=model_id)
+    elif model_provider == "lmstudio":
+        from agno.models.lmstudio import LMStudio
+        return LMStudio(id=model_id)
+    elif model_provider == "meta":
+        from agno.models.meta import Llama
+        return Llama(id=model_id)
+    elif model_provider == "mistral":
+        from agno.models.mistral import MistralChat
+        return MistralChat(id=model_id)
+    elif model_provider == "nebius":
+        from agno.models.nebius import Nebius
+        return Nebius(id=model_id)
+    elif model_provider == "nexus":
+        from agno.models.nexus import Nexus
+        return Nexus(id=model_id)
+    elif model_provider == "nvidia":
+        from agno.models.nvidia import Nvidia
+        return Nvidia(id=model_id)
+    elif model_provider == "ollama":
+        from agno.models.ollama import Ollama
+        return Ollama(id=model_id)
+    elif model_provider == "openai":
+        from agno.models.openai import OpenAIChat
+        return OpenAIChat(id=model_id)
+    elif model_provider == "openai-responses":
+        from agno.models.openai import OpenAIResponses
+        return OpenAIResponses(id=model_id)
+    elif model_provider == "openrouter":
+        from agno.models.openrouter import OpenRouter
+        return OpenRouter(id=model_id)
+    elif model_provider == "perplexity":
+        from agno.models.perplexity import Perplexity
+        return Perplexity(id=model_id)
+    elif model_provider == "portkey":
+        from agno.models.portkey import Portkey
+        return Portkey(id=model_id)
+    elif model_provider == "requesty":
+        from agno.models.requesty import Requesty
+        return Requesty(id=model_id)
+    elif model_provider == "sambanova":
+        from agno.models.sambanova import Sambanova
+        return Sambanova(id=model_id)
+    elif model_provider == "siliconflow":
+        from agno.models.siliconflow import Siliconflow
+        return Siliconflow(id=model_id)
+    elif model_provider == "together":
+        from agno.models.together import Together
+        return Together(id=model_id)
+    elif model_provider == "vercel":
+        from agno.models.vercel import V0
+        return V0(id=model_id)
+    elif model_provider == "vertexai-claude":
+        from agno.models.vertexai.claude import Claude as VertexAIClaude
+        return VertexAIClaude(id=model_id)
+    elif model_provider == "vllm":
+        from agno.models.vllm import VLLM
+        return VLLM(id=model_id)
+    elif model_provider == "xai":
+        from agno.models.xai import xAI
+        return xAI(id=model_id)
+    else:
+        raise ValueError(f"Model provider '{model_provider}' is not supported.")
+def _parse_model_string(model_string: str) -> Model:
+    if not model_string or not isinstance(model_string, str):
+        raise ValueError(f"Model string must be a non-empty string, got: {model_string}")
+    if ":" not in model_string:
+        raise ValueError(
+            f"Invalid model string format: '{model_string}'. Model strings should be in format '<provider>:<model_id>' e.g. 'openai:gpt-4o'"
+        )
+    parts = model_string.split(":", 1)
+    if len(parts) != 2:
+        raise ValueError(
+            f"Invalid model string format: '{model_string}'. Model strings should be in format '<provider>:<model_id>' e.g. 'openai:gpt-4o'"
+        )
+    model_provider, model_id = parts
+    model_provider = model_provider.strip().lower()
+    model_id = model_id.strip()
+    if not model_provider or not model_id:
+        raise ValueError(
+            f"Invalid model string format: '{model_string}'. Model strings should be in format '<provider>:<model_id>' e.g. 'openai:gpt-4o'"
+        )
+    return _get_model_class(model_id, model_provider)
+def get_model(model: Union[Model, str, None]) -> Optional[Model]:
+    if model is None:
+        return None
+    elif isinstance(model, Model):
+        return model
+    elif isinstance(model, str):
+        return _parse_model_string(model)
     else:
-        raise ValueError(f"Model provider {model_provider} not supported")
+        raise ValueError("Model must be a Model instance, string, or None")

agno/models/vertexai/claude.py CHANGED Viewed

@@ -5,10 +5,7 @@ from typing import Any, Dict, Optional
 from agno.models.anthropic import Claude as AnthropicClaude
 try:
-    from anthropic import AnthropicVertex as AnthropicClient
-    from anthropic import (
-        AsyncAnthropicVertex as AsyncAnthropicClient,
-    )
+    from anthropic import AnthropicVertex, AsyncAnthropicVertex
 except ImportError as e:
     raise ImportError("`anthropic` not installed. Please install it with `pip install anthropic`") from e
@@ -25,15 +22,14 @@ class Claude(AnthropicClaude):
     name: str = "Claude"
     provider: str = "VertexAI"
+    client: Optional[AnthropicVertex] = None  # type: ignore
+    async_client: Optional[AsyncAnthropicVertex] = None  # type: ignore
     # Client parameters
     region: Optional[str] = None
     project_id: Optional[str] = None
     base_url: Optional[str] = None
-    # Anthropic clients
-    client: Optional[AnthropicClient] = None
-    async_client: Optional[AsyncAnthropicClient] = None
     def _get_client_params(self) -> Dict[str, Any]:
         client_params: Dict[str, Any] = {}
@@ -51,7 +47,7 @@ class Claude(AnthropicClaude):
             client_params["default_headers"] = self.default_headers
         return client_params
-    def get_client(self) -> AnthropicClient:
+    def get_client(self):
         """
         Returns an instance of the Anthropic client.
         """
@@ -59,16 +55,16 @@ class Claude(AnthropicClaude):
             return self.client
         _client_params = self._get_client_params()
-        self.client = AnthropicClient(**_client_params)
+        self.client = AnthropicVertex(**_client_params)
         return self.client
-    def get_async_client(self) -> AsyncAnthropicClient:
+    def get_async_client(self):
         """
         Returns an instance of the async Anthropic client.
         """
-        if self.async_client:
+        if self.async_client and not self.async_client.is_closed():
             return self.async_client
         _client_params = self._get_client_params()
-        self.async_client = AsyncAnthropicClient(**_client_params)
+        self.async_client = AsyncAnthropicVertex(**_client_params)
         return self.async_client

agno/os/app.py CHANGED Viewed

@@ -46,7 +46,7 @@ from agno.os.utils import (
     update_cors_middleware,
 )
 from agno.team.team import Team
-from agno.utils.log import logger
+from agno.utils.log import log_debug, log_error, log_warning
 from agno.utils.string import generate_id, generate_id_from_name
 from agno.workflow.workflow import Workflow
@@ -454,21 +454,22 @@ class AgentOS:
             @fastapi_app.exception_handler(HTTPException)
             async def http_exception_handler(_, exc: HTTPException) -> JSONResponse:
+                log_error(f"HTTP exception: {exc.status_code} {exc.detail}")
                 return JSONResponse(
                     status_code=exc.status_code,
                     content={"detail": str(exc.detail)},
                 )
-            async def general_exception_handler(request: Request, call_next):
-                try:
-                    return await call_next(request)
-                except Exception as e:
-                    return JSONResponse(
-                        status_code=e.status_code if hasattr(e, "status_code") else 500,  # type: ignore
-                        content={"detail": str(e)},
-                    )
+            @fastapi_app.exception_handler(Exception)
+            async def general_exception_handler(_: Request, exc: Exception) -> JSONResponse:
+                import traceback
+                log_error(f"Unhandled exception:\n{traceback.format_exc(limit=5)}")
-            fastapi_app.middleware("http")(general_exception_handler)
+                return JSONResponse(
+                    status_code=getattr(exc, "status_code", 500),
+                    content={"detail": str(exc)},
+                )
         # Update CORS middleware
         update_cors_middleware(fastapi_app, self.settings.cors_origin_list)  # type: ignore
@@ -500,7 +501,7 @@ class AgentOS:
                 # Skip conflicting AgentOS routes, prefer user's existing routes
                 for conflict in conflicts:
                     methods_str = ", ".join(conflict["methods"])  # type: ignore
-                    logger.debug(
+                    log_debug(
                         f"Skipping conflicting AgentOS route: {methods_str} {conflict['path']} - "
                         f"Using existing custom route instead"
                     )
@@ -519,7 +520,7 @@ class AgentOS:
                 # Log warnings but still add all routes (AgentOS routes will override)
                 for conflict in conflicts:
                     methods_str = ", ".join(conflict["methods"])  # type: ignore
-                    logger.warning(
+                    log_warning(
                         f"Route conflict detected: {methods_str} {conflict['path']} - "
                         f"AgentOS route will override existing custom route"
                     )

agno/os/routers/evals/evals.py CHANGED Viewed

@@ -356,10 +356,10 @@ def attach_routes(
             ):
                 default_model = deepcopy(agent.model)
                 if eval_run_input.model_id != agent.model.id or eval_run_input.model_provider != agent.model.provider:
-                    model = get_model(
-                        model_id=eval_run_input.model_id.lower(),
-                        model_provider=eval_run_input.model_provider.lower(),
-                    )
+                    model_provider = eval_run_input.model_provider.lower()
+                    model_id = eval_run_input.model_id.lower()
+                    model_string = f"{model_provider}:{model_id}"
+                    model = get_model(model_string)
                     agent.model = model
             team = None
@@ -378,10 +378,10 @@ def attach_routes(
             ):
                 default_model = deepcopy(team.model)
                 if eval_run_input.model_id != team.model.id or eval_run_input.model_provider != team.model.provider:
-                    model = get_model(
-                        model_id=eval_run_input.model_id.lower(),
-                        model_provider=eval_run_input.model_provider.lower(),
-                    )
+                    model_provider = eval_run_input.model_provider.lower()
+                    model_id = eval_run_input.model_id.lower()
+                    model_string = f"{model_provider}:{model_id}"
+                    model = get_model(model_string)
                     team.model = model
             agent = None

agno/os/routers/evals/utils.py CHANGED Viewed

@@ -33,6 +33,7 @@ async def run_accuracy_eval(
         additional_context=eval_run_input.additional_context,
         num_iterations=eval_run_input.num_iterations or 1,
         name=eval_run_input.name,
+        model=default_model,
     )
     result = accuracy_eval.run(print_results=False, print_summary=False)

agno 2.2.5__py3-none-any.whl → 2.2.7__py3-none-any.whl

agno 2.2.5py3-none-any.whl → 2.2.7py3-none-any.whl