PyPI - vision-agent - Versions diffs - 0.2.56__py3-none-any.whl → 0.2.58__py3-none-any.whl - Mend

vision-agent 0.2.56py3-none-any.whl → 0.2.58py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (26) hide show

vision_agent/__init__.py +1 -2
vision_agent/agent/agent.py +3 -1
vision_agent/agent/vision_agent.py +110 -81
vision_agent/agent/vision_agent_prompts.py +1 -1
vision_agent/lmm/__init__.py +1 -1
vision_agent/lmm/lmm.py +54 -116
vision_agent/tools/__init__.py +2 -1
vision_agent/tools/tools.py +3 -3
{vision_agent-0.2.56.dist-info → vision_agent-0.2.58.dist-info}/METADATA +36 -7
vision_agent-0.2.58.dist-info/RECORD +23 -0
vision_agent/agent/agent_coder.py +0 -216
vision_agent/agent/agent_coder_prompts.py +0 -135
vision_agent/agent/data_interpreter.py +0 -475
vision_agent/agent/data_interpreter_prompts.py +0 -186
vision_agent/agent/easytool.py +0 -346
vision_agent/agent/easytool_prompts.py +0 -89
vision_agent/agent/easytool_v2.py +0 -781
vision_agent/agent/easytool_v2_prompts.py +0 -152
vision_agent/agent/reflexion.py +0 -299
vision_agent/agent/reflexion_prompts.py +0 -100
vision_agent/llm/__init__.py +0 -1
vision_agent/llm/llm.py +0 -176
vision_agent/tools/easytool_tools.py +0 -1242
vision_agent-0.2.56.dist-info/RECORD +0 -36
{vision_agent-0.2.56.dist-info → vision_agent-0.2.58.dist-info}/LICENSE +0 -0
{vision_agent-0.2.56.dist-info → vision_agent-0.2.58.dist-info}/WHEEL +0 -0

vision_agent/llm/llm.py DELETED Viewed

@@ -1,176 +0,0 @@
-import json
-import os
-from abc import ABC, abstractmethod
-from typing import Any, Callable, Dict, List, Mapping, Optional, Union, cast
-from langsmith.wrappers import wrap_openai
-from openai import AzureOpenAI, OpenAI
-from vision_agent.tools.easytool_tools import (
-    CLIP,
-    GroundingDINO,
-    GroundingSAM,
-    ZeroShotCounting,
-)
-from vision_agent.tools.prompts import CHOOSE_PARAMS, SYSTEM_PROMPT
-class LLM(ABC):
-    @abstractmethod
-    def generate(self, prompt: str) -> str:
-        pass
-    @abstractmethod
-    def chat(self, chat: List[Dict[str, str]]) -> str:
-        pass
-    @abstractmethod
-    def __call__(self, input: Union[str, List[Dict[str, str]]]) -> str:
-        pass
-class OpenAILLM(LLM):
-    r"""An LLM class for any OpenAI LLM model."""
-    def __init__(
-        self,
-        model_name: str = "gpt-4o",
-        api_key: Optional[str] = None,
-        json_mode: bool = False,
-        system_prompt: Optional[str] = None,
-        **kwargs: Any
-    ):
-        if not api_key:
-            self.client = wrap_openai(OpenAI())
-        else:
-            self.client = wrap_openai(OpenAI(api_key=api_key))
-        self.model_name = model_name
-        self.system_prompt = system_prompt
-        self.kwargs = kwargs
-        if json_mode:
-            self.kwargs["response_format"] = {"type": "json_object"}
-    def generate(self, prompt: str) -> str:
-        messages = []
-        if self.system_prompt:
-            messages.append({"role": "system", "content": self.system_prompt})
-        messages.append({"role": "user", "content": prompt})
-        response = self.client.chat.completions.create(
-            model=self.model_name,
-            messages=messages,  # type: ignore
-            **self.kwargs,
-        )
-        return cast(str, response.choices[0].message.content)
-    def chat(self, chat: List[Dict[str, str]]) -> str:
-        if self.system_prompt and not any(msg["role"] == "system" for msg in chat):
-            chat.insert(0, {"role": "system", "content": self.system_prompt})
-        response = self.client.chat.completions.create(
-            model=self.model_name,
-            messages=chat,  # type: ignore
-            **self.kwargs,
-        )
-        return cast(str, response.choices[0].message.content)
-    def __call__(self, input: Union[str, List[Dict[str, str]]]) -> str:
-        if isinstance(input, str):
-            return self.generate(input)
-        return self.chat(input)
-    def generate_classifier(self, question: str) -> Callable:
-        api_doc = CLIP.description + "\n" + str(CLIP.usage)
-        prompt = CHOOSE_PARAMS.format(api_doc=api_doc, question=question)
-        response = self.client.chat.completions.create(
-            model=self.model_name,
-            response_format={"type": "json_object"},
-            messages=[
-                {"role": "system", "content": SYSTEM_PROMPT},
-                {"role": "user", "content": prompt},
-            ],
-        )
-        params = json.loads(cast(str, response.choices[0].message.content))[
-            "Parameters"
-        ]
-        return lambda x: CLIP()(**{"prompt": params["prompt"], "image": x})
-    def generate_detector(self, question: str) -> Callable:
-        api_doc = GroundingDINO.description + "\n" + str(GroundingDINO.usage)
-        prompt = CHOOSE_PARAMS.format(api_doc=api_doc, question=question)
-        response = self.client.chat.completions.create(
-            model=self.model_name,
-            response_format={"type": "json_object"},
-            messages=[
-                {"role": "system", "content": SYSTEM_PROMPT},
-                {"role": "user", "content": prompt},
-            ],
-        )
-        params: Mapping = json.loads(cast(str, response.choices[0].message.content))[
-            "Parameters"
-        ]
-        return lambda x: GroundingDINO()(**{"prompt": params["prompt"], "image": x})
-    def generate_segmentor(self, question: str) -> Callable:
-        api_doc = GroundingSAM.description + "\n" + str(GroundingSAM.usage)
-        prompt = CHOOSE_PARAMS.format(api_doc=api_doc, question=question)
-        response = self.client.chat.completions.create(
-            model=self.model_name,
-            response_format={"type": "json_object"},
-            messages=[
-                {"role": "system", "content": SYSTEM_PROMPT},
-                {"role": "user", "content": prompt},
-            ],
-        )
-        params: Mapping = json.loads(cast(str, response.choices[0].message.content))[
-            "Parameters"
-        ]
-        return lambda x: GroundingSAM()(**{"prompt": params["prompt"], "image": x})
-    def generate_zero_shot_counter(self, question: str) -> Callable:
-        return lambda x: ZeroShotCounting()(**{"image": x})
-    def generate_image_qa_tool(self, question: str) -> Callable:
-        from vision_agent.tools.easytool_tools import ImageQuestionAnswering
-        return lambda x: ImageQuestionAnswering()(**{"prompt": question, "image": x})
-class AzureOpenAILLM(OpenAILLM):
-    def __init__(
-        self,
-        model_name: str = "gpt-4o",
-        api_key: Optional[str] = None,
-        api_version: str = "2024-02-01",
-        azure_endpoint: Optional[str] = None,
-        json_mode: bool = False,
-        **kwargs: Any
-    ):
-        if not api_key:
-            api_key = os.getenv("AZURE_OPENAI_API_KEY")
-        if not azure_endpoint:
-            azure_endpoint = os.getenv("AZURE_OPENAI_ENDPOINT")
-        if not api_key:
-            raise ValueError("Azure OpenAI API key is required.")
-        if not azure_endpoint:
-            raise ValueError("Azure OpenAI endpoint is required.")
-        self.client = wrap_openai(
-            AzureOpenAI(
-                api_key=api_key, api_version=api_version, azure_endpoint=azure_endpoint
-            )
-        )
-        self.model_name = model_name
-        self.kwargs = kwargs
-        if json_mode:
-            self.kwargs["response_format"] = {"type": "json_object"}

vision-agent 0.2.56__py3-none-any.whl → 0.2.58__py3-none-any.whl

vision-agent 0.2.56py3-none-any.whl → 0.2.58py3-none-any.whl