PyPI - vision-agent - Versions diffs - 0.2.182__tar.gz → 0.2.183__tar.gz - Mend - Supply Chain Defender

vision-agent 0.2.182tar.gz → 0.2.183tar.gz

Sign up to get free protection for your applications and to get access to all the features.

Files changed (35) hide show

{vision_agent-0.2.182 → vision_agent-0.2.183}/PKG-INFO RENAMED Viewed

@@ -1,6 +1,6 @@
 Metadata-Version: 2.1
 Name: vision-agent
-Version: 0.2.182
+Version: 0.2.183
 Summary: Toolset for Vision Agent
 Author: Landing AI
 Author-email: dev@landing.ai

{vision_agent-0.2.182 → vision_agent-0.2.183}/pyproject.toml RENAMED Viewed

@@ -4,7 +4,7 @@ build-backend = "poetry.core.masonry.api"
 [tool.poetry]
 name = "vision-agent"
-version = "0.2.182"
+version = "0.2.183"
 description = "Toolset for Vision Agent"
 authors = ["Landing AI <dev@landing.ai>"]
 readme = "README.md"

{vision_agent-0.2.182 → vision_agent-0.2.183}/vision_agent/tools/__init__.py RENAMED Viewed

@@ -66,6 +66,7 @@ from .tools import (
     vit_image_classification,
     vit_nsfw_classification,
     qwen2_vl_images_vqa,
+    qwen2_vl_video_vqa,
     video_temporal_localization,
 )

{vision_agent-0.2.182 → vision_agent-0.2.183}/vision_agent/tools/tools.py RENAMED Viewed

@@ -930,6 +930,37 @@ def ixc25_video_vqa(prompt: str, frames: List[np.ndarray]) -> str:
     return cast(str, data["answer"])
+def qwen2_vl_video_vqa(prompt: str, frames: List[np.ndarray]) -> str:
+    """'qwen2_vl_video_vqa' is a tool that can answer any questions about arbitrary videos
+    including regular videos or videos of documents or presentations. It returns text
+    as an answer to the question.
+    Parameters:
+        prompt (str): The question about the video
+        frames (List[np.ndarray]): The reference frames used for the question
+    Returns:
+        str: A string which is the answer to the given prompt.
+    Example
+    -------
+        >>> qwen2_vl_video_vqa('Which football player made the goal?', frames)
+        'Lionel Messi'
+    """
+    buffer_bytes = frames_to_bytes(frames)
+    files = [("video", buffer_bytes)]
+    payload = {
+        "prompt": prompt,
+        "model": "qwen2vl",
+        "function_name": "qwen2_vl_video_vqa",
+    }
+    data: Dict[str, Any] = send_inference_request(
+        payload, "image-to-text", files=files, v2=True
+    )
+    return cast(str, data)
 def gpt4o_image_vqa(prompt: str, image: np.ndarray) -> str:
     """'gpt4o_image_vqa' is a tool that can answer any questions about arbitrary images
     including regular images or images of documents or presentations. It returns text
@@ -2238,13 +2269,13 @@ FUNCTION_TOOLS = [
     florence2_sam2_image,
     florence2_sam2_video_tracking,
     florence2_phrase_grounding,
-    ixc25_image_vqa,
-    ixc25_video_vqa,
     detr_segmentation,
     depth_anything_v2,
     generate_pose_image,
     closest_mask_distance,
     closest_box_distance,
+    qwen2_vl_images_vqa,
+    qwen2_vl_video_vqa,
 ]
 UTIL_TOOLS = [

{vision_agent-0.2.182 → vision_agent-0.2.183}/LICENSE RENAMED Viewed

File without changes

{vision_agent-0.2.182 → vision_agent-0.2.183}/README.md RENAMED Viewed

File without changes

{vision_agent-0.2.182 → vision_agent-0.2.183}/vision_agent/__init__.py RENAMED Viewed

File without changes

{vision_agent-0.2.182 → vision_agent-0.2.183}/vision_agent/agent/__init__.py RENAMED Viewed

File without changes

{vision_agent-0.2.182 → vision_agent-0.2.183}/vision_agent/agent/agent.py RENAMED Viewed

File without changes

{vision_agent-0.2.182 → vision_agent-0.2.183}/vision_agent/agent/agent_utils.py RENAMED Viewed

File without changes

{vision_agent-0.2.182 → vision_agent-0.2.183}/vision_agent/agent/vision_agent.py RENAMED Viewed

File without changes

{vision_agent-0.2.182 → vision_agent-0.2.183}/vision_agent/agent/vision_agent_coder.py RENAMED Viewed

File without changes

{vision_agent-0.2.182 → vision_agent-0.2.183}/vision_agent/agent/vision_agent_coder_prompts.py RENAMED Viewed

File without changes

{vision_agent-0.2.182 → vision_agent-0.2.183}/vision_agent/agent/vision_agent_planner.py RENAMED Viewed

File without changes

{vision_agent-0.2.182 → vision_agent-0.2.183}/vision_agent/agent/vision_agent_planner_prompts.py RENAMED Viewed

File without changes

{vision_agent-0.2.182 → vision_agent-0.2.183}/vision_agent/agent/vision_agent_prompts.py RENAMED Viewed

File without changes

{vision_agent-0.2.182 → vision_agent-0.2.183}/vision_agent/clients/__init__.py RENAMED Viewed

File without changes

{vision_agent-0.2.182 → vision_agent-0.2.183}/vision_agent/clients/http.py RENAMED Viewed

File without changes

{vision_agent-0.2.182 → vision_agent-0.2.183}/vision_agent/clients/landing_public_api.py RENAMED Viewed

File without changes

{vision_agent-0.2.182 → vision_agent-0.2.183}/vision_agent/fonts/__init__.py RENAMED Viewed

File without changes

{vision_agent-0.2.182 → vision_agent-0.2.183}/vision_agent/fonts/default_font_ch_en.ttf RENAMED Viewed

File without changes

{vision_agent-0.2.182 → vision_agent-0.2.183}/vision_agent/lmm/__init__.py RENAMED Viewed

File without changes

{vision_agent-0.2.182 → vision_agent-0.2.183}/vision_agent/lmm/lmm.py RENAMED Viewed

File without changes

{vision_agent-0.2.182 → vision_agent-0.2.183}/vision_agent/lmm/types.py RENAMED Viewed

File without changes

{vision_agent-0.2.182 → vision_agent-0.2.183}/vision_agent/tools/meta_tools.py RENAMED Viewed

File without changes

{vision_agent-0.2.182 → vision_agent-0.2.183}/vision_agent/tools/prompts.py RENAMED Viewed

File without changes

{vision_agent-0.2.182 → vision_agent-0.2.183}/vision_agent/tools/tool_utils.py RENAMED Viewed

File without changes

{vision_agent-0.2.182 → vision_agent-0.2.183}/vision_agent/tools/tools_types.py RENAMED Viewed

File without changes

{vision_agent-0.2.182 → vision_agent-0.2.183}/vision_agent/utils/__init__.py RENAMED Viewed

File without changes

{vision_agent-0.2.182 → vision_agent-0.2.183}/vision_agent/utils/exceptions.py RENAMED Viewed

File without changes

{vision_agent-0.2.182 → vision_agent-0.2.183}/vision_agent/utils/execute.py RENAMED Viewed

File without changes

{vision_agent-0.2.182 → vision_agent-0.2.183}/vision_agent/utils/image_utils.py RENAMED Viewed

File without changes

{vision_agent-0.2.182 → vision_agent-0.2.183}/vision_agent/utils/sim.py RENAMED Viewed

File without changes

{vision_agent-0.2.182 → vision_agent-0.2.183}/vision_agent/utils/type_defs.py RENAMED Viewed

File without changes

{vision_agent-0.2.182 → vision_agent-0.2.183}/vision_agent/utils/video.py RENAMED Viewed

File without changes