PyPI - vision-agent - Versions diffs - 0.2.37__tar.gz → 0.2.38__tar.gz - Mend - Supply Chain Defender

vision-agent 0.2.37tar.gz → 0.2.38tar.gz

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (36) hide show

{vision_agent-0.2.37 → vision_agent-0.2.38}/PKG-INFO RENAMED Viewed

@@ -1,6 +1,6 @@
 Metadata-Version: 2.1
 Name: vision-agent
-Version: 0.2.37
+Version: 0.2.38
 Summary: Toolset for Vision Agent
 Author: Landing AI
 Author-email: dev@landing.ai

{vision_agent-0.2.37 → vision_agent-0.2.38}/pyproject.toml RENAMED Viewed

@@ -4,7 +4,7 @@ build-backend = "poetry.core.masonry.api"
 [tool.poetry]
 name = "vision-agent"
-version = "0.2.37"
+version = "0.2.38"
 description = "Toolset for Vision Agent"
 authors = ["Landing AI <dev@landing.ai>"]
 readme = "README.md"

{vision_agent-0.2.37 → vision_agent-0.2.38}/vision_agent/tools/tools.py RENAMED Viewed

@@ -198,7 +198,7 @@ def extract_frames(
 def ocr(image: np.ndarray) -> List[Dict[str, Any]]:
     """'ocr' extracts text from an image. It returns a list of detected text, bounding
-    boxes, and confidence scores.
+    boxes, and confidence scores. The results are sorted from top-left to bottom right
     Parameters:
         image (np.ndarray): The image to extract text from.
@@ -211,7 +211,7 @@ def ocr(image: np.ndarray) -> List[Dict[str, Any]]:
     -------
     >>> ocr(image)
     [
-        {'label': 'some text', 'bbox': [0.1, 0.11, 0.35, 0.4], 'score': 0.99},
+        {'label': 'hello world', 'bbox': [0.1, 0.11, 0.35, 0.4], 'score': 0.99},
     ]
     """
@@ -245,7 +245,8 @@ def ocr(image: np.ndarray) -> List[Dict[str, Any]]:
         box = normalize_bbox(box, image_size)
         output.append({"label": label, "bbox": box, "score": round(det["score"], 2)})
-    return output
+    ocr_results = sorted(output, key=lambda x: (x["bbox"][1], x["bbox"][0]))
+    return ocr_results
 def zero_shot_counting(image: np.ndarray) -> Dict[str, Any]:

{vision_agent-0.2.37 → vision_agent-0.2.38}/LICENSE RENAMED Viewed

File without changes

{vision_agent-0.2.37 → vision_agent-0.2.38}/README.md RENAMED Viewed

File without changes

{vision_agent-0.2.37 → vision_agent-0.2.38}/vision_agent/__init__.py RENAMED Viewed

File without changes

{vision_agent-0.2.37 → vision_agent-0.2.38}/vision_agent/agent/__init__.py RENAMED Viewed

File without changes

{vision_agent-0.2.37 → vision_agent-0.2.38}/vision_agent/agent/agent.py RENAMED Viewed

File without changes

{vision_agent-0.2.37 → vision_agent-0.2.38}/vision_agent/agent/agent_coder.py RENAMED Viewed

File without changes

{vision_agent-0.2.37 → vision_agent-0.2.38}/vision_agent/agent/agent_coder_prompts.py RENAMED Viewed

File without changes

{vision_agent-0.2.37 → vision_agent-0.2.38}/vision_agent/agent/data_interpreter.py RENAMED Viewed

File without changes

{vision_agent-0.2.37 → vision_agent-0.2.38}/vision_agent/agent/data_interpreter_prompts.py RENAMED Viewed

File without changes

{vision_agent-0.2.37 → vision_agent-0.2.38}/vision_agent/agent/easytool.py RENAMED Viewed

File without changes

{vision_agent-0.2.37 → vision_agent-0.2.38}/vision_agent/agent/easytool_prompts.py RENAMED Viewed

File without changes

{vision_agent-0.2.37 → vision_agent-0.2.38}/vision_agent/agent/easytool_v2.py RENAMED Viewed

File without changes

{vision_agent-0.2.37 → vision_agent-0.2.38}/vision_agent/agent/easytool_v2_prompts.py RENAMED Viewed

File without changes

{vision_agent-0.2.37 → vision_agent-0.2.38}/vision_agent/agent/reflexion.py RENAMED Viewed

File without changes

{vision_agent-0.2.37 → vision_agent-0.2.38}/vision_agent/agent/reflexion_prompts.py RENAMED Viewed

File without changes

{vision_agent-0.2.37 → vision_agent-0.2.38}/vision_agent/agent/vision_agent.py RENAMED Viewed

File without changes

{vision_agent-0.2.37 → vision_agent-0.2.38}/vision_agent/agent/vision_agent_prompts.py RENAMED Viewed

File without changes

{vision_agent-0.2.37 → vision_agent-0.2.38}/vision_agent/fonts/__init__.py RENAMED Viewed

File without changes

{vision_agent-0.2.37 → vision_agent-0.2.38}/vision_agent/fonts/default_font_ch_en.ttf RENAMED Viewed

File without changes

{vision_agent-0.2.37 → vision_agent-0.2.38}/vision_agent/llm/__init__.py RENAMED Viewed

File without changes

{vision_agent-0.2.37 → vision_agent-0.2.38}/vision_agent/llm/llm.py RENAMED Viewed

File without changes

{vision_agent-0.2.37 → vision_agent-0.2.38}/vision_agent/lmm/__init__.py RENAMED Viewed

File without changes

{vision_agent-0.2.37 → vision_agent-0.2.38}/vision_agent/lmm/lmm.py RENAMED Viewed

File without changes

{vision_agent-0.2.37 → vision_agent-0.2.38}/vision_agent/tools/__init__.py RENAMED Viewed

File without changes

{vision_agent-0.2.37 → vision_agent-0.2.38}/vision_agent/tools/easytool_tools.py RENAMED Viewed

File without changes

{vision_agent-0.2.37 → vision_agent-0.2.38}/vision_agent/tools/prompts.py RENAMED Viewed

File without changes

{vision_agent-0.2.37 → vision_agent-0.2.38}/vision_agent/tools/tool_utils.py RENAMED Viewed

File without changes

{vision_agent-0.2.37 → vision_agent-0.2.38}/vision_agent/utils/__init__.py RENAMED Viewed

File without changes

{vision_agent-0.2.37 → vision_agent-0.2.38}/vision_agent/utils/execute.py RENAMED Viewed

File without changes

{vision_agent-0.2.37 → vision_agent-0.2.38}/vision_agent/utils/image_utils.py RENAMED Viewed

File without changes

{vision_agent-0.2.37 → vision_agent-0.2.38}/vision_agent/utils/sim.py RENAMED Viewed

File without changes

{vision_agent-0.2.37 → vision_agent-0.2.38}/vision_agent/utils/type_defs.py RENAMED Viewed

File without changes

{vision_agent-0.2.37 → vision_agent-0.2.38}/vision_agent/utils/video.py RENAMED Viewed

File without changes