PyPI - vlmparse - Versions diffs - 0.1.4__py3-none-any.whl → 0.1.5__py3-none-any.whl - Mend

vlmparse 0.1.4py3-none-any.whl → 0.1.5py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (30) hide show

vlmparse/clients/docling.py +2 -2
vlmparse/clients/dotsocr.py +11 -2
vlmparse/clients/mineru.py +8 -7
vlmparse/clients/openai_converter.py +1 -0
vlmparse/converter_with_server.py +5 -4
vlmparse/registries.py +2 -4
vlmparse/servers/docker_server.py +1 -1
vlmparse/servers/utils.py +3 -2
{vlmparse-0.1.4.dist-info → vlmparse-0.1.5.dist-info}/METADATA +17 -3
vlmparse-0.1.5.dist-info/RECORD +36 -0
vlmparse/benchpdf2md/bench_tests/benchmark_tsts.py +0 -1763
vlmparse/benchpdf2md/bench_tests/utils.py +0 -0
vlmparse/benchpdf2md/create_dataset.py +0 -60
vlmparse/benchpdf2md/olmocrbench/katex/__init__.py +0 -1
vlmparse/benchpdf2md/olmocrbench/katex/render.py +0 -592
vlmparse/benchpdf2md/olmocrbench/repeatdetect.py +0 -175
vlmparse/benchpdf2md/olmocrbench/run_olmocr_bench.py +0 -256
vlmparse/benchpdf2md/olmocrbench/tests.py +0 -1334
vlmparse/benchpdf2md/run_benchmark.py +0 -296
vlmparse/benchpdf2md/st_visu_benchmark/app.py +0 -271
vlmparse/benchpdf2md/st_visu_benchmark/highligh_text.py +0 -117
vlmparse/benchpdf2md/st_visu_benchmark/test_form.py +0 -95
vlmparse/benchpdf2md/st_visu_benchmark/ui_elements.py +0 -20
vlmparse/benchpdf2md/st_visu_benchmark/utils.py +0 -50
vlmparse/benchpdf2md/utils.py +0 -56
vlmparse-0.1.4.dist-info/RECORD +0 -51
{vlmparse-0.1.4.dist-info → vlmparse-0.1.5.dist-info}/WHEEL +0 -0
{vlmparse-0.1.4.dist-info → vlmparse-0.1.5.dist-info}/entry_points.txt +0 -0
{vlmparse-0.1.4.dist-info → vlmparse-0.1.5.dist-info}/licenses/LICENSE +0 -0
{vlmparse-0.1.4.dist-info → vlmparse-0.1.5.dist-info}/top_level.txt +0 -0

vlmparse/clients/docling.py CHANGED Viewed

@@ -34,7 +34,7 @@ class DoclingDockerServerConfig(DockerServerConfig):
             "LOG_LEVEL": "DEBUG",  # Enable verbose logging
             # Performance Tuning
             # "UVICORN_WORKERS": "4",  # Increase web server workers (Default: 1)
-            # "DOCLING_SERVE_ENG_LOC_NUM_WORKERS": "4",  # Increase processing workers (Default: 2)
+            "DOCLING_SERVE_ENG_LOC_NUM_WORKERS": "16",  # Increase processing workers (Default: 2)
             "DOCLING_NUM_THREADS": "32",  # Increase torch threads (Default: 4)
         }
     )
@@ -62,8 +62,8 @@ class DoclingDockerServerConfig(DockerServerConfig):
 class DoclingConverterConfig(ConverterConfig):
     """Configuration for Docling converter client."""
+    base_url: str
     model_name: str = "docling"
-    base_url: str = "http://localhost:5001"
     timeout: int = 300
     api_kwargs: dict = {"output_format": "markdown", "image_export_mode": "referenced"}

vlmparse/clients/dotsocr.py CHANGED Viewed

@@ -8,6 +8,7 @@ from PIL import Image
 from pydantic import Field
 from vlmparse.clients.openai_converter import (
+    LLMParams,
     OpenAIConverterClient,
     OpenAIConverterConfig,
 )
@@ -28,6 +29,7 @@ class DotsOCRDockerServerConfig(DockerServerConfig):
     dockerfile_dir: str = str(DOCKERFILE_DIR / "dotsocr")
     command_args: list[str] = Field(
         default_factory=lambda: [
+            "/workspace/weights/DotsOCR",
             "--tensor-parallel-size",
             "1",
             "--gpu-memory-utilization",
@@ -44,12 +46,19 @@ class DotsOCRDockerServerConfig(DockerServerConfig):
             # "16384",
         ]
     )
-    add_model_key_to_server: bool = False
+    add_model_key_to_server: bool = True
     aliases: list[str] = Field(default_factory=lambda: ["dotsocr"])
     @property
     def client_config(self):
-        return DotsOCRConverterConfig(llm_params=self.llm_params)
+        return DotsOCRConverterConfig(
+            llm_params=LLMParams(
+                base_url=f"http://localhost:{self.docker_port}{self.get_base_url_suffix()}",
+            )
+        )
+    def get_base_url_suffix(self) -> str:
+        return "/v1"
 class DotsOCRConverterConfig(OpenAIConverterConfig):

vlmparse/clients/mineru.py CHANGED Viewed

@@ -1,6 +1,5 @@
 import asyncio
 import io
-import os
 import orjson
 from loguru import logger
@@ -20,18 +19,21 @@ class MinerUDockerServerConfig(DockerServerConfig):
     docker_image: str = "pulsia/mineru25apipulsia:latest"
     docker_port: int = 4299
     container_port: int = 8000
+    server_ready_indicators: list[str] = Field(
+        default_factory=lambda: ["Uvicorn running"]
+    )
     @property
     def client_config(self):
-        return MinerUConverterConfig(api_url=f"http://localhost:{self.docker_port}")
+        return MinerUConverterConfig(base_url=f"http://localhost:{self.docker_port}")
 class MinerUConverterConfig(ConverterConfig):
     """Configuration for MinerU API converter."""
-    base_url: str = Field(
-        default_factory=lambda: os.getenv("MINERU_API_URL", "http://localhost:4299")
-    )
+    base_url: str
+    model_name: str = "opendatalab/MinerU2.5-2509-1.2B"
+    aliases: list[str] = Field(default_factory=lambda: ["mineru25"])
     timeout: int = 600
     def get_client(self, **kwargs) -> "MinerUConverter":
@@ -54,13 +56,12 @@ class MinerUConverter(BaseConverter):
         super().__init__(config=config, **kwargs)
         from httpx import AsyncClient
-        self.client = AsyncClient(base_url=config.api_url, timeout=config.timeout)
+        self.client = AsyncClient(base_url=config.base_url, timeout=config.timeout)
     async def _async_inference_with_api(self, image) -> list:
         """Run async inference with MinerU API."""
         img_byte_arr = await asyncio.to_thread(to_bytes_io, image)
         response = await self.client.post(
             "process-image",
             files={"image": ("image.png", img_byte_arr, "image/png")},

vlmparse/clients/openai_converter.py CHANGED Viewed

@@ -92,6 +92,7 @@ class OpenAIConverterClient(BaseConverter):
             base_url=self.config.llm_params.base_url,
             api_key=self.config.llm_params.api_key,
             timeout=self.config.llm_params.timeout,
+            max_retries=self.config.llm_params.max_retries,
         )
     async def _get_chat_completion(

vlmparse/converter_with_server.py CHANGED Viewed

@@ -42,13 +42,13 @@ class ConverterWithServer:
             docker_config = docker_config_registry.get(
                 self.model, default=self.with_vllm_server
             )
-            if self.port is not None:
-                docker_config.docker_port = self.port
             if docker_config is not None:
+                if self.port is not None:
+                    docker_config.docker_port = self.port
                 docker_config.gpu_device_ids = gpu_device_ids
-                server = docker_config.get_server(auto_stop=True)
-                server.start()
+                self.server = docker_config.get_server(auto_stop=True)
+                self.server.start()
                 self.client = docker_config.get_client()
             else:
@@ -56,6 +56,7 @@ class ConverterWithServer:
         else:
             client_config = converter_config_registry.get(self.model, uri=self.uri)
             self.client = client_config.get_client()
     def parse(

vlmparse/registries.py CHANGED Viewed

@@ -108,6 +108,7 @@ for gemini_model in [
     "gemini-2.5-flash",
     "gemini-2.5-flash-lite",
     "gemini-3-pro-preview",
+    "gemini-3-flash-preview",
 ]:
     converter_config_registry.register(
         gemini_model,
@@ -120,12 +121,9 @@ for gemini_model in [
         ),
     )
 for openai_model in [
-    "gpt-5.1",
-    "gpt-5.1-mini",
-    "gpt-5.1-nano",
+    "gpt-5.2",
     "gpt-5",
     "gpt-5-mini",
-    "gpt-5-nano",
 ]:
     converter_config_registry.register(
         openai_model,

vlmparse/servers/docker_server.py CHANGED Viewed

@@ -78,7 +78,7 @@ class VLLMDockerServerConfig(DockerServerConfig):
         from vlmparse.clients.openai_converter import LLMParams
         return LLMParams(
-            base_url=f"http://localhost:{self.docker_port}/v1",
+            base_url=f"http://localhost:{self.docker_port}{self.get_base_url_suffix()}",
             model_name=self.default_model_name,
         )

vlmparse/servers/utils.py CHANGED Viewed

@@ -3,9 +3,8 @@ import time
 from contextlib import contextmanager
 from pathlib import Path
-from loguru import logger
 import docker
+from loguru import logger
 def _ensure_image_exists(
@@ -230,6 +229,8 @@ def get_model_from_uri(uri: str) -> str:
     for container in containers:
         c_uri = container.labels.get("vlmparse_uri")
         c_model = container.labels.get("vlmparse_model_name")
+        if c_uri is not None:
+            c_uri = c_uri.replace("localhost", "0.0.0.0")
         # Check if user URI matches container URI (ignoring /v1 suffix if missing)
         if c_uri and (

{vlmparse-0.1.4.dist-info → vlmparse-0.1.5.dist-info}/METADATA RENAMED Viewed

@@ -1,7 +1,7 @@
 Metadata-Version: 2.4
 Name: vlmparse
-Version: 0.1.4
-Requires-Python: >=3.12.0
+Version: 0.1.5
+Requires-Python: >=3.11.0
 Description-Content-Type: text/markdown
 License-File: LICENSE
 Requires-Dist: devtools>=0.12.2
@@ -72,6 +72,19 @@ Supported Converters:
 ## Installation
+Simplest solution with only the cli:
+```bash
+uv tool install vlmparse
+```
+If you want to run the granite-docling model or use the streamlit viewing app:
+```bash
+uv tool install vlmparse[docling_core,st_app]
+```
+If you prefer cloning the repository and using the local version:
 ```bash
 uv sync
 ```
@@ -86,10 +99,11 @@ Activate the virtual environment:
 ```bash
 source .venv/bin/activate
 ```
-Other solution: append uv run to all the commands below.
 ## CLI Usage
+Note that you can bypass the previous installation step and just add uvx before each of the commands below.
 ### Convert PDFs
 With a general VLM (requires setting your api key as an environment variable):

vlmparse-0.1.5.dist-info/RECORD ADDED Viewed

@@ -0,0 +1,36 @@
+vlmparse/base_model.py,sha256=4U4UPe8SNArliKnUf8pp8zQugWYsnhg9okylt7mrW1U,381
+vlmparse/build_doc.py,sha256=LAWrnFrqamN5PwJo57AUtQOPrMFGnCGw4gBjEKZ6pYo,2127
+vlmparse/cli.py,sha256=tQma1IkOsFnqPKqqHVO1PJh18n1w82gp4ewA7oraJkE,15855
+vlmparse/constants.py,sha256=7-47S01n4MI2ebR09bpdOo3_P16d-z-NVGsm6KJP8ls,110
+vlmparse/converter.py,sha256=F0JSY9sFYUggCvaUCb27kKGJJpnZKW2FStMDVJoIOeQ,7383
+vlmparse/converter_with_server.py,sha256=G393O7vU_lJz6Vz-qYVkrjFhf0Vmpjjl8OjPKQe2blU,3928
+vlmparse/registries.py,sha256=6bEUKTkTjc8C7c1R1ZvAHSF5NCXmAuhNpw0qNnuQ7-A,5818
+vlmparse/utils.py,sha256=rcVrtPiQVj_8HAmFQOu___72uYIapp_X89yxrMNCBow,1236
+vlmparse/clients/chandra.py,sha256=zfu-A6Slh-fIAyrtrlVoCb6QHLBimnimefap_K9YwYw,9775
+vlmparse/clients/deepseekocr.py,sha256=rQvaOaPPoDiZ0MzXqfqqH9BgUBfjmlfHu3NlMjSDgiQ,6501
+vlmparse/clients/docling.py,sha256=SAkLsqseuWfkuiel8FWR1G0Z5s-SZU3dE2JbsOvF4SA,5328
+vlmparse/clients/dotsocr.py,sha256=w2T-xkhlw1AfT-CUYoF0ectr2jDYHe9239B24XKB1UQ,10139
+vlmparse/clients/granite_docling.py,sha256=EQpsv5qSJG0HtMSacmJStER2sq4TGf1EMU5_NmJsl4g,4634
+vlmparse/clients/hunyuanocr.py,sha256=Xw0Q1l-3pQzaEgFngnfM8vrSWpnT3I99QvDaGZ8XooM,1712
+vlmparse/clients/lightonocr.py,sha256=wx1Im8Z3wlRWwYbPqnSd3LqTtdAU8CnX5mzu1BuCUY8,1314
+vlmparse/clients/mineru.py,sha256=bilDPcUoLk2rcFVqMk4q2Hx2txilc3GDUbjAEoMM_BI,3671
+vlmparse/clients/nanonetocr.py,sha256=BT5vaeerCsK5agvOaHK3NvLUqWd1FfDmrMmDYbp646I,1543
+vlmparse/clients/olmocr.py,sha256=mQEDpfyLY8a80Zlps5mG0QaWytIgnNQZVEVWKWjPIjk,1849
+vlmparse/clients/openai_converter.py,sha256=j2H0iAQTADRRpu1Zy1b-1OFfWyXuqCvrQKy2UcwggTA,5696
+vlmparse/clients/paddleocrvl.py,sha256=tmaqg3boV4edywiiiNiNiI3dBHi111wz4dFb52OISXw,1376
+vlmparse/clients/prompts.py,sha256=-J60lqxgRzlkQ9VsQLxmWsIMaDt-gNqWqWoqHIw9CLc,4228
+vlmparse/clients/pipe_utils/cleaner.py,sha256=oxBkBTOkluN1lmeNbzajRIe0_D__ZGwUOBaI_Ph0uxE,2396
+vlmparse/clients/pipe_utils/html_to_md_conversion.py,sha256=cFFqzD2jCNw_968_eu3Wt--Ox7iJj2Rn5UoP_DZWosU,4112
+vlmparse/clients/pipe_utils/utils.py,sha256=935ecIO446I0pstszE_1nrIPHn1Ffrxunq7fVd0dsd8,315
+vlmparse/data_model/box.py,sha256=lJsh4qhjgYXZF5vTSJ1qMXD5GVlBi2_SBedBMlfJikU,16868
+vlmparse/data_model/document.py,sha256=pdCZvWzRFkez53ZJpNaB4ezUW-OVUlbR3_SBmmgVzGQ,4217
+vlmparse/servers/docker_server.py,sha256=qOoZcWSHrK7kK7tAL61RJSW-Jmee93It2SEfWG3jGrc,6633
+vlmparse/servers/utils.py,sha256=qy2-rnQTCQKt6CeTV5H74tvRTXyzBV2KswQiYW8Tf-k,8908
+vlmparse/st_viewer/fs_nav.py,sha256=7GNH68h2Loh5pQ64Pe72-D2cs2BLhqRXevEmKdFmPX0,1616
+vlmparse/st_viewer/st_viewer.py,sha256=m2rQTtk5rlwErNmivNAg-4rkHkvNkvLhoJZxFQi7Dwk,2105
+vlmparse-0.1.5.dist-info/licenses/LICENSE,sha256=3TKJHk8hPBR5dbLWZ3IpfCftl-_m-iyBwpYQGZYxj14,1080
+vlmparse-0.1.5.dist-info/METADATA,sha256=LN4W1cvXJvL22hwLAgeSwd3PGTmlrt6lgqNi-tL9pes,5446
+vlmparse-0.1.5.dist-info/WHEEL,sha256=_zCd3N1l69ArxyTb8rzEoP9TpbYXkqRFSNOD5OuxnTs,91
+vlmparse-0.1.5.dist-info/entry_points.txt,sha256=gD5berP6HwE2wNIkls-Lw5goiceA8uMgPEd7ifnFJXs,47
+vlmparse-0.1.5.dist-info/top_level.txt,sha256=k4ni-GNH_iAX7liQEsk_KY_c3xgZgt8k9fsSs9IXLXs,9
+vlmparse-0.1.5.dist-info/RECORD,,

vlmparse 0.1.4__py3-none-any.whl → 0.1.5__py3-none-any.whl

vlmparse 0.1.4py3-none-any.whl → 0.1.5py3-none-any.whl