PyPI - vlmparse - Versions diffs - 0.1.5__py3-none-any.whl → 0.1.6__py3-none-any.whl - Mend

vlmparse 0.1.5py3-none-any.whl → 0.1.6py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (19) hide show

vlmparse/cli.py +26 -96
vlmparse/clients/chandra.py +1 -1
vlmparse/clients/deepseekocr.py +51 -51
vlmparse/clients/dotsocr.py +9 -5
vlmparse/clients/hunyuanocr.py +2 -1
vlmparse/clients/mineru.py +11 -13
vlmparse/clients/olmocr.py +1 -1
vlmparse/clients/openai_converter.py +13 -4
vlmparse/clients/paddleocrvl.py +2 -1
vlmparse/converter_with_server.py +33 -7
vlmparse/data_model/document.py +11 -1
vlmparse/registries.py +1 -3
vlmparse/servers/docker_server.py +15 -1
{vlmparse-0.1.5.dist-info → vlmparse-0.1.6.dist-info}/METADATA +6 -4
{vlmparse-0.1.5.dist-info → vlmparse-0.1.6.dist-info}/RECORD +19 -19
{vlmparse-0.1.5.dist-info → vlmparse-0.1.6.dist-info}/WHEEL +0 -0
{vlmparse-0.1.5.dist-info → vlmparse-0.1.6.dist-info}/entry_points.txt +0 -0
{vlmparse-0.1.5.dist-info → vlmparse-0.1.6.dist-info}/licenses/LICENSE +0 -0
{vlmparse-0.1.5.dist-info → vlmparse-0.1.6.dist-info}/top_level.txt +0 -0

vlmparse/cli.py CHANGED Viewed

@@ -4,13 +4,24 @@ from loguru import logger
 class DParseCLI:
-    def serve(self, model: str, port: int | None = None, gpus: str | None = None):
+    """Parsing of pdf to text using VLMs: typ in vlmparse to get the command lists, then `vlmparse <command> --help` to get help on a specific command."""
+    def serve(
+        self,
+        model: str,
+        port: int | None = None,
+        gpus: str | None = None,
+        vllm_kwargs: dict | None = None,
+        forget_predefined_vllm_kwargs: bool = False,
+    ):
         """Deploy a VLLM server in a Docker container.
         Args:
             model: Model name
             port: VLLM server port (default: 8056)
             gpus: Comma-separated GPU device IDs (e.g., "0" or "0,1,2"). If not specified, all GPUs will be used.
+            vllm_kwargs: Additional keyword arguments to pass to the VLLM server.
+            forget_predefined_vllm_kwargs: If True, the predefined VLLM kwargs from the docker config will be replaced by vllm_kwargs otherwise the predefined kwargs will be updated with vllm_kwargs with a risk of collision of argument names.
         """
         if port is None:
             port = 8056
@@ -32,6 +43,10 @@ class DParseCLI:
             docker_config.gpu_device_ids = [g.strip() for g in str(gpus).split(",")]
         server = docker_config.get_server(auto_stop=False)
+        if server is None:
+            logger.error(f"Model server not found for model: {model}")
+            return
         # Deploy server and leave it running (cleanup=False)
         logger.info(
             f"Deploying VLLM server for {docker_config.model_name} on port {port}..."
@@ -54,6 +69,8 @@ class DParseCLI:
         with_vllm_server: bool = False,
         concurrency: int = 10,
         dpi: int | None = None,
+        vllm_kwargs: dict | None = None,
+        debug: bool = False,
     ):
         """Parse PDF documents and save results.
@@ -67,109 +84,22 @@ class DParseCLI:
             mode: Output mode - "document" (save as JSON zip), "md" (save as markdown file), "md_page" (save as folder of markdown pages)
             with_vllm_server: If True, a local VLLM server will be deployed if the model is not found in the registry. Note that if the model is in the registry and the uri is None, the server will be anyway deployed.
             dpi: DPI to use for the conversion. If not specified, the default DPI will be used.
+            vllm_kwargs: Additional keyword arguments to pass to the VLLM server.
+            debug: If True, run in debug mode (single-threaded, no concurrency)
         """
         from vlmparse.converter_with_server import ConverterWithServer
-        converter_with_server = ConverterWithServer(
+        with ConverterWithServer(
             model=model,
             uri=uri,
             gpus=gpus,
             with_vllm_server=with_vllm_server,
             concurrency=concurrency,
-        )
-        return converter_with_server.parse(
-            inputs=inputs, out_folder=out_folder, mode=mode, dpi=dpi
-        )
-        # from vlmparse.registries import converter_config_registry
-        # # Infer model from URI if provided
-        # if uri is not None and model is None:
-        #     import docker
-        #     try:
-        #         docker_client = docker.from_env()
-        #         containers = docker_client.containers.list()
-        #         for container in containers:
-        #             # Check both exact match and match with/without trailing slash
-        #             container_uri = container.labels.get("vlmparse_uri", "")
-        #             if container_uri and (
-        #                 container_uri == uri
-        #                 or container_uri.rstrip("/") == uri.rstrip("/")
-        #             ):
-        #                 inferred_model = container.labels.get("vlmparse_model_name")
-        #                 if inferred_model:
-        #                     logger.info(
-        #                         f"Inferred model {inferred_model} from URI {uri}"
-        #                     )
-        #                     model = inferred_model
-        #                     break
-        #     except Exception:
-        #         # If Docker is not available or fails, just proceed with provided arguments
-        #         pass
-        # if mode not in ["document", "md", "md_page"]:
-        #     logger.error(f"Invalid mode: {mode}. Must be one of: document, md, md_page")
-        #     return
-        # # Expand file paths from glob patterns
-        # file_paths = []
-        # if isinstance(inputs, str):
-        #     inputs = [inputs]
-        # for pattern in inputs:
-        #     if "*" in pattern or "?" in pattern:
-        #         file_paths.extend(glob(pattern, recursive=True))
-        #     elif os.path.isdir(pattern):
-        #         file_paths.extend(glob(os.path.join(pattern, "*.pdf"), recursive=True))
-        #     elif os.path.isfile(pattern):
-        #         file_paths.append(pattern)
-        #     else:
-        #         logger.error(f"Invalid input: {pattern}")
-        # # Filter to only existing PDF files
-        # file_paths = [f for f in file_paths if os.path.exists(f) and f.endswith(".pdf")]
-        # if not file_paths:
-        #     logger.error("No PDF files found matching the inputs patterns")
-        #     return
-        # logger.info(f"Processing {len(file_paths)} files with {model} converter")
-        # gpu_device_ids = None
-        # if gpus is not None:
-        #     gpu_device_ids = [g.strip() for g in gpus.split(",")]
-        # if uri is None:
-        #     from vlmparse.registries import docker_config_registry
-        #     docker_config = docker_config_registry.get(model, default=with_vllm_server)
-        #     if docker_config is not None:
-        #         docker_config.gpu_device_ids = gpu_device_ids
-        #         server = docker_config.get_server(auto_stop=True)
-        #         server.start()
-        #         client = docker_config.get_client(
-        #             save_folder=out_folder, save_mode=mode
-        #         )
-        #     else:
-        #         client = converter_config_registry.get(model).get_client(
-        #             save_folder=out_folder, save_mode=mode
-        #         )
-        # else:
-        #     client_config = converter_config_registry.get(model, uri=uri)
-        #     client = client_config.get_client(save_folder=out_folder, save_mode=mode)
-        # client.num_concurrent_files = concurrency
-        # client.num_concurrent_pages = concurrency
-        # if dpi is not None:
-        #     client.config.dpi = int(dpi)
-        # documents = client.batch(file_paths)
-        # if documents is not None:
-        #     logger.info(f"Processed {len(documents)} documents to {out_folder}")
-        # else:
-        #     logger.info(f"Processed {len(file_paths)} documents to {out_folder}")
+            vllm_kwargs=vllm_kwargs,
+        ) as converter_with_server:
+            return converter_with_server.parse(
+                inputs=inputs, out_folder=out_folder, mode=mode, dpi=dpi, debug=debug
+            )
     def list(self):
         """List all containers whose name begins with vlmparse."""

vlmparse/clients/chandra.py CHANGED Viewed

@@ -194,7 +194,7 @@ class ChandraConverterConfig(OpenAIConverterConfig):
     model_name: str = "datalab-to/chandra"
     prompt_type: str = "ocr"  # Default prompt type
     bbox_scale: int = 1024
-    max_retries: int = 6
+    max_retries: int = 0
     max_failure_retries: int = None
     completion_kwargs: dict = Field(
         default_factory=lambda: {

vlmparse/clients/deepseekocr.py CHANGED Viewed

@@ -15,6 +15,57 @@ from vlmparse.servers.docker_server import VLLMDockerServerConfig
 from vlmparse.utils import to_base64
+class DeepSeekOCRDockerServerConfig(VLLMDockerServerConfig):
+    """Configuration for DeepSeekOCR model."""
+    model_name: str = "deepseek-ai/DeepSeek-OCR"
+    command_args: list[str] = Field(
+        default_factory=lambda: [
+            "--limit-mm-per-prompt",
+            '{"image": 1}',
+            "--async-scheduling",
+            "--logits_processors",
+            "vllm.model_executor.models.deepseek_ocr:NGramPerReqLogitsProcessor",
+            "--no-enable-prefix-caching",
+            "--mm-processor-cache-gb",
+            "0",
+        ]
+    )
+    aliases: list[str] = Field(default_factory=lambda: ["deepseekocr"])
+    @property
+    def client_config(self):
+        return DeepSeekOCRConverterConfig(llm_params=self.llm_params)
+class DeepSeekOCRConverterConfig(OpenAIConverterConfig):
+    """DeepSeekOCR converter - backward compatibility alias."""
+    model_name: str = "deepseek-ai/DeepSeek-OCR"
+    aliases: list[str] = Field(default_factory=lambda: ["deepseekocr"])
+    prompt_mode: Literal["layout", "ocr"] = "ocr"
+    completion_kwargs: dict | None = {
+        "temperature": 0.0,
+        "max_tokens": 8181,
+        "extra_body": {
+            "skip_special_tokens": False,
+            # args used to control custom logits processor
+            "vllm_xargs": {
+                "ngram_size": 30,
+                "window_size": 90,
+                # whitelist: <td>, </td>
+                "whitelist_token_ids": [128821, 128822],
+            },
+        },
+    }
+    dpi: int = 200
+    aliases: list[str] = Field(default_factory=lambda: ["deepseekocr"])
+    def get_client(self, **kwargs) -> "DeepSeekOCRConverterClient":
+        return DeepSeekOCRConverterClient(config=self, **kwargs)
 def re_match(text):
     pattern = r"(<\|ref\|>(.*?)<\|/ref\|><\|det\|>(.*?)<\|/det\|>)"
     matches = re.findall(pattern, text, re.DOTALL)
@@ -150,54 +201,3 @@ class DeepSeekOCRConverterClient(OpenAIConverterClient):
         logger.debug(page.text)
         return page
-class DeepSeekOCRDockerServerConfig(VLLMDockerServerConfig):
-    """Configuration for DeepSeekOCR model."""
-    model_name: str = "deepseek-ai/DeepSeek-OCR"
-    command_args: list[str] = Field(
-        default_factory=lambda: [
-            "--limit-mm-per-prompt",
-            '{"image": 1}',
-            "--async-scheduling",
-            "--logits_processors",
-            "vllm.model_executor.models.deepseek_ocr:NGramPerReqLogitsProcessor",
-            "--no-enable-prefix-caching",
-            "--mm-processor-cache-gb",
-            "0",
-        ]
-    )
-    aliases: list[str] = Field(default_factory=lambda: ["deepseekocr"])
-    @property
-    def client_config(self):
-        return DeepSeekOCRConverterConfig(llm_params=self.llm_params)
-class DeepSeekOCRConverterConfig(OpenAIConverterConfig):
-    """DeepSeekOCR converter - backward compatibility alias."""
-    model_name: str = "deepseek-ai/DeepSeek-OCR"
-    aliases: list[str] = Field(default_factory=lambda: ["deepseekocr"])
-    prompt_mode: Literal["layout", "ocr"] = "ocr"
-    completion_kwargs: dict | None = {
-        "temperature": 0.0,
-        "max_tokens": 8181,
-        "extra_body": {
-            "skip_special_tokens": False,
-            # args used to control custom logits processor
-            "vllm_xargs": {
-                "ngram_size": 30,
-                "window_size": 90,
-                # whitelist: <td>, </td>
-                "whitelist_token_ids": [128821, 128822],
-            },
-        },
-    }
-    dpi: int = 200
-    aliases: list[str] = Field(default_factory=lambda: ["deepseekocr"])
-    def get_client(self, **kwargs) -> "DeepSeekOCRConverterClient":
-        return DeepSeekOCRConverterClient(config=self, **kwargs)

vlmparse/clients/dotsocr.py CHANGED Viewed

@@ -237,7 +237,7 @@ class DotsOCRConverter(OpenAIConverterClient):
         )
         prompt = self.PROMPTS[prompt_mode]
-        response = await self._async_inference_with_vllm(image, prompt)
+        response, usage = await self._async_inference_with_vllm(image, prompt)
         if prompt_mode in ["prompt_layout_all_en"]:
             try:
@@ -248,17 +248,17 @@ class DotsOCRConverter(OpenAIConverterClient):
                     image.width,
                     image.height,
                 )
-                return {}, cells, False
+                return {}, cells, False, usage
             except Exception as e:
                 logger.warning(f"cells post process error: {e}, returning raw response")
-                return {}, response, True
+                return {}, response, True, usage
         else:
-            return {}, response, None
+            return {}, response, None, usage
     async def async_call_inside_page(self, page: Page) -> Page:
         image = page.image
-        _, response, _ = await self._parse_image_vllm(
+        _, response, _, usage = await self._parse_image_vllm(
             image, prompt_mode=self.config.prompt_mode
         )
         logger.info("Response: " + str(response))
@@ -283,4 +283,8 @@ class DotsOCRConverter(OpenAIConverterClient):
         text = clean_response(response)
         text = html_to_md_keep_tables(text)
         page.text = text
+        page.completion_tokens = usage.completion_tokens
+        page.prompt_tokens = usage.prompt_tokens
+        page.reasoning_tokens = usage.reasoning_tokens
         return page

vlmparse/clients/hunyuanocr.py CHANGED Viewed

@@ -39,7 +39,8 @@ class HunyuanOCRConverterConfig(OpenAIConverterConfig):
     completion_kwargs: dict | None = {
         "temperature": 0.0,
         "extra_body": {"top_k": 1, "repetition_penalty": 1.0},
+        "max_completion_tokens": 16384,  # max token len used in training according to the technical report is 32000, but in practice the model breaks earlier
     }
-    max_image_size: int | None = 1540
     dpi: int = 200
     aliases: list[str] = Field(default_factory=lambda: ["hunyuanocr"])
+    stream: bool = True

vlmparse/clients/mineru.py CHANGED Viewed

@@ -52,24 +52,22 @@ class MinerUConverter(BaseConverter):
     config: MinerUConverterConfig
-    def __init__(self, config: MinerUConverterConfig, **kwargs):
-        super().__init__(config=config, **kwargs)
-        from httpx import AsyncClient
-        self.client = AsyncClient(base_url=config.base_url, timeout=config.timeout)
     async def _async_inference_with_api(self, image) -> list:
         """Run async inference with MinerU API."""
+        from httpx import AsyncClient
-        img_byte_arr = await asyncio.to_thread(to_bytes_io, image)
-        response = await self.client.post(
-            "process-image",
-            files={"image": ("image.png", img_byte_arr, "image/png")},
-        )
+        async with AsyncClient(
+            base_url=self.config.base_url, timeout=self.config.timeout
+        ) as client:
+            img_byte_arr = await asyncio.to_thread(to_bytes_io, image)
+            response = await client.post(
+                "process-image",
+                files={"image": ("image.png", img_byte_arr, "image/png")},
+            )
-        response.raise_for_status()
+            response.raise_for_status()
-        res = orjson.loads(response.content)
+            res = orjson.loads(response.content)
         return res

vlmparse/clients/olmocr.py CHANGED Viewed

@@ -41,6 +41,6 @@ class OlmOCRConverterConfig(OpenAIConverterConfig):
         "temperature": 0.1,
         "max_tokens": 8000,
     }
-    max_image_size: int | None = 1288
+    # max_image_size: int | None = 1288
     dpi: int = 200
     aliases: list[str] = Field(default_factory=lambda: ["olmocr-2-fp8"])

vlmparse/clients/openai_converter.py CHANGED Viewed

@@ -40,6 +40,8 @@ def get_llm_params(model_name: str, uri: str | None = None):
     ]:
         base_url = None
         api_key = os.getenv("OPENAI_API_KEY")
+        if api_key is None:
+            raise ValueError("OPENAI_API_KEY environment variable not set")
     else:
         if model_name in [
             "gemini-2.5-flash-lite",
@@ -48,6 +50,8 @@ def get_llm_params(model_name: str, uri: str | None = None):
         ]:
             base_url = GOOGLE_API_BASE_URL
             api_key = os.getenv("GOOGLE_API_KEY")
+            if api_key is None:
+                raise ValueError("GOOGLE_API_KEY environment variable not set")
         else:
             return None
     return LLMParams(base_url=base_url, model_name=model_name, api_key=api_key)
@@ -97,7 +101,7 @@ class OpenAIConverterClient(BaseConverter):
     async def _get_chat_completion(
         self, messages: list[dict], completion_kwargs: dict | None = None
-    ) -> str:
+    ) -> tuple[str, "CompletionUsage"]:  # noqa: F821
         """Helper to handle chat completion with optional streaming."""
         if completion_kwargs is None:
             completion_kwargs = self.config.completion_kwargs
@@ -126,7 +130,8 @@ class OpenAIConverterClient(BaseConverter):
                     "Response is None, finish reason: "
                     + response_obj.choices[0].finish_reason
                 )
-            return response_obj.choices[0].message.content
+            return response_obj.choices[0].message.content, response_obj.usage
     async def async_call_inside_page(self, page: Page) -> Page:
         """Process a single page using OpenAI-compatible API."""
@@ -163,12 +168,16 @@ class OpenAIConverterClient(BaseConverter):
             },
         ]
-        response = await self._get_chat_completion(messages)
-        logger.info("Response: " + str(response))
+        response, usage = await self._get_chat_completion(messages)
+        logger.debug("Response: " + str(response))
         page.raw_response = response
         text = clean_response(response)
         text = html_to_md_keep_tables(text)
         page.text = text
+        page.prompt_tokens = usage.prompt_tokens
+        page.completion_tokens = usage.completion_tokens
+        if hasattr(usage, "reasoning_tokens"):
+            page.reasoning_tokens = usage.reasoning_tokens
         return page

vlmparse/clients/paddleocrvl.py CHANGED Viewed

@@ -42,7 +42,8 @@ class PaddleOCRVLConverterConfig(OpenAIConverterConfig):
     postprompt: str | None = TASKS["ocr"]
     completion_kwargs: dict | None = {
         "temperature": 0.0,
+        "max_completion_tokens": 16384,
     }
-    max_image_size: int | None = 1540
     dpi: int = 200
     aliases: list[str] = Field(default_factory=lambda: ["paddleocrvl"])
+    stream: bool = True

vlmparse/converter_with_server.py CHANGED Viewed

@@ -12,28 +12,35 @@ from vlmparse.utils import get_file_paths
 class ConverterWithServer:
     def __init__(
         self,
-        model: str,
+        model: str | None = None,
         uri: str | None = None,
         gpus: str | None = None,
         port: int | None = None,
         with_vllm_server: bool = False,
         concurrency: int = 10,
+        vllm_kwargs: dict | None = None,
+        forget_predefined_vllm_kwargs: bool = False,
     ):
-        from vlmparse.registries import (
-            converter_config_registry,
-            docker_config_registry,
-        )
         self.model = model
         self.uri = uri
         self.port = port
         self.gpus = gpus
         self.with_vllm_server = with_vllm_server
         self.concurrency = concurrency
+        self.vllm_kwargs = vllm_kwargs
+        self.forget_predefined_vllm_kwargs = forget_predefined_vllm_kwargs
+        self.server = None
+        self.client = None
         if self.uri is not None and self.model is None:
             self.model = get_model_from_uri(self.uri)
+    def start_server_and_client(self):
+        from vlmparse.registries import (
+            converter_config_registry,
+            docker_config_registry,
+        )
         gpu_device_ids = None
         if self.gpus is not None:
             gpu_device_ids = [g.strip() for g in self.gpus.split(",")]
@@ -47,7 +54,12 @@ class ConverterWithServer:
                 if self.port is not None:
                     docker_config.docker_port = self.port
                 docker_config.gpu_device_ids = gpu_device_ids
+                docker_config.update_command_args(
+                    self.vllm_kwargs,
+                    forget_predefined_vllm_kwargs=self.forget_predefined_vllm_kwargs,
+                )
                 self.server = docker_config.get_server(auto_stop=True)
                 self.server.start()
                 self.client = docker_config.get_client()
@@ -59,6 +71,17 @@ class ConverterWithServer:
             self.client = client_config.get_client()
+    def stop_server(self):
+        if self.server is not None and self.server.auto_stop:
+            self.server.stop()
+    def __enter__(self):
+        self.start_server_and_client()
+        return self
+    def __exit__(self, exc_type, exc_value, traceback):
+        self.stop_server()
     def parse(
         self,
         inputs: str | list[str],
@@ -68,6 +91,9 @@ class ConverterWithServer:
         debug: bool = False,
         retrylast: bool = False,
     ):
+        assert (
+            self.client is not None
+        ), "Client not initialized. Call start_server_and_client() first."
         file_paths = get_file_paths(inputs)
         assert (
             out_folder is not None
@@ -119,5 +145,5 @@ class ConverterWithServer:
         return documents
-    def get_out_folder(self) -> Path:
+    def get_out_folder(self) -> str | None:
         return self.client.save_folder

vlmparse/data_model/document.py CHANGED Viewed

@@ -41,6 +41,10 @@ class Page(VLMParseBaseModel):
     buffer_image: Optional[Image.Image | str | dict] = None
     latency: Optional[float] = None
     """Time taken to process the page in seconds."""
+    prompt_tokens: Optional[int] = None
+    completion_tokens: Optional[int] = None
+    """Include reasoning tokens"""
+    reasoning_tokens: Optional[int] = None
     @property
     def image(self):
@@ -66,7 +70,7 @@ class Page(VLMParseBaseModel):
         image = self.image
-        if layout:
+        if layout and image is not None:
             if self.items is None:
                 return image
             items = self.items
@@ -85,6 +89,9 @@ class Page(VLMParseBaseModel):
                 )
         return image
+    def to_markdown(self, **kwargs):
+        return self.text if self.text is not None else ""
 class Document(VLMParseBaseModel):
     file_path: str
@@ -104,6 +111,9 @@ class Document(VLMParseBaseModel):
             page.error is not None for page in self.pages
         )
+    def to_markdown(self, **kwargs):
+        return "\n\n".join([page.to_markdown(**kwargs) for page in self.pages])
     def to_zip(
         self,
         file_path,

vlmparse/registries.py CHANGED Viewed

@@ -77,9 +77,7 @@ class ConverterConfigRegistry:
         """Register a config factory for a model name."""
         self._registry[model_name] = config_factory
-    def get(
-        self, model_name: str, uri: str | None = None
-    ) -> OpenAIConverterConfig | None:
+    def get(self, model_name: str, uri: str | None = None) -> OpenAIConverterConfig:
         """Get config for a model name. Returns default if not registered."""
         if model_name in self._registry:
             return self._registry[model_name](uri=uri)

vlmparse/servers/docker_server.py CHANGED Viewed

@@ -47,6 +47,20 @@ class DockerServerConfig(BaseModel):
         """Build command for container. Override in subclasses for specific logic."""
         return self.command_args if self.command_args else None
+    def update_command_args(
+        self,
+        vllm_kwargs: dict | None = None,
+        forget_predefined_vllm_kwargs: bool = False,
+    ) -> list[str]:
+        if vllm_kwargs is not None:
+            new_kwargs = [f"--{k}={v}" for k, v in vllm_kwargs.items()]
+            if forget_predefined_vllm_kwargs:
+                self.command_args = new_kwargs
+            else:
+                self.command_args.extend(new_kwargs)
+        return self.command_args
     def get_volumes(self) -> dict | None:
         """Setup volumes for container. Override in subclasses for specific logic."""
         return self.volumes
@@ -144,7 +158,7 @@ class ConverterServer:
         """Start the Docker server."""
         if self._server_context is not None:
             logger.warning("Server already started")
-            return self.base_url
+            return self.base_url, self._container
         # Use the generic docker_server for all server types
         self._server_context = docker_server(config=self.config, cleanup=self.auto_stop)

{vlmparse-0.1.5.dist-info → vlmparse-0.1.6.dist-info}/METADATA RENAMED Viewed

@@ -1,6 +1,6 @@
 Metadata-Version: 2.4
 Name: vlmparse
-Version: 0.1.5
+Version: 0.1.6
 Requires-Python: >=3.11.0
 Description-Content-Type: text/markdown
 License-File: LICENSE
@@ -199,11 +199,13 @@ server.stop()
 ```
-Converter with automatic server deployment:
+Converter with automatic server management:
 ```python
 from vlmparse.converter_with_server import ConverterWithServer
-converter_with_server = ConverterWithServer(model="mineru2.5")
-documents = converter_with_server.parse(inputs=["file1.pdf", "file2.pdf"], out_folder="./output")
+with ConverterWithServer(model="mineru2.5") as converter_with_server:
+    documents = converter_with_server.parse(inputs=["file1.pdf", "file2.pdf"], out_folder="./output")
 ```
+Note that if you pass an uri of a vllm server to `ConverterWithServer`, the model name is inferred automatically and no server is started.

{vlmparse-0.1.5.dist-info → vlmparse-0.1.6.dist-info}/RECORD RENAMED Viewed

@@ -1,36 +1,36 @@
 vlmparse/base_model.py,sha256=4U4UPe8SNArliKnUf8pp8zQugWYsnhg9okylt7mrW1U,381
 vlmparse/build_doc.py,sha256=LAWrnFrqamN5PwJo57AUtQOPrMFGnCGw4gBjEKZ6pYo,2127
-vlmparse/cli.py,sha256=tQma1IkOsFnqPKqqHVO1PJh18n1w82gp4ewA7oraJkE,15855
+vlmparse/cli.py,sha256=gY45YZe5LanN-ozG2vVtOaB2qyNWpjO2DvPmJeBi_wA,13045
 vlmparse/constants.py,sha256=7-47S01n4MI2ebR09bpdOo3_P16d-z-NVGsm6KJP8ls,110
 vlmparse/converter.py,sha256=F0JSY9sFYUggCvaUCb27kKGJJpnZKW2FStMDVJoIOeQ,7383
-vlmparse/converter_with_server.py,sha256=G393O7vU_lJz6Vz-qYVkrjFhf0Vmpjjl8OjPKQe2blU,3928
-vlmparse/registries.py,sha256=6bEUKTkTjc8C7c1R1ZvAHSF5NCXmAuhNpw0qNnuQ7-A,5818
+vlmparse/converter_with_server.py,sha256=62kcEp0NjzDR2vVmEfCeeLlwbb8E3sWcseb2jjK7DpM,4861
+vlmparse/registries.py,sha256=yBVrrhy61rSoLwdNV-z0C4lqIpTbLoWab3V6u7aSyNM,5797
 vlmparse/utils.py,sha256=rcVrtPiQVj_8HAmFQOu___72uYIapp_X89yxrMNCBow,1236
-vlmparse/clients/chandra.py,sha256=zfu-A6Slh-fIAyrtrlVoCb6QHLBimnimefap_K9YwYw,9775
-vlmparse/clients/deepseekocr.py,sha256=rQvaOaPPoDiZ0MzXqfqqH9BgUBfjmlfHu3NlMjSDgiQ,6501
+vlmparse/clients/chandra.py,sha256=EulsCZdwOtm0pQ6CDm320U96k8aWFN4wKqCm1Xo7VCE,9775
+vlmparse/clients/deepseekocr.py,sha256=Uw6tPvP2KVsPDlz1ZUgYdbgQSjmFPuYeFDrGMMOTBAo,6501
 vlmparse/clients/docling.py,sha256=SAkLsqseuWfkuiel8FWR1G0Z5s-SZU3dE2JbsOvF4SA,5328
-vlmparse/clients/dotsocr.py,sha256=w2T-xkhlw1AfT-CUYoF0ectr2jDYHe9239B24XKB1UQ,10139
+vlmparse/clients/dotsocr.py,sha256=uGJoYEiDkP3-rmfdkAnMeAX-T4RZyEPoh6jmow5_-J8,10336
 vlmparse/clients/granite_docling.py,sha256=EQpsv5qSJG0HtMSacmJStER2sq4TGf1EMU5_NmJsl4g,4634
-vlmparse/clients/hunyuanocr.py,sha256=Xw0Q1l-3pQzaEgFngnfM8vrSWpnT3I99QvDaGZ8XooM,1712
+vlmparse/clients/hunyuanocr.py,sha256=UFqaS4b8UM9EtizyrZIxlqcYlESmxm8xrQZP7lL6tkE,1857
 vlmparse/clients/lightonocr.py,sha256=wx1Im8Z3wlRWwYbPqnSd3LqTtdAU8CnX5mzu1BuCUY8,1314
-vlmparse/clients/mineru.py,sha256=bilDPcUoLk2rcFVqMk4q2Hx2txilc3GDUbjAEoMM_BI,3671
+vlmparse/clients/mineru.py,sha256=6jZ1sKn2kGwUvD8gVs4PqEDH7uUXYK8pAB5Fr1JeqnY,3617
 vlmparse/clients/nanonetocr.py,sha256=BT5vaeerCsK5agvOaHK3NvLUqWd1FfDmrMmDYbp646I,1543
-vlmparse/clients/olmocr.py,sha256=mQEDpfyLY8a80Zlps5mG0QaWytIgnNQZVEVWKWjPIjk,1849
-vlmparse/clients/openai_converter.py,sha256=j2H0iAQTADRRpu1Zy1b-1OFfWyXuqCvrQKy2UcwggTA,5696
-vlmparse/clients/paddleocrvl.py,sha256=tmaqg3boV4edywiiiNiNiI3dBHi111wz4dFb52OISXw,1376
+vlmparse/clients/olmocr.py,sha256=A4Vl0meYpU5QPTML_OxyyRM07xCxtfrMZedgGMYEcuU,1851
+vlmparse/clients/openai_converter.py,sha256=nMKJeWH43UxHMMLns3wjX0pYjU5Xnai6IYxFmS9I63s,6193
+vlmparse/clients/paddleocrvl.py,sha256=qFBDj_UQocyq3WCh24tUOx9Ud7S9DfSm-1n3ztikY2s,1402
 vlmparse/clients/prompts.py,sha256=-J60lqxgRzlkQ9VsQLxmWsIMaDt-gNqWqWoqHIw9CLc,4228
 vlmparse/clients/pipe_utils/cleaner.py,sha256=oxBkBTOkluN1lmeNbzajRIe0_D__ZGwUOBaI_Ph0uxE,2396
 vlmparse/clients/pipe_utils/html_to_md_conversion.py,sha256=cFFqzD2jCNw_968_eu3Wt--Ox7iJj2Rn5UoP_DZWosU,4112
 vlmparse/clients/pipe_utils/utils.py,sha256=935ecIO446I0pstszE_1nrIPHn1Ffrxunq7fVd0dsd8,315
 vlmparse/data_model/box.py,sha256=lJsh4qhjgYXZF5vTSJ1qMXD5GVlBi2_SBedBMlfJikU,16868
-vlmparse/data_model/document.py,sha256=pdCZvWzRFkez53ZJpNaB4ezUW-OVUlbR3_SBmmgVzGQ,4217
-vlmparse/servers/docker_server.py,sha256=qOoZcWSHrK7kK7tAL61RJSW-Jmee93It2SEfWG3jGrc,6633
+vlmparse/data_model/document.py,sha256=xheaMeStOj2c9GZKmdtxcEl_Dj44V5JyVp6JnTrSpH0,4615
+vlmparse/servers/docker_server.py,sha256=FBW2TvtUHUQNwj0rBP92shvoiJCGlc_oAKQBXN8260E,7114
 vlmparse/servers/utils.py,sha256=qy2-rnQTCQKt6CeTV5H74tvRTXyzBV2KswQiYW8Tf-k,8908
 vlmparse/st_viewer/fs_nav.py,sha256=7GNH68h2Loh5pQ64Pe72-D2cs2BLhqRXevEmKdFmPX0,1616
 vlmparse/st_viewer/st_viewer.py,sha256=m2rQTtk5rlwErNmivNAg-4rkHkvNkvLhoJZxFQi7Dwk,2105
-vlmparse-0.1.5.dist-info/licenses/LICENSE,sha256=3TKJHk8hPBR5dbLWZ3IpfCftl-_m-iyBwpYQGZYxj14,1080
-vlmparse-0.1.5.dist-info/METADATA,sha256=LN4W1cvXJvL22hwLAgeSwd3PGTmlrt6lgqNi-tL9pes,5446
-vlmparse-0.1.5.dist-info/WHEEL,sha256=_zCd3N1l69ArxyTb8rzEoP9TpbYXkqRFSNOD5OuxnTs,91
-vlmparse-0.1.5.dist-info/entry_points.txt,sha256=gD5berP6HwE2wNIkls-Lw5goiceA8uMgPEd7ifnFJXs,47
-vlmparse-0.1.5.dist-info/top_level.txt,sha256=k4ni-GNH_iAX7liQEsk_KY_c3xgZgt8k9fsSs9IXLXs,9
-vlmparse-0.1.5.dist-info/RECORD,,
+vlmparse-0.1.6.dist-info/licenses/LICENSE,sha256=3TKJHk8hPBR5dbLWZ3IpfCftl-_m-iyBwpYQGZYxj14,1080
+vlmparse-0.1.6.dist-info/METADATA,sha256=Xad3SjAYvCzUvPo6A6GKvc3daxtf5XNs1AQjDlF7RmI,5597
+vlmparse-0.1.6.dist-info/WHEEL,sha256=_zCd3N1l69ArxyTb8rzEoP9TpbYXkqRFSNOD5OuxnTs,91
+vlmparse-0.1.6.dist-info/entry_points.txt,sha256=gD5berP6HwE2wNIkls-Lw5goiceA8uMgPEd7ifnFJXs,47
+vlmparse-0.1.6.dist-info/top_level.txt,sha256=k4ni-GNH_iAX7liQEsk_KY_c3xgZgt8k9fsSs9IXLXs,9
+vlmparse-0.1.6.dist-info/RECORD,,

{vlmparse-0.1.5.dist-info → vlmparse-0.1.6.dist-info}/WHEEL RENAMED Viewed

File without changes

{vlmparse-0.1.5.dist-info → vlmparse-0.1.6.dist-info}/entry_points.txt RENAMED Viewed

File without changes

{vlmparse-0.1.5.dist-info → vlmparse-0.1.6.dist-info}/licenses/LICENSE RENAMED Viewed

File without changes

{vlmparse-0.1.5.dist-info → vlmparse-0.1.6.dist-info}/top_level.txt RENAMED Viewed

File without changes

vlmparse 0.1.5__py3-none-any.whl → 0.1.6__py3-none-any.whl

vlmparse 0.1.5py3-none-any.whl → 0.1.6py3-none-any.whl