PyPI - langchain-ocr-lib - Versions diffs - 0.3.0__py3-none-any.whl → 0.3.2__py3-none-any.whl - Mend

langchain-ocr-lib 0.3.0py3-none-any.whl → 0.3.2py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (10) hide show

langchain_ocr_lib/di_config.py CHANGED Viewed

@@ -14,6 +14,7 @@ from langchain_ocr_lib.di_binding_keys.binding_keys import (
 from langchain_ollama import ChatOllama
 from langchain_openai import ChatOpenAI
 from langfuse import Langfuse
+from functools import partial
 from langchain_ocr_lib.impl.chains.ocr_chain import OcrChain
 from langchain_ocr_lib.impl.settings.ollama_chat_settings import OllamaSettings
@@ -50,16 +51,17 @@ def lib_di_config(binder: Binder):
     if llm_class_type_settings.llm_type == "ollama":
         settings = OllamaSettings()
-        llm_instance = llm_provider(settings, ChatOllama)
+        partial_llm_provider = partial(llm_provider,settings, ChatOllama)
     elif llm_class_type_settings.llm_type == "openai":
         settings = OpenAISettings()
-        llm_instance = llm_provider(settings, ChatOpenAI)
+        partial_llm_provider = partial(llm_provider,settings, ChatOpenAI)
     elif llm_class_type_settings.llm_type == "vllm":
         settings = VllmSettings()
-        llm_instance = llm_provider(settings, ChatOpenAI)
+        partial_llm_provider = partial(llm_provider,settings, ChatOpenAI)
     else:
         raise NotImplementedError("Configured LLM is not implemented")
-    binder.bind(LargeLanguageModelKey, llm_instance)
+    binder.bind_to_provider(LargeLanguageModelKey, partial_llm_provider)
     prompt = ocr_prompt_template_builder(language=language_settings.language, model_name=settings.model)
@@ -78,17 +80,19 @@ def lib_di_config(binder: Binder):
             managed_prompts={
                 OcrChain.__name__: prompt,
             },
+            enabled=langfuse_settings.enabled,
         ),
     )
-    binder.bind(OcrChainKey, OcrChain())
+    binder.bind(OcrChainKey if langfuse_settings.enabled else LangfuseTracedChainKey, OcrChain())
-    binder.bind(
-        LangfuseTracedChainKey,
-        LangfuseTracedChain(
-            settings=langfuse_settings,
-        ),
-    )
+    if langfuse_settings.enabled:
+        binder.bind(
+            LangfuseTracedChainKey,
+            LangfuseTracedChain(
+                settings=langfuse_settings,
+            ),
+        )
     binder.bind(PdfConverterKey, Pdf2MarkdownConverter())
     binder.bind(ImageConverterKey, Image2MarkdownConverter())

langchain_ocr_lib/impl/langfuse_manager/langfuse_manager.py CHANGED Viewed

@@ -32,22 +32,10 @@ class LangfuseManager:
     def __init__(
         self,
         managed_prompts: dict[str, str],
+        enabled: bool = True,
     ):
         self._managed_prompts = managed_prompts
-    def init_prompts(self) -> None:
-        """
-        Initialize the prompts managed by the LangfuseManager.
-        This method iterates over the keys of the managed prompts and retrieves
-        each prompt using the `get_langfuse_prompt` method.
-        Returns
-        -------
-        None
-        """
-        for key in list(self._managed_prompts.keys()):
-            self.get_langfuse_prompt(key)
+        self._enabled = enabled
     def get_langfuse_prompt(self, base_prompt_name: str) -> Optional[ChatPromptClient]:
         """
@@ -70,6 +58,9 @@ class LangfuseManager:
         Exception
             If an error occurs while retrieving the prompt template from Langfuse.
         """
+        if not self._enabled:
+            logger.info("Langfuse is not enabled. Using fallback prompt.")
+            return None
         try:
             langfuse_prompt = self._langfuse.get_prompt(base_prompt_name)
         except NotFoundError:
@@ -86,11 +77,7 @@ class LangfuseManager:
             )
             langfuse_prompt = self._langfuse.get_prompt(base_prompt_name)
         except Exception as error:
-            logger.error(
-                "Error occured while getting prompt template from langfuse. Error:\n{error}",
-                extra={error: error},
-            )
-            return None
+            logger.error(f"Error occurred while getting prompt template from langfuse. Error:\n{error}")
         return langfuse_prompt
     def get_base_llm(self, name: str) -> LLM:
@@ -108,9 +95,12 @@ class LangfuseManager:
             The base Large Language Model. If the Langfuse prompt is not found,
             returns the LLM with a fallback configuration.
         """
+        if not self._enabled:
+            logger.info("Langfuse is not enabled. Using fallback LLM.")
+            return self._llm
         langfuse_prompt = self.get_langfuse_prompt(name)
         if not langfuse_prompt:
-            logger.error("Using fallback for llm")
+            logger.warning("Could not retrieve prompt template from langfuse. Using fallback LLM.")
             return self._llm
         return self._llm.with_config({"configurable": langfuse_prompt.config})
@@ -135,7 +125,8 @@ class LangfuseManager:
         """
         langfuse_prompt = self.get_langfuse_prompt(name)
         if not langfuse_prompt:
-            logger.error("Could not retrieve prompt template from langfuse. Using fallback value.")
+            if self._enabled:
+                logger.warning("Could not retrieve prompt template from langfuse. Using fallback value.")
             fallback = self._managed_prompts[name]
             if isinstance(fallback, ChatPromptTemplate):
                 return fallback

langchain_ocr_lib/impl/settings/langfuse_settings.py CHANGED Viewed

@@ -27,3 +27,7 @@ class LangfuseSettings(BaseSettings):
     secret_key: str = Field(default="", description="The secret key for Langfuse.")
     public_key: str = Field(default="", description="The public key for Langfuse.")
     host: str = Field(default="https://api.langchain.com", description="The host for Langfuse.")
+    enabled: bool = Field(
+        default=True,
+        description="Whether to enable Langfuse. If set to False, Langfuse will not be used.",
+    )

langchain_ocr_lib/impl/settings/ollama_chat_settings.py CHANGED Viewed

@@ -35,7 +35,7 @@ class OllamaSettings(BaseSettings):
         env_prefix = "OLLAMA_"
         case_sensitive = False
-    model: str = Field(default="gemma3:4b-it-q4_K_M")
+    model: str = Field(default="gemma3:4b-it-q4_K_M", title="LLM Model")
     base_url: str = Field(default="http://localhost:11434")
     top_k: int = Field(default=0, title="LLM Top K")
     top_p: float = Field(default=0, title="LLM Top P")

langchain_ocr_lib/impl/settings/openai_chat_settings.py CHANGED Viewed

@@ -28,10 +28,10 @@ class OpenAISettings(BaseSettings):
         env_prefix = "OPENAI_"
         case_sensitive = False
-    model: str = Field(default="gpt-4o-mini-search-preview-2025-03-11", description="The model identifier")
+    model: str = Field(default="gpt-4o-mini-search-preview-2025-03-11", description="The model identifier", title="LLM Model")
     api_key: str = Field(default="", description="The API key for authentication")
-    top_p: float = Field(default=1.0, description="Total probability mass of tokens to consider at each step")
-    temperature: float = Field(default=0, description="What sampling temperature to use")
+    top_p: float = Field(default=1.0, description="Total probability mass of tokens to consider at each step", title="Top P")
+    temperature: float = Field(default=0, description="What sampling temperature to use", title="Temperature")
     base_url: str = Field(
         default="https://api.openai.com/v1",
         description="The base URL for the OpenAI API endpoint",

langchain_ocr_lib/impl/settings/vllm_chat_settings.py CHANGED Viewed

@@ -28,10 +28,10 @@ class VllmSettings(BaseSettings):
         env_prefix = "VLLM_"
         case_sensitive = False
-    model: str = Field(default="", description="The model identifier")
+    model: str = Field(default="", description="The model identifier", title="LLM Model")
     api_key: str = Field(default="", description="The API key for authentication")
-    top_p: float = Field(default=1.0, description="Total probability mass of tokens to consider at each step")
-    temperature: float = Field(default=0, description="What sampling temperature to use")
+    top_p: float = Field(default=1.0, description="Total probability mass of tokens to consider at each step", title="Top P")
+    temperature: float = Field(default=0, description="What sampling temperature to use", title="Temperature")
     base_url: str = Field(
         default="http://localhost:8000/v1",
         description="The base URL for the Vllm API endpoint",

{langchain_ocr_lib-0.3.0.dist-info → langchain_ocr_lib-0.3.2.dist-info}/METADATA RENAMED Viewed

@@ -1,7 +1,7 @@
-Metadata-Version: 2.1
+Metadata-Version: 2.3
 Name: langchain-ocr-lib
-Version: 0.3.0
-Summary:
+Version: 0.3.2
+Summary: Modular, vision-LLM-powered chain to convert image and PDF documents into clean Markdown.
 License: MIT
 Author: Andreas Klos
 Author-email: aklos@outlook.de
@@ -25,9 +25,13 @@ Requires-Dist: pytest-asyncio (>=0.25.0,<0.26.0)
 Requires-Dist: pyyaml (>=6.0.2,<7.0.0)
 Description-Content-Type: text/markdown
-# langchain_ocr_lib
+# langchain-ocr-lib
-**langchain_ocr_lib** is the OCR processing engine behind LangChain-OCR. It provides a modular, vision-LLM-powered Chain to convert image and PDF documents into clean Markdown. Designed for direct CLI usage or integration into larger applications.
+**langchain-ocr-lib** is the OCR processing engine behind LangChain-OCR. It provides a modular, vision-LLM-powered Chain to convert image and PDF documents into clean Markdown. Designed for direct CLI usage or integration into larger applications.
+<div align="center">
+  <img src="./images/logo.png" alt="Logo" style="width:30%;">
+</div>
 ## Table of Contents
@@ -137,7 +141,7 @@ class Converter:
         return self._converter.convert2markdown(filename=filename)
 converter = Converter()
-markdown = converter.convert("../docs/invoice.pdf") # Adjust the file path as needed
+markdown = converter.convert("../examples/invoice.pdf") # Adjust the file path as needed
 print(markdown)
 ```
@@ -174,7 +178,7 @@ class Converter:
         self._converter.convert(filename=filename)
 converter = Converter()
-converter.convert("../docs/invoice.pdf") # Adjust the file path as needed
+converter.convert("../examples/invoice.pdf") # Adjust the file path as needed
 ```
 ### 4.3 Docker
@@ -183,6 +187,6 @@ Run OCR via Docker without local Python setup:
 ```bash
 docker build -t ocr -f langchain_ocr_lib/Dockerfile .
-docker run --net=host -it --rm -v ./docs:/app/docs:ro ocr docs/invoice.png
+docker run --net=host -it --rm -v ./examples:/app/examples:ro ocr examples/invoice.png
 ```

{langchain_ocr_lib-0.3.0.dist-info → langchain_ocr_lib-0.3.2.dist-info}/RECORD RENAMED Viewed

@@ -5,7 +5,7 @@ langchain_ocr_lib/converter/__init__.py,sha256=47DEQpj8HBSa-_TImW-5JCeuQeRkm5NMp
 langchain_ocr_lib/converter/converter.py,sha256=oDUNzVWD743RgqIal7T4OVv-Z1RKE9uQYzAIPpgY3o8,1280
 langchain_ocr_lib/di_binding_keys/__init__.py,sha256=47DEQpj8HBSa-_TImW-5JCeuQeRkm5NMpJWZG3hSuFU,0
 langchain_ocr_lib/di_binding_keys/binding_keys.py,sha256=jE8rwNcLaI0NflIMkK0vu0LVy5o4y0pYgdjbpDNTGyk,338
-langchain_ocr_lib/di_config.py,sha256=eYzDi_LJaYY_JhRnNqW3VYGd3N1QblaGFjWlL_6Vx9c,3537
+langchain_ocr_lib/di_config.py,sha256=LvRnptts1VCDa3HVP7jtBtQTyG-QEErbyplGX86uaUA,3802
 langchain_ocr_lib/impl/__init__.py,sha256=47DEQpj8HBSa-_TImW-5JCeuQeRkm5NMpJWZG3hSuFU,0
 langchain_ocr_lib/impl/chains/__init__.py,sha256=47DEQpj8HBSa-_TImW-5JCeuQeRkm5NMpJWZG3hSuFU,0
 langchain_ocr_lib/impl/chains/ocr_chain.py,sha256=stE8RLE1ieRHf6XHreKCRfhNfXzw9fNLTake7xQBGL8,2673
@@ -13,17 +13,17 @@ langchain_ocr_lib/impl/converter/__init__.py,sha256=47DEQpj8HBSa-_TImW-5JCeuQeRk
 langchain_ocr_lib/impl/converter/image_converter.py,sha256=G1rDOCbudWNL4sDvSGJ7CeeFrWUblfWPGaZf5JsnpiM,2871
 langchain_ocr_lib/impl/converter/pdf_converter.py,sha256=pTHPojuNLCSWJp4FzXBHshXva2sBGyOs6Y7jnKJrnNo,3760
 langchain_ocr_lib/impl/langfuse_manager/__init__.py,sha256=47DEQpj8HBSa-_TImW-5JCeuQeRkm5NMpJWZG3hSuFU,0
-langchain_ocr_lib/impl/langfuse_manager/langfuse_manager.py,sha256=AEF1iFYghr-62gcPcUb4Yi3DNRYfe-JsIWd3ymsIU8I,5403
+langchain_ocr_lib/impl/langfuse_manager/langfuse_manager.py,sha256=C2waQ1Mvqz6bECXAcaMiBsE8TLc2kLr5QUIgXqgH_cE,5311
 langchain_ocr_lib/impl/llms/__init__.py,sha256=47DEQpj8HBSa-_TImW-5JCeuQeRkm5NMpJWZG3hSuFU,0
 langchain_ocr_lib/impl/llms/llm_factory.py,sha256=9DsUdoYNrjeWLGA9ISDdHN2cxcQ7DquNQ5it6zSxHlg,2199
 langchain_ocr_lib/impl/llms/llm_type.py,sha256=_LKtdVuTRYX6gupkxJtEtIwrbtiMvZmG8WOxfzlm42M,286
 langchain_ocr_lib/impl/settings/__init__.py,sha256=47DEQpj8HBSa-_TImW-5JCeuQeRkm5NMpJWZG3hSuFU,0
-langchain_ocr_lib/impl/settings/langfuse_settings.py,sha256=5lr3tVeiHXDUaYtWAnZPXrKxBJgM2wgaz7yyZThhCsE,812
+langchain_ocr_lib/impl/settings/langfuse_settings.py,sha256=QT4_VwYj0msFbgL3qIQ-oer3Lt0qny0FFAyfssGu-q0,962
 langchain_ocr_lib/impl/settings/language_settings.py,sha256=tdAC1t5wGu1MoH1jhjkDnxnX4Ui7giwxt7Qm8_LPkP8,627
 langchain_ocr_lib/impl/settings/llm_class_type_settings.py,sha256=4KC6zxby13wn38rB8055J8LNVTsmUfrOiyLtLuToHaM,598
-langchain_ocr_lib/impl/settings/ollama_chat_settings.py,sha256=8RWMsaK4qDrqC6Mrxekr8IEDYwcvjYwhw9xDwZemxI4,1506
-langchain_ocr_lib/impl/settings/openai_chat_settings.py,sha256=gZqmFYDtF0l5lEAnuT2VzdqLWKnTPSK_lTeg7ERmJas,1276
-langchain_ocr_lib/impl/settings/vllm_chat_settings.py,sha256=y8PPNUcce1uA4kEu6p0p5vCwCOGp9uEEvHbCoS1Ohh8,1226
+langchain_ocr_lib/impl/settings/ollama_chat_settings.py,sha256=YQkgD7CfOjHN5wkpJakO0GfM7-D2GqoJLP1gB2932ms,1525
+langchain_ocr_lib/impl/settings/openai_chat_settings.py,sha256=NqVfkcI8OoD8TVxyv4l0G9ycUC6LIs6Qs4kQRL24doA,1331
+langchain_ocr_lib/impl/settings/vllm_chat_settings.py,sha256=Zr4L6Urp-f1JZu7Q1dwL6671EQbrIIYL0ubJSQlod3c,1281
 langchain_ocr_lib/impl/tracers/__init__.py,sha256=47DEQpj8HBSa-_TImW-5JCeuQeRkm5NMpJWZG3hSuFU,0
 langchain_ocr_lib/impl/tracers/langfuse_traced_chain.py,sha256=syjwNt8HfVmaWXZ-ElFYsc-KwpnKQz2LE3K5jV7c3GE,1599
 langchain_ocr_lib/language_mapping/language_mapping.py,sha256=VY7WkkZauoHNxkvgUYbig0rDmlKqDkz24cXMd6A7txM,700
@@ -32,7 +32,7 @@ langchain_ocr_lib/prompt_templates/__init__.py,sha256=47DEQpj8HBSa-_TImW-5JCeuQe
 langchain_ocr_lib/prompt_templates/ocr_prompt.py,sha256=3Be1AL-HJkxPnAP0DNH1MqvAxFWTCeM5UOKP63xkHsY,3543
 langchain_ocr_lib/tracers/__init__.py,sha256=47DEQpj8HBSa-_TImW-5JCeuQeRkm5NMpJWZG3hSuFU,0
 langchain_ocr_lib/tracers/traced_chain.py,sha256=uxRkdLNn_G6dAsti_gUuF7muhIj10xrOUL7HUga40oc,3056
-langchain_ocr_lib-0.3.0.dist-info/METADATA,sha256=IaqIz9OXgu5WQXwEVpLmMNLmz2w3IowWmdZ7kt5O6VM,6240
-langchain_ocr_lib-0.3.0.dist-info/WHEEL,sha256=Nq82e9rUAnEjt98J6MlVmMCZb-t9cYE2Ir1kpBmnWfs,88
-langchain_ocr_lib-0.3.0.dist-info/entry_points.txt,sha256=l4mIs0tnIgbJYuVveZySQKVBnqNMHS-8ZZtLwz8ag5k,61
-langchain_ocr_lib-0.3.0.dist-info/RECORD,,
+langchain_ocr_lib-0.3.2.dist-info/METADATA,sha256=MYG6NqcxYMkVY2UQ0SbSCdNmpSJJ98NUb5KLBSDciyg,6440
+langchain_ocr_lib-0.3.2.dist-info/WHEEL,sha256=fGIA9gx4Qxk2KDKeNJCbOEwSrmLtjWCwzBz351GyrPQ,88
+langchain_ocr_lib-0.3.2.dist-info/entry_points.txt,sha256=l4mIs0tnIgbJYuVveZySQKVBnqNMHS-8ZZtLwz8ag5k,61
+langchain_ocr_lib-0.3.2.dist-info/RECORD,,

{langchain_ocr_lib-0.3.0.dist-info → langchain_ocr_lib-0.3.2.dist-info}/WHEEL RENAMED Viewed

@@ -1,4 +1,4 @@
 Wheel-Version: 1.0
-Generator: poetry-core 1.9.1
+Generator: poetry-core 2.1.2
 Root-Is-Purelib: true
 Tag: py3-none-any

{langchain_ocr_lib-0.3.0.dist-info → langchain_ocr_lib-0.3.2.dist-info}/entry_points.txt RENAMED Viewed

File without changes

langchain-ocr-lib 0.3.0__py3-none-any.whl → 0.3.2__py3-none-any.whl

langchain-ocr-lib 0.3.0py3-none-any.whl → 0.3.2py3-none-any.whl