PyPI - hamtaa-texttools - Versions diffs - 0.1.44__tar.gz → 0.1.45__tar.gz - Mend

hamtaa-texttools 0.1.44tar.gz → 0.1.45tar.gz

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Potentially problematic release.

This version of hamtaa-texttools might be problematic. Click here for more details.

Files changed (69) hide show

{hamtaa_texttools-0.1.44 → hamtaa_texttools-0.1.45}/PKG-INFO RENAMED Viewed

@@ -1,12 +1,12 @@
 Metadata-Version: 2.4
 Name: hamtaa-texttools
-Version: 0.1.44
+Version: 0.1.45
 Summary: A set of high-level NLP tools
 Author: Tohidi, Montazer, Givechi, Mousavinezhad
 Requires-Python: >=3.8
 Description-Content-Type: text/markdown
-Requires-Dist: openai>=1.97.0
-Requires-Dist: numpy>=1.26.4
+Requires-Dist: openai==1.97.1
+Requires-Dist: numpy==1.26.4
 # Text Tools

{hamtaa_texttools-0.1.44 → hamtaa_texttools-0.1.45}/hamtaa_texttools.egg-info/PKG-INFO RENAMED Viewed

@@ -1,12 +1,12 @@
 Metadata-Version: 2.4
 Name: hamtaa-texttools
-Version: 0.1.44
+Version: 0.1.45
 Summary: A set of high-level NLP tools
 Author: Tohidi, Montazer, Givechi, Mousavinezhad
 Requires-Python: >=3.8
 Description-Content-Type: text/markdown
-Requires-Dist: openai>=1.97.0
-Requires-Dist: numpy>=1.26.4
+Requires-Dist: openai==1.97.1
+Requires-Dist: numpy==1.26.4
 # Text Tools

{hamtaa_texttools-0.1.44 → hamtaa_texttools-0.1.45}/hamtaa_texttools.egg-info/SOURCES.txt RENAMED Viewed

@@ -20,9 +20,6 @@ texttools/base/base_router.py
 texttools/base/base_summarizer.py
 texttools/base/base_task_performer.py
 texttools/base/base_translator.py
-texttools/batch_manager/__init__.py
-texttools/batch_manager/batch_manager.py
-texttools/batch_manager/batch_runner.py
 texttools/formatter/__init__.py
 texttools/formatter/base.py
 texttools/formatter/gemma3_formatter.py
@@ -62,4 +59,8 @@ texttools/tools/summarizer/__init__.py
 texttools/tools/summarizer/gemma_summarizer.py
 texttools/tools/summarizer/llm_summerizer.py
 texttools/tools/translator/__init__.py
-texttools/tools/translator/gemma_translator.py
+texttools/tools/translator/gemma_translator.py
+texttools/utils/flex_processor.py
+texttools/utils/batch_manager/__init__.py
+texttools/utils/batch_manager/batch_manager.py
+texttools/utils/batch_manager/batch_runner.py

hamtaa_texttools-0.1.45/hamtaa_texttools.egg-info/requires.txt ADDED Viewed

	@@ -0,0 +1,2 @@
1	+ openai==1.97.1
2	+ numpy==1.26.4

{hamtaa_texttools-0.1.44 → hamtaa_texttools-0.1.45}/pyproject.toml RENAMED Viewed

@@ -4,7 +4,7 @@ build-backend = "setuptools.build_meta"
 [project]
 name = "hamtaa-texttools"
-version = "0.1.44"
+version = "0.1.45"
 description = "A set of high-level NLP tools"
 readme = "README.md"
 requires-python = ">=3.8"
@@ -15,8 +15,8 @@ authors = [
   { name = "Mousavinezhad" }
 ]
 dependencies = [
-  "openai>=1.97.0",
-  "numpy>=1.26.4",
+  "openai==1.97.1",
+  "numpy==1.26.4",
 ]
 [tool.setuptools.packages.find]

{hamtaa_texttools-0.1.44 → hamtaa_texttools-0.1.45}/texttools/__init__.py RENAMED Viewed

@@ -1,4 +1,4 @@
-from texttools.batch_manager import BatchJobRunner, SimpleBatchManager
+from texttools.utils.batch_manager import BatchJobRunner, SimpleBatchManager
 from texttools.handlers import (
     NoOpResultHandler,
     PrintResultHandler,

{hamtaa_texttools-0.1.44 → hamtaa_texttools-0.1.45}/texttools/tools/translator/gemma_translator.py RENAMED Viewed

@@ -1,5 +1,3 @@
-import json
-import re
 from typing import Any, Optional
 from openai import OpenAI
@@ -35,7 +33,7 @@ class GemmaTranslator(BaseTranslator):
         **client_kwargs: Any,
     ):
         super().__init__(handlers)
-        self.client = client
+        self.client: OpenAI = client
         self.model = model
         self.temperature = temperature
         self.client_kwargs = client_kwargs
@@ -134,27 +132,16 @@ class GemmaTranslator(BaseTranslator):
         messages.append({"role": "user", "content": text_prompt})
         restructured = self.chat_formatter.format(messages=messages)
-        completion = self.client.chat.completions.create(
+        completion = self.client.chat.completions.parse(
             model=self.model,
             messages=restructured,
-            response_format={
-                "type": "json_schema",
-                "json_schema": {
-                    "name": "NER",
-                    "schema": PreprocessorOutput.model_json_schema(),
-                },
-            },
+            response_format=PreprocessorOutput,
             temperature=self.temperature,
-            **self.client_kwargs,
+            extra_body=dict(guided_decoding_backend="auto") ** self.client_kwargs,
         )
-        response = completion.choices[0].message.content
-        # Remove Markdown-style triple backticks and any optional language tag like "json"
-        if response.startswith("```"):
-            response = re.sub(r"^```(?:json)?\s*|```$", "", response.strip())
-        entities = json.loads(response)
+        message = completion.choices[0].message
+        entities = message.parsed
         return entities
     def translate(
@@ -189,7 +176,7 @@ class GemmaTranslator(BaseTranslator):
             temperature=self.temperature,
             **self.client_kwargs,
         )
-        response = completion.choices[0].message.content.strip()
+        response = completion.choices[0].message.content
         self._dispatch(
             {

hamtaa_texttools-0.1.45/texttools/utils/flex_processor.py ADDED Viewed

@@ -0,0 +1,78 @@
+import random
+import asyncio
+from openai import OpenAI, RateLimitError, APIError
+from typing import Optional
+from pydantic import BaseModel, ValidationError
+import httpx
+# http_client = httpx()
+# test_client = OpenAI(http_client=http_client)
+async def flex_processing(
+        LLM_client: OpenAI,
+        system_prompt: str,
+        user_prompt: str,
+        output_model: Optional[BaseModel]=None,
+        prompt_cache_key: Optional[str]=None,
+        max_retries: int = 10,
+        base_delay: float = 2.0,
+        model_name: Optional[str] ="gpt-5-mini",
+        **client_kwargs):
+    """
+    Wrapper for flex processing with retry and exponential backoff.
+    Handles 429 'Resource Unavailable' errors gracefully.
+    """
+    for attempt in range(max_retries):
+        try:
+            request_kwargs = {
+                    "model": model_name,
+                    "messages": [
+                        {"role": "system", "content": system_prompt},
+                        {"role": "user", "content": user_prompt},
+                    ],
+                    "service_tier": "flex",
+                    "timeout": 900.0,
+                    **client_kwargs
+                }
+            if output_model:
+                request_kwargs["response_format"] = output_model
+            if prompt_cache_key:
+                request_kwargs["prompt_cache_key"] = prompt_cache_key
+            response = LLM_client.chat.completions.parse(**request_kwargs)
+            # response = self.client.chat.completions.parse(output_model)
+            content = response.choices[0].message.content
+                # ✅ Validate structured output if a model is provided
+            if output_model is not None:
+                try:
+                    output_model.model_validate_json(content)
+                    base_content = response.choices[0].message.parsed
+                    # base_content = output_model(**content)
+                    return base_content
+                except ValidationError as ve:
+                    # Treat invalid output as retryable
+                    wait_time = base_delay * (2 ** attempt) + random.uniform(0, 1)
+                    print(
+                        f"[Flex Retry] Attempt {attempt+1}/{max_retries} produced invalid structured output. "
+                        f"Retrying in {wait_time:.2f}s... (ValidationError: {ve})"
+                    )
+                    await asyncio.sleep(wait_time)
+                    continue
+        except (RateLimitError, APIError) as e:
+            wait_time = base_delay * (2 ** attempt) + random.uniform(0, 1)
+            print(
+                f"[Flex Retry] Attempt {attempt+1}/{max_retries} failed "
+                f"with error: {type(e).__name__} - {e}. "
+                f"Retrying in {wait_time:.2f}s..."
+            )
+            await asyncio.sleep(wait_time)
+        except Exception as e:
+            # Non-recoverable error: break out immediately
+            raise RuntimeError(
+                f"[Flex Processing] Unrecoverable error for prompt_key={prompt_cache_key}: {e}"
+            )
+    raise RuntimeError(
+        f"[Flex Processing] Exhausted {max_retries} retries for prompt_key={prompt_cache_key}"
+    )