PyPI - lollms-client - Versions diffs - 1.5.6__py3-none-any.whl → 1.7.13__py3-none-any.whl - Mend

lollms-client 1.5.6py3-none-any.whl → 1.7.13py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (63) hide show

lollms_client/__init__.py +1 -1
lollms_client/llm_bindings/azure_openai/__init__.py +2 -2
lollms_client/llm_bindings/claude/__init__.py +125 -35
lollms_client/llm_bindings/gemini/__init__.py +261 -159
lollms_client/llm_bindings/grok/__init__.py +52 -15
lollms_client/llm_bindings/groq/__init__.py +2 -2
lollms_client/llm_bindings/hugging_face_inference_api/__init__.py +2 -2
lollms_client/llm_bindings/litellm/__init__.py +1 -1
lollms_client/llm_bindings/llama_cpp_server/__init__.py +605 -0
lollms_client/llm_bindings/llamacpp/__init__.py +18 -11
lollms_client/llm_bindings/lollms/__init__.py +76 -21
lollms_client/llm_bindings/lollms_webui/__init__.py +1 -1
lollms_client/llm_bindings/mistral/__init__.py +2 -2
lollms_client/llm_bindings/novita_ai/__init__.py +142 -6
lollms_client/llm_bindings/ollama/__init__.py +345 -89
lollms_client/llm_bindings/open_router/__init__.py +2 -2
lollms_client/llm_bindings/openai/__init__.py +81 -20
lollms_client/llm_bindings/openllm/__init__.py +362 -506
lollms_client/llm_bindings/openwebui/__init__.py +333 -171
lollms_client/llm_bindings/perplexity/__init__.py +2 -2
lollms_client/llm_bindings/pythonllamacpp/__init__.py +3 -3
lollms_client/llm_bindings/tensor_rt/__init__.py +1 -1
lollms_client/llm_bindings/transformers/__init__.py +428 -632
lollms_client/llm_bindings/vllm/__init__.py +1 -1
lollms_client/lollms_agentic.py +4 -2
lollms_client/lollms_base_binding.py +61 -0
lollms_client/lollms_core.py +512 -1890
lollms_client/lollms_discussion.py +65 -39
lollms_client/lollms_llm_binding.py +126 -261
lollms_client/lollms_mcp_binding.py +49 -77
lollms_client/lollms_stt_binding.py +99 -52
lollms_client/lollms_tti_binding.py +38 -38
lollms_client/lollms_ttm_binding.py +38 -42
lollms_client/lollms_tts_binding.py +43 -18
lollms_client/lollms_ttv_binding.py +38 -42
lollms_client/lollms_types.py +4 -2
lollms_client/stt_bindings/whisper/__init__.py +108 -23
lollms_client/stt_bindings/whispercpp/__init__.py +7 -1
lollms_client/tti_bindings/diffusers/__init__.py +464 -803
lollms_client/tti_bindings/diffusers/server/main.py +1062 -0
lollms_client/tti_bindings/gemini/__init__.py +182 -239
lollms_client/tti_bindings/leonardo_ai/__init__.py +6 -3
lollms_client/tti_bindings/lollms/__init__.py +4 -1
lollms_client/tti_bindings/novita_ai/__init__.py +5 -2
lollms_client/tti_bindings/openai/__init__.py +10 -11
lollms_client/tti_bindings/stability_ai/__init__.py +5 -3
lollms_client/ttm_bindings/audiocraft/__init__.py +7 -12
lollms_client/ttm_bindings/beatoven_ai/__init__.py +7 -3
lollms_client/ttm_bindings/lollms/__init__.py +4 -17
lollms_client/ttm_bindings/replicate/__init__.py +7 -4
lollms_client/ttm_bindings/stability_ai/__init__.py +7 -4
lollms_client/ttm_bindings/topmediai/__init__.py +6 -3
lollms_client/tts_bindings/bark/__init__.py +7 -10
lollms_client/tts_bindings/lollms/__init__.py +6 -1
lollms_client/tts_bindings/piper_tts/__init__.py +8 -11
lollms_client/tts_bindings/xtts/__init__.py +157 -74
lollms_client/tts_bindings/xtts/server/main.py +241 -280
{lollms_client-1.5.6.dist-info → lollms_client-1.7.13.dist-info}/METADATA +113 -5
lollms_client-1.7.13.dist-info/RECORD +90 -0
lollms_client-1.5.6.dist-info/RECORD +0 -87
{lollms_client-1.5.6.dist-info → lollms_client-1.7.13.dist-info}/WHEEL +0 -0
{lollms_client-1.5.6.dist-info → lollms_client-1.7.13.dist-info}/licenses/LICENSE +0 -0
{lollms_client-1.5.6.dist-info → lollms_client-1.7.13.dist-info}/top_level.txt +0 -0

lollms_client/lollms_llm_binding.py CHANGED Viewed

@@ -1,20 +1,15 @@
 # lollms_binding.py
-from abc import ABC, abstractmethod
+from abc import abstractmethod
 import importlib
 from pathlib import Path
-from typing import Optional, Callable, List, Union
-from lollms_client.lollms_types import ELF_COMPLETION_FORMAT
-import importlib
-from pathlib import Path
-from typing import Optional, Dict, List
+from typing import Optional, Callable, List, Union, Dict, Any
 from ascii_colors import trace_exception, ASCIIColors
 from lollms_client.lollms_types import MSG_TYPE
 from lollms_client.lollms_discussion import LollmsDiscussion
 from lollms_client.lollms_utilities import ImageTokenizer
+from lollms_client.lollms_base_binding import LollmsBaseBinding
 import re
 import yaml
-from pathlib import Path
 import json
 def load_known_contexts():
@@ -42,7 +37,7 @@ def load_known_contexts():
         print(f"An unexpected error occurred: {e}")
         return []
-class LollmsLLMBinding(ABC):
+class LollmsLLMBinding(LollmsBaseBinding):
     """Abstract base class for all LOLLMS LLM bindings"""
     def __init__(self,
@@ -55,7 +50,7 @@ class LollmsLLMBinding(ABC):
         Args:
             binding_name (Optional[str]): The name of the bindingto be used
         """
-        self.binding_name=binding_name
+        super().__init__(binding_name=binding_name, **kwargs)
         self.model_name = None #Must be set by the instance
         self.default_ctx_size = kwargs.get("ctx_size")
         self.default_n_predict = kwargs.get("n_predict")
@@ -72,151 +67,92 @@ class LollmsLLMBinding(ABC):
     @abstractmethod
     def generate_text(self,
-                     prompt: str,
-                     images: Optional[List[str]] = None,
-                     system_prompt: str = "",
-                     n_predict: Optional[int] = None,
-                     stream: Optional[bool] = None,
-                     temperature: Optional[float] = None,
-                     top_k: Optional[int] = None,
-                     top_p: Optional[float] = None,
-                     repeat_penalty: Optional[float] = None,
-                     repeat_last_n: Optional[int] = None,
-                     seed: Optional[int] = None,
-                     n_threads: Optional[int] = None,
-                     ctx_size: int | None = None,
-                     streaming_callback: Optional[Callable[[str, MSG_TYPE], None]] = None,
-                     split:Optional[bool]=False, # put to true if the prompt is a discussion
-                     user_keyword:Optional[str]="!@>user:",
-                     ai_keyword:Optional[str]="!@>assistant:",
-                     ) -> Union[str, dict]:
+                    prompt: str,
+                    images: Optional[List[str]] = None,
+                    system_prompt: str = "",
+                    n_predict: Optional[int] = None,
+                    stream: Optional[bool] = None,
+                    temperature: Optional[float] = None,
+                    top_k: Optional[int] = None,
+                    top_p: Optional[float] = None,
+                    repeat_penalty: Optional[float] = None,
+                    repeat_last_n: Optional[int] = None,
+                    seed: Optional[int] = None,
+                    n_threads: Optional[int] = None,
+                    ctx_size: int | None = None,
+                    streaming_callback: Optional[Callable[[str, MSG_TYPE], None]] = None,
+                    split:Optional[bool]=False, # put to true if the prompt is a discussion
+                    user_keyword:Optional[str]="!@>user:",
+                    ai_keyword:Optional[str]="!@>assistant:",
+                    think: Optional[bool] = False,
+                    reasoning_effort: Optional[bool] = "low", # low, medium, high
+                    reasoning_summary: Optional[bool] = "auto", # auto
+                    **kwargs
+                    ) -> Union[str, dict]:
         """
         Generate text using the active LLM binding, using instance defaults if parameters are not provided.
-        Args:
-            prompt (str): The input prompt for text generation.
-            images (Optional[List[str]]): List of image file paths for multimodal generation.
-            n_predict (Optional[int]): Maximum number of tokens to generate. Uses instance default if None.
-            stream (Optional[bool]): Whether to stream the output. Uses instance default if None.
-            temperature (Optional[float]): Sampling temperature. Uses instance default if None.
-            top_k (Optional[int]): Top-k sampling parameter. Uses instance default if None.
-            top_p (Optional[float]): Top-p sampling parameter. Uses instance default if None.
-            repeat_penalty (Optional[float]): Penalty for repeated tokens. Uses instance default if None.
-            repeat_last_n (Optional[int]): Number of previous tokens to consider for repeat penalty. Uses instance default if None.
-            seed (Optional[int]): Random seed for generation. Uses instance default if None.
-            n_threads (Optional[int]): Number of threads to use. Uses instance default if None.
-            ctx_size (int | None): Context size override for this generation.
-            streaming_callback (Optional[Callable[[str, str], None]]): Callback function for streaming output.
-                - First parameter (str): The chunk of text received.
-                - Second parameter (str): The message type (e.g., MSG_TYPE.MSG_TYPE_CHUNK).
-            split:Optional[bool]: put to true if the prompt is a discussion
-            user_keyword:Optional[str]: when splitting we use this to extract user prompt
-            ai_keyword:Optional[str]": when splitting we use this to extract ai prompt
-        Returns:
-            Union[str, dict]: Generated text or error dictionary if failed.
         """
         pass
     def generate_from_messages(self,
-                     messages: List[Dict],
-                     n_predict: Optional[int] = None,
-                     stream: Optional[bool] = None,
-                     temperature: Optional[float] = None,
-                     top_k: Optional[int] = None,
-                     top_p: Optional[float] = None,
-                     repeat_penalty: Optional[float] = None,
-                     repeat_last_n: Optional[int] = None,
-                     seed: Optional[int] = None,
-                     n_threads: Optional[int] = None,
-                     ctx_size: int | None = None,
-                     streaming_callback: Optional[Callable[[str, MSG_TYPE], None]] = None,
-                     **kwargs
-                     ) -> Union[str, dict]:
+                    messages: List[Dict],
+                    n_predict: Optional[int] = None,
+                    stream: Optional[bool] = None,
+                    temperature: Optional[float] = None,
+                    top_k: Optional[int] = None,
+                    top_p: Optional[float] = None,
+                    repeat_penalty: Optional[float] = None,
+                    repeat_last_n: Optional[int] = None,
+                    seed: Optional[int] = None,
+                    n_threads: Optional[int] = None,
+                    ctx_size: int | None = None,
+                    streaming_callback: Optional[Callable[[str, MSG_TYPE], None]] = None,
+                    think: Optional[bool] = False,
+                    reasoning_effort: Optional[bool] = "low", # low, medium, high
+                    reasoning_summary: Optional[bool] = "auto", # auto
+                    **kwargs
+                    ) -> Union[str, dict]:
         """
         Generate text using the active LLM binding, using instance defaults if parameters are not provided.
-        Args:
-            messages (List[Dict]): A openai compatible list of messages
-            n_predict (Optional[int]): Maximum number of tokens to generate. Uses instance default if None.
-            stream (Optional[bool]): Whether to stream the output. Uses instance default if None.
-            temperature (Optional[float]): Sampling temperature. Uses instance default if None.
-            top_k (Optional[int]): Top-k sampling parameter. Uses instance default if None.
-            top_p (Optional[float]): Top-p sampling parameter. Uses instance default if None.
-            repeat_penalty (Optional[float]): Penalty for repeated tokens. Uses instance default if None.
-            repeat_last_n (Optional[int]): Number of previous tokens to consider for repeat penalty. Uses instance default if None.
-            seed (Optional[int]): Random seed for generation. Uses instance default if None.
-            n_threads (Optional[int]): Number of threads to use. Uses instance default if None.
-            ctx_size (int | None): Context size override for this generation.
-            streaming_callback (Optional[Callable[[str, MSG_TYPE], None]]): Callback for streaming output.
-        Returns:
-            Union[str, dict]: Generated text or error dictionary if failed.
         """
         ASCIIColors.red("This binding does not support generate_from_messages")
     @abstractmethod
     def chat(self,
-             discussion: LollmsDiscussion,
-             branch_tip_id: Optional[str] = None,
-             n_predict: Optional[int] = None,
-             stream: Optional[bool] = None,
-             temperature: Optional[float] = None,
-             top_k: Optional[int] = None,
-             top_p: Optional[float] = None,
-             repeat_penalty: Optional[float] = None,
-             repeat_last_n: Optional[int] = None,
-             seed: Optional[int] = None,
-             n_threads: Optional[int] = None,
-             ctx_size: Optional[int] = None,
-             streaming_callback: Optional[Callable[[str, MSG_TYPE], None]] = None
-             ) -> Union[str, dict]:
+            discussion: LollmsDiscussion,
+            branch_tip_id: Optional[str] = None,
+            n_predict: Optional[int] = None,
+            stream: Optional[bool] = None,
+            temperature: Optional[float] = None,
+            top_k: Optional[int] = None,
+            top_p: Optional[float] = None,
+            repeat_penalty: Optional[float] = None,
+            repeat_last_n: Optional[int] = None,
+            seed: Optional[int] = None,
+            n_threads: Optional[int] = None,
+            ctx_size: Optional[int] = None,
+            streaming_callback: Optional[Callable[[str, MSG_TYPE], None]] = None,
+            think: Optional[bool] = False,
+            reasoning_effort: Optional[bool] = "low", # low, medium, high
+            reasoning_summary: Optional[bool] = "auto", # auto
+            **kwargs
+            ) -> Union[str, dict]:
         """
         A method to conduct a chat session with the model using a LollmsDiscussion object.
-        This method is responsible for formatting the discussion into the specific
-        format required by the model's API and then calling the generation endpoint.
-        Args:
-            discussion (LollmsDiscussion): The discussion object containing the conversation history.
-            branch_tip_id (Optional[str]): The ID of the message to use as the tip of the conversation branch. Defaults to the active branch.
-            n_predict (Optional[int]): Maximum number of tokens to generate.
-            stream (Optional[bool]): Whether to stream the output.
-            temperature (Optional[float]): Sampling temperature.
-            top_k (Optional[int]): Top-k sampling parameter.
-            top_p (Optional[float]): Top-p sampling parameter.
-            repeat_penalty (Optional[float]): Penalty for repeated tokens.
-            repeat_last_n (Optional[int]): Number of previous tokens to consider for repeat penalty.
-            seed (Optional[int]): Random seed for generation.
-            n_threads (Optional[int]): Number of threads to use.
-            ctx_size (Optional[int]): Context size override for this generation.
-            streaming_callback (Optional[Callable[[str, MSG_TYPE], None]]): Callback for streaming output.
-        Returns:
-            Union[str, dict]: The generated text or an error dictionary.
         """
         pass
-    def get_ctx_size(self, model_name: Optional[str] = None) -> Optional[int]:
+    def get_ctx_size(self, model_name: Optional[str|None] = None) -> Optional[int]:
         """
         Retrieves context size for a model from a hardcoded list.
-        This method checks if the model name contains a known base model identifier
-        (e.g., 'llama3.1', 'gemma2') to determine its context length. It's intended
-        as a failsafe when the context size cannot be retrieved directly from the
-        Ollama API.
         """
         if model_name is None:
             model_name = self.model_name
-        # Hardcoded context sizes for popular models. More specific names (e.g., 'llama3.1')
-        # should appear, as they will be checked first due to the sorting logic below.
         known_contexts = load_known_contexts()
         normalized_model_name = model_name.lower().strip()
-        # Sort keys by length in descending order. This ensures that a more specific
-        # name like 'llama3.1' is checked before a less specific name like 'llama3'.
         sorted_base_models = sorted(known_contexts.keys(), key=len, reverse=True)
         for base_name in sorted_base_models:
@@ -236,12 +172,6 @@ class LollmsLLMBinding(ABC):
     def tokenize(self, text: str) -> list:
         """
         Tokenize the input text into a list of tokens.
-        Args:
-            text (str): The text to tokenize.
-        Returns:
-            list: List of tokens.
         """
         pass
@@ -249,12 +179,6 @@ class LollmsLLMBinding(ABC):
     def detokenize(self, tokens: list) -> str:
         """
         Convert a list of tokens back to text.
-        Args:
-            tokens (list): List of tokens to detokenize.
-        Returns:
-            str: Detokenized text.
         """
         pass
@@ -262,27 +186,14 @@ class LollmsLLMBinding(ABC):
     def count_tokens(self, text: str) -> int:
         """
         Count tokens from a text.
-        Args:
-            tokens (list): List of tokens to detokenize.
-        Returns:
-            int: Number of tokens in text.
         """
         pass
     def count_image_tokens(self, image: str) -> int:
         """
         Estimate the number of tokens for an image using ImageTokenizer based on self.model_name.
-        Args:
-            image (str): Image to count tokens from. Either base64 string, path to image file, or URL.
-        Returns:
-            int: Estimated number of tokens for the image. Returns -1 on error.
         """
         try:
-            # Delegate token counting to ImageTokenizer
             return ImageTokenizer(self.model_name).count_image_tokens(image)
         except Exception as e:
             ASCIIColors.warning(f"Could not estimate image tokens: {e}")
@@ -291,13 +202,6 @@ class LollmsLLMBinding(ABC):
     def embed(self, text: str, **kwargs) -> list:
         """
         Get embeddings for the input text using Ollama API
-        Args:
-            text (str or List[str]): Input text to embed
-            **kwargs: Additional arguments like model, truncate, options, keep_alive
-        Returns:
-            dict: Response containing embeddings
         """
         pass
@@ -305,28 +209,27 @@ class LollmsLLMBinding(ABC):
     def get_model_info(self) -> dict:
         """
         Return information about the current model.
-        Returns:
-            dict: Model information dictionary.
         """
         pass
-    @abstractmethod
-    def listModels(self) -> list:
-        """Lists models"""
-        pass
+    def get_zoo(self) -> List[Dict[str, Any]]:
+        """
+        Returns a list of models available for download.
+        each entry is a dict with:
+        name, description, size, type, link
+        """
+        return []
+    def download_from_zoo(self, index: int, progress_callback: Callable[[dict], None] = None) -> dict:
+        """
+        Downloads a model from the zoo using its index.
+        """
+        return {"status": False, "message": "Not implemented"}
     @abstractmethod
     def load_model(self, model_name: str) -> bool:
         """
         Load a specific model.
-        Args:
-            model_name (str): Name of the model to load.
-        Returns:
-            bool: True if model loaded successfully, False otherwise.
         """
         pass
@@ -334,9 +237,7 @@ class LollmsLLMBinding(ABC):
     def split_discussion(self, lollms_prompt_string: str, system_keyword="!@>system:", user_keyword="!@>user:", ai_keyword="!@>assistant:") -> list:
         """
         Splits a LoLLMs prompt into a list of OpenAI-style messages.
-        If the very first chunk has no prefix, it's assigned to "system".
         """
-        # Regex to split on any of the three prefixes (lookahead)
         pattern = r"(?={}|{}|{})".format(
             re.escape(system_keyword),
             re.escape(user_keyword),
@@ -350,7 +251,6 @@ class LollmsLLMBinding(ABC):
             if not part:
                 continue
-            # Determine role and strip prefix if present
             if part.startswith(system_keyword):
                 role = "system"
                 content = part[len(system_keyword):].strip()
@@ -361,33 +261,54 @@ class LollmsLLMBinding(ABC):
                 role = "assistant"
                 content = part[len(ai_keyword):].strip()
             else:
-                # No prefix: if it's the first valid chunk, treat as system
                 if not messages:
                     role = "system"
                     content = part
                 else:
-                    # otherwise skip unrecognized segments
                     continue
             messages.append({"role": role, "content": content})
             if messages[-1]["content"]=="":
                 del messages[-1]
         return messages
     def ps(self):
-        return []
+        """
+        List models (simulating a process status command).
+        Since Lollms/OpenAI API doesn't have a specific 'ps' endpoint for running models with memory stats,
+        we list available models and populate structure with available info, leaving hardware stats empty.
+        """
+        # Since there is no dedicated ps endpoint to see *running* models in the standard OpenAI API,
+        # we list available models and try to map relevant info.
+        models = self.list_models()
+        standardized_models = []
+        for m in models:
+            standardized_models.append({
+                "model_name": m.get("model_name"),
+                "size": None,
+                "vram_size": None,
+                "gpu_usage_percent": None,
+                "cpu_usage_percent": None,
+                "expires_at": None,
+                "parameters_size": None,
+                "quantization_level": None,
+                "parent_model": None,
+                "context_size": m.get("context_length"),
+                "owned_by": m.get("owned_by"),
+                "created": m.get("created")
+            })
+        return standardized_models
+    def get_context_size(self) -> Optional[int]:
+        """
+        Returns the default context size for the binding.
+        """
+        return self.default_ctx_size
 class LollmsLLMBindingManager:
     """Manages binding discovery and instantiation"""
     def __init__(self, llm_bindings_dir: Union[str, Path] = Path(__file__).parent.parent / "llm_bindings"):
-        """
-        Initialize the LollmsLLMBindingManager.
-        Args:
-            llm_bindings_dir (str): Directory containing binding implementations. Defaults to "llm_bindings".
-        """
         self.llm_bindings_dir = Path(llm_bindings_dir)
         self.available_bindings = {}
@@ -408,13 +329,6 @@ class LollmsLLMBindingManager:
                       **kwargs) -> Optional[LollmsLLMBinding]:
         """
         Create an instance of a specific binding.
-        Args:
-            binding_name (str): Name of the binding to create.
-            kwargs: binding specific arguments
-        Returns:
-            Optional[LollmsLLMBinding]: Binding instance or None if creation failed.
         """
         if binding_name not in self.available_bindings:
             self._load_binding(binding_name)
@@ -470,14 +384,7 @@ class LollmsLLMBindingManager:
     @staticmethod
     def get_bindings_list(llm_bindings_dir: Union[str, Path]) -> List[Dict]:
         """
-        Lists all available LLM bindings by scanning a directory, loading their
-        description.yaml file if present, or providing a default description.
-        Args:
-            llm_bindings_dir (Union[str, Path]): The path to the directory containing LLM binding folders.
-        Returns:
-            List[Dict]: A list of dictionaries, each describing a binding.
+        Lists all available LLM bindings by scanning a directory.
         """
         bindings_dir = Path(llm_bindings_dir)
         if not bindings_dir.is_dir():
@@ -508,70 +415,28 @@ class LollmsLLMBindingManager:
     def get_available_bindings(self) -> List[Dict]:
         """
         Retrieves a list of all available LLM bindings with their full descriptions.
-        This method scans the configured `llm_bindings_dir`, parsing the `description.yaml`
-        file for each valid binding. If a `description.yaml` is missing, a fallback
-        description with common parameters is generated. This is the primary method
-        for discovering available bindings and their configuration requirements.
-        Returns:
-            List[Dict]:
-                A list of dictionaries, where each dictionary represents the
-                full description of an available binding.
-                Each dictionary contains the following keys:
-                - ``binding_name`` (str): The programmatic name of the binding (its folder name).
-                - ``title`` (str): A user-friendly title for the binding.
-                - ``author`` (str): The creator of the binding.
-                - ``creation_date`` (str): The date the binding was created.
-                - ``last_update_date`` (str): The date of the last major update.
-                - ``description`` (str): A detailed explanation of the binding's purpose.
-                - ``input_parameters`` (List[Dict]): A list of parameters required to
-                  configure the binding. Each parameter is a dictionary with:
-                    - ``name`` (str): The parameter's name (e.g., 'model_name').
-                    - ``type`` (str): The expected data type ('str', 'int', 'float', 'bool').
-                    - ``description`` (str): A user-friendly description of the parameter.
-                    - ``mandatory`` (bool): True if the parameter must be provided.
-                    - ``default``: The default value for the parameter.
-        Example of a returned dictionary in the list:
-        .. code-block:: python
-            {
-                "binding_name": "ollama",
-                "title": "Ollama",
-                "author": "ParisNeo",
-                ...
-                "input_parameters": [
-                    {
-                        "name": "host_address",
-                        "type": "str",
-                        "description": "The URL of the Ollama server.",
-                        "mandatory": True,
-                        "default": "http://localhost:11434"
-                    },
-                    ...
-                ]
-            }
         """
         return LollmsLLMBindingManager.get_bindings_list(self.llm_bindings_dir)
 def get_available_bindings(llm_bindings_dir: Union[str, Path] = None) -> List[Dict]:
     """
     Lists all available LLM bindings with their detailed descriptions.
-    This function serves as a primary entry point for discovering what bindings
-    are available and how to configure them.
-    Args:
-        llm_bindings_dir (Union[str, Path], optional):
-            The path to the LLM bindings directory. If None, it defaults to the
-            'llm_bindings' subdirectory relative to this file.
-            Defaults to None.
-    Returns:
-        List[Dict]: A list of dictionaries, each describing a binding.
     """
     if llm_bindings_dir is None:
         llm_bindings_dir = Path(__file__).parent / "llm_bindings"
-    return LollmsLLMBindingManager.get_bindings_list(llm_bindings_dir)
+    return LollmsLLMBindingManager.get_bindings_list(llm_bindings_dir)
+def list_binding_models(llm_binding_name: str, llm_binding_config: Optional[Dict[str, any]]|None = None, llm_bindings_dir: str|Path = Path(__file__).parent / "llm_bindings") -> List[Dict]:
+    """
+    Lists all available models for a specific binding.
+    """
+    binding = LollmsLLMBindingManager(llm_bindings_dir).create_binding(
+        binding_name=llm_binding_name,
+        **{
+            k: v
+            for k, v in (llm_binding_config or {}).items()
+            if k != "binding_name"
+        }
+    )
+    return binding.list_models() if binding else []

lollms-client 1.5.6__py3-none-any.whl → 1.7.13__py3-none-any.whl

lollms-client 1.5.6py3-none-any.whl → 1.7.13py3-none-any.whl