PyPI - lm-deluge - Versions diffs - 0.0.34__py3-none-any.whl → 0.0.36__py3-none-any.whl - Mend

lm-deluge 0.0.34py3-none-any.whl → 0.0.36py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Potentially problematic release.

This version of lm-deluge might be problematic. Click here for more details.

Files changed (29) hide show

lm_deluge/api_requests/anthropic.py +1 -1
lm_deluge/api_requests/gemini.py +4 -2
lm_deluge/api_requests/openai.py +17 -4
lm_deluge/api_requests/response.py +4 -3
lm_deluge/cli.py +300 -0
lm_deluge/client.py +22 -73
lm_deluge/models/__init__.py +144 -0
lm_deluge/models/anthropic.py +124 -0
lm_deluge/models/bedrock.py +99 -0
lm_deluge/models/cerebras.py +57 -0
lm_deluge/models/cohere.py +98 -0
lm_deluge/models/deepseek.py +27 -0
lm_deluge/models/fireworks.py +16 -0
lm_deluge/models/google.py +153 -0
lm_deluge/models/grok.py +38 -0
lm_deluge/models/groq.py +74 -0
lm_deluge/models/meta.py +65 -0
lm_deluge/models/mistral.py +110 -0
lm_deluge/models/openai.py +318 -0
lm_deluge/models/openrouter.py +1 -0
lm_deluge/models/together.py +112 -0
lm_deluge/prompt.py +2 -2
lm_deluge/util/harmony.py +47 -0
{lm_deluge-0.0.34.dist-info → lm_deluge-0.0.36.dist-info}/METADATA +1 -1
{lm_deluge-0.0.34.dist-info → lm_deluge-0.0.36.dist-info}/RECORD +28 -12
lm_deluge/models.py +0 -1305
{lm_deluge-0.0.34.dist-info → lm_deluge-0.0.36.dist-info}/WHEEL +0 -0
{lm_deluge-0.0.34.dist-info → lm_deluge-0.0.36.dist-info}/licenses/LICENSE +0 -0
{lm_deluge-0.0.34.dist-info → lm_deluge-0.0.36.dist-info}/top_level.txt +0 -0

lm_deluge/models/google.py ADDED Viewed

@@ -0,0 +1,153 @@
+GOOGLE_MODELS = {
+    #   .oooooo.                                   oooo                  .o.       ooooo
+    #  d8P'  `Y8b                                  `888                 .888.      `888'
+    # 888            .ooooo.   .ooooo.   .oooooooo  888   .ooooo.      .8"888.      888
+    # 888           d88' `88b d88' `88b 888' `88b   888  d88' `88b    .8' `888.     888
+    # 888     ooooo 888   888 888   888 888   888   888  888ooo888   .88ooo8888.    888
+    # `88.    .88'  888   888 888   888 `88bod8P'   888  888    .o  .8'     `888.   888
+    #  `Y8bood8P'   `Y8bod8P' `Y8bod8P' `8oooooo.  o888o `Y8bod8P' o88o     o8888o o888o
+    #                                   d"     YD
+    #                                   "Y88888P'
+    # these are through AI studio rather than Vertex, and using the OpenAI-compatible endpoints
+    "gemini-2.0-flash-compat": {
+        "id": "gemini-2.0-flash-compat",
+        "name": "gemini-2.0-flash",
+        "api_base": "https://generativelanguage.googleapis.com/v1beta/openai",
+        "api_key_env_var": "GEMINI_API_KEY",
+        "supports_json": True,
+        "supports_logprobs": False,
+        "api_spec": "openai",
+        "input_cost": 0.1,
+        "output_cost": 0.4,
+        "requests_per_minute": 20,
+        "tokens_per_minute": 100_000,
+        "reasoning_model": False,
+    },
+    "gemini-2.0-flash-lite-compat": {
+        "id": "gemini-2.0-flash-lite-compat",
+        "name": "gemini-2.0-flash-lite",
+        "api_base": "https://generativelanguage.googleapis.com/v1beta/openai",
+        "api_key_env_var": "GEMINI_API_KEY",
+        "supports_json": True,
+        "supports_logprobs": False,
+        "api_spec": "openai",
+        "input_cost": 0.1,
+        "output_cost": 0.4,
+        "requests_per_minute": 20,
+        "tokens_per_minute": 100_000,
+        "reasoning_model": False,
+    },
+    "gemini-2.5-pro-compat": {
+        "id": "gemini-2.5-pro-compat",
+        "name": "gemini-2.5-pro",
+        "api_base": "https://generativelanguage.googleapis.com/v1beta/openai",
+        "api_key_env_var": "GEMINI_API_KEY",
+        "supports_json": True,
+        "supports_logprobs": False,
+        "api_spec": "openai",
+        "input_cost": 0.1,
+        "output_cost": 0.4,
+        "requests_per_minute": 20,
+        "tokens_per_minute": 100_000,
+        "reasoning_model": True,
+    },
+    "gemini-2.5-flash-compat": {
+        "id": "gemini-2.5-flash-compat",
+        "name": "gemini-2.5-flash",
+        "api_base": "https://generativelanguage.googleapis.com/v1beta/openai",
+        "api_key_env_var": "GEMINI_API_KEY",
+        "supports_json": True,
+        "supports_logprobs": False,
+        "api_spec": "openai",
+        "input_cost": 0.1,
+        "output_cost": 0.4,
+        "requests_per_minute": 20,
+        "tokens_per_minute": 100_000,
+        "reasoning_model": True,
+    },
+    "gemini-2.5-flash-lite-compat": {
+        "id": "gemini-2.5-flash-lite-compat",
+        "name": "gemini-2.5-flash-lite",
+        "api_base": "https://generativelanguage.googleapis.com/v1beta/openai",
+        "api_key_env_var": "GEMINI_API_KEY",
+        "supports_json": True,
+        "supports_logprobs": False,
+        "api_spec": "openai",
+        "input_cost": 0.1,
+        "output_cost": 0.4,
+        "requests_per_minute": 20,
+        "tokens_per_minute": 100_000,
+        "reasoning_model": True,
+    },
+    # Native Gemini API versions with file support
+    "gemini-2.0-flash": {
+        "id": "gemini-2.0-flash",
+        "name": "gemini-2.0-flash",
+        "api_base": "https://generativelanguage.googleapis.com/v1beta",
+        "api_key_env_var": "GEMINI_API_KEY",
+        "supports_json": True,
+        "supports_logprobs": False,
+        "api_spec": "gemini",
+        "input_cost": 0.1,
+        "output_cost": 0.4,
+        "requests_per_minute": 20,
+        "tokens_per_minute": 100_000,
+        "reasoning_model": False,
+    },
+    "gemini-2.0-flash-lite": {
+        "id": "gemini-2.0-flash-lite",
+        "name": "gemini-2.0-flash-lite",
+        "api_base": "https://generativelanguage.googleapis.com/v1beta",
+        "api_key_env_var": "GEMINI_API_KEY",
+        "supports_json": True,
+        "supports_logprobs": False,
+        "api_spec": "gemini",
+        "input_cost": 0.1,
+        "output_cost": 0.4,
+        "requests_per_minute": 20,
+        "tokens_per_minute": 100_000,
+        "reasoning_model": False,
+    },
+    "gemini-2.5-pro": {
+        "id": "gemini-2.5-pro",
+        "name": "gemini-2.5-pro",
+        "api_base": "https://generativelanguage.googleapis.com/v1beta",
+        "api_key_env_var": "GEMINI_API_KEY",
+        "supports_json": True,
+        "supports_logprobs": False,
+        "api_spec": "gemini",
+        "input_cost": 0.1,
+        "output_cost": 0.4,
+        "requests_per_minute": 20,
+        "tokens_per_minute": 100_000,
+        "reasoning_model": True,
+    },
+    "gemini-2.5-flash": {
+        "id": "gemini-2.5-flash",
+        "name": "gemini-2.5-flash",
+        "api_base": "https://generativelanguage.googleapis.com/v1beta",
+        "api_key_env_var": "GEMINI_API_KEY",
+        "supports_json": True,
+        "supports_logprobs": False,
+        "api_spec": "gemini",
+        "input_cost": 0.1,
+        "output_cost": 0.4,
+        "requests_per_minute": 20,
+        "tokens_per_minute": 100_000,
+        "reasoning_model": True,
+    },
+    "gemini-2.5-flash-lite": {
+        "id": "gemini-2.5-flash-lite",
+        "name": "gemini-2.5-flash-lite",
+        "api_base": "https://generativelanguage.googleapis.com/v1beta",
+        "api_key_env_var": "GEMINI_API_KEY",
+        "supports_json": True,
+        "supports_logprobs": False,
+        "api_spec": "gemini",
+        "input_cost": 0.1,
+        "output_cost": 0.4,
+        "requests_per_minute": 20,
+        "tokens_per_minute": 100_000,
+        "reasoning_model": True,
+    },
+}

lm_deluge/models/grok.py ADDED Viewed

@@ -0,0 +1,38 @@
+XAI_MODELS = {
+    #  .d8888b.                  888
+    # d88P  Y88b                 888
+    # 888    888                 888
+    # 888        888d888 .d88b.  888  888
+    # 888  88888 888P"  d88""88b 888 .88P
+    # 888    888 888    888  888 888888K
+    # Y88b  d88P 888    Y88..88P 888 "88b
+    #  "Y8888P88 888     "Y88P"  888  888
+    "grok-3": {
+        "id": "grok-3",
+        "name": "grok-3-latest",
+        "api_base": "https://api.x.ai/v1",
+        "api_key_env_var": "GROK_API_KEY",
+        "supports_json": True,
+        "supports_logprobs": True,
+        "api_spec": "openai",
+        "input_cost": 2.0,
+        "output_cost": 8.0,
+        "requests_per_minute": 20,
+        "tokens_per_minute": 100_000,
+        "reasoning_model": False,
+    },
+    "grok-3-mini": {
+        "id": "grok-3-mini",
+        "name": "grok-3-mini-latest",
+        "api_base": "https://api.x.ai/v1",
+        "api_key_env_var": "GROK_API_KEY",
+        "supports_json": True,
+        "supports_logprobs": True,
+        "api_spec": "openai",
+        "input_cost": 2.0,
+        "output_cost": 8.0,
+        "requests_per_minute": 20,
+        "tokens_per_minute": 100_000,
+        "reasoning_model": True,
+    },
+}

lm_deluge/models/groq.py ADDED Viewed

@@ -0,0 +1,74 @@
+GROQ_MODELS = {
+    "llama-3.1-8b-groq": {
+        "id": "llama-3.1-8b-groq",
+        "name": "llama-3.1-8b-instant",
+        "api_base": "https://api.groq.com/openai/v1",
+        "api_key_env_var": "GROQ_API_KEY",
+        "supports_json": False,
+        "api_spec": "openai",
+    },
+    "llama-3.3-70b-groq": {
+        "id": "llama-3.3-70b-groq",
+        "name": "llama-3.3-70b-versatile",
+        "api_base": "https://api.groq.com/openai/v1",
+        "api_key_env_var": "GROQ_API_KEY",
+        "supports_json": False,
+        "api_spec": "openai",
+    },
+    "r1-llama-70b-groq": {
+        "id": "r1-llama-70b-groq",
+        "name": "deepseek-r1-distill-llama-70b",
+        "api_base": "https://api.groq.com/openai/v1",
+        "api_key_env_var": "GROQ_API_KEY",
+        "supports_json": False,
+        "api_spec": "openai",
+    },
+    "llama-4-maverick-groq": {
+        "id": "llama-4-maverick-groq",
+        "name": "meta-llama/llama-4-maverick-17b-128e-instruct",
+        "api_base": "https://api.groq.com/openai/v1",
+        "api_key_env_var": "GROQ_API_KEY",
+        "supports_json": False,
+        "api_spec": "openai",
+    },
+    "llama-4-scout-groq": {
+        "id": "llama-4-scout-groq",
+        "name": "meta-llama/llama-4-scout-17b-16e-instruct",
+        "api_base": "https://api.groq.com/openai/v1",
+        "api_key_env_var": "GROQ_API_KEY",
+        "supports_json": False,
+        "api_spec": "openai",
+    },
+    "kimi-k2-groq": {
+        "id": "kimi-k2-groq",
+        "name": "moonshotai/kimi-k2-instruct",
+        "api_base": "https://api.groq.com/openai/v1",
+        "api_key_env_var": "GROQ_API_KEY",
+        "supports_json": False,
+        "api_spec": "openai",
+    },
+    "gpt-oss-120b-groq": {
+        "id": "gpt-oss-120b-groq",
+        "name": "openai/gpt-oss-120b",
+        "api_base": "https://api.groq.com/openai/v1",
+        "api_key_env_var": "GROQ_API_KEY",
+        "supports_json": False,
+        "api_spec": "openai",
+    },
+    "gpt-oss-20b-groq": {
+        "id": "gpt-oss-20b-groq",
+        "name": "openai/gpt-oss-20b",
+        "api_base": "https://api.groq.com/openai/v1",
+        "api_key_env_var": "GROQ_API_KEY",
+        "supports_json": False,
+        "api_spec": "openai",
+    },
+    "qwen-3-32b-groq": {
+        "id": "qwen-3-32b-groq",
+        "name": "qwen/qwen3-32b",
+        "api_base": "https://api.groq.com/openai/v1",
+        "api_key_env_var": "GROQ_API_KEY",
+        "supports_json": False,
+        "api_spec": "openai",
+    },
+}

lm_deluge/models/meta.py ADDED Viewed

@@ -0,0 +1,65 @@
+META_MODELS = {
+    # `7MMM.     ,MMF'         mm
+    #   MMMb    dPMM           MM
+    #   M YM   ,M MM  .gP"Ya mmMMmm  ,6"Yb.
+    #   M  Mb  M' MM ,M'   Yb  MM   8)   MM
+    #   M  YM.P'  MM 8M""""""  MM    ,pm9MM
+    #   M  `YM'   MM YM.    ,  MM   8M   MM
+    # .JML. `'  .JMML.`Mbmmd'  `Mbmo`Moo9^Yo.
+    "llama-4-scout": {
+        "id": "llama-4-scout",
+        "name": "Llama-4-Scout-17B-16E-Instruct-FP8",
+        "api_base": "https://api.llama.com/compat/v1",
+        "api_key_env_var": "META_API_KEY",
+        "supports_json": True,
+        "supports_logprobs": True,
+        "api_spec": "openai",
+        "input_cost": 0.0,
+        "output_cost": 0.0,
+        "requests_per_minute": 3_000,
+        "tokens_per_minute": 1_000_000,
+        "reasoning_model": False,
+    },
+    "llama-4-maverick": {
+        "id": "llama-4-maverick",
+        "name": "Llama-4-Maverick-17B-128E-Instruct-FP8",
+        "api_base": "https://api.llama.com/compat/v1",
+        "api_key_env_var": "META_API_KEY",
+        "supports_json": True,
+        "supports_logprobs": True,
+        "api_spec": "openai",
+        "input_cost": 0.0,
+        "output_cost": 0.0,
+        "requests_per_minute": 3_000,
+        "tokens_per_minute": 1_000_000,
+        "reasoning_model": False,
+    },
+    "llama-3.3-70b": {
+        "id": "llama-3.3-70b",
+        "name": "Llama-3.3-70B-Instruct",
+        "api_base": "https://api.llama.com/compat/v1",
+        "api_key_env_var": "META_API_KEY",
+        "supports_json": True,
+        "supports_logprobs": True,
+        "api_spec": "openai",
+        "input_cost": 0.0,
+        "output_cost": 0.0,
+        "requests_per_minute": 3_000,
+        "tokens_per_minute": 1_000_000,
+        "reasoning_model": False,
+    },
+    "llama-3.3-8b": {
+        "id": "llama-3.3-8b",
+        "name": "Llama-3.3-8B-Instruct",
+        "api_base": "https://api.llama.com/compat/v1",
+        "api_key_env_var": "META_API_KEY",
+        "supports_json": True,
+        "supports_logprobs": True,
+        "api_spec": "openai",
+        "input_cost": 0.0,
+        "output_cost": 0.0,
+        "requests_per_minute": 3_000,
+        "tokens_per_minute": 1_000_000,
+        "reasoning_model": False,
+    },
+}

lm_deluge/models/mistral.py ADDED Viewed

@@ -0,0 +1,110 @@
+#  ██████   ██████  ███           █████                        ████
+# ░░██████ ██████  ░░░           ░░███                        ░░███
+#  ░███░█████░███  ████   █████  ███████   ████████   ██████   ░███
+#  ░███░░███ ░███ ░░███  ███░░  ░░░███░   ░░███░░███ ░░░░░███  ░███
+#  ░███ ░░░  ░███  ░███ ░░█████   ░███     ░███ ░░░   ███████  ░███
+#  ░███      ░███  ░███  ░░░░███  ░███ ███ ░███      ███░░███  ░███
+#  █████     █████ █████ ██████   ░░█████  █████    ░░████████ █████
+# ░░░░░     ░░░░░ ░░░░░ ░░░░░░     ░░░░░  ░░░░░      ░░░░░░░░ ░░░░░
+MISTRAL_MODELS = {
+    "mistral-medium": {
+        "id": "mistral-medium",
+        "name": "mistral-medium-latest",
+        "api_base": "https://api.mistral.ai/v1",
+        "api_key_env_var": "MISTRAL_API_KEY",
+        "supports_json": True,
+        "api_spec": "mistral",
+        "input_cost": 0.4,
+        "output_cost": 2.0,
+    },
+    "mistral-large": {
+        "id": "mistral-large",
+        "name": "mistral-large-latest",
+        "api_base": "https://api.mistral.ai/v1",
+        "api_key_env_var": "MISTRAL_API_KEY",
+        "supports_json": True,
+        "api_spec": "mistral",
+        "input_cost": 2.0,
+        "output_cost": 6.0,
+    },
+    "pixtral-large": {
+        "id": "pixtral-large",
+        "name": "pixtral-large-latest",
+        "api_base": "https://api.mistral.ai/v1",
+        "api_key_env_var": "MISTRAL_API_KEY",
+        "supports_json": True,
+        "api_spec": "mistral",
+        "input_cost": 2.0,
+        "output_cost": 6.0,
+    },
+    "mistral-small": {
+        "id": "mistral-small",
+        "name": "mistral-small-latest",
+        "api_base": "https://api.mistral.ai/v1",
+        "api_key_env_var": "MISTRAL_API_KEY",
+        "supports_json": True,
+        "api_spec": "mistral",
+        "input_cost": 0.1,
+        "output_cost": 0.3,
+    },
+    "devstral-small": {
+        "id": "devstral-small",
+        "name": "devstral-small-2505",
+        "api_base": "https://api.mistral.ai/v1",
+        "api_key_env_var": "MISTRAL_API_KEY",
+        "supports_json": True,
+        "api_spec": "mistral",
+        "input_cost": 0.1,
+        "output_cost": 0.3,
+    },
+    "codestral": {
+        "id": "codestral",
+        "name": "codestral-latest",
+        "api_base": "https://api.mistral.ai/v1",
+        "api_key_env_var": "MISTRAL_API_KEY",
+        "supports_json": True,
+        "api_spec": "mistral",
+        "input_cost": 0.2,
+        "output_cost": 0.6,
+    },
+    "pixtral-12b": {
+        "id": "pixtral-12b",
+        "name": "pixtral-12b",
+        "api_base": "https://api.mistral.ai/v1",
+        "api_key_env_var": "MISTRAL_API_KEY",
+        "supports_json": True,
+        "api_spec": "mistral",
+        "input_cost": 0.1,
+        "output_cost": 0.3,
+    },
+    "mistral-nemo": {
+        "id": "mistral-nemo",
+        "name": "open-mistral-nemo",
+        "api_base": "https://api.mistral.ai/v1",
+        "api_key_env_var": "MISTRAL_API_KEY",
+        "supports_json": True,
+        "api_spec": "mistral",
+        "input_cost": 0.1,
+        "output_cost": 0.3,
+    },
+    "ministral-8b": {
+        "id": "ministral-8b",
+        "name": "ministral-8b-latest",
+        "api_base": "https://api.mistral.ai/v1",
+        "api_key_env_var": "MISTRAL_API_KEY",
+        "supports_json": True,
+        "api_spec": "mistral",
+        "input_cost": 0.7,
+        "output_cost": 0.7,
+    },
+    "mixtral-8x22b": {
+        "id": "mixtral-8x22b",
+        "name": "open-mixtral-8x22b",
+        "api_base": "https://api.mistral.ai/v1",
+        "api_key_env_var": "MISTRAL_API_KEY",
+        "supports_json": True,
+        "api_spec": "mistral",
+        "input_cost": 2.0,
+        "output_cost": 6.0,
+    },
+}

lm-deluge 0.0.34__py3-none-any.whl → 0.0.36__py3-none-any.whl

Potentially problematic release.

lm-deluge 0.0.34py3-none-any.whl → 0.0.36py3-none-any.whl