PyPI - python-fastllm - Versions diffs - 0.0.4__tar.gz → 0.0.6__tar.gz - Mend

python-fastllm 0.0.4tar.gz → 0.0.6tar.gz

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (27) hide show

{python_fastllm-0.0.4 → python_fastllm-0.0.6}/PKG-INFO RENAMED Viewed

@@ -1,6 +1,6 @@
 Metadata-Version: 2.4
 Name: python-fastllm
-Version: 0.0.4
+Version: 0.0.6
 Author-email: Kerem Turgutlu <keremturgutlu@gmail.com>
 License: Apache-2.0
 Project-URL: Repository, https://github.com/AnswerDotAI/fastllm

python_fastllm-0.0.6/fastllm/__init__.py ADDED Viewed

	@@ -0,0 +1 @@
1	+ __version__ = "0.0.6"

{python_fastllm-0.0.4 → python_fastllm-0.0.6}/fastllm/acomplete.py RENAMED Viewed

@@ -49,7 +49,7 @@ api2spec = {'openai':oai_spec, 'openai_chat':oai_spec, 'anthropic':ant_spec, 'ge
 # %% ../nbs/06_acomplete.ipynb #79075d95
 @flexicache()
-def mk_client(model, vendor_name=None, api_name=None, api_key=None, base_url=None, xtra_hdrs=None):
+def mk_client(model=None, vendor_name=None, api_name=None, api_key=None, base_url=None, xtra_hdrs=None):
     err_msg = f"please pass a valid one vendor: {', '.join(list(vendor_mapping))} or pass `api_name`,`base_url` and `api_key`"
     if vendor_name:
         override_base_url = base_url
@@ -62,7 +62,7 @@ def mk_client(model, vendor_name=None, api_name=None, api_key=None, base_url=Non
                 if auth_fn.exists(): api_key = nested_idx(json.loads(auth_fn.read_text()), *keys)
             api_key = get_api_key(api_key, env_api_nm)
         except KeyError: raise ValueError(f"Unknown vendor '{vendor_name}', {err_msg}")
-    elif api_name and base_url and api_key:  vendor_name = ifnone(vendor_name, 'custom')
+    elif base_url and api_key: vendor_name, api_name = ifnone(vendor_name, 'custom'), ifnone(api_name, 'openai_chat')
     elif (api_name:=infer_api_name(model)):  base_url, vendor_name = None, api_name
     else: raise ValueError(f"Model {model} can't be auto resolved, {err_msg}")
     api = api_registry.apis[api_name]

{python_fastllm-0.0.4 → python_fastllm-0.0.6}/fastllm/chat.py RENAMED Viewed

@@ -476,7 +476,7 @@ def _think_kw(model, think, vendor_name):
 def _prep_call(self:AsyncChat, prefill, search, max_tokens, kwargs, stream=False, think=None):
     "Prepare model info, prefill, search, and provider kwargs for a completion call"
     model_info = get_model_info(self.model, self.vendor_name)
-    if max_tokens is None: max_tokens = model_info.get('max_output_tokens')
+    if max_tokens is None: max_tokens = ifnone(model_info.get('max_output_tokens'), 32_000)
     if not model_info.get("supports_assistant_prefill"): prefill = None
     if _has_search(model_info) and (s:=ifnone(search,self.search)):
         if 'web_search_options' not in kwargs: kwargs['web_search_options'] = {}

{python_fastllm-0.0.4 → python_fastllm-0.0.6}/fastllm/types.py RENAMED Viewed

@@ -240,7 +240,7 @@ def infer_api_name(model):
 def get_model_meta(model, vendor_name=None, tfm=noop):
     "Look up cost metadata for `model` from litellm price map, using `vendor_name` prefix if needed."
     vendor_name = ifnone(vendor_name, infer_api_name(model))
-    mp = model_prices_meta()
+    mp, key = model_prices_meta(), ''
     if model in mp: key = model
     elif vendor_name=='gemini' and model.startswith('models/'): key = f"gemini/{model.removeprefix('models/')}"
     elif vendor_name:                                           key = f"{vendor_name}/{model}"
@@ -273,7 +273,7 @@ _codex_overrides = {
 }
 # %% ../nbs/00_types.ipynb #fbfdeb0a
-def get_model_info(mn, vendor_name=None):
+def get_model_info(mn, vendor_name=None, strict=False):
     info = get_model_meta(mn, 'chatgpt' if vendor_name=='codex' else vendor_name)
     # anthropic web search
     if 'search_context_cost_per_query' in info: info['supports_web_search'] = True
@@ -306,6 +306,9 @@ def get_model_info(mn, vendor_name=None):
                     supports_prompt_caching=True, supports_native_streaming=True, supports_native_structured_output=True,
                     max_tokens=1000000, max_input_tokens=1000000, max_output_tokens=65536,
                     input_cost_per_token=0.5e-6, cache_read_input_token_cost=0.1e-6, output_cost_per_token=3.0e-6)
+    # unresolved models
+    if not info and not strict: info = info | codex_pricing
     return dict2obj(info)
 # %% ../nbs/00_types.ipynb #8bfca02d

{python_fastllm-0.0.4 → python_fastllm-0.0.6}/python_fastllm.egg-info/PKG-INFO RENAMED Viewed

@@ -1,6 +1,6 @@
 Metadata-Version: 2.4
 Name: python-fastllm
-Version: 0.0.4
+Version: 0.0.6
 Author-email: Kerem Turgutlu <keremturgutlu@gmail.com>
 License: Apache-2.0
 Project-URL: Repository, https://github.com/AnswerDotAI/fastllm