PyPI - renderers - Versions diffs - 0.1.8.dev34__tar.gz → 0.1.8.dev35__tar.gz - Mend

renderers 0.1.8.dev34tar.gz → 0.1.8.dev35tar.gz

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (63) hide show

{renderers-0.1.8.dev34 → renderers-0.1.8.dev35}/PKG-INFO RENAMED Viewed

@@ -1,6 +1,6 @@
 Metadata-Version: 2.4
 Name: renderers
-Version: 0.1.8.dev34
+Version: 0.1.8.dev35
 Summary: Chat template renderers — deterministic message-to-token conversion for LLM training
 License-Expression: Apache-2.0
 License-File: LICENSE

{renderers-0.1.8.dev34 → renderers-0.1.8.dev35}/renderers/_version.py RENAMED Viewed

@@ -18,7 +18,7 @@ version_tuple: tuple[int | str, ...]
 commit_id: str | None
 __commit_id__: str | None
-__version__ = version = '0.1.8.dev34'
-__version_tuple__ = version_tuple = (0, 1, 8, 'dev34')
+__version__ = version = '0.1.8.dev35'
+__version_tuple__ = version_tuple = (0, 1, 8, 'dev35')
 __commit_id__ = commit_id = None

{renderers-0.1.8.dev34 → renderers-0.1.8.dev35}/renderers/base.py RENAMED Viewed

@@ -1089,7 +1089,6 @@ def _patched_load(model_name_or_path: str, **kwargs):
     path is still discoverable in logs.
     """
     import fastokens
-    from transformers import AutoTokenizer
     global _FASTOKENS_ANNOUNCED
@@ -1102,13 +1101,72 @@ def _patched_load(model_name_or_path: str, **kwargs):
             )
             _FASTOKENS_ANNOUNCED = True
     try:
-        return AutoTokenizer.from_pretrained(model_name_or_path, **kwargs)
+        return _load_tokenizer_via_auto(model_name_or_path, **kwargs)
     finally:
         with _FASTOKENS_PATCH_LOCK:
             with contextlib.redirect_stdout(io.StringIO()):
                 fastokens.unpatch_transformers()
+def _load_fast_tokenizer_directly(
+    model_name_or_path: str, revision: str | None
+) -> Any | None:
+    """Load a self-contained fast tokenizer without building the model config.
+    ``AutoTokenizer.from_pretrained`` eagerly constructs the *model* config to
+    resolve the tokenizer class — even for a plain ``PreTrainedTokenizerFast``.
+    That construction can raise on modeling-only concerns the tokenizer never
+    needs (e.g. RoPE parameter validation for configs that carry nested
+    ``rope_parameters``). When the repo ships a complete ``tokenizer.json`` and
+    declares no custom tokenizer, the tokenizer is fully self-describing, so we
+    load it directly and skip the config detour.
+    Returns ``None`` when there's nothing safe to load this way — a custom
+    ``auto_map`` tokenizer (which must run through ``AutoTokenizer`` with
+    ``trust_remote_code``) or no fast tokenizer at all — so the caller can
+    surface its original error instead.
+    """
+    from transformers import PreTrainedTokenizerFast
+    from transformers.models.auto.tokenization_auto import get_tokenizer_config
+    try:
+        if "auto_map" in get_tokenizer_config(model_name_or_path, revision=revision):
+            return None
+        return PreTrainedTokenizerFast.from_pretrained(
+            model_name_or_path, revision=revision
+        )
+    except Exception:
+        return None
+def _load_tokenizer_via_auto(model_name_or_path: str, **kwargs) -> Any:
+    """``AutoTokenizer.from_pretrained`` with a config-free fallback.
+    renderers needs the tokenizer, not the model. If ``AutoTokenizer`` fails
+    while building the model config it loads to resolve the tokenizer class,
+    retry by loading the repo's self-contained ``tokenizer.json`` directly. The
+    original error is re-raised if the repo has no such tokenizer.
+    """
+    from transformers import AutoTokenizer
+    try:
+        return AutoTokenizer.from_pretrained(model_name_or_path, **kwargs)
+    except Exception as exc:
+        tok = _load_fast_tokenizer_directly(
+            model_name_or_path, revision=kwargs.get("revision")
+        )
+        if tok is None:
+            raise
+        logger.debug(
+            "AutoTokenizer.from_pretrained(%r) failed building the model config "
+            "(%s: %s); loaded the tokenizer directly from tokenizer.json.",
+            model_name_or_path,
+            type(exc).__name__,
+            str(exc)[:160],
+        )
+        return tok
 def load_tokenizer(
     model_name_or_path: str,
     *,
@@ -1138,9 +1196,14 @@ def load_tokenizer(
     fastokens raises during the patched load (e.g. an unknown
     pre-tokenizer type), we automatically retry with the vanilla
     backend and emit an INFO log.
-    """
-    from transformers import AutoTokenizer
+    ``AutoTokenizer.from_pretrained`` eagerly builds the model config to
+    resolve the tokenizer class. If that construction raises on a
+    modeling-only concern the tokenizer doesn't need (e.g. RoPE
+    validation for configs with nested ``rope_parameters``), we fall
+    back to loading the repo's self-contained ``tokenizer.json``
+    directly — see ``_load_tokenizer_via_auto``.
+    """
     kwargs: dict[str, Any] = {}
     revision = TRUSTED_REVISIONS.get(model_name_or_path)
     if revision is not None:
@@ -1149,7 +1212,7 @@ def load_tokenizer(
         kwargs = {"trust_remote_code": False}
     if not use_fastokens or model_name_or_path in FASTOKENS_INCOMPATIBLE:
-        return AutoTokenizer.from_pretrained(model_name_or_path, **kwargs)
+        return _load_tokenizer_via_auto(model_name_or_path, **kwargs)
     try:
         return _patched_load(model_name_or_path, **kwargs)
@@ -1162,7 +1225,7 @@ def load_tokenizer(
             type(exc).__name__,
             str(exc)[:160],
         )
-        return AutoTokenizer.from_pretrained(model_name_or_path, **kwargs)
+        return _load_tokenizer_via_auto(model_name_or_path, **kwargs)
 def _populate_registry():

{renderers-0.1.8.dev34 → renderers-0.1.8.dev35}/.github/workflows/publish-dev.yml RENAMED Viewed

File without changes

{renderers-0.1.8.dev34 → renderers-0.1.8.dev35}/.github/workflows/publish.yml RENAMED Viewed

File without changes

{renderers-0.1.8.dev34 → renderers-0.1.8.dev35}/.github/workflows/style.yml RENAMED Viewed

File without changes

{renderers-0.1.8.dev34 → renderers-0.1.8.dev35}/.github/workflows/test.yml RENAMED Viewed

File without changes

{renderers-0.1.8.dev34 → renderers-0.1.8.dev35}/.gitignore RENAMED Viewed

File without changes

{renderers-0.1.8.dev34 → renderers-0.1.8.dev35}/.pre-commit-config.yaml RENAMED Viewed

File without changes

{renderers-0.1.8.dev34 → renderers-0.1.8.dev35}/LICENSE RENAMED Viewed

File without changes

{renderers-0.1.8.dev34 → renderers-0.1.8.dev35}/README.md RENAMED Viewed

File without changes

{renderers-0.1.8.dev34 → renderers-0.1.8.dev35}/docs/renderer-config.md RENAMED Viewed

File without changes

{renderers-0.1.8.dev34 → renderers-0.1.8.dev35}/examples/README.md RENAMED Viewed

File without changes

{renderers-0.1.8.dev34 → renderers-0.1.8.dev35}/examples/sglang/multiturn_generate_sglang.py RENAMED Viewed

File without changes

{renderers-0.1.8.dev34 → renderers-0.1.8.dev35}/examples/sglang/online_multiturn_sglang.py RENAMED Viewed

File without changes

{renderers-0.1.8.dev34 → renderers-0.1.8.dev35}/examples/tinker/multiturn_generate_tinker.py RENAMED Viewed

File without changes

{renderers-0.1.8.dev34 → renderers-0.1.8.dev35}/examples/transformers/multiturn_generate_transformers.py RENAMED Viewed

File without changes

{renderers-0.1.8.dev34 → renderers-0.1.8.dev35}/examples/vllm/multiturn_generate_vllm.py RENAMED Viewed

File without changes

{renderers-0.1.8.dev34 → renderers-0.1.8.dev35}/pyproject.toml RENAMED Viewed

File without changes

{renderers-0.1.8.dev34 → renderers-0.1.8.dev35}/renderers/__init__.py RENAMED Viewed

File without changes

{renderers-0.1.8.dev34 → renderers-0.1.8.dev35}/renderers/client.py RENAMED Viewed

File without changes

{renderers-0.1.8.dev34 → renderers-0.1.8.dev35}/renderers/configs.py RENAMED Viewed

File without changes

{renderers-0.1.8.dev34 → renderers-0.1.8.dev35}/renderers/deepseek_v3.py RENAMED Viewed

File without changes

{renderers-0.1.8.dev34 → renderers-0.1.8.dev35}/renderers/default.py RENAMED Viewed

File without changes

{renderers-0.1.8.dev34 → renderers-0.1.8.dev35}/renderers/glm45.py RENAMED Viewed

File without changes

{renderers-0.1.8.dev34 → renderers-0.1.8.dev35}/renderers/glm5.py RENAMED Viewed

File without changes

{renderers-0.1.8.dev34 → renderers-0.1.8.dev35}/renderers/gpt_oss.py RENAMED Viewed

File without changes

{renderers-0.1.8.dev34 → renderers-0.1.8.dev35}/renderers/kimi_k2.py RENAMED Viewed

File without changes

{renderers-0.1.8.dev34 → renderers-0.1.8.dev35}/renderers/kimi_k25.py RENAMED Viewed

File without changes

{renderers-0.1.8.dev34 → renderers-0.1.8.dev35}/renderers/laguna_xs2.py RENAMED Viewed

File without changes

{renderers-0.1.8.dev34 → renderers-0.1.8.dev35}/renderers/minimax_m2.py RENAMED Viewed

File without changes

{renderers-0.1.8.dev34 → renderers-0.1.8.dev35}/renderers/nemotron3.py RENAMED Viewed

File without changes

{renderers-0.1.8.dev34 → renderers-0.1.8.dev35}/renderers/parsers.py RENAMED Viewed

File without changes

{renderers-0.1.8.dev34 → renderers-0.1.8.dev35}/renderers/parsing.py RENAMED Viewed

File without changes

{renderers-0.1.8.dev34 → renderers-0.1.8.dev35}/renderers/qwen3.py RENAMED Viewed

File without changes

{renderers-0.1.8.dev34 → renderers-0.1.8.dev35}/renderers/qwen35.py RENAMED Viewed

File without changes

{renderers-0.1.8.dev34 → renderers-0.1.8.dev35}/renderers/qwen36.py RENAMED Viewed

File without changes

{renderers-0.1.8.dev34 → renderers-0.1.8.dev35}/renderers/qwen3_vl.py RENAMED Viewed

File without changes

{renderers-0.1.8.dev34 → renderers-0.1.8.dev35}/tests/conftest.py RENAMED Viewed

File without changes

{renderers-0.1.8.dev34 → renderers-0.1.8.dev35}/tests/test_bridge.py RENAMED Viewed

File without changes

{renderers-0.1.8.dev34 → renderers-0.1.8.dev35}/tests/test_build_helpers.py RENAMED Viewed

File without changes

{renderers-0.1.8.dev34 → renderers-0.1.8.dev35}/tests/test_client.py RENAMED Viewed

File without changes

{renderers-0.1.8.dev34 → renderers-0.1.8.dev35}/tests/test_gpt_oss_harmony_parity.py RENAMED Viewed

File without changes

{renderers-0.1.8.dev34 → renderers-0.1.8.dev35}/tests/test_incremental.py RENAMED Viewed

File without changes

{renderers-0.1.8.dev34 → renderers-0.1.8.dev35}/tests/test_is_content.py RENAMED Viewed

File without changes

{renderers-0.1.8.dev34 → renderers-0.1.8.dev35}/tests/test_kimi_k25_tool_schema.py RENAMED Viewed

File without changes

{renderers-0.1.8.dev34 → renderers-0.1.8.dev35}/tests/test_load_tokenizer.py RENAMED Viewed

File without changes

{renderers-0.1.8.dev34 → renderers-0.1.8.dev35}/tests/test_load_tokenizer_fastokens.py RENAMED Viewed

File without changes

{renderers-0.1.8.dev34 → renderers-0.1.8.dev35}/tests/test_message_indices.py RENAMED Viewed

File without changes

{renderers-0.1.8.dev34 → renderers-0.1.8.dev35}/tests/test_multimodal.py RENAMED Viewed

File without changes

{renderers-0.1.8.dev34 → renderers-0.1.8.dev35}/tests/test_parse_response.py RENAMED Viewed

File without changes

{renderers-0.1.8.dev34 → renderers-0.1.8.dev35}/tests/test_parse_response_robustness.py RENAMED Viewed

File without changes

{renderers-0.1.8.dev34 → renderers-0.1.8.dev35}/tests/test_parsers.py RENAMED Viewed

File without changes

{renderers-0.1.8.dev34 → renderers-0.1.8.dev35}/tests/test_preserve_thinking.py RENAMED Viewed

File without changes

{renderers-0.1.8.dev34 → renderers-0.1.8.dev35}/tests/test_qwen35_size_coverage.py RENAMED Viewed

File without changes

{renderers-0.1.8.dev34 → renderers-0.1.8.dev35}/tests/test_render_ids.py RENAMED Viewed

File without changes

{renderers-0.1.8.dev34 → renderers-0.1.8.dev35}/tests/test_renderer_config.py RENAMED Viewed

File without changes

{renderers-0.1.8.dev34 → renderers-0.1.8.dev35}/tests/test_renderer_config_parity.py RENAMED Viewed

File without changes

{renderers-0.1.8.dev34 → renderers-0.1.8.dev35}/tests/test_roundtrip.py RENAMED Viewed

File without changes

{renderers-0.1.8.dev34 → renderers-0.1.8.dev35}/tests/test_sampled_mask.py RENAMED Viewed

File without changes

{renderers-0.1.8.dev34 → renderers-0.1.8.dev35}/tests/test_tokens_per_message.py RENAMED Viewed

File without changes

{renderers-0.1.8.dev34 → renderers-0.1.8.dev35}/tests/test_tool_arg_type_preservation.py RENAMED Viewed

File without changes

{renderers-0.1.8.dev34 → renderers-0.1.8.dev35}/uv.lock RENAMED Viewed

File without changes

renderers 0.1.8.dev34__tar.gz → 0.1.8.dev35__tar.gz

renderers 0.1.8.dev34tar.gz → 0.1.8.dev35tar.gz