PyPI - tokenshrink - Versions diffs - 0.2.2__tar.gz → 0.2.4__tar.gz - Mend

tokenshrink 0.2.2tar.gz → 0.2.4tar.gz

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (26) hide show

{tokenshrink-0.2.2 → tokenshrink-0.2.4}/PKG-INFO RENAMED Viewed

@@ -1,6 +1,6 @@
 Metadata-Version: 2.4
 Name: tokenshrink
-Version: 0.2.2
+Version: 0.2.4
 Summary: Cut your AI costs 50-80%. FAISS retrieval + LLMLingua compression + REFRAG-inspired adaptive optimization.
 Project-URL: Homepage, https://tokenshrink.dev
 Project-URL: Repository, https://github.com/MusashiMiyamoto1-cloud/tokenshrink

{tokenshrink-0.2.2 → tokenshrink-0.2.4}/pyproject.toml RENAMED Viewed

@@ -4,7 +4,7 @@ build-backend = "hatchling.build"
 [project]
 name = "tokenshrink"
-version = "0.2.2"
+version = "0.2.4"
 description = "Cut your AI costs 50-80%. FAISS retrieval + LLMLingua compression + REFRAG-inspired adaptive optimization."
 readme = "README.md"
 license = "MIT"

{tokenshrink-0.2.2 → tokenshrink-0.2.4}/src/tokenshrink/__init__.py RENAMED Viewed

@@ -23,7 +23,7 @@ CLI:
     tokenshrink stats
 """
-__version__ = "0.2.2"
+__version__ = "0.2.4"
 def __getattr__(name):
     if name in ("TokenShrink", "ShrinkResult", "ChunkScore"):

{tokenshrink-0.2.2 → tokenshrink-0.2.4}/src/tokenshrink/cli.py RENAMED Viewed

@@ -11,8 +11,21 @@ Usage:
 import argparse
 import sys
 import json
+import os
 from pathlib import Path
+# Early suppression: check for --quiet or --json BEFORE heavy imports
+if "--quiet" in sys.argv or "--json" in sys.argv:
+    os.environ["TRANSFORMERS_VERBOSITY"] = "error"
+    os.environ["HF_HUB_DISABLE_PROGRESS_BARS"] = "1"
+    os.environ["HF_HUB_DISABLE_TELEMETRY"] = "1"
+    os.environ["TOKENIZERS_PARALLELISM"] = "false"
+    os.environ["TQDM_DISABLE"] = "1"
+    import warnings
+    warnings.filterwarnings("ignore")
+    import logging
+    logging.disable(logging.WARNING)
 from tokenshrink import __version__
@@ -123,17 +136,6 @@ def main():
         parser.print_help()
         sys.exit(0)
-    # Suppress noisy output when --quiet or --json
-    if args.quiet or args.json:
-        import os, logging, warnings
-        os.environ["TRANSFORMERS_VERBOSITY"] = "error"
-        os.environ["HF_HUB_DISABLE_PROGRESS_BARS"] = "1"
-        os.environ["TOKENIZERS_PARALLELISM"] = "false"
-        logging.getLogger("sentence_transformers").setLevel(logging.ERROR)
-        logging.getLogger("transformers").setLevel(logging.ERROR)
-        logging.getLogger("huggingface_hub").setLevel(logging.ERROR)
-        warnings.filterwarnings("ignore", message=".*unauthenticated.*")
     # Lazy import to avoid loading ML models for --help/--version
     from tokenshrink import TokenShrink

{tokenshrink-0.2.2 → tokenshrink-0.2.4}/src/tokenshrink/pipeline.py RENAMED Viewed

@@ -613,7 +613,7 @@ class TokenShrink:
             "ratio": total_compressed / total_original if total_original else 1.0,
         }
-    def search(self, question: str, k: int = 5, min_score: float = 0.15) -> list[dict]:
+    def search(self, question: str, k: int = 5, min_score: float = 0.05) -> list[dict]:
         """Search without compression. Returns raw chunks with scores."""
         if self._index.ntotal == 0:
             return []