PyPI - waterfall - Versions diffs - 0.2.11__py3-none-any.whl → 0.2.13__py3-none-any.whl - Mend

waterfall 0.2.11py3-none-any.whl → 0.2.13py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (7) hide show

waterfall/WatermarkerBase.py CHANGED Viewed

@@ -24,6 +24,24 @@ from waterfall.WatermarkingFnFourier import WatermarkingFnFourier
 os.environ["TOKENIZERS_PARALLELISM"] = "false"
+# Check transformers version
+import transformers
+from packaging import version
+transformers_version = version.parse(transformers.__version__)
+# Set model loading kwargs based on transformers version
+if transformers_version >= version.parse("4.56.0"):
+    model_from_pretrained_kwargs = {"dtype": "auto"}
+else:
+    model_from_pretrained_kwargs = {"torch_dtype": torch.bfloat16}
+# Group beam search is shifted to transformers-community package in 4.57.0
+use_custom_group_beam_search = transformers_version >= version.parse("4.57.0")
+# BatchEncoding to() non_blocking added in 4.48.0
+if transformers_version >= version.parse("4.48.0"):
+    batch_encoding_to_kwargs = {"non_blocking": True}
+else:
+    batch_encoding_to_kwargs = {}
 class PerturbationProcessor(LogitsProcessor):
     def __init__(self,
                  N : int = 32000,     # Vocab size
@@ -134,7 +152,7 @@ class Watermarker:
         self.model = AutoModelForCausalLM.from_pretrained(
             model_name_or_path,
             device_map=device_map,
-            torch_dtype=dtype,
+            **model_from_pretrained_kwargs,
         )
     def compute_phi(self, watermarkingFnClass = WatermarkingFnFourier) -> None:
@@ -279,6 +297,9 @@ class Watermarker:
             diversity_penalty = kwargs.get("diversity_penalty", None)
             if num_beams <= 1:
                 kwargs["diversity_penalty"] = None
+        if use_custom_group_beam_search:
+            kwargs["custom_generate"]="transformers-community/group-beam-search"
+            kwargs["trust_remote_code"]=True
         if num_beams > 1 and temperature is not None and temperature != 1.0:
             logits_processor.append(TemperatureLogitsWarper(float(temperature)))
@@ -302,7 +323,7 @@ class Watermarker:
             tokd_inputs_order = range(len(tokd_inputs))
         tokd_input_batches = []
         for i in range(0, len(tokd_inputs), max_batch_size):
-            batch = self.tokenizer.pad(tokd_inputs[i:i+max_batch_size], padding=True, padding_side="left").to(self.model.device, non_blocking=True)
+            batch = self.tokenizer.pad(tokd_inputs[i:i+max_batch_size], padding=True, padding_side="left").to(self.model.device, **batch_encoding_to_kwargs)
             tokd_input_batches.append(batch)
         torch.cuda.synchronize()

waterfall/watermark.py CHANGED Viewed

@@ -15,6 +15,21 @@ from waterfall.WatermarkingFnFourier import WatermarkingFnFourier
 from waterfall.WatermarkingFnSquare import WatermarkingFnSquare
 from waterfall.WatermarkerBase import Watermarker
+# Check transformers version
+import transformers
+from packaging import version
+transformers_version = version.parse(transformers.__version__)
+if transformers_version >= version.parse("4.56.0"):
+    model_from_pretrained_kwargs = {"dtype": "auto"}
+else:
+    model_from_pretrained_kwargs = {"torch_dtype": torch.bfloat16}
+if transformers_version < version.parse("5.0.0") and transformers_version >= version.parse("4.50.0"):
+    additional_generation_config = {
+        "use_model_defaults": False,
+    }
+else:
+    additional_generation_config = {}
 PROMPT = (
     "Paraphrase the user provided text while preserving semantic similarity. "
     "Do not include any other sentences in the response, such as explanations of the paraphrasing. "
@@ -160,7 +175,7 @@ def watermark_texts(
         return_scores=True,
         use_tqdm=use_tqdm,
         generation_config=generation_config,
-        use_model_defaults=False,
+        **additional_generation_config,
     )
     T_ws = watermarked["text"]
     # Reshape T_ws to Queries X Beams
@@ -306,8 +321,8 @@ def main():
     tokenizer = AutoTokenizer.from_pretrained(model_name_or_path)
     model = AutoModelForCausalLM.from_pretrained(
         model_name_or_path,
-        torch_dtype=torch.bfloat16,
         device_map=device,
+        **model_from_pretrained_kwargs,
         )
     watermarker = Watermarker(tokenizer=tokenizer, model=model, id=id, kappa=kappa, k_p=k_p, watermarkingFnClass=watermarkingFnClass)

{waterfall-0.2.11.dist-info → waterfall-0.2.13.dist-info}/METADATA RENAMED Viewed

@@ -1,6 +1,6 @@
 Metadata-Version: 2.4
 Name: waterfall
-Version: 0.2.11
+Version: 0.2.13
 Summary: Scalable Framework for Robust Text Watermarking and Provenance for LLMs
 Project-URL: Homepage, https://github.com/aoi3142/Waterfall
 Project-URL: Issues, https://github.com/aoi3142/Waterfall/issues
@@ -15,7 +15,7 @@ Requires-Dist: numpy>=1.25.0
 Requires-Dist: scipy>=1.13.0
 Requires-Dist: sentence-transformers>=3.0.0
 Requires-Dist: torch>=2.3.0
-Requires-Dist: transformers<4.57.0,>=4.43.1
+Requires-Dist: transformers>=4.43.1
 Description-Content-Type: text/markdown
 # Waterfall: Scalable Framework for Robust Text Watermarking and Provenance for LLMs [EMNLP 2024 Main Long]

{waterfall-0.2.11.dist-info → waterfall-0.2.13.dist-info}/RECORD RENAMED Viewed

@@ -1,12 +1,12 @@
-waterfall/WatermarkerBase.py,sha256=pk2NB7J0oBLXcO0FIRBHllnSowbpeRNd9ZjvPuUOeeM,21945
+waterfall/WatermarkerBase.py,sha256=H-tJ96WUihW30EFFnPn92pna4qQtyYjcWBlVVtY3oMM,22863
 waterfall/WatermarkingFn.py,sha256=-b-kGRdL0a7eKRqJmcHPAR_rCjxQYnsg1Ne6bTwBc1I,1931
 waterfall/WatermarkingFnFourier.py,sha256=QYayAQYwi1dQkDIyqmvhU568VhrVYTVy47HkI8F8SZs,1358
 waterfall/WatermarkingFnSquare.py,sha256=2PAO05DdKT02npo7GDf_82D520nP7kGAWK6H4E4JMt4,1638
 waterfall/__init__.py,sha256=47DEQpj8HBSa-_TImW-5JCeuQeRkm5NMpJWZG3hSuFU,0
 waterfall/permute.py,sha256=uYKdmn4pGvjB6hInInLGxFIF6vt507lqJ_qe-ST1PFE,2783
-waterfall/watermark.py,sha256=avyQIFJBhqu_q_ZBp0-RWvAOIJmzJvVisbiIca2GPyA,14536
-waterfall-0.2.11.dist-info/METADATA,sha256=Ttp-F0sjA31gppuF6dfo5ze4HfNWIPYnNAf3VF0h02E,8768
-waterfall-0.2.11.dist-info/WHEEL,sha256=WLgqFyCfm_KASv4WHyYy0P3pM_m7J5L9k2skdKLirC8,87
-waterfall-0.2.11.dist-info/entry_points.txt,sha256=XXnUzuWXu2nc9j4WAll9tq6HyodN_8WJLjeG0O4Y2Gw,60
-waterfall-0.2.11.dist-info/licenses/LICENSE,sha256=zAtaO-k41Q-Q4Etl4bzuh7pgNJsPH-dYfzvznRa0OvM,11341
-waterfall-0.2.11.dist-info/RECORD,,
+waterfall/watermark.py,sha256=Qe_NSNH2XL5ZCf069fa438NOpNsju3l4kr2GDoKbuVU,15093
+waterfall-0.2.13.dist-info/METADATA,sha256=VwO9mXTFEOoFxRASPt7qeZVCkMIbhH3_LkJ02yccOFM,8760
+waterfall-0.2.13.dist-info/WHEEL,sha256=WLgqFyCfm_KASv4WHyYy0P3pM_m7J5L9k2skdKLirC8,87
+waterfall-0.2.13.dist-info/entry_points.txt,sha256=XXnUzuWXu2nc9j4WAll9tq6HyodN_8WJLjeG0O4Y2Gw,60
+waterfall-0.2.13.dist-info/licenses/LICENSE,sha256=zAtaO-k41Q-Q4Etl4bzuh7pgNJsPH-dYfzvznRa0OvM,11341
+waterfall-0.2.13.dist-info/RECORD,,

{waterfall-0.2.11.dist-info → waterfall-0.2.13.dist-info}/WHEEL RENAMED Viewed

File without changes

{waterfall-0.2.11.dist-info → waterfall-0.2.13.dist-info}/entry_points.txt RENAMED Viewed

File without changes

{waterfall-0.2.11.dist-info → waterfall-0.2.13.dist-info}/licenses/LICENSE RENAMED Viewed

File without changes

waterfall 0.2.11__py3-none-any.whl → 0.2.13__py3-none-any.whl

waterfall 0.2.11py3-none-any.whl → 0.2.13py3-none-any.whl