PyPI - waterfall - Versions diffs - 0.2.10__py3-none-any.whl → 0.2.12__py3-none-any.whl - Mend

waterfall 0.2.10py3-none-any.whl → 0.2.12py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (8) hide show

waterfall/WatermarkerBase.py CHANGED Viewed

@@ -24,6 +24,17 @@ from waterfall.WatermarkingFnFourier import WatermarkingFnFourier
 os.environ["TOKENIZERS_PARALLELISM"] = "false"
+# Check transformers version
+import transformers
+from packaging import version
+# Group beam search is shifted to transformers-community package in 4.57.0
+use_custom_group_beam_search = version.parse(transformers.__version__) >= version.parse("4.57.0")
+# Set model loading kwargs based on transformers version
+if version.parse(transformers.__version__) >= version.parse("4.56.0"):
+    model_from_pretrained_kwargs = {"dtype": "auto"}
+else:
+    model_from_pretrained_kwargs = {"torch_dtype": torch.bfloat16}
 class PerturbationProcessor(LogitsProcessor):
     def __init__(self,
                  N : int = 32000,     # Vocab size
@@ -134,7 +145,7 @@ class Watermarker:
         self.model = AutoModelForCausalLM.from_pretrained(
             model_name_or_path,
             device_map=device_map,
-            torch_dtype=dtype,
+            **model_from_pretrained_kwargs,
         )
     def compute_phi(self, watermarkingFnClass = WatermarkingFnFourier) -> None:
@@ -228,6 +239,7 @@ class Watermarker:
             use_tqdm : bool = False,
             batched_generate : bool = True,
             discard_incomplete : bool = True,
+            logits_processor = [],
             **kwargs    # Other generate parameters
             ) -> List[str] | dict:  # Returns flattened list of query x beam
@@ -259,7 +271,6 @@ class Watermarker:
             squeezed_tokd_inputs.append(BatchEncoding({"input_ids": input_ids, "attention_mask": attention_mask}))
         tokd_inputs = squeezed_tokd_inputs
-        logits_processor = []
         # Ensure top_k and top_p happens before watermarking
         if "generation_config" in kwargs:
             generation_config: GenerationConfig = kwargs["generation_config"]
@@ -275,10 +286,13 @@ class Watermarker:
             top_k = kwargs.pop("top_k", None)
             top_p = kwargs.pop("top_p", None)
             temperature = kwargs.pop("temperature", 1.0)
-            num_beams = kwargs.pop("num_beams", 1)
-            diversity_penalty = kwargs.pop("diversity_penalty", None)
+            num_beams = kwargs.get("num_beams", 1)
+            diversity_penalty = kwargs.get("diversity_penalty", None)
             if num_beams <= 1:
                 kwargs["diversity_penalty"] = None
+        if use_custom_group_beam_search:
+            kwargs["custom_generate"]="transformers-community/group-beam-search"
+            kwargs["trust_remote_code"]=True
         if num_beams > 1 and temperature is not None and temperature != 1.0:
             logits_processor.append(TemperatureLogitsWarper(float(temperature)))
@@ -351,10 +365,6 @@ class Watermarker:
             decoded_output = [i.strip() for i in decoded_output]
             return_dict["text"] = decoded_output
-        if is_single:
-            for k, v in return_dict.items():
-                return_dict[k] = v[0]
         if return_text and len(return_dict) == 1:
             return decoded_output

waterfall/watermark.py CHANGED Viewed

@@ -15,6 +15,14 @@ from waterfall.WatermarkingFnFourier import WatermarkingFnFourier
 from waterfall.WatermarkingFnSquare import WatermarkingFnSquare
 from waterfall.WatermarkerBase import Watermarker
+# Check transformers version
+import transformers
+from packaging import version
+if version.parse(transformers.__version__) >= version.parse("4.56.0"):
+    model_from_pretrained_kwargs = {"dtype": "auto"}
+else:
+    model_from_pretrained_kwargs = {"torch_dtype": torch.bfloat16}
 PROMPT = (
     "Paraphrase the user provided text while preserving semantic similarity. "
     "Do not include any other sentences in the response, such as explanations of the paraphrasing. "
@@ -306,8 +314,8 @@ def main():
     tokenizer = AutoTokenizer.from_pretrained(model_name_or_path)
     model = AutoModelForCausalLM.from_pretrained(
         model_name_or_path,
-        torch_dtype=torch.bfloat16,
         device_map=device,
+        **model_from_pretrained_kwargs,
         )
     watermarker = Watermarker(tokenizer=tokenizer, model=model, id=id, kappa=kappa, k_p=k_p, watermarkingFnClass=watermarkingFnClass)

{waterfall-0.2.10.dist-info → waterfall-0.2.12.dist-info}/METADATA RENAMED Viewed

@@ -1,6 +1,6 @@
 Metadata-Version: 2.4
 Name: waterfall
-Version: 0.2.10
+Version: 0.2.12
 Summary: Scalable Framework for Robust Text Watermarking and Provenance for LLMs
 Project-URL: Homepage, https://github.com/aoi3142/Waterfall
 Project-URL: Issues, https://github.com/aoi3142/Waterfall/issues
@@ -15,7 +15,7 @@ Requires-Dist: numpy>=1.25.0
 Requires-Dist: scipy>=1.13.0
 Requires-Dist: sentence-transformers>=3.0.0
 Requires-Dist: torch>=2.3.0
-Requires-Dist: transformers<4.57.0,>=4.43.1
+Requires-Dist: transformers>=4.43.1
 Description-Content-Type: text/markdown
 # Waterfall: Scalable Framework for Robust Text Watermarking and Provenance for LLMs [EMNLP 2024 Main Long]

waterfall-0.2.12.dist-info/RECORD ADDED Viewed

@@ -0,0 +1,12 @@
+waterfall/WatermarkerBase.py,sha256=6O_S78dD3Jha2OkJK2u3euwCH93i-mTiYYGXosPDMig,22632
+waterfall/WatermarkingFn.py,sha256=-b-kGRdL0a7eKRqJmcHPAR_rCjxQYnsg1Ne6bTwBc1I,1931
+waterfall/WatermarkingFnFourier.py,sha256=QYayAQYwi1dQkDIyqmvhU568VhrVYTVy47HkI8F8SZs,1358
+waterfall/WatermarkingFnSquare.py,sha256=2PAO05DdKT02npo7GDf_82D520nP7kGAWK6H4E4JMt4,1638
+waterfall/__init__.py,sha256=47DEQpj8HBSa-_TImW-5JCeuQeRkm5NMpJWZG3hSuFU,0
+waterfall/permute.py,sha256=uYKdmn4pGvjB6hInInLGxFIF6vt507lqJ_qe-ST1PFE,2783
+waterfall/watermark.py,sha256=fvscFoSbM51YUuDaOmrOKGvwXO25VMgGJKTfAeeKCaA,14817
+waterfall-0.2.12.dist-info/METADATA,sha256=TBoeAFK8qkG-jIRi-OeKq4GbtFTDQkaUKyKuFNeDQHo,8760
+waterfall-0.2.12.dist-info/WHEEL,sha256=WLgqFyCfm_KASv4WHyYy0P3pM_m7J5L9k2skdKLirC8,87
+waterfall-0.2.12.dist-info/entry_points.txt,sha256=XXnUzuWXu2nc9j4WAll9tq6HyodN_8WJLjeG0O4Y2Gw,60
+waterfall-0.2.12.dist-info/licenses/LICENSE,sha256=zAtaO-k41Q-Q4Etl4bzuh7pgNJsPH-dYfzvznRa0OvM,11341
+waterfall-0.2.12.dist-info/RECORD,,

{waterfall-0.2.10.dist-info → waterfall-0.2.12.dist-info}/WHEEL RENAMED Viewed

@@ -1,4 +1,4 @@
 Wheel-Version: 1.0
-Generator: hatchling 1.27.0
+Generator: hatchling 1.28.0
 Root-Is-Purelib: true
 Tag: py3-none-any

waterfall-0.2.10.dist-info/RECORD DELETED Viewed

@@ -1,12 +0,0 @@
-waterfall/WatermarkerBase.py,sha256=1IvGo1rz1Ec-NW8rQ9bSC8KNdHawu4gl4CNsNncce7Q,22046
-waterfall/WatermarkingFn.py,sha256=-b-kGRdL0a7eKRqJmcHPAR_rCjxQYnsg1Ne6bTwBc1I,1931
-waterfall/WatermarkingFnFourier.py,sha256=QYayAQYwi1dQkDIyqmvhU568VhrVYTVy47HkI8F8SZs,1358
-waterfall/WatermarkingFnSquare.py,sha256=2PAO05DdKT02npo7GDf_82D520nP7kGAWK6H4E4JMt4,1638
-waterfall/__init__.py,sha256=47DEQpj8HBSa-_TImW-5JCeuQeRkm5NMpJWZG3hSuFU,0
-waterfall/permute.py,sha256=uYKdmn4pGvjB6hInInLGxFIF6vt507lqJ_qe-ST1PFE,2783
-waterfall/watermark.py,sha256=avyQIFJBhqu_q_ZBp0-RWvAOIJmzJvVisbiIca2GPyA,14536
-waterfall-0.2.10.dist-info/METADATA,sha256=vUr4PSIrQvPdkBjrsQc7uKJj4GVUSBZnpvElPA8n1Uc,8768
-waterfall-0.2.10.dist-info/WHEEL,sha256=qtCwoSJWgHk21S1Kb4ihdzI2rlJ1ZKaIurTj_ngOhyQ,87
-waterfall-0.2.10.dist-info/entry_points.txt,sha256=XXnUzuWXu2nc9j4WAll9tq6HyodN_8WJLjeG0O4Y2Gw,60
-waterfall-0.2.10.dist-info/licenses/LICENSE,sha256=zAtaO-k41Q-Q4Etl4bzuh7pgNJsPH-dYfzvznRa0OvM,11341
-waterfall-0.2.10.dist-info/RECORD,,

{waterfall-0.2.10.dist-info → waterfall-0.2.12.dist-info}/entry_points.txt RENAMED Viewed

File without changes

{waterfall-0.2.10.dist-info → waterfall-0.2.12.dist-info}/licenses/LICENSE RENAMED Viewed

File without changes

waterfall 0.2.10__py3-none-any.whl → 0.2.12__py3-none-any.whl

waterfall 0.2.10py3-none-any.whl → 0.2.12py3-none-any.whl