PyPI - vlm-dataset-captioner - Versions diffs - 0.0.1__tar.gz → 0.0.2__tar.gz - Mend

vlm-dataset-captioner 0.0.1tar.gz → 0.0.2tar.gz

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (7) hide show

{vlm_dataset_captioner-0.0.1 → vlm_dataset_captioner-0.0.2}/PKG-INFO RENAMED Viewed

@@ -1,6 +1,6 @@
 Metadata-Version: 2.4
 Name: vlm-dataset-captioner
-Version: 0.0.1
+Version: 0.0.2
 Summary: Uses a VLM to caption images from a dataset.
 Author: Alex Senden
 Maintainer: Alex Senden

vlm_dataset_captioner-0.0.2/vlm_dataset_captioner/__init__.py ADDED Viewed

@@ -0,0 +1,5 @@
+"""VLM Captioner - Uses a VLM to caption images from a dataset."""
+from .vlm_caption import caption_entire_directory
+__all__ = ["caption_entire_directory"]

{vlm_dataset_captioner-0.0.1 → vlm_dataset_captioner-0.0.2}/vlm_dataset_captioner/vlm_caption.py RENAMED Viewed

@@ -103,7 +103,7 @@ def caption_image(prompt, image, model, processor, max_new_tokens=None):
     # Generate caption
     generated_ids = model.generate(
         **inputs,
-        max_new_tokens=128,
+        max_new_tokens=max_new_tokens or 128,
         do_sample=True,
         top_p=1.0,
         temperature=0.7,
@@ -159,13 +159,17 @@ def requires_caption(image_file, output_directory, overwrite):
 def caption_entire_directory(
     directory_path,
     output_directory,
-    model,
-    processor,
+    model_name="Qwen/Qwen2.5-VL-32B-Instruct",
+    model=None,
+    processor=None,
     max_new_tokens=None,
     ignore_substring=None,
     num_captions=None,
     overwrite=False,
 ):
+    if model is None or processor is None:
+        model, processor = init_model(model_name=model_name)
     print(
         f"INFO: Processing directory {directory_path} for image captions.", flush=True
     )
@@ -178,12 +182,12 @@ def caption_entire_directory(
                     caption_entire_directory(
                         subdir_path,
                         os.path.join(output_directory, subdir),
-                        model,
-                        processor,
-                        max_new_tokens,
-                        ignore_substring,
-                        num_captions,
-                        overwrite,
+                        model=model,
+                        processor=processor,
+                        max_new_tokens=max_new_tokens,
+                        ignore_substring=ignore_substring,
+                        num_captions=num_captions,
+                        overwrite=overwrite,
                     )
     else:
         prompt = get_prompt_for_directory(directory_path)

{vlm_dataset_captioner-0.0.1 → vlm_dataset_captioner-0.0.2}/.gitignore RENAMED Viewed

File without changes

{vlm_dataset_captioner-0.0.1 → vlm_dataset_captioner-0.0.2}/README.md RENAMED Viewed

File without changes

{vlm_dataset_captioner-0.0.1 → vlm_dataset_captioner-0.0.2}/pyproject.toml RENAMED Viewed

File without changes

{vlm_dataset_captioner-0.0.1 → vlm_dataset_captioner-0.0.2}/vlm_dataset_captioner/vlm_caption_cli.py RENAMED Viewed

File without changes

vlm-dataset-captioner 0.0.1__tar.gz → 0.0.2__tar.gz

vlm-dataset-captioner 0.0.1tar.gz → 0.0.2tar.gz