PyPI - xinference - Versions diffs - 0.15.2__py3-none-any.whl → 0.15.4__py3-none-any.whl - Mend

xinference 0.15.2py3-none-any.whl → 0.15.4py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Potentially problematic release.

This version of xinference might be problematic. Click here for more details.

Files changed (57) hide show

xinference/_version.py +3 -3
xinference/api/restful_api.py +29 -2
xinference/client/restful/restful_client.py +10 -0
xinference/constants.py +4 -0
xinference/core/image_interface.py +76 -23
xinference/core/model.py +80 -39
xinference/core/progress_tracker.py +187 -0
xinference/core/supervisor.py +11 -0
xinference/core/worker.py +1 -0
xinference/model/audio/chattts.py +2 -1
xinference/model/audio/core.py +0 -2
xinference/model/audio/model_spec.json +8 -0
xinference/model/audio/model_spec_modelscope.json +9 -0
xinference/model/embedding/core.py +14 -5
xinference/model/embedding/model_spec.json +7 -0
xinference/model/embedding/model_spec_modelscope.json +9 -1
xinference/model/image/core.py +6 -7
xinference/model/image/sdapi.py +35 -4
xinference/model/image/stable_diffusion/core.py +212 -70
xinference/model/llm/llm_family.json +28 -40
xinference/model/llm/llm_family_modelscope.json +18 -22
xinference/model/llm/transformers/cogvlm2.py +2 -1
xinference/model/llm/transformers/cogvlm2_video.py +2 -0
xinference/model/llm/transformers/core.py +6 -2
xinference/model/llm/transformers/deepseek_vl.py +2 -0
xinference/model/llm/transformers/glm4v.py +2 -1
xinference/model/llm/transformers/intern_vl.py +2 -0
xinference/model/llm/transformers/minicpmv25.py +2 -0
xinference/model/llm/transformers/minicpmv26.py +2 -0
xinference/model/llm/transformers/omnilmm.py +2 -0
xinference/model/llm/transformers/qwen2_audio.py +11 -4
xinference/model/llm/transformers/qwen2_vl.py +2 -28
xinference/model/llm/transformers/qwen_vl.py +2 -1
xinference/model/llm/transformers/utils.py +35 -2
xinference/model/llm/transformers/yi_vl.py +2 -0
xinference/model/llm/utils.py +72 -17
xinference/model/llm/vllm/core.py +69 -9
xinference/model/llm/vllm/utils.py +41 -0
xinference/model/rerank/core.py +19 -0
xinference/model/rerank/model_spec.json +8 -0
xinference/model/rerank/model_spec_modelscope.json +8 -0
xinference/model/utils.py +7 -29
xinference/model/video/core.py +0 -2
xinference/web/ui/build/asset-manifest.json +3 -3
xinference/web/ui/build/index.html +1 -1
xinference/web/ui/build/static/js/{main.29578905.js → main.e51a356d.js} +3 -3
xinference/web/ui/build/static/js/main.e51a356d.js.map +1 -0
xinference/web/ui/node_modules/.cache/babel-loader/4385c1095eefbff0a8ec3b2964ba6e5a66a05ab31be721483ca2f43e2a91f6ff.json +1 -0
{xinference-0.15.2.dist-info → xinference-0.15.4.dist-info}/METADATA +6 -5
{xinference-0.15.2.dist-info → xinference-0.15.4.dist-info}/RECORD +55 -53
xinference/web/ui/build/static/js/main.29578905.js.map +0 -1
xinference/web/ui/node_modules/.cache/babel-loader/68bede6d95bb5ef0b35bbb3ec5b8c937eaf6862c6cdbddb5ef222a7776aaf336.json +0 -1
/xinference/web/ui/build/static/js/{main.29578905.js.LICENSE.txt → main.e51a356d.js.LICENSE.txt} +0 -0
{xinference-0.15.2.dist-info → xinference-0.15.4.dist-info}/LICENSE +0 -0
{xinference-0.15.2.dist-info → xinference-0.15.4.dist-info}/WHEEL +0 -0
{xinference-0.15.2.dist-info → xinference-0.15.4.dist-info}/entry_points.txt +0 -0
{xinference-0.15.2.dist-info → xinference-0.15.4.dist-info}/top_level.txt +0 -0

xinference/model/audio/model_spec.json CHANGED Viewed

@@ -71,6 +71,14 @@
     "model_ability": "audio-to-text",
     "multilingual": true
   },
+  {
+    "model_name": "whisper-large-v3-turbo",
+    "model_family": "whisper",
+    "model_id": "openai/whisper-large-v3-turbo",
+    "model_revision": "41f01f3fe87f28c78e2fbf8b568835947dd65ed9",
+    "model_ability": "audio-to-text",
+    "multilingual": true
+  },
   {
     "model_name": "Belle-distilwhisper-large-v2-zh",
     "model_family": "whisper",

xinference/model/audio/model_spec_modelscope.json CHANGED Viewed

@@ -8,6 +8,15 @@
     "model_ability": "audio-to-text",
     "multilingual": true
   },
+  {
+    "model_name": "whisper-large-v3-turbo",
+    "model_family": "whisper",
+    "model_hub": "modelscope",
+    "model_id": "AI-ModelScope/whisper-large-v3-turbo",
+    "model_revision": "master",
+    "model_ability": "audio-to-text",
+    "multilingual": true
+  },
   {
     "model_name": "SenseVoiceSmall",
     "model_family": "funasr",

xinference/model/embedding/core.py CHANGED Viewed

@@ -141,7 +141,15 @@ class EmbeddingModel:
     def load(self):
         try:
+            import sentence_transformers
             from sentence_transformers import SentenceTransformer
+            if sentence_transformers.__version__ < "3.1.0":
+                raise ValueError(
+                    "The sentence_transformers version must be greater than 3.1.0. "
+                    "Please upgrade your version via `pip install -U sentence_transformers` or refer to "
+                    "https://github.com/UKPLab/sentence-transformers"
+                )
         except ImportError:
             error_message = "Failed to import module 'SentenceTransformer'"
             installation_guide = [
@@ -173,9 +181,6 @@ class EmbeddingModel:
                 )
                 torch_dtype = torch.float32
-        from ..utils import patch_trust_remote_code
-        patch_trust_remote_code()
         if (
             "gte" in self._model_spec.model_name.lower()
             and "qwen2" in self._model_spec.model_name.lower()
@@ -191,7 +196,10 @@ class EmbeddingModel:
         else:
             model_kwargs = {"torch_dtype": torch_dtype} if torch_dtype else None
             self._model = SentenceTransformer(
-                self._model_path, device=self._device, model_kwargs=model_kwargs
+                self._model_path,
+                device=self._device,
+                model_kwargs=model_kwargs,
+                trust_remote_code=True,
             )
     def create_embedding(self, sentences: Union[str, List[str]], **kwargs):
@@ -213,6 +221,7 @@ class EmbeddingModel:
             convert_to_tensor: bool = False,
             device: str = None,
             normalize_embeddings: bool = False,
+            **kwargs,
         ):
             """
             Computes sentence embeddings
@@ -317,7 +326,7 @@ class EmbeddingModel:
                 all_token_nums += features["attention_mask"].sum().item()
                 with torch.no_grad():
-                    out_features = model.forward(features)
+                    out_features = model.forward(features, **kwargs)
                     if output_value == "token_embeddings":
                         embeddings = []

xinference/model/embedding/model_spec.json CHANGED Viewed

@@ -238,5 +238,12 @@
     "language": ["zh", "en"],
     "model_id": "Alibaba-NLP/gte-Qwen2-7B-instruct",
     "model_revision": "e26182b2122f4435e8b3ebecbf363990f409b45b"
+  },
+  {
+    "model_name": "jina-embeddings-v3",
+    "dimensions": 1024,
+    "max_tokens": 8192,
+    "language": ["zh", "en"],
+    "model_id": "jinaai/jina-embeddings-v3"
   }
 ]

xinference/model/embedding/model_spec_modelscope.json CHANGED Viewed

@@ -233,12 +233,20 @@
     "model_id": "AI-ModelScope/m3e-large",
     "model_hub": "modelscope"
   },
-    {
+  {
     "model_name": "gte-Qwen2",
     "dimensions": 4096,
     "max_tokens": 32000,
     "language": ["zh", "en"],
     "model_id": "iic/gte_Qwen2-7B-instruct",
     "model_hub": "modelscope"
+  },
+  {
+    "model_name": "jina-embeddings-v3",
+    "dimensions": 1024,
+    "max_tokens": 8192,
+    "language": ["zh", "en"],
+    "model_id": "jinaai/jina-embeddings-v3",
+    "model_hub": "modelscope"
   }
 ]

xinference/model/image/core.py CHANGED Viewed

@@ -23,8 +23,6 @@ from ..core import CacheableModelSpec, ModelDescription
 from ..utils import valid_model_revision
 from .stable_diffusion.core import DiffusionModel
-MAX_ATTEMPTS = 3
 logger = logging.getLogger(__name__)
 MODEL_NAME_TO_REVISION: Dict[str, List[str]] = defaultdict(list)
@@ -210,18 +208,19 @@ def create_image_model_instance(
         for name in controlnet:
             for cn_model_spec in model_spec.controlnet:
                 if cn_model_spec.model_name == name:
-                    if not model_path:
-                        model_path = cache(cn_model_spec)
-                    controlnet_model_paths.append(model_path)
+                    controlnet_model_path = cache(cn_model_spec)
+                    controlnet_model_paths.append(controlnet_model_path)
                     break
             else:
                 raise ValueError(
                     f"controlnet `{name}` is not supported for model `{model_name}`."
                 )
         if len(controlnet_model_paths) == 1:
-            kwargs["controlnet"] = controlnet_model_paths[0]
+            kwargs["controlnet"] = (controlnet[0], controlnet_model_paths[0])
         else:
-            kwargs["controlnet"] = controlnet_model_paths
+            kwargs["controlnet"] = [
+                (n, path) for n, path in zip(controlnet, controlnet_model_paths)
+            ]
     if not model_path:
         model_path = cache(model_spec)
     if peft_model_config is not None:

xinference/model/image/sdapi.py CHANGED Viewed

@@ -11,11 +11,12 @@
 # WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
 # See the License for the specific language governing permissions and
 # limitations under the License.
 import base64
 import io
 import warnings
-from PIL import Image
+from PIL import Image, ImageOps
 class SDAPIToDiffusersConverter:
@@ -26,11 +27,12 @@ class SDAPIToDiffusersConverter:
         "width",
         "height",
         "sampler_name",
+        "progressor",
     }
     txt2img_arg_mapping = {
         "steps": "num_inference_steps",
         "cfg_scale": "guidance_scale",
-        # "denoising_strength": "strength",
+        "denoising_strength": "strength",
     }
     img2img_identical_args = {
         "prompt",
@@ -39,12 +41,15 @@ class SDAPIToDiffusersConverter:
         "width",
         "height",
         "sampler_name",
+        "progressor",
     }
     img2img_arg_mapping = {
         "init_images": "image",
+        "mask": "mask_image",
         "steps": "num_inference_steps",
         "cfg_scale": "guidance_scale",
         "denoising_strength": "strength",
+        "inpaint_full_res_padding": "padding_mask_crop",
     }
     @staticmethod
@@ -121,12 +126,38 @@ class SDAPIDiffusionModelMixin:
     def img2img(self, **kwargs):
         init_images = kwargs.pop("init_images", [])
-        kwargs["init_images"] = [self._decode_b64_img(i) for i in init_images]
+        kwargs["init_images"] = init_images = [
+            self._decode_b64_img(i) for i in init_images
+        ]
+        if len(init_images) == 1:
+            kwargs["init_images"] = init_images[0]
+        mask_image = kwargs.pop("mask", None)
+        if mask_image:
+            if kwargs.pop("inpainting_mask_invert"):
+                mask_image = ImageOps.invert(mask_image)
+            kwargs["mask"] = self._decode_b64_img(mask_image)
+            # process inpaint_full_res and inpaint_full_res_padding
+            if kwargs.pop("inpaint_full_res", None):
+                kwargs["inpaint_full_res_padding"] = kwargs.pop(
+                    "inpaint_full_res_padding", 0
+                )
+            else:
+                # inpaint_full_res_padding is turned `into padding_mask_crop`
+                # in diffusers, if padding_mask_crop is passed, it will do inpaint_full_res
+                # so if not inpaint_full_rs, we need to pop this option
+                kwargs.pop("inpaint_full_res_padding", None)
         clip_skip = kwargs.get("override_settings", {}).get("clip_skip")
         converted_kwargs = self._check_kwargs("img2img", kwargs)
         if clip_skip:
             converted_kwargs["clip_skip"] = clip_skip
-        result = self.image_to_image(response_format="b64_json", **converted_kwargs)  # type: ignore
+        if not converted_kwargs.get("mask_image"):
+            result = self.image_to_image(response_format="b64_json", **converted_kwargs)  # type: ignore
+        else:
+            result = self.inpainting(response_format="b64_json", **converted_kwargs)  # type: ignore
         # convert to SD API result
         return {

xinference 0.15.2__py3-none-any.whl → 0.15.4__py3-none-any.whl

Potentially problematic release.

xinference 0.15.2py3-none-any.whl → 0.15.4py3-none-any.whl