PyPI - xinference - Versions diffs - 0.9.4__py3-none-any.whl → 0.10.1__py3-none-any.whl - Mend - Supply Chain Defender

xinference 0.9.4py3-none-any.whl → 0.10.1py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Potentially problematic release.

This version of xinference might be problematic. Click here for more details.

Files changed (103) hide show

{xinference-0.9.4.dist-info → xinference-0.10.1.dist-info}/METADATA RENAMED Viewed

@@ -1,6 +1,6 @@
 Metadata-Version: 2.1
 Name: xinference
-Version: 0.9.4
+Version: 0.10.1
 Summary: Model Serving Made Easy
 Home-page: https://github.com/xorbitsai/inference
 Author: Qin Xuye
@@ -22,6 +22,7 @@ License-File: LICENSE
 Requires-Dist: xoscar >=0.3.0
 Requires-Dist: torch
 Requires-Dist: gradio >=3.39.0
+Requires-Dist: typer[all] <0.12.0
 Requires-Dist: pillow
 Requires-Dist: click
 Requires-Dist: tqdm >=4.27
@@ -43,12 +44,14 @@ Requires-Dist: aioprometheus[starlette] >=23.12.0
 Requires-Dist: pynvml
 Requires-Dist: async-timeout
 Requires-Dist: peft
+Requires-Dist: timm
+Requires-Dist: opencv-contrib-python
 Provides-Extra: all
 Requires-Dist: chatglm-cpp >=0.3.0 ; extra == 'all'
-Requires-Dist: llama-cpp-python >=0.2.25 ; extra == 'all'
+Requires-Dist: llama-cpp-python !=0.2.58,>=0.2.25 ; extra == 'all'
 Requires-Dist: transformers >=4.34.1 ; extra == 'all'
 Requires-Dist: torch ; extra == 'all'
-Requires-Dist: accelerate >=0.20.3 ; extra == 'all'
+Requires-Dist: accelerate >=0.27.2 ; extra == 'all'
 Requires-Dist: sentencepiece ; extra == 'all'
 Requires-Dist: transformers-stream-generator ; extra == 'all'
 Requires-Dist: bitsandbytes ; extra == 'all'
@@ -60,7 +63,12 @@ Requires-Dist: diffusers ; extra == 'all'
 Requires-Dist: controlnet-aux ; extra == 'all'
 Requires-Dist: orjson ; extra == 'all'
 Requires-Dist: optimum ; extra == 'all'
+Requires-Dist: outlines ==0.0.34 ; extra == 'all'
+Requires-Dist: attrdict ; extra == 'all'
+Requires-Dist: timm >=0.9.16 ; extra == 'all'
+Requires-Dist: torchvision ; extra == 'all'
 Requires-Dist: auto-gptq ; (sys_platform != "darwin") and extra == 'all'
+Requires-Dist: autoawq ; (sys_platform != "darwin") and extra == 'all'
 Requires-Dist: vllm >=0.2.6 ; (sys_platform == "linux") and extra == 'all'
 Requires-Dist: sglang[all] ; (sys_platform == "linux") and extra == 'all'
 Provides-Extra: benchmark
@@ -81,7 +89,7 @@ Requires-Dist: jieba >=0.42.0 ; extra == 'dev'
 Requires-Dist: flake8 >=3.8.0 ; extra == 'dev'
 Requires-Dist: black ; extra == 'dev'
 Requires-Dist: openai >1 ; extra == 'dev'
-Requires-Dist: opencv-python ; extra == 'dev'
+Requires-Dist: opencv-contrib-python ; extra == 'dev'
 Requires-Dist: langchain ; extra == 'dev'
 Requires-Dist: orjson ; extra == 'dev'
 Requires-Dist: sphinx-tabs ; extra == 'dev'
@@ -94,11 +102,12 @@ Requires-Dist: sphinx-intl >=0.9.9 ; extra == 'doc'
 Requires-Dist: sphinx-tabs ; extra == 'doc'
 Requires-Dist: sphinx-design ; extra == 'doc'
 Requires-Dist: prometheus-client ; extra == 'doc'
+Requires-Dist: timm ; extra == 'doc'
+Requires-Dist: opencv-contrib-python ; extra == 'doc'
 Provides-Extra: embedding
 Requires-Dist: sentence-transformers >=2.3.1 ; extra == 'embedding'
 Provides-Extra: ggml
-Requires-Dist: llama-cpp-python >=0.2.25 ; extra == 'ggml'
-Requires-Dist: ctransformers ; extra == 'ggml'
+Requires-Dist: llama-cpp-python !=0.2.58,>=0.2.25 ; extra == 'ggml'
 Requires-Dist: chatglm-cpp >=0.3.0 ; extra == 'ggml'
 Provides-Extra: image
 Requires-Dist: diffusers ; extra == 'image'
@@ -111,7 +120,7 @@ Requires-Dist: sglang[all] ; extra == 'sglang'
 Provides-Extra: transformers
 Requires-Dist: transformers >=4.34.1 ; extra == 'transformers'
 Requires-Dist: torch ; extra == 'transformers'
-Requires-Dist: accelerate >=0.20.3 ; extra == 'transformers'
+Requires-Dist: accelerate >=0.27.2 ; extra == 'transformers'
 Requires-Dist: sentencepiece ; extra == 'transformers'
 Requires-Dist: transformers-stream-generator ; extra == 'transformers'
 Requires-Dist: bitsandbytes ; extra == 'transformers'
@@ -119,7 +128,11 @@ Requires-Dist: protobuf ; extra == 'transformers'
 Requires-Dist: einops ; extra == 'transformers'
 Requires-Dist: tiktoken ; extra == 'transformers'
 Requires-Dist: auto-gptq ; extra == 'transformers'
+Requires-Dist: autoawq ; extra == 'transformers'
 Requires-Dist: optimum ; extra == 'transformers'
+Requires-Dist: attrdict ; extra == 'transformers'
+Requires-Dist: timm >=0.9.16 ; extra == 'transformers'
+Requires-Dist: torchvision ; extra == 'transformers'
 Requires-Dist: peft ; extra == 'transformers'
 Provides-Extra: vllm
 Requires-Dist: vllm >=0.2.6 ; extra == 'vllm'
@@ -152,20 +165,20 @@ potential of cutting-edge AI models.
 ## 🔥 Hot Topics
 ### Framework Enhancements
+- Support specifying worker and GPU indexes for launching models: [#1195](https://github.com/xorbitsai/inference/pull/1195)
+- Support SGLang backend: [#1161](https://github.com/xorbitsai/inference/pull/1161)
 - Support LoRA for LLM and image models: [#1080](https://github.com/xorbitsai/inference/pull/1080)
 - Support speech recognition model: [#929](https://github.com/xorbitsai/inference/pull/929)
 - Metrics support: [#906](https://github.com/xorbitsai/inference/pull/906)
 - Docker image: [#855](https://github.com/xorbitsai/inference/pull/855)
 - Support multimodal: [#829](https://github.com/xorbitsai/inference/pull/829)
-- Auto recover: [#694](https://github.com/xorbitsai/inference/pull/694)
-- Function calling API: [#701](https://github.com/xorbitsai/inference/pull/701), here's example: https://github.com/xorbitsai/inference/blob/main/examples/FunctionCall.ipynb
 ### New Models
+- Built-in support for [Qwen1.5 MOE](https://huggingface.co/Qwen/Qwen1.5-MoE-A2.7B-Chat): [#1263](https://github.com/xorbitsai/inference/pull/1263)
+- Built-in support for [Qwen1.5 32B](https://huggingface.co/Qwen/Qwen1.5-32B-Chat): [#1249](https://github.com/xorbitsai/inference/pull/1249)
+- Built-in support for [OmniLMM](https://github.com/OpenBMB/OmniLMM): [#1171](https://github.com/xorbitsai/inference/pull/1171)
 - Built-in support for [Gemma](https://github.com/google-deepmind/gemma): [#1024](https://github.com/xorbitsai/inference/pull/1024)
 - Built-in support for [Qwen1.5](https://github.com/QwenLM/Qwen1.5): [#994](https://github.com/xorbitsai/inference/pull/994)
 - Built-in support for [Yi-VL](https://github.com/01-ai/Yi): [#946](https://github.com/xorbitsai/inference/pull/946)
-- Built-in support for [Whisper](https://github.com/openai/whisper): [#929](https://github.com/xorbitsai/inference/pull/929)
-- Built-in support for [Orion-chat](https://huggingface.co/OrionStarAI): [#933](https://github.com/xorbitsai/inference/pull/933)
-- Built-in support for [InternLM2-chat](https://huggingface.co/internlm/internlm2-chat-7b): [#829](https://github.com/xorbitsai/inference/pull/913)
 ### Integrations
 - [Dify](https://docs.dify.ai/advanced/model-configuration/xinference): an LLMOps platform that enables developers (and even non-developers) to quickly build useful applications based on large language models, ensuring they are visual, operable, and improvable.
 - [Chatbox](https://chatboxai.app/): a desktop client for multiple cutting-edge LLM models, available on Windows, Mac and Linux.