PyPI - langroid - Versions diffs - 0.1.239__py3-none-any.whl → 0.1.241__py3-none-any.whl - Mend

langroid 0.1.239py3-none-any.whl → 0.1.241py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (6) hide show

langroid/language_models/openai_gpt.py CHANGED Viewed

@@ -670,23 +670,26 @@ class OpenAIGPT(LanguageModel):
         sys.stdout.write(Colors().GREEN)
         sys.stdout.flush()
         has_function = False
-        for event in response:
-            (
-                is_break,
-                has_function,
-                function_name,
-                function_args,
-                completion,
-            ) = self._process_stream_event(
-                event,
-                chat=chat,
-                has_function=has_function,
-                completion=completion,
-                function_args=function_args,
-                function_name=function_name,
-            )
-            if is_break:
-                break
+        try:
+            for event in response:
+                (
+                    is_break,
+                    has_function,
+                    function_name,
+                    function_args,
+                    completion,
+                ) = self._process_stream_event(
+                    event,
+                    chat=chat,
+                    has_function=has_function,
+                    completion=completion,
+                    function_args=function_args,
+                    function_name=function_name,
+                )
+                if is_break:
+                    break
+        except Exception:
+            pass
         print("")
         # TODO- get usage info in stream mode (?)
@@ -722,23 +725,26 @@ class OpenAIGPT(LanguageModel):
         sys.stdout.write(Colors().GREEN)
         sys.stdout.flush()
         has_function = False
-        async for event in response:
-            (
-                is_break,
-                has_function,
-                function_name,
-                function_args,
-                completion,
-            ) = self._process_stream_event(
-                event,
-                chat=chat,
-                has_function=has_function,
-                completion=completion,
-                function_args=function_args,
-                function_name=function_name,
-            )
-            if is_break:
-                break
+        try:
+            async for event in response:
+                (
+                    is_break,
+                    has_function,
+                    function_name,
+                    function_args,
+                    completion,
+                ) = self._process_stream_event(
+                    event,
+                    chat=chat,
+                    has_function=has_function,
+                    completion=completion,
+                    function_args=function_args,
+                    function_name=function_name,
+                )
+                if is_break:
+                    break
+        except Exception:
+            pass
         print("")
         # TODO- get usage info in stream mode (?)

langroid/vector_store/qdrantdb.py CHANGED Viewed

@@ -3,7 +3,7 @@ import json
 import logging
 import os
 import uuid
-from typing import List, Optional, Sequence, Tuple, TypeVar
+from typing import Dict, List, Optional, Sequence, Tuple, TypeVar
 from dotenv import load_dotenv
 from qdrant_client import QdrantClient
@@ -13,7 +13,12 @@ from qdrant_client.http.models import (
     CollectionStatus,
     Distance,
     Filter,
-    SearchParams,
+    NamedSparseVector,
+    NamedVector,
+    SearchRequest,
+    SparseIndexParams,
+    SparseVector,
+    SparseVectorParams,
     VectorParams,
 )
@@ -22,7 +27,7 @@ from langroid.embedding_models.base import (
     EmbeddingModelsConfig,
 )
 from langroid.embedding_models.models import OpenAIEmbeddingsConfig
-from langroid.mytypes import Document, EmbeddingFunction
+from langroid.mytypes import Document, EmbeddingFunction, Embeddings
 from langroid.utils.configuration import settings
 from langroid.vector_store.base import VectorStore, VectorStoreConfig
@@ -62,15 +67,36 @@ class QdrantDBConfig(VectorStoreConfig):
     storage_path: str = ".qdrant/data"
     embedding: EmbeddingModelsConfig = OpenAIEmbeddingsConfig()
     distance: str = Distance.COSINE
+    use_sparse_embeddings: bool = False
+    sparse_embedding_model: str = ""
+    sparse_limit: int = 3
 class QdrantDB(VectorStore):
     def __init__(self, config: QdrantDBConfig = QdrantDBConfig()):
         super().__init__(config)
-        self.config = config
+        self.config: QdrantDBConfig = config
         emb_model = EmbeddingModel.create(config.embedding)
         self.embedding_fn: EmbeddingFunction = emb_model.embedding_fn()
         self.embedding_dim = emb_model.embedding_dims
+        if self.config.use_sparse_embeddings:
+            try:
+                from transformers import AutoModelForMaskedLM, AutoTokenizer
+            except ImportError:
+                raise ImportError(
+                    """
+                    To use sparse embeddings,
+                    you must install langroid with the [transformers] extra, e.g.:
+                    pip install "langroid[transformers]"
+                    """
+                )
+            self.sparse_tokenizer = AutoTokenizer.from_pretrained(
+                self.config.sparse_embedding_model
+            )
+            self.sparse_model = AutoModelForMaskedLM.from_pretrained(
+                self.config.sparse_embedding_model
+            )
         self.host = config.host
         self.port = config.port
         load_dotenv()
@@ -205,12 +231,22 @@ class QdrantDB(VectorStore):
                 else:
                     logger.warning("Recreating fresh collection")
             self.client.delete_collection(collection_name=collection_name)
-        self.client.create_collection(
-            collection_name=collection_name,
-            vectors_config=VectorParams(
+        vectors_config = {
+            "": VectorParams(
                 size=self.embedding_dim,
                 distance=Distance.COSINE,
-            ),
+            )
+        }
+        sparse_vectors_config = None
+        if self.config.use_sparse_embeddings:
+            sparse_vectors_config = {
+                "text-sparse": SparseVectorParams(index=SparseIndexParams())
+            }
+        self.client.create_collection(
+            collection_name=collection_name,
+            vectors_config=vectors_config,
+            sparse_vectors_config=sparse_vectors_config,
         )
         collection_info = self.client.get_collection(collection_name=collection_name)
         assert collection_info.status == CollectionStatus.GREEN
@@ -221,6 +257,32 @@ class QdrantDB(VectorStore):
             logger.info(collection_info)
             logger.setLevel(level)
+    def get_sparse_embeddings(self, inputs: List[str]) -> List[SparseVector]:
+        if not self.config.use_sparse_embeddings:
+            return []
+        import torch
+        tokens = self.sparse_tokenizer(
+            inputs, return_tensors="pt", truncation=True, padding=True
+        )
+        output = self.sparse_model(**tokens)
+        vectors = torch.max(
+            torch.log(torch.relu(output.logits) + torch.tensor(1.0))
+            * tokens.attention_mask.unsqueeze(-1),
+            dim=1,
+        )[0].squeeze(dim=1)
+        sparse_embeddings = []
+        for vec in vectors:
+            cols = vec.nonzero().squeeze().cpu().tolist()
+            weights = vec[cols].cpu().tolist()
+            sparse_embeddings.append(
+                SparseVector(
+                    indices=cols,
+                    values=weights,
+                )
+            )
+        return sparse_embeddings
     def add_documents(self, documents: Sequence[Document]) -> None:
         # Add id to metadata if not already present
         super().maybe_add_ids(documents)
@@ -232,6 +294,9 @@ class QdrantDB(VectorStore):
             return
         document_dicts = [doc.dict() for doc in documents]
         embedding_vecs = self.embedding_fn([doc.content for doc in documents])
+        sparse_embedding_vecs = self.get_sparse_embeddings(
+            [doc.content for doc in documents]
+        )
         if self.config.collection_name is None:
             raise ValueError("No collection name set, cannot ingest docs")
         if self.config.collection_name not in colls:
@@ -241,11 +306,16 @@ class QdrantDB(VectorStore):
         # else we get an API error
         b = self.config.batch_size
         for i in range(0, len(ids), b):
+            vectors: Dict[str, Embeddings | List[SparseVector]] = {
+                "": embedding_vecs[i : i + b]
+            }
+            if self.config.use_sparse_embeddings:
+                vectors["text-sparse"] = sparse_embedding_vecs[i : i + b]
             self.client.upsert(
                 collection_name=self.config.collection_name,
                 points=Batch(
                     ids=ids[i : i + b],
-                    vectors=embedding_vecs[i : i + b],
+                    vectors=vectors,
                     payloads=document_dicts[i : i + b],
                 ),
             )
@@ -332,18 +402,39 @@ class QdrantDB(VectorStore):
             filter = Filter()
         else:
             filter = Filter.parse_obj(json.loads(where))
+        requests = [
+            SearchRequest(
+                vector=NamedVector(
+                    name="",
+                    vector=embedding,
+                ),
+                limit=k,
+                with_payload=True,
+                filter=filter,
+            )
+        ]
+        if self.config.use_sparse_embeddings:
+            sparse_embedding = self.get_sparse_embeddings([text])[0]
+            requests.append(
+                SearchRequest(
+                    vector=NamedSparseVector(
+                        name="text-sparse",
+                        vector=sparse_embedding,
+                    ),
+                    limit=self.config.sparse_limit,
+                    with_payload=True,
+                    filter=filter,
+                )
+            )
         if self.config.collection_name is None:
             raise ValueError("No collection name set, cannot search")
-        search_result: List[ScoredPoint] = self.client.search(
-            collection_name=self.config.collection_name,
-            query_vector=embedding,
-            query_filter=filter,
-            limit=k,
-            search_params=SearchParams(
-                hnsw_ef=128,
-                exact=False,  # use Apx NN, not exact NN
-            ),
+        search_result_lists: List[List[ScoredPoint]] = self.client.search_batch(
+            collection_name=self.config.collection_name, requests=requests
         )
+        search_result = [
+            match for result in search_result_lists for match in result
+        ]  # 2D list -> 1D list
         scores = [match.score for match in search_result if match is not None]
         docs = [
             Document(**(match.payload))  # type: ignore

{langroid-0.1.239.dist-info → langroid-0.1.241.dist-info}/METADATA RENAMED Viewed

@@ -1,6 +1,6 @@
 Metadata-Version: 2.1
 Name: langroid
-Version: 0.1.239
+Version: 0.1.241
 Summary: Harness LLMs with Multi-Agent Programming
 License: MIT
 Author: Prasad Chalasani
@@ -36,6 +36,7 @@ Requires-Dist: fakeredis (>=2.12.1,<3.0.0)
 Requires-Dist: fire (>=0.5.0,<0.6.0)
 Requires-Dist: flake8 (>=6.0.0,<7.0.0)
 Requires-Dist: google-api-python-client (>=2.95.0,<3.0.0)
+Requires-Dist: google-generativeai (>=0.5.2,<0.6.0)
 Requires-Dist: groq (>=0.5.0,<0.6.0)
 Requires-Dist: grpcio (>=1.62.1,<2.0.0)
 Requires-Dist: halo (>=0.0.31,<0.0.32)
@@ -99,8 +100,9 @@ Requires-Dist: sqlalchemy (>=2.0.19,<3.0.0)
 Requires-Dist: tantivy (>=0.21.0,<0.22.0)
 Requires-Dist: thefuzz (>=0.20.0,<0.21.0)
 Requires-Dist: tiktoken (>=0.5.1,<0.6.0)
-Requires-Dist: torch (==2.0.0) ; extra == "hf-embeddings"
+Requires-Dist: torch (==2.0.0) ; extra == "hf-embeddings" or extra == "transformers"
 Requires-Dist: trafilatura (>=1.5.0,<2.0.0)
+Requires-Dist: transformers (>=4.40.1,<5.0.0) ; extra == "transformers"
 Requires-Dist: typer (>=0.9.0,<0.10.0)
 Requires-Dist: types-pillow (>=10.2.0.20240406,<11.0.0.0)
 Requires-Dist: types-pyyaml (>=6.0.12.20240311,<7.0.0.0)

{langroid-0.1.239.dist-info → langroid-0.1.241.dist-info}/RECORD RENAMED Viewed

@@ -63,7 +63,7 @@ langroid/language_models/azure_openai.py,sha256=ncRCbKooqLVOY-PWQUIo9C3yTuKEFbAw
 langroid/language_models/base.py,sha256=B6dX43ZR65mIvjD95W4RcfpT-WpmiuEcstR3eMrr56Y,21029
 langroid/language_models/config.py,sha256=5UF3DzO1a-Dfsc3vghE0XGq7g9t_xDsRCsuRiU4dgBg,366
 langroid/language_models/openai_assistants.py,sha256=9K-DEAL2aSWHeXj2hwCo2RAlK9_1oCPtqX2u1wISCj8,36
-langroid/language_models/openai_gpt.py,sha256=BOZt2lOFViN3ct-jvfELRKeUkUaBOGhGxO7F6JQNCNY,50257
+langroid/language_models/openai_gpt.py,sha256=ueB9MJzxGBIjN_i22v2ZqoWo_twnQan_s4p0dzf4zzI,50505
 langroid/language_models/prompt_formatter/__init__.py,sha256=9JXFF22QNMmbQV1q4nrIeQVTtA3Tx8tEZABLtLBdFyc,352
 langroid/language_models/prompt_formatter/base.py,sha256=eDS1sgRNZVnoajwV_ZIha6cba5Dt8xjgzdRbPITwx3Q,1221
 langroid/language_models/prompt_formatter/hf_formatter.py,sha256=TFL6ppmeQWnzr6CKQzRZFYY810zE1mr8DZnhw6i85ok,5217
@@ -120,8 +120,8 @@ langroid/vector_store/lancedb.py,sha256=lbl8wZuV6GNw0LnIwOSriSNwoMEba90umQTcQHtM
 langroid/vector_store/meilisearch.py,sha256=d2huA9P-NoYRuAQ9ZeXJmMKr7ry8u90RUSR28k2ecQg,11340
 langroid/vector_store/momento.py,sha256=9cui31TTrILid2KIzUpBkN2Ey3g_CZWOQVdaFsA4Ors,10045
 langroid/vector_store/qdrant_cloud.py,sha256=3im4Mip0QXLkR6wiqVsjV1QvhSElfxdFSuDKddBDQ-4,188
-langroid/vector_store/qdrantdb.py,sha256=foKRxRv0BBony6S4Vt0Vav9Rn9HMxZvcIh1cE7nosFE,13524
-langroid-0.1.239.dist-info/LICENSE,sha256=EgVbvA6VSYgUlvC3RvPKehSg7MFaxWDsFuzLOsPPfJg,1065
-langroid-0.1.239.dist-info/METADATA,sha256=OqbY4y93jSmtPY7XjpgI_VLm3G6tromEe-MmtKMsDVE,49012
-langroid-0.1.239.dist-info/WHEEL,sha256=FMvqSimYX_P7y0a7UY-_Mc83r5zkBZsCYPm7Lr0Bsq4,88
-langroid-0.1.239.dist-info/RECORD,,
+langroid/vector_store/qdrantdb.py,sha256=sk5Qb2ZNbooi0rorsMuqIMokF7WADw6PJ0D6goM2XBw,16802
+langroid-0.1.241.dist-info/LICENSE,sha256=EgVbvA6VSYgUlvC3RvPKehSg7MFaxWDsFuzLOsPPfJg,1065
+langroid-0.1.241.dist-info/METADATA,sha256=3-gQbFV94rqEec_esydP028p-Ol3w2J9mbrcupeq0Xg,49163
+langroid-0.1.241.dist-info/WHEEL,sha256=FMvqSimYX_P7y0a7UY-_Mc83r5zkBZsCYPm7Lr0Bsq4,88
+langroid-0.1.241.dist-info/RECORD,,

{langroid-0.1.239.dist-info → langroid-0.1.241.dist-info}/LICENSE RENAMED Viewed

File without changes

{langroid-0.1.239.dist-info → langroid-0.1.241.dist-info}/WHEEL RENAMED Viewed

File without changes

langroid 0.1.239__py3-none-any.whl → 0.1.241__py3-none-any.whl

langroid 0.1.239py3-none-any.whl → 0.1.241py3-none-any.whl