PyPI - vectoriz - Versions diffs - 0.0.4__tar.gz → 0.0.5__tar.gz - Mend

vectoriz 0.0.4tar.gz → 0.0.5tar.gz

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (16) hide show

{vectoriz-0.0.4 → vectoriz-0.0.5}/PKG-INFO RENAMED Viewed

@@ -1,6 +1,6 @@
 Metadata-Version: 2.4
 Name: vectoriz
-Version: 0.0.4
+Version: 0.0.5
 Summary: Python library for creating vectorized data from text or files.
 Home-page: https://github.com/PedroHenriqueDevBR/vectoriz
 Author: PedroHenriqueDevBR
@@ -25,6 +25,24 @@ Dynamic: summary
 # Vectoriz
+[![PyPI version](https://badge.fury.io/py/vectoriz.svg)](https://pypi.org/project/vectoriz/)
+[![GitHub license](https://img.shields.io/github/license/PedroHenriqueDevBR/vectoriz)](https://github.com/PedroHenriqueDevBR/vectoriz/blob/main/LICENSE)
+[![Python Version](https://img.shields.io/badge/python-3.12%2B-blue)](https://www.python.org/downloads/)
+[![GitHub issues](https://img.shields.io/github/issues/PedroHenriqueDevBR/vectoriz)](https://github.com/PedroHenriqueDevBR/vectoriz/issues)
+[![GitHub stars](https://img.shields.io/github/stars/PedroHenriqueDevBR/vectoriz)](https://github.com/PedroHenriqueDevBR/vectoriz/stargazers)
+[![GitHub forks](https://img.shields.io/github/forks/PedroHenriqueDevBR/vectoriz)](https://github.com/PedroHenriqueDevBR/vectoriz/network)
+Vectoriz is available on PyPI and can be installed via pip:
+```bash
+pip install vectoriz
+```
 A tool for generating vector embeddings for Retrieval-Augmented Generation (RAG) applications.
 ## Overview
@@ -63,7 +81,8 @@ files_features = FilesFeature()
 argument = files_features.load_all_files_from_directory(directory_path)
 # Created FAISS index to be used in queries
-index = transformer.create_index(argument.text_list)
+token_data = transformer.create_index(argument.text_list)
+index = token_data.index
 # To load files from VectorDB use
 vector_client = VectorDBClient()
@@ -74,6 +93,12 @@ argument = vector_client.file_argument
 # To save data on VectorDB use
 vector_client = VectorDBClient(index, argument)
 vector_client.save_data(index_db_path, np_db_path)
+# To search information on index
+query = input(">>> ")
+amoount_content = 1
+response = self.transformer.search(query, self.index, self.argument.text_list, amoount_content)
+print(response)
 ```
 ## Contributing

{vectoriz-0.0.4 → vectoriz-0.0.5}/README.md RENAMED Viewed

@@ -1,5 +1,23 @@
 # Vectoriz
+[![PyPI version](https://badge.fury.io/py/vectoriz.svg)](https://pypi.org/project/vectoriz/)
+[![GitHub license](https://img.shields.io/github/license/PedroHenriqueDevBR/vectoriz)](https://github.com/PedroHenriqueDevBR/vectoriz/blob/main/LICENSE)
+[![Python Version](https://img.shields.io/badge/python-3.12%2B-blue)](https://www.python.org/downloads/)
+[![GitHub issues](https://img.shields.io/github/issues/PedroHenriqueDevBR/vectoriz)](https://github.com/PedroHenriqueDevBR/vectoriz/issues)
+[![GitHub stars](https://img.shields.io/github/stars/PedroHenriqueDevBR/vectoriz)](https://github.com/PedroHenriqueDevBR/vectoriz/stargazers)
+[![GitHub forks](https://img.shields.io/github/forks/PedroHenriqueDevBR/vectoriz)](https://github.com/PedroHenriqueDevBR/vectoriz/network)
+Vectoriz is available on PyPI and can be installed via pip:
+```bash
+pip install vectoriz
+```
 A tool for generating vector embeddings for Retrieval-Augmented Generation (RAG) applications.
 ## Overview
@@ -38,7 +56,8 @@ files_features = FilesFeature()
 argument = files_features.load_all_files_from_directory(directory_path)
 # Created FAISS index to be used in queries
-index = transformer.create_index(argument.text_list)
+token_data = transformer.create_index(argument.text_list)
+index = token_data.index
 # To load files from VectorDB use
 vector_client = VectorDBClient()
@@ -49,6 +68,12 @@ argument = vector_client.file_argument
 # To save data on VectorDB use
 vector_client = VectorDBClient(index, argument)
 vector_client.save_data(index_db_path, np_db_path)
+# To search information on index
+query = input(">>> ")
+amoount_content = 1
+response = self.transformer.search(query, self.index, self.argument.text_list, amoount_content)
+print(response)
 ```
 ## Contributing

{vectoriz-0.0.4 → vectoriz-0.0.5}/setup.py RENAMED Viewed

@@ -2,7 +2,7 @@ from setuptools import setup, find_packages
 setup(
     name="vectoriz",
-    version="0.0.4",
+    version="0.0.5",
     author="PedroHenriqueDevBR",
     author_email="pedro.henrique.particular@gmail.com",
     description="Python library for creating vectorized data from text or files.",

{vectoriz-0.0.4 → vectoriz-0.0.5}/vectoriz/files.py RENAMED Viewed

@@ -2,7 +2,7 @@ import os
 import docx
 import numpy as np
 from typing import Optional
-from vectoriz.token_transformer import TokenTransformer
+from token_transformer import TokenTransformer
 class FileArgument:
     def __init__(

{vectoriz-0.0.4 → vectoriz-0.0.5}/vectoriz/token_transformer.py RENAMED Viewed

@@ -73,15 +73,16 @@ class TokenTransformer:
     def search(
         self,
         query: str,
-        data: TokenData,
+        index: faiss.IndexFlatL2,
+        texts: list[str],
         context_amount: int = 1,
     ) -> str:
         query_embedding = self._query_to_embeddings(query)
-        _, I = data.index.search(query_embedding, k=context_amount)
+        _, I = index.search(query_embedding, k=context_amount)
         context = ""
         for i in I[0]:
-            context += data.texts[i] + "\n"
+            context += texts[i] + "\n"
         return context.strip()

{vectoriz-0.0.4 → vectoriz-0.0.5}/vectoriz/vector_db.py RENAMED Viewed

@@ -3,8 +3,8 @@ import faiss
 import numpy as np
 from typing import Optional
-from vectoriz.files import FileArgument
-from vectoriz.token_transformer import TokenTransformer
+from files import FileArgument
+from token_transformer import TokenTransformer
 class VectorDBClient:
@@ -54,15 +54,6 @@ class VectorDBClient:
 class VectorDB:
-    def __init__(self):
-        """
-        Constructor for the class.
-        Initializes the following attributes:
-        - transformer: A TokenTransformer instance for text transformation.
-        """
-        self.transformer = TokenTransformer()
     def load_saved_data(
         self, faiss_db_path: str, np_db_path: str
     ) -> Optional[VectorDBClient]:
@@ -158,13 +149,14 @@ class VectorDB:
             - 'chunk_names': The chunk names
             - 'texts': The text content
         """
+        transformer = TokenTransformer()
         np_db_path = np_db_path if np_db_path.endswith(".npz") else np_db_path + ".npz"
         embeddings_np: np.ndarray = None
         if argument.ndarray_data is not None:
             embeddings_np = argument.ndarray_data
         else:
-            embeddings_np = self.transformer.get_np_vectors(argument.embeddings)
+            embeddings_np = transformer.get_np_vectors(argument.embeddings)
         np.savez(
             np_db_path,

{vectoriz-0.0.4 → vectoriz-0.0.5}/vectoriz.egg-info/PKG-INFO RENAMED Viewed

@@ -1,6 +1,6 @@
 Metadata-Version: 2.4
 Name: vectoriz
-Version: 0.0.4
+Version: 0.0.5
 Summary: Python library for creating vectorized data from text or files.
 Home-page: https://github.com/PedroHenriqueDevBR/vectoriz
 Author: PedroHenriqueDevBR
@@ -25,6 +25,24 @@ Dynamic: summary
 # Vectoriz
+[![PyPI version](https://badge.fury.io/py/vectoriz.svg)](https://pypi.org/project/vectoriz/)
+[![GitHub license](https://img.shields.io/github/license/PedroHenriqueDevBR/vectoriz)](https://github.com/PedroHenriqueDevBR/vectoriz/blob/main/LICENSE)
+[![Python Version](https://img.shields.io/badge/python-3.12%2B-blue)](https://www.python.org/downloads/)
+[![GitHub issues](https://img.shields.io/github/issues/PedroHenriqueDevBR/vectoriz)](https://github.com/PedroHenriqueDevBR/vectoriz/issues)
+[![GitHub stars](https://img.shields.io/github/stars/PedroHenriqueDevBR/vectoriz)](https://github.com/PedroHenriqueDevBR/vectoriz/stargazers)
+[![GitHub forks](https://img.shields.io/github/forks/PedroHenriqueDevBR/vectoriz)](https://github.com/PedroHenriqueDevBR/vectoriz/network)
+Vectoriz is available on PyPI and can be installed via pip:
+```bash
+pip install vectoriz
+```
 A tool for generating vector embeddings for Retrieval-Augmented Generation (RAG) applications.
 ## Overview
@@ -63,7 +81,8 @@ files_features = FilesFeature()
 argument = files_features.load_all_files_from_directory(directory_path)
 # Created FAISS index to be used in queries
-index = transformer.create_index(argument.text_list)
+token_data = transformer.create_index(argument.text_list)
+index = token_data.index
 # To load files from VectorDB use
 vector_client = VectorDBClient()
@@ -74,6 +93,12 @@ argument = vector_client.file_argument
 # To save data on VectorDB use
 vector_client = VectorDBClient(index, argument)
 vector_client.save_data(index_db_path, np_db_path)
+# To search information on index
+query = input(">>> ")
+amoount_content = 1
+response = self.transformer.search(query, self.index, self.argument.text_list, amoount_content)
+print(response)
 ```
 ## Contributing