PyPI - vectoriz - Versions diffs - 0.0.4__tar.gz → 0.1.0b0__tar.gz - Mend

vectoriz 0.0.4tar.gz → 0.1.0b0tar.gz

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (16) hide show

{vectoriz-0.0.4 → vectoriz-0.1.0b0}/PKG-INFO RENAMED Viewed

@@ -1,6 +1,6 @@
 Metadata-Version: 2.4
 Name: vectoriz
-Version: 0.0.4
+Version: 0.1.0b0
 Summary: Python library for creating vectorized data from text or files.
 Home-page: https://github.com/PedroHenriqueDevBR/vectoriz
 Author: PedroHenriqueDevBR
@@ -25,6 +25,24 @@ Dynamic: summary
 # Vectoriz
+[![PyPI version](https://badge.fury.io/py/vectoriz.svg)](https://pypi.org/project/vectoriz/)
+[![GitHub license](https://img.shields.io/github/license/PedroHenriqueDevBR/vectoriz)](https://github.com/PedroHenriqueDevBR/vectoriz/blob/main/LICENSE)
+[![Python Version](https://img.shields.io/badge/python-3.12%2B-blue)](https://www.python.org/downloads/)
+[![GitHub issues](https://img.shields.io/github/issues/PedroHenriqueDevBR/vectoriz)](https://github.com/PedroHenriqueDevBR/vectoriz/issues)
+[![GitHub stars](https://img.shields.io/github/stars/PedroHenriqueDevBR/vectoriz)](https://github.com/PedroHenriqueDevBR/vectoriz/stargazers)
+[![GitHub forks](https://img.shields.io/github/forks/PedroHenriqueDevBR/vectoriz)](https://github.com/PedroHenriqueDevBR/vectoriz/network)
+Vectoriz is available on PyPI and can be installed via pip:
+```bash
+pip install vectoriz
+```
 A tool for generating vector embeddings for Retrieval-Augmented Generation (RAG) applications.
 ## Overview
@@ -63,7 +81,8 @@ files_features = FilesFeature()
 argument = files_features.load_all_files_from_directory(directory_path)
 # Created FAISS index to be used in queries
-index = transformer.create_index(argument.text_list)
+token_data = transformer.create_index(argument.text_list)
+index = token_data.index
 # To load files from VectorDB use
 vector_client = VectorDBClient()
@@ -74,6 +93,12 @@ argument = vector_client.file_argument
 # To save data on VectorDB use
 vector_client = VectorDBClient(index, argument)
 vector_client.save_data(index_db_path, np_db_path)
+# To search information on index
+query = input(">>> ")
+amoount_content = 1
+response = self.transformer.search(query, self.index, self.argument.text_list, amoount_content)
+print(response)
 ```
 ## Contributing

{vectoriz-0.0.4 → vectoriz-0.1.0b0}/README.md RENAMED Viewed

@@ -1,5 +1,23 @@
 # Vectoriz
+[![PyPI version](https://badge.fury.io/py/vectoriz.svg)](https://pypi.org/project/vectoriz/)
+[![GitHub license](https://img.shields.io/github/license/PedroHenriqueDevBR/vectoriz)](https://github.com/PedroHenriqueDevBR/vectoriz/blob/main/LICENSE)
+[![Python Version](https://img.shields.io/badge/python-3.12%2B-blue)](https://www.python.org/downloads/)
+[![GitHub issues](https://img.shields.io/github/issues/PedroHenriqueDevBR/vectoriz)](https://github.com/PedroHenriqueDevBR/vectoriz/issues)
+[![GitHub stars](https://img.shields.io/github/stars/PedroHenriqueDevBR/vectoriz)](https://github.com/PedroHenriqueDevBR/vectoriz/stargazers)
+[![GitHub forks](https://img.shields.io/github/forks/PedroHenriqueDevBR/vectoriz)](https://github.com/PedroHenriqueDevBR/vectoriz/network)
+Vectoriz is available on PyPI and can be installed via pip:
+```bash
+pip install vectoriz
+```
 A tool for generating vector embeddings for Retrieval-Augmented Generation (RAG) applications.
 ## Overview
@@ -38,7 +56,8 @@ files_features = FilesFeature()
 argument = files_features.load_all_files_from_directory(directory_path)
 # Created FAISS index to be used in queries
-index = transformer.create_index(argument.text_list)
+token_data = transformer.create_index(argument.text_list)
+index = token_data.index
 # To load files from VectorDB use
 vector_client = VectorDBClient()
@@ -49,6 +68,12 @@ argument = vector_client.file_argument
 # To save data on VectorDB use
 vector_client = VectorDBClient(index, argument)
 vector_client.save_data(index_db_path, np_db_path)
+# To search information on index
+query = input(">>> ")
+amoount_content = 1
+response = self.transformer.search(query, self.index, self.argument.text_list, amoount_content)
+print(response)
 ```
 ## Contributing

{vectoriz-0.0.4 → vectoriz-0.1.0b0}/setup.py RENAMED Viewed

@@ -2,7 +2,7 @@ from setuptools import setup, find_packages
 setup(
     name="vectoriz",
-    version="0.0.4",
+    version="0.1.0-beta",
     author="PedroHenriqueDevBR",
     author_email="pedro.henrique.particular@gmail.com",
     description="Python library for creating vectorized data from text or files.",

{vectoriz-0.0.4 → vectoriz-0.1.0b0}/vectoriz/files.py RENAMED Viewed

@@ -2,6 +2,7 @@ import os
 import docx
 import numpy as np
 from typing import Optional
 from vectoriz.token_transformer import TokenTransformer
 class FileArgument:

{vectoriz-0.0.4 → vectoriz-0.1.0b0}/vectoriz/token_transformer.py RENAMED Viewed

@@ -73,15 +73,16 @@ class TokenTransformer:
     def search(
         self,
         query: str,
-        data: TokenData,
+        index: faiss.IndexFlatL2,
+        texts: list[str],
         context_amount: int = 1,
     ) -> str:
         query_embedding = self._query_to_embeddings(query)
-        _, I = data.index.search(query_embedding, k=context_amount)
+        _, I = index.search(query_embedding, k=context_amount)
         context = ""
         for i in I[0]:
-            context += data.texts[i] + "\n"
+            context += texts[i] + "\n"
         return context.strip()

{vectoriz-0.0.4 → vectoriz-0.1.0b0}/vectoriz/vector_db.py RENAMED Viewed

@@ -54,15 +54,6 @@ class VectorDBClient:
 class VectorDB:
-    def __init__(self):
-        """
-        Constructor for the class.
-        Initializes the following attributes:
-        - transformer: A TokenTransformer instance for text transformation.
-        """
-        self.transformer = TokenTransformer()
     def load_saved_data(
         self, faiss_db_path: str, np_db_path: str
     ) -> Optional[VectorDBClient]:
@@ -158,13 +149,14 @@ class VectorDB:
             - 'chunk_names': The chunk names
             - 'texts': The text content
         """
+        transformer = TokenTransformer()
         np_db_path = np_db_path if np_db_path.endswith(".npz") else np_db_path + ".npz"
         embeddings_np: np.ndarray = None
         if argument.ndarray_data is not None:
             embeddings_np = argument.ndarray_data
         else:
-            embeddings_np = self.transformer.get_np_vectors(argument.embeddings)
+            embeddings_np = transformer.get_np_vectors(argument.embeddings)
         np.savez(
             np_db_path,

{vectoriz-0.0.4 → vectoriz-0.1.0b0}/vectoriz.egg-info/PKG-INFO RENAMED Viewed

@@ -1,6 +1,6 @@
 Metadata-Version: 2.4
 Name: vectoriz
-Version: 0.0.4
+Version: 0.1.0b0
 Summary: Python library for creating vectorized data from text or files.
 Home-page: https://github.com/PedroHenriqueDevBR/vectoriz
 Author: PedroHenriqueDevBR
@@ -25,6 +25,24 @@ Dynamic: summary
 # Vectoriz
+[![PyPI version](https://badge.fury.io/py/vectoriz.svg)](https://pypi.org/project/vectoriz/)
+[![GitHub license](https://img.shields.io/github/license/PedroHenriqueDevBR/vectoriz)](https://github.com/PedroHenriqueDevBR/vectoriz/blob/main/LICENSE)
+[![Python Version](https://img.shields.io/badge/python-3.12%2B-blue)](https://www.python.org/downloads/)
+[![GitHub issues](https://img.shields.io/github/issues/PedroHenriqueDevBR/vectoriz)](https://github.com/PedroHenriqueDevBR/vectoriz/issues)
+[![GitHub stars](https://img.shields.io/github/stars/PedroHenriqueDevBR/vectoriz)](https://github.com/PedroHenriqueDevBR/vectoriz/stargazers)
+[![GitHub forks](https://img.shields.io/github/forks/PedroHenriqueDevBR/vectoriz)](https://github.com/PedroHenriqueDevBR/vectoriz/network)
+Vectoriz is available on PyPI and can be installed via pip:
+```bash
+pip install vectoriz
+```
 A tool for generating vector embeddings for Retrieval-Augmented Generation (RAG) applications.
 ## Overview
@@ -63,7 +81,8 @@ files_features = FilesFeature()
 argument = files_features.load_all_files_from_directory(directory_path)
 # Created FAISS index to be used in queries
-index = transformer.create_index(argument.text_list)
+token_data = transformer.create_index(argument.text_list)
+index = token_data.index
 # To load files from VectorDB use
 vector_client = VectorDBClient()
@@ -74,6 +93,12 @@ argument = vector_client.file_argument
 # To save data on VectorDB use
 vector_client = VectorDBClient(index, argument)
 vector_client.save_data(index_db_path, np_db_path)
+# To search information on index
+query = input(">>> ")
+amoount_content = 1
+response = self.transformer.search(query, self.index, self.argument.text_list, amoount_content)
+print(response)
 ```
 ## Contributing