PyPI - ddi-fw - Versions diffs - 0.0.126__py3-none-any.whl → 0.0.128__py3-none-any.whl - Mend

ddi-fw 0.0.126py3-none-any.whl → 0.0.128py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (5) hide show

ddi_fw/langchain/storage.py CHANGED Viewed

@@ -137,20 +137,23 @@ class DataFrameToVectorDB:
                 total = 0
                 partial_dfs = split_dataframe(col_df, min_size=partial_df_size)
                 for partial_df in partial_dfs:
-                    import torch
+                    # import torch
                     documents = []
                     loader = DataFrameLoader(
                         data_frame=partial_df, page_content_column=page_content_column)
                     loaded_docs = loader.load()
                     # print(loaded_docs)
-                    # documents.extend(self.__split_docs(loaded_docs))
+                    documents.extend(self.__split_docs(loaded_docs))
+                    split_docs_chunked = self.__split_list(
+                        documents, self.batch_size)
+                    for split_docs_chunk in split_docs_chunked:
+                        print("entered chunks")
+                        self.vectordb.add_documents(loaded_docs)
+                        self.vectordb.persist()
                     total += len(partial_df)
-                    self.vectordb.add_documents(loaded_docs)
-                    self.vectordb.persist()
                     print(f"{page_content_column}: {total}/{len(col_df)}")
-                    torch.cuda.empty_cache()
+                    # torch.cuda.empty_cache()
                     # time.sleep(30)  # The GPU will not be used during this period
                     # split_docs_chunked = self.__split_list(
@@ -171,8 +174,8 @@ class DataFrameToVectorDB:
                 split_docs_chunked = self.__split_list(
                     documents, self.batch_size)
                 for split_docs_chunk in split_docs_chunked:
-                    import torch
-                    torch.cuda.empty_cache()
+                    # import torch
+                    # torch.cuda.empty_cache()
                     self.vectordb.add_documents(split_docs_chunk)
                     self.vectordb.persist()
                     print(f"{page_content_column}, size:{len(split_docs_chunk)}")

{ddi_fw-0.0.126.dist-info → ddi_fw-0.0.128.dist-info}/METADATA RENAMED Viewed

@@ -1,6 +1,6 @@
 Metadata-Version: 2.1
 Name: ddi_fw
-Version: 0.0.126
+Version: 0.0.128
 Summary: Do not use :)
 Author-email: Kıvanç Bayraktar <bayraktarkivanc@gmail.com>
 Maintainer-email: Kıvanç Bayraktar <bayraktarkivanc@gmail.com>

{ddi_fw-0.0.126.dist-info → ddi_fw-0.0.128.dist-info}/RECORD RENAMED Viewed

@@ -58,7 +58,7 @@ ddi_fw/drugbank/event_extractor.py,sha256=6odoZohhK7OdLF-LF0l-5BFq0_NMG_5jrFJbHr
 ddi_fw/langchain/__init__.py,sha256=zS0CQrakWEP19biSRewFJGcBT8WBZq4899HrEKiMqUY,269
 ddi_fw/langchain/embeddings.py,sha256=lU64a5AZ62jP8U3hTSwK0kXt7gThbwPACLfJMZ1baPA,7538
 ddi_fw/langchain/sentence_splitter.py,sha256=h_bYElx4Ud1mwDNJfL7mUwvgadwKX3GKlSzu5L2PXzg,280
-ddi_fw/langchain/storage.py,sha256=INiAYeP714iyTLUj-aiyl7GM56qwdhpw6eVO81qbHFU,10918
+ddi_fw/langchain/storage.py,sha256=yElFDwLaz2g0dXVYtc_ANzGOzt5Xs4qGQAu59uhnLN4,11158
 ddi_fw/ml/__init__.py,sha256=tIxiW0g6q1VsmDYVXR_ovvHQR3SCir8g2bKxx_CrS7s,221
 ddi_fw/ml/evaluation_helper.py,sha256=o4-w5Xa3t4olLW4ymx_8L-Buhe5wfQEmT2bh4Zz544c,13066
 ddi_fw/ml/ml_helper.py,sha256=fySjIAFzkeEOvaLJhDwtCOgRhgYQ7H106eqaP16GhDY,4489
@@ -91,7 +91,7 @@ ddi_fw/utils/package_helper.py,sha256=erl8_onmhK-41zQoaED2qyDUV9GQxmT9sdoyRp9_q5
 ddi_fw/utils/py7zr_helper.py,sha256=gOqaFIyJvTjUM-btO2x9AQ69jZOS8PoKN0wetYIckJw,4747
 ddi_fw/utils/utils.py,sha256=szwnxMTDRrZoeNRyDuf3aCbtzriwtaRk4mHSH3asLdA,4301
 ddi_fw/utils/zip_helper.py,sha256=YRZA4tKZVBJwGQM0_WK6L-y5MoqkKoC-nXuuHK6CU9I,5567
-ddi_fw-0.0.126.dist-info/METADATA,sha256=gGpAp81CDpjQU_v_8zlSYN5oxe3a6DBzbXEZfFM4iOY,1965
-ddi_fw-0.0.126.dist-info/WHEEL,sha256=PZUExdf71Ui_so67QXpySuHtCi3-J3wvF4ORK6k_S8U,91
-ddi_fw-0.0.126.dist-info/top_level.txt,sha256=PMwHICFZTZtcpzQNPV4UQnfNXYIeLR_Ste-Wfc1h810,7
-ddi_fw-0.0.126.dist-info/RECORD,,
+ddi_fw-0.0.128.dist-info/METADATA,sha256=pwm1OITkNjTUEGoATkiYnfljebCP7sBSQXyuSxEwOLA,1965
+ddi_fw-0.0.128.dist-info/WHEEL,sha256=PZUExdf71Ui_so67QXpySuHtCi3-J3wvF4ORK6k_S8U,91
+ddi_fw-0.0.128.dist-info/top_level.txt,sha256=PMwHICFZTZtcpzQNPV4UQnfNXYIeLR_Ste-Wfc1h810,7
+ddi_fw-0.0.128.dist-info/RECORD,,

{ddi_fw-0.0.126.dist-info → ddi_fw-0.0.128.dist-info}/WHEEL RENAMED Viewed

File without changes

{ddi_fw-0.0.126.dist-info → ddi_fw-0.0.128.dist-info}/top_level.txt RENAMED Viewed

File without changes

ddi-fw 0.0.126__py3-none-any.whl → 0.0.128__py3-none-any.whl

ddi-fw 0.0.126py3-none-any.whl → 0.0.128py3-none-any.whl