ddi-fw 0.0.233__tar.gz → 0.0.234__tar.gz

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.
Files changed (112) hide show
  1. {ddi_fw-0.0.233 → ddi_fw-0.0.234}/PKG-INFO +1 -1
  2. {ddi_fw-0.0.233 → ddi_fw-0.0.234}/pyproject.toml +1 -1
  3. {ddi_fw-0.0.233 → ddi_fw-0.0.234}/src/ddi_fw/vectorization/feature_vector_generation.py +40 -2
  4. {ddi_fw-0.0.233 → ddi_fw-0.0.234}/src/ddi_fw.egg-info/PKG-INFO +1 -1
  5. {ddi_fw-0.0.233 → ddi_fw-0.0.234}/README.md +0 -0
  6. {ddi_fw-0.0.233 → ddi_fw-0.0.234}/setup.cfg +0 -0
  7. {ddi_fw-0.0.233 → ddi_fw-0.0.234}/src/ddi_fw/datasets/__init__.py +0 -0
  8. {ddi_fw-0.0.233 → ddi_fw-0.0.234}/src/ddi_fw/datasets/core.py +0 -0
  9. {ddi_fw-0.0.233 → ddi_fw-0.0.234}/src/ddi_fw/datasets/dataset_splitter.py +0 -0
  10. {ddi_fw-0.0.233 → ddi_fw-0.0.234}/src/ddi_fw/datasets/db_utils.py +0 -0
  11. {ddi_fw-0.0.233 → ddi_fw-0.0.234}/src/ddi_fw/datasets/ddi_mdl/base.py +0 -0
  12. {ddi_fw-0.0.233 → ddi_fw-0.0.234}/src/ddi_fw/datasets/ddi_mdl/data/event.db +0 -0
  13. {ddi_fw-0.0.233 → ddi_fw-0.0.234}/src/ddi_fw/datasets/ddi_mdl/debug.log +0 -0
  14. {ddi_fw-0.0.233 → ddi_fw-0.0.234}/src/ddi_fw/datasets/ddi_mdl/indexes/test_indexes.txt +0 -0
  15. {ddi_fw-0.0.233 → ddi_fw-0.0.234}/src/ddi_fw/datasets/ddi_mdl/indexes/train_fold_0.txt +0 -0
  16. {ddi_fw-0.0.233 → ddi_fw-0.0.234}/src/ddi_fw/datasets/ddi_mdl/indexes/train_fold_1.txt +0 -0
  17. {ddi_fw-0.0.233 → ddi_fw-0.0.234}/src/ddi_fw/datasets/ddi_mdl/indexes/train_fold_2.txt +0 -0
  18. {ddi_fw-0.0.233 → ddi_fw-0.0.234}/src/ddi_fw/datasets/ddi_mdl/indexes/train_fold_3.txt +0 -0
  19. {ddi_fw-0.0.233 → ddi_fw-0.0.234}/src/ddi_fw/datasets/ddi_mdl/indexes/train_fold_4.txt +0 -0
  20. {ddi_fw-0.0.233 → ddi_fw-0.0.234}/src/ddi_fw/datasets/ddi_mdl/indexes/train_indexes.txt +0 -0
  21. {ddi_fw-0.0.233 → ddi_fw-0.0.234}/src/ddi_fw/datasets/ddi_mdl/indexes/validation_fold_0.txt +0 -0
  22. {ddi_fw-0.0.233 → ddi_fw-0.0.234}/src/ddi_fw/datasets/ddi_mdl/indexes/validation_fold_1.txt +0 -0
  23. {ddi_fw-0.0.233 → ddi_fw-0.0.234}/src/ddi_fw/datasets/ddi_mdl/indexes/validation_fold_2.txt +0 -0
  24. {ddi_fw-0.0.233 → ddi_fw-0.0.234}/src/ddi_fw/datasets/ddi_mdl/indexes/validation_fold_3.txt +0 -0
  25. {ddi_fw-0.0.233 → ddi_fw-0.0.234}/src/ddi_fw/datasets/ddi_mdl/indexes/validation_fold_4.txt +0 -0
  26. {ddi_fw-0.0.233 → ddi_fw-0.0.234}/src/ddi_fw/datasets/ddi_mdl/indexes_old/test_indexes.txt +0 -0
  27. {ddi_fw-0.0.233 → ddi_fw-0.0.234}/src/ddi_fw/datasets/ddi_mdl/indexes_old/train_fold_0.txt +0 -0
  28. {ddi_fw-0.0.233 → ddi_fw-0.0.234}/src/ddi_fw/datasets/ddi_mdl/indexes_old/train_fold_1.txt +0 -0
  29. {ddi_fw-0.0.233 → ddi_fw-0.0.234}/src/ddi_fw/datasets/ddi_mdl/indexes_old/train_fold_2.txt +0 -0
  30. {ddi_fw-0.0.233 → ddi_fw-0.0.234}/src/ddi_fw/datasets/ddi_mdl/indexes_old/train_fold_3.txt +0 -0
  31. {ddi_fw-0.0.233 → ddi_fw-0.0.234}/src/ddi_fw/datasets/ddi_mdl/indexes_old/train_fold_4.txt +0 -0
  32. {ddi_fw-0.0.233 → ddi_fw-0.0.234}/src/ddi_fw/datasets/ddi_mdl/indexes_old/train_indexes.txt +0 -0
  33. {ddi_fw-0.0.233 → ddi_fw-0.0.234}/src/ddi_fw/datasets/ddi_mdl/indexes_old/validation_fold_0.txt +0 -0
  34. {ddi_fw-0.0.233 → ddi_fw-0.0.234}/src/ddi_fw/datasets/ddi_mdl/indexes_old/validation_fold_1.txt +0 -0
  35. {ddi_fw-0.0.233 → ddi_fw-0.0.234}/src/ddi_fw/datasets/ddi_mdl/indexes_old/validation_fold_2.txt +0 -0
  36. {ddi_fw-0.0.233 → ddi_fw-0.0.234}/src/ddi_fw/datasets/ddi_mdl/indexes_old/validation_fold_3.txt +0 -0
  37. {ddi_fw-0.0.233 → ddi_fw-0.0.234}/src/ddi_fw/datasets/ddi_mdl/indexes_old/validation_fold_4.txt +0 -0
  38. {ddi_fw-0.0.233 → ddi_fw-0.0.234}/src/ddi_fw/datasets/ddi_mdl/readme.md +0 -0
  39. {ddi_fw-0.0.233 → ddi_fw-0.0.234}/src/ddi_fw/datasets/ddi_mdl_text/base.py +0 -0
  40. {ddi_fw-0.0.233 → ddi_fw-0.0.234}/src/ddi_fw/datasets/ddi_mdl_text/data/event.db +0 -0
  41. {ddi_fw-0.0.233 → ddi_fw-0.0.234}/src/ddi_fw/datasets/ddi_mdl_text/indexes/test_indexes.txt +0 -0
  42. {ddi_fw-0.0.233 → ddi_fw-0.0.234}/src/ddi_fw/datasets/ddi_mdl_text/indexes/train_fold_0.txt +0 -0
  43. {ddi_fw-0.0.233 → ddi_fw-0.0.234}/src/ddi_fw/datasets/ddi_mdl_text/indexes/train_fold_1.txt +0 -0
  44. {ddi_fw-0.0.233 → ddi_fw-0.0.234}/src/ddi_fw/datasets/ddi_mdl_text/indexes/train_fold_2.txt +0 -0
  45. {ddi_fw-0.0.233 → ddi_fw-0.0.234}/src/ddi_fw/datasets/ddi_mdl_text/indexes/train_fold_3.txt +0 -0
  46. {ddi_fw-0.0.233 → ddi_fw-0.0.234}/src/ddi_fw/datasets/ddi_mdl_text/indexes/train_fold_4.txt +0 -0
  47. {ddi_fw-0.0.233 → ddi_fw-0.0.234}/src/ddi_fw/datasets/ddi_mdl_text/indexes/train_indexes.txt +0 -0
  48. {ddi_fw-0.0.233 → ddi_fw-0.0.234}/src/ddi_fw/datasets/ddi_mdl_text/indexes/validation_fold_0.txt +0 -0
  49. {ddi_fw-0.0.233 → ddi_fw-0.0.234}/src/ddi_fw/datasets/ddi_mdl_text/indexes/validation_fold_1.txt +0 -0
  50. {ddi_fw-0.0.233 → ddi_fw-0.0.234}/src/ddi_fw/datasets/ddi_mdl_text/indexes/validation_fold_2.txt +0 -0
  51. {ddi_fw-0.0.233 → ddi_fw-0.0.234}/src/ddi_fw/datasets/ddi_mdl_text/indexes/validation_fold_3.txt +0 -0
  52. {ddi_fw-0.0.233 → ddi_fw-0.0.234}/src/ddi_fw/datasets/ddi_mdl_text/indexes/validation_fold_4.txt +0 -0
  53. {ddi_fw-0.0.233 → ddi_fw-0.0.234}/src/ddi_fw/datasets/mdf_sa_ddi/__init__.py +0 -0
  54. {ddi_fw-0.0.233 → ddi_fw-0.0.234}/src/ddi_fw/datasets/mdf_sa_ddi/base.py +0 -0
  55. {ddi_fw-0.0.233 → ddi_fw-0.0.234}/src/ddi_fw/datasets/mdf_sa_ddi/df_extraction_cleanxiaoyu50.csv +0 -0
  56. {ddi_fw-0.0.233 → ddi_fw-0.0.234}/src/ddi_fw/datasets/mdf_sa_ddi/drug_information_del_noDDIxiaoyu50.csv +0 -0
  57. {ddi_fw-0.0.233 → ddi_fw-0.0.234}/src/ddi_fw/datasets/mdf_sa_ddi/indexes/test_indexes.txt +0 -0
  58. {ddi_fw-0.0.233 → ddi_fw-0.0.234}/src/ddi_fw/datasets/mdf_sa_ddi/indexes/train_fold_0.txt +0 -0
  59. {ddi_fw-0.0.233 → ddi_fw-0.0.234}/src/ddi_fw/datasets/mdf_sa_ddi/indexes/train_fold_1.txt +0 -0
  60. {ddi_fw-0.0.233 → ddi_fw-0.0.234}/src/ddi_fw/datasets/mdf_sa_ddi/indexes/train_fold_2.txt +0 -0
  61. {ddi_fw-0.0.233 → ddi_fw-0.0.234}/src/ddi_fw/datasets/mdf_sa_ddi/indexes/train_fold_3.txt +0 -0
  62. {ddi_fw-0.0.233 → ddi_fw-0.0.234}/src/ddi_fw/datasets/mdf_sa_ddi/indexes/train_fold_4.txt +0 -0
  63. {ddi_fw-0.0.233 → ddi_fw-0.0.234}/src/ddi_fw/datasets/mdf_sa_ddi/indexes/train_indexes.txt +0 -0
  64. {ddi_fw-0.0.233 → ddi_fw-0.0.234}/src/ddi_fw/datasets/mdf_sa_ddi/indexes/validation_fold_0.txt +0 -0
  65. {ddi_fw-0.0.233 → ddi_fw-0.0.234}/src/ddi_fw/datasets/mdf_sa_ddi/indexes/validation_fold_1.txt +0 -0
  66. {ddi_fw-0.0.233 → ddi_fw-0.0.234}/src/ddi_fw/datasets/mdf_sa_ddi/indexes/validation_fold_2.txt +0 -0
  67. {ddi_fw-0.0.233 → ddi_fw-0.0.234}/src/ddi_fw/datasets/mdf_sa_ddi/indexes/validation_fold_3.txt +0 -0
  68. {ddi_fw-0.0.233 → ddi_fw-0.0.234}/src/ddi_fw/datasets/mdf_sa_ddi/indexes/validation_fold_4.txt +0 -0
  69. {ddi_fw-0.0.233 → ddi_fw-0.0.234}/src/ddi_fw/datasets/mdf_sa_ddi/mdf-sa-ddi.zip +0 -0
  70. {ddi_fw-0.0.233 → ddi_fw-0.0.234}/src/ddi_fw/datasets/setup_._py +0 -0
  71. {ddi_fw-0.0.233 → ddi_fw-0.0.234}/src/ddi_fw/drugbank/__init__.py +0 -0
  72. {ddi_fw-0.0.233 → ddi_fw-0.0.234}/src/ddi_fw/drugbank/drugbank.xsd +0 -0
  73. {ddi_fw-0.0.233 → ddi_fw-0.0.234}/src/ddi_fw/drugbank/drugbank_parser.py +0 -0
  74. {ddi_fw-0.0.233 → ddi_fw-0.0.234}/src/ddi_fw/drugbank/drugbank_processor.py +0 -0
  75. {ddi_fw-0.0.233 → ddi_fw-0.0.234}/src/ddi_fw/drugbank/drugbank_processor_org.py +0 -0
  76. {ddi_fw-0.0.233 → ddi_fw-0.0.234}/src/ddi_fw/drugbank/event_extractor.py +0 -0
  77. {ddi_fw-0.0.233 → ddi_fw-0.0.234}/src/ddi_fw/langchain/__init__.py +0 -0
  78. {ddi_fw-0.0.233 → ddi_fw-0.0.234}/src/ddi_fw/langchain/embeddings.py +0 -0
  79. {ddi_fw-0.0.233 → ddi_fw-0.0.234}/src/ddi_fw/langchain/sentence_splitter.py +0 -0
  80. {ddi_fw-0.0.233 → ddi_fw-0.0.234}/src/ddi_fw/langchain/storage.py +0 -0
  81. {ddi_fw-0.0.233 → ddi_fw-0.0.234}/src/ddi_fw/ml/__init__.py +0 -0
  82. {ddi_fw-0.0.233 → ddi_fw-0.0.234}/src/ddi_fw/ml/evaluation_helper.py +0 -0
  83. {ddi_fw-0.0.233 → ddi_fw-0.0.234}/src/ddi_fw/ml/ml_helper.py +0 -0
  84. {ddi_fw-0.0.233 → ddi_fw-0.0.234}/src/ddi_fw/ml/model_wrapper.py +0 -0
  85. {ddi_fw-0.0.233 → ddi_fw-0.0.234}/src/ddi_fw/ml/pytorch_wrapper.py +0 -0
  86. {ddi_fw-0.0.233 → ddi_fw-0.0.234}/src/ddi_fw/ml/tensorflow_wrapper.py +0 -0
  87. {ddi_fw-0.0.233 → ddi_fw-0.0.234}/src/ddi_fw/ml/tracking_service.py +0 -0
  88. {ddi_fw-0.0.233 → ddi_fw-0.0.234}/src/ddi_fw/ner/__init__.py +0 -0
  89. {ddi_fw-0.0.233 → ddi_fw-0.0.234}/src/ddi_fw/ner/mmlrestclient.py +0 -0
  90. {ddi_fw-0.0.233 → ddi_fw-0.0.234}/src/ddi_fw/ner/ner.py +0 -0
  91. {ddi_fw-0.0.233 → ddi_fw-0.0.234}/src/ddi_fw/pipeline/__init__.py +0 -0
  92. {ddi_fw-0.0.233 → ddi_fw-0.0.234}/src/ddi_fw/pipeline/multi_modal_combination_strategy.py +0 -0
  93. {ddi_fw-0.0.233 → ddi_fw-0.0.234}/src/ddi_fw/pipeline/multi_pipeline.py +0 -0
  94. {ddi_fw-0.0.233 → ddi_fw-0.0.234}/src/ddi_fw/pipeline/multi_pipeline_org.py +0 -0
  95. {ddi_fw-0.0.233 → ddi_fw-0.0.234}/src/ddi_fw/pipeline/ner_pipeline.py +0 -0
  96. {ddi_fw-0.0.233 → ddi_fw-0.0.234}/src/ddi_fw/pipeline/pipeline.py +0 -0
  97. {ddi_fw-0.0.233 → ddi_fw-0.0.234}/src/ddi_fw/utils/__init__.py +0 -0
  98. {ddi_fw-0.0.233 → ddi_fw-0.0.234}/src/ddi_fw/utils/categorical_data_encoding_checker.py +0 -0
  99. {ddi_fw-0.0.233 → ddi_fw-0.0.234}/src/ddi_fw/utils/enums.py +0 -0
  100. {ddi_fw-0.0.233 → ddi_fw-0.0.234}/src/ddi_fw/utils/json_helper.py +0 -0
  101. {ddi_fw-0.0.233 → ddi_fw-0.0.234}/src/ddi_fw/utils/kaggle.py +0 -0
  102. {ddi_fw-0.0.233 → ddi_fw-0.0.234}/src/ddi_fw/utils/numpy_utils.py +0 -0
  103. {ddi_fw-0.0.233 → ddi_fw-0.0.234}/src/ddi_fw/utils/package_helper.py +0 -0
  104. {ddi_fw-0.0.233 → ddi_fw-0.0.234}/src/ddi_fw/utils/py7zr_helper.py +0 -0
  105. {ddi_fw-0.0.233 → ddi_fw-0.0.234}/src/ddi_fw/utils/utils.py +0 -0
  106. {ddi_fw-0.0.233 → ddi_fw-0.0.234}/src/ddi_fw/utils/zip_helper.py +0 -0
  107. {ddi_fw-0.0.233 → ddi_fw-0.0.234}/src/ddi_fw/vectorization/__init__.py +0 -0
  108. {ddi_fw-0.0.233 → ddi_fw-0.0.234}/src/ddi_fw/vectorization/idf_helper.py +0 -0
  109. {ddi_fw-0.0.233 → ddi_fw-0.0.234}/src/ddi_fw.egg-info/SOURCES.txt +0 -0
  110. {ddi_fw-0.0.233 → ddi_fw-0.0.234}/src/ddi_fw.egg-info/dependency_links.txt +0 -0
  111. {ddi_fw-0.0.233 → ddi_fw-0.0.234}/src/ddi_fw.egg-info/requires.txt +0 -0
  112. {ddi_fw-0.0.233 → ddi_fw-0.0.234}/src/ddi_fw.egg-info/top_level.txt +0 -0
@@ -1,6 +1,6 @@
1
1
  Metadata-Version: 2.4
2
2
  Name: ddi_fw
3
- Version: 0.0.233
3
+ Version: 0.0.234
4
4
  Summary: Do not use :)
5
5
  Author-email: Kıvanç Bayraktar <bayraktarkivanc@gmail.com>
6
6
  Maintainer-email: Kıvanç Bayraktar <bayraktarkivanc@gmail.com>
@@ -6,7 +6,7 @@ build-backend = "setuptools.build_meta"
6
6
 
7
7
  [project]
8
8
  name = "ddi_fw"
9
- version = "0.0.233"
9
+ version = "0.0.234"
10
10
  description = "Do not use :)"
11
11
  readme = "README.md"
12
12
  authors = [
@@ -1,3 +1,4 @@
1
+ import os
1
2
  import numpy as np
2
3
  import pandas as pd
3
4
  from scipy.spatial.distance import pdist, squareform
@@ -28,7 +29,8 @@ def find_distinct_elements_count(frame):
28
29
 
29
30
  class SimilarityMatrixGenerator:
30
31
  def __init__(self):
31
- pass
32
+ # Check if GPU usage is enabled via an environment variable
33
+ self.use_gpu = os.getenv("SIMILARITY_MATRIX_USE_GPU", "false").lower() == "true"
32
34
 
33
35
  def create_jaccard_similarity_matrices_ex_1(self, array):
34
36
  jaccard_sim = 1 - pdist(array, metric='jaccard')
@@ -45,8 +47,15 @@ class SimilarityMatrixGenerator:
45
47
  return np.nan_to_num(matrix, nan=0.0)
46
48
  # return matrix
47
49
 
50
+
51
+ def create_jaccard_similarity_matrices(self, matrix: np.ndarray)->np.ndarray:
52
+ if self.use_gpu:
53
+ return self.__create_jaccard_similarity_matrices_gpu(matrix)
54
+ else:
55
+ return self.__create_jaccard_similarity_matrices(matrix)
56
+
48
57
  """produced from ChatGPT"""
49
- def create_jaccard_similarity_matrices(self, matrix)->np.ndarray:
58
+ def __create_jaccard_similarity_matrices(self, matrix: np.ndarray)->np.ndarray:
50
59
  """
51
60
  Efficiently compute the Jaccard similarity between rows of a binary matrix using vectorized operations.
52
61
 
@@ -75,6 +84,35 @@ class SimilarityMatrixGenerator:
75
84
 
76
85
  return similarity
77
86
 
87
+ import cupy as cp
88
+
89
+ def __create_jaccard_similarity_matrices_gpu(self,matrix: np.ndarray) -> np.ndarray:
90
+ """
91
+ Efficiently compute the Jaccard similarity between rows of a binary matrix using GPU-accelerated CuPy.
92
+
93
+ Parameters:
94
+ matrix (cp.ndarray): A 2D binary CuPy array (only 0s and 1s).
95
+
96
+ Returns:
97
+ cp.ndarray: A 2D CuPy array containing the pairwise Jaccard similarity.
98
+ """
99
+ if not ((matrix == 0) | (matrix == 1)).all():
100
+ raise ValueError("Input matrix must be binary (contain only 0s and 1s).")
101
+ matrix = cp.asarray(matrix)
102
+ # Intersection: dot product (each pair of rows)
103
+ intersection = matrix @ matrix.T
104
+
105
+ # Row-wise sum (number of 1s per row)
106
+ row_sums = matrix.sum(axis=1, keepdims=True)
107
+
108
+ # Union: |A ∪ B| = |A| + |B| - |A ∩ B|
109
+ union = row_sums + row_sums.T - intersection
110
+
111
+ # Avoid division by zero
112
+ similarity = cp.divide(intersection, union, out=cp.ones_like(intersection, dtype=cp.float64)) #, where=union != 0
113
+
114
+ return cp.asnumpy(similarity)
115
+
78
116
 
79
117
 
80
118
  class VectorGenerator:
@@ -1,6 +1,6 @@
1
1
  Metadata-Version: 2.4
2
2
  Name: ddi_fw
3
- Version: 0.0.233
3
+ Version: 0.0.234
4
4
  Summary: Do not use :)
5
5
  Author-email: Kıvanç Bayraktar <bayraktarkivanc@gmail.com>
6
6
  Maintainer-email: Kıvanç Bayraktar <bayraktarkivanc@gmail.com>
File without changes
File without changes
File without changes