ddi-fw 0.0.233__tar.gz → 0.0.235__tar.gz

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.
Files changed (112) hide show
  1. {ddi_fw-0.0.233 → ddi_fw-0.0.235}/PKG-INFO +1 -1
  2. {ddi_fw-0.0.233 → ddi_fw-0.0.235}/pyproject.toml +1 -1
  3. {ddi_fw-0.0.233 → ddi_fw-0.0.235}/src/ddi_fw/vectorization/feature_vector_generation.py +41 -2
  4. {ddi_fw-0.0.233 → ddi_fw-0.0.235}/src/ddi_fw.egg-info/PKG-INFO +1 -1
  5. {ddi_fw-0.0.233 → ddi_fw-0.0.235}/README.md +0 -0
  6. {ddi_fw-0.0.233 → ddi_fw-0.0.235}/setup.cfg +0 -0
  7. {ddi_fw-0.0.233 → ddi_fw-0.0.235}/src/ddi_fw/datasets/__init__.py +0 -0
  8. {ddi_fw-0.0.233 → ddi_fw-0.0.235}/src/ddi_fw/datasets/core.py +0 -0
  9. {ddi_fw-0.0.233 → ddi_fw-0.0.235}/src/ddi_fw/datasets/dataset_splitter.py +0 -0
  10. {ddi_fw-0.0.233 → ddi_fw-0.0.235}/src/ddi_fw/datasets/db_utils.py +0 -0
  11. {ddi_fw-0.0.233 → ddi_fw-0.0.235}/src/ddi_fw/datasets/ddi_mdl/base.py +0 -0
  12. {ddi_fw-0.0.233 → ddi_fw-0.0.235}/src/ddi_fw/datasets/ddi_mdl/data/event.db +0 -0
  13. {ddi_fw-0.0.233 → ddi_fw-0.0.235}/src/ddi_fw/datasets/ddi_mdl/debug.log +0 -0
  14. {ddi_fw-0.0.233 → ddi_fw-0.0.235}/src/ddi_fw/datasets/ddi_mdl/indexes/test_indexes.txt +0 -0
  15. {ddi_fw-0.0.233 → ddi_fw-0.0.235}/src/ddi_fw/datasets/ddi_mdl/indexes/train_fold_0.txt +0 -0
  16. {ddi_fw-0.0.233 → ddi_fw-0.0.235}/src/ddi_fw/datasets/ddi_mdl/indexes/train_fold_1.txt +0 -0
  17. {ddi_fw-0.0.233 → ddi_fw-0.0.235}/src/ddi_fw/datasets/ddi_mdl/indexes/train_fold_2.txt +0 -0
  18. {ddi_fw-0.0.233 → ddi_fw-0.0.235}/src/ddi_fw/datasets/ddi_mdl/indexes/train_fold_3.txt +0 -0
  19. {ddi_fw-0.0.233 → ddi_fw-0.0.235}/src/ddi_fw/datasets/ddi_mdl/indexes/train_fold_4.txt +0 -0
  20. {ddi_fw-0.0.233 → ddi_fw-0.0.235}/src/ddi_fw/datasets/ddi_mdl/indexes/train_indexes.txt +0 -0
  21. {ddi_fw-0.0.233 → ddi_fw-0.0.235}/src/ddi_fw/datasets/ddi_mdl/indexes/validation_fold_0.txt +0 -0
  22. {ddi_fw-0.0.233 → ddi_fw-0.0.235}/src/ddi_fw/datasets/ddi_mdl/indexes/validation_fold_1.txt +0 -0
  23. {ddi_fw-0.0.233 → ddi_fw-0.0.235}/src/ddi_fw/datasets/ddi_mdl/indexes/validation_fold_2.txt +0 -0
  24. {ddi_fw-0.0.233 → ddi_fw-0.0.235}/src/ddi_fw/datasets/ddi_mdl/indexes/validation_fold_3.txt +0 -0
  25. {ddi_fw-0.0.233 → ddi_fw-0.0.235}/src/ddi_fw/datasets/ddi_mdl/indexes/validation_fold_4.txt +0 -0
  26. {ddi_fw-0.0.233 → ddi_fw-0.0.235}/src/ddi_fw/datasets/ddi_mdl/indexes_old/test_indexes.txt +0 -0
  27. {ddi_fw-0.0.233 → ddi_fw-0.0.235}/src/ddi_fw/datasets/ddi_mdl/indexes_old/train_fold_0.txt +0 -0
  28. {ddi_fw-0.0.233 → ddi_fw-0.0.235}/src/ddi_fw/datasets/ddi_mdl/indexes_old/train_fold_1.txt +0 -0
  29. {ddi_fw-0.0.233 → ddi_fw-0.0.235}/src/ddi_fw/datasets/ddi_mdl/indexes_old/train_fold_2.txt +0 -0
  30. {ddi_fw-0.0.233 → ddi_fw-0.0.235}/src/ddi_fw/datasets/ddi_mdl/indexes_old/train_fold_3.txt +0 -0
  31. {ddi_fw-0.0.233 → ddi_fw-0.0.235}/src/ddi_fw/datasets/ddi_mdl/indexes_old/train_fold_4.txt +0 -0
  32. {ddi_fw-0.0.233 → ddi_fw-0.0.235}/src/ddi_fw/datasets/ddi_mdl/indexes_old/train_indexes.txt +0 -0
  33. {ddi_fw-0.0.233 → ddi_fw-0.0.235}/src/ddi_fw/datasets/ddi_mdl/indexes_old/validation_fold_0.txt +0 -0
  34. {ddi_fw-0.0.233 → ddi_fw-0.0.235}/src/ddi_fw/datasets/ddi_mdl/indexes_old/validation_fold_1.txt +0 -0
  35. {ddi_fw-0.0.233 → ddi_fw-0.0.235}/src/ddi_fw/datasets/ddi_mdl/indexes_old/validation_fold_2.txt +0 -0
  36. {ddi_fw-0.0.233 → ddi_fw-0.0.235}/src/ddi_fw/datasets/ddi_mdl/indexes_old/validation_fold_3.txt +0 -0
  37. {ddi_fw-0.0.233 → ddi_fw-0.0.235}/src/ddi_fw/datasets/ddi_mdl/indexes_old/validation_fold_4.txt +0 -0
  38. {ddi_fw-0.0.233 → ddi_fw-0.0.235}/src/ddi_fw/datasets/ddi_mdl/readme.md +0 -0
  39. {ddi_fw-0.0.233 → ddi_fw-0.0.235}/src/ddi_fw/datasets/ddi_mdl_text/base.py +0 -0
  40. {ddi_fw-0.0.233 → ddi_fw-0.0.235}/src/ddi_fw/datasets/ddi_mdl_text/data/event.db +0 -0
  41. {ddi_fw-0.0.233 → ddi_fw-0.0.235}/src/ddi_fw/datasets/ddi_mdl_text/indexes/test_indexes.txt +0 -0
  42. {ddi_fw-0.0.233 → ddi_fw-0.0.235}/src/ddi_fw/datasets/ddi_mdl_text/indexes/train_fold_0.txt +0 -0
  43. {ddi_fw-0.0.233 → ddi_fw-0.0.235}/src/ddi_fw/datasets/ddi_mdl_text/indexes/train_fold_1.txt +0 -0
  44. {ddi_fw-0.0.233 → ddi_fw-0.0.235}/src/ddi_fw/datasets/ddi_mdl_text/indexes/train_fold_2.txt +0 -0
  45. {ddi_fw-0.0.233 → ddi_fw-0.0.235}/src/ddi_fw/datasets/ddi_mdl_text/indexes/train_fold_3.txt +0 -0
  46. {ddi_fw-0.0.233 → ddi_fw-0.0.235}/src/ddi_fw/datasets/ddi_mdl_text/indexes/train_fold_4.txt +0 -0
  47. {ddi_fw-0.0.233 → ddi_fw-0.0.235}/src/ddi_fw/datasets/ddi_mdl_text/indexes/train_indexes.txt +0 -0
  48. {ddi_fw-0.0.233 → ddi_fw-0.0.235}/src/ddi_fw/datasets/ddi_mdl_text/indexes/validation_fold_0.txt +0 -0
  49. {ddi_fw-0.0.233 → ddi_fw-0.0.235}/src/ddi_fw/datasets/ddi_mdl_text/indexes/validation_fold_1.txt +0 -0
  50. {ddi_fw-0.0.233 → ddi_fw-0.0.235}/src/ddi_fw/datasets/ddi_mdl_text/indexes/validation_fold_2.txt +0 -0
  51. {ddi_fw-0.0.233 → ddi_fw-0.0.235}/src/ddi_fw/datasets/ddi_mdl_text/indexes/validation_fold_3.txt +0 -0
  52. {ddi_fw-0.0.233 → ddi_fw-0.0.235}/src/ddi_fw/datasets/ddi_mdl_text/indexes/validation_fold_4.txt +0 -0
  53. {ddi_fw-0.0.233 → ddi_fw-0.0.235}/src/ddi_fw/datasets/mdf_sa_ddi/__init__.py +0 -0
  54. {ddi_fw-0.0.233 → ddi_fw-0.0.235}/src/ddi_fw/datasets/mdf_sa_ddi/base.py +0 -0
  55. {ddi_fw-0.0.233 → ddi_fw-0.0.235}/src/ddi_fw/datasets/mdf_sa_ddi/df_extraction_cleanxiaoyu50.csv +0 -0
  56. {ddi_fw-0.0.233 → ddi_fw-0.0.235}/src/ddi_fw/datasets/mdf_sa_ddi/drug_information_del_noDDIxiaoyu50.csv +0 -0
  57. {ddi_fw-0.0.233 → ddi_fw-0.0.235}/src/ddi_fw/datasets/mdf_sa_ddi/indexes/test_indexes.txt +0 -0
  58. {ddi_fw-0.0.233 → ddi_fw-0.0.235}/src/ddi_fw/datasets/mdf_sa_ddi/indexes/train_fold_0.txt +0 -0
  59. {ddi_fw-0.0.233 → ddi_fw-0.0.235}/src/ddi_fw/datasets/mdf_sa_ddi/indexes/train_fold_1.txt +0 -0
  60. {ddi_fw-0.0.233 → ddi_fw-0.0.235}/src/ddi_fw/datasets/mdf_sa_ddi/indexes/train_fold_2.txt +0 -0
  61. {ddi_fw-0.0.233 → ddi_fw-0.0.235}/src/ddi_fw/datasets/mdf_sa_ddi/indexes/train_fold_3.txt +0 -0
  62. {ddi_fw-0.0.233 → ddi_fw-0.0.235}/src/ddi_fw/datasets/mdf_sa_ddi/indexes/train_fold_4.txt +0 -0
  63. {ddi_fw-0.0.233 → ddi_fw-0.0.235}/src/ddi_fw/datasets/mdf_sa_ddi/indexes/train_indexes.txt +0 -0
  64. {ddi_fw-0.0.233 → ddi_fw-0.0.235}/src/ddi_fw/datasets/mdf_sa_ddi/indexes/validation_fold_0.txt +0 -0
  65. {ddi_fw-0.0.233 → ddi_fw-0.0.235}/src/ddi_fw/datasets/mdf_sa_ddi/indexes/validation_fold_1.txt +0 -0
  66. {ddi_fw-0.0.233 → ddi_fw-0.0.235}/src/ddi_fw/datasets/mdf_sa_ddi/indexes/validation_fold_2.txt +0 -0
  67. {ddi_fw-0.0.233 → ddi_fw-0.0.235}/src/ddi_fw/datasets/mdf_sa_ddi/indexes/validation_fold_3.txt +0 -0
  68. {ddi_fw-0.0.233 → ddi_fw-0.0.235}/src/ddi_fw/datasets/mdf_sa_ddi/indexes/validation_fold_4.txt +0 -0
  69. {ddi_fw-0.0.233 → ddi_fw-0.0.235}/src/ddi_fw/datasets/mdf_sa_ddi/mdf-sa-ddi.zip +0 -0
  70. {ddi_fw-0.0.233 → ddi_fw-0.0.235}/src/ddi_fw/datasets/setup_._py +0 -0
  71. {ddi_fw-0.0.233 → ddi_fw-0.0.235}/src/ddi_fw/drugbank/__init__.py +0 -0
  72. {ddi_fw-0.0.233 → ddi_fw-0.0.235}/src/ddi_fw/drugbank/drugbank.xsd +0 -0
  73. {ddi_fw-0.0.233 → ddi_fw-0.0.235}/src/ddi_fw/drugbank/drugbank_parser.py +0 -0
  74. {ddi_fw-0.0.233 → ddi_fw-0.0.235}/src/ddi_fw/drugbank/drugbank_processor.py +0 -0
  75. {ddi_fw-0.0.233 → ddi_fw-0.0.235}/src/ddi_fw/drugbank/drugbank_processor_org.py +0 -0
  76. {ddi_fw-0.0.233 → ddi_fw-0.0.235}/src/ddi_fw/drugbank/event_extractor.py +0 -0
  77. {ddi_fw-0.0.233 → ddi_fw-0.0.235}/src/ddi_fw/langchain/__init__.py +0 -0
  78. {ddi_fw-0.0.233 → ddi_fw-0.0.235}/src/ddi_fw/langchain/embeddings.py +0 -0
  79. {ddi_fw-0.0.233 → ddi_fw-0.0.235}/src/ddi_fw/langchain/sentence_splitter.py +0 -0
  80. {ddi_fw-0.0.233 → ddi_fw-0.0.235}/src/ddi_fw/langchain/storage.py +0 -0
  81. {ddi_fw-0.0.233 → ddi_fw-0.0.235}/src/ddi_fw/ml/__init__.py +0 -0
  82. {ddi_fw-0.0.233 → ddi_fw-0.0.235}/src/ddi_fw/ml/evaluation_helper.py +0 -0
  83. {ddi_fw-0.0.233 → ddi_fw-0.0.235}/src/ddi_fw/ml/ml_helper.py +0 -0
  84. {ddi_fw-0.0.233 → ddi_fw-0.0.235}/src/ddi_fw/ml/model_wrapper.py +0 -0
  85. {ddi_fw-0.0.233 → ddi_fw-0.0.235}/src/ddi_fw/ml/pytorch_wrapper.py +0 -0
  86. {ddi_fw-0.0.233 → ddi_fw-0.0.235}/src/ddi_fw/ml/tensorflow_wrapper.py +0 -0
  87. {ddi_fw-0.0.233 → ddi_fw-0.0.235}/src/ddi_fw/ml/tracking_service.py +0 -0
  88. {ddi_fw-0.0.233 → ddi_fw-0.0.235}/src/ddi_fw/ner/__init__.py +0 -0
  89. {ddi_fw-0.0.233 → ddi_fw-0.0.235}/src/ddi_fw/ner/mmlrestclient.py +0 -0
  90. {ddi_fw-0.0.233 → ddi_fw-0.0.235}/src/ddi_fw/ner/ner.py +0 -0
  91. {ddi_fw-0.0.233 → ddi_fw-0.0.235}/src/ddi_fw/pipeline/__init__.py +0 -0
  92. {ddi_fw-0.0.233 → ddi_fw-0.0.235}/src/ddi_fw/pipeline/multi_modal_combination_strategy.py +0 -0
  93. {ddi_fw-0.0.233 → ddi_fw-0.0.235}/src/ddi_fw/pipeline/multi_pipeline.py +0 -0
  94. {ddi_fw-0.0.233 → ddi_fw-0.0.235}/src/ddi_fw/pipeline/multi_pipeline_org.py +0 -0
  95. {ddi_fw-0.0.233 → ddi_fw-0.0.235}/src/ddi_fw/pipeline/ner_pipeline.py +0 -0
  96. {ddi_fw-0.0.233 → ddi_fw-0.0.235}/src/ddi_fw/pipeline/pipeline.py +0 -0
  97. {ddi_fw-0.0.233 → ddi_fw-0.0.235}/src/ddi_fw/utils/__init__.py +0 -0
  98. {ddi_fw-0.0.233 → ddi_fw-0.0.235}/src/ddi_fw/utils/categorical_data_encoding_checker.py +0 -0
  99. {ddi_fw-0.0.233 → ddi_fw-0.0.235}/src/ddi_fw/utils/enums.py +0 -0
  100. {ddi_fw-0.0.233 → ddi_fw-0.0.235}/src/ddi_fw/utils/json_helper.py +0 -0
  101. {ddi_fw-0.0.233 → ddi_fw-0.0.235}/src/ddi_fw/utils/kaggle.py +0 -0
  102. {ddi_fw-0.0.233 → ddi_fw-0.0.235}/src/ddi_fw/utils/numpy_utils.py +0 -0
  103. {ddi_fw-0.0.233 → ddi_fw-0.0.235}/src/ddi_fw/utils/package_helper.py +0 -0
  104. {ddi_fw-0.0.233 → ddi_fw-0.0.235}/src/ddi_fw/utils/py7zr_helper.py +0 -0
  105. {ddi_fw-0.0.233 → ddi_fw-0.0.235}/src/ddi_fw/utils/utils.py +0 -0
  106. {ddi_fw-0.0.233 → ddi_fw-0.0.235}/src/ddi_fw/utils/zip_helper.py +0 -0
  107. {ddi_fw-0.0.233 → ddi_fw-0.0.235}/src/ddi_fw/vectorization/__init__.py +0 -0
  108. {ddi_fw-0.0.233 → ddi_fw-0.0.235}/src/ddi_fw/vectorization/idf_helper.py +0 -0
  109. {ddi_fw-0.0.233 → ddi_fw-0.0.235}/src/ddi_fw.egg-info/SOURCES.txt +0 -0
  110. {ddi_fw-0.0.233 → ddi_fw-0.0.235}/src/ddi_fw.egg-info/dependency_links.txt +0 -0
  111. {ddi_fw-0.0.233 → ddi_fw-0.0.235}/src/ddi_fw.egg-info/requires.txt +0 -0
  112. {ddi_fw-0.0.233 → ddi_fw-0.0.235}/src/ddi_fw.egg-info/top_level.txt +0 -0
@@ -1,6 +1,6 @@
1
1
  Metadata-Version: 2.4
2
2
  Name: ddi_fw
3
- Version: 0.0.233
3
+ Version: 0.0.235
4
4
  Summary: Do not use :)
5
5
  Author-email: Kıvanç Bayraktar <bayraktarkivanc@gmail.com>
6
6
  Maintainer-email: Kıvanç Bayraktar <bayraktarkivanc@gmail.com>
@@ -6,7 +6,7 @@ build-backend = "setuptools.build_meta"
6
6
 
7
7
  [project]
8
8
  name = "ddi_fw"
9
- version = "0.0.233"
9
+ version = "0.0.235"
10
10
  description = "Do not use :)"
11
11
  readme = "README.md"
12
12
  authors = [
@@ -1,7 +1,9 @@
1
+ import os
1
2
  import numpy as np
2
3
  import pandas as pd
3
4
  from scipy.spatial.distance import pdist, squareform
4
5
  from sklearn.preprocessing import MultiLabelBinarizer
6
+ import cupy as cp
5
7
 
6
8
  # todo pd.unique kullan
7
9
  def find_distinct_elements(frame):
@@ -28,7 +30,8 @@ def find_distinct_elements_count(frame):
28
30
 
29
31
  class SimilarityMatrixGenerator:
30
32
  def __init__(self):
31
- pass
33
+ # Check if GPU usage is enabled via an environment variable
34
+ self.use_gpu = os.getenv("SIMILARITY_MATRIX_USE_GPU", "false").lower() == "true"
32
35
 
33
36
  def create_jaccard_similarity_matrices_ex_1(self, array):
34
37
  jaccard_sim = 1 - pdist(array, metric='jaccard')
@@ -45,8 +48,16 @@ class SimilarityMatrixGenerator:
45
48
  return np.nan_to_num(matrix, nan=0.0)
46
49
  # return matrix
47
50
 
51
+
52
+ def create_jaccard_similarity_matrices(self, matrix: np.ndarray)->np.ndarray:
53
+ if self.use_gpu:
54
+ print("Using GPU for Jaccard similarity matrix computation.")
55
+ return self.__create_jaccard_similarity_matrices_gpu(matrix)
56
+ else:
57
+ return self.__create_jaccard_similarity_matrices(matrix)
58
+
48
59
  """produced from ChatGPT"""
49
- def create_jaccard_similarity_matrices(self, matrix)->np.ndarray:
60
+ def __create_jaccard_similarity_matrices(self, matrix: np.ndarray)->np.ndarray:
50
61
  """
51
62
  Efficiently compute the Jaccard similarity between rows of a binary matrix using vectorized operations.
52
63
 
@@ -76,6 +87,34 @@ class SimilarityMatrixGenerator:
76
87
  return similarity
77
88
 
78
89
 
90
+ def __create_jaccard_similarity_matrices_gpu(self,matrix: np.ndarray) -> np.ndarray:
91
+ """
92
+ Efficiently compute the Jaccard similarity between rows of a binary matrix using GPU-accelerated CuPy.
93
+
94
+ Parameters:
95
+ matrix (cp.ndarray): A 2D binary CuPy array (only 0s and 1s).
96
+
97
+ Returns:
98
+ cp.ndarray: A 2D CuPy array containing the pairwise Jaccard similarity.
99
+ """
100
+ if not ((matrix == 0) | (matrix == 1)).all():
101
+ raise ValueError("Input matrix must be binary (contain only 0s and 1s).")
102
+ matrix = cp.asarray(matrix)
103
+ # Intersection: dot product (each pair of rows)
104
+ intersection = matrix @ matrix.T
105
+
106
+ # Row-wise sum (number of 1s per row)
107
+ row_sums = matrix.sum(axis=1, keepdims=True)
108
+
109
+ # Union: |A ∪ B| = |A| + |B| - |A ∩ B|
110
+ union = row_sums + row_sums.T - intersection
111
+
112
+ # Avoid division by zero
113
+ similarity = cp.divide(intersection, union, out=cp.ones_like(intersection, dtype=cp.float64)) #, where=union != 0
114
+
115
+ return cp.asnumpy(similarity)
116
+
117
+
79
118
 
80
119
  class VectorGenerator:
81
120
  def __init__(self, df):
@@ -1,6 +1,6 @@
1
1
  Metadata-Version: 2.4
2
2
  Name: ddi_fw
3
- Version: 0.0.233
3
+ Version: 0.0.235
4
4
  Summary: Do not use :)
5
5
  Author-email: Kıvanç Bayraktar <bayraktarkivanc@gmail.com>
6
6
  Maintainer-email: Kıvanç Bayraktar <bayraktarkivanc@gmail.com>
File without changes
File without changes
File without changes