ddi-fw 0.0.100__tar.gz → 0.0.102__tar.gz

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.
Files changed (102) hide show
  1. {ddi_fw-0.0.100 → ddi_fw-0.0.102}/PKG-INFO +1 -1
  2. {ddi_fw-0.0.100 → ddi_fw-0.0.102}/pyproject.toml +1 -1
  3. {ddi_fw-0.0.100 → ddi_fw-0.0.102}/src/ddi_fw/langchain/storage.py +2 -2
  4. {ddi_fw-0.0.100 → ddi_fw-0.0.102}/src/ddi_fw/utils/kaggle.py +7 -2
  5. {ddi_fw-0.0.100 → ddi_fw-0.0.102}/src/ddi_fw.egg-info/PKG-INFO +1 -1
  6. {ddi_fw-0.0.100 → ddi_fw-0.0.102}/README.md +0 -0
  7. {ddi_fw-0.0.100 → ddi_fw-0.0.102}/setup.cfg +0 -0
  8. {ddi_fw-0.0.100 → ddi_fw-0.0.102}/src/ddi_fw/datasets/__init__.py +0 -0
  9. {ddi_fw-0.0.100 → ddi_fw-0.0.102}/src/ddi_fw/datasets/core.py +0 -0
  10. {ddi_fw-0.0.100 → ddi_fw-0.0.102}/src/ddi_fw/datasets/db_utils.py +0 -0
  11. {ddi_fw-0.0.100 → ddi_fw-0.0.102}/src/ddi_fw/datasets/ddi_mdl/base.py +0 -0
  12. {ddi_fw-0.0.100 → ddi_fw-0.0.102}/src/ddi_fw/datasets/ddi_mdl/data/event.db +0 -0
  13. {ddi_fw-0.0.100 → ddi_fw-0.0.102}/src/ddi_fw/datasets/ddi_mdl/indexes/test_indexes.txt +0 -0
  14. {ddi_fw-0.0.100 → ddi_fw-0.0.102}/src/ddi_fw/datasets/ddi_mdl/indexes/train_fold_0.txt +0 -0
  15. {ddi_fw-0.0.100 → ddi_fw-0.0.102}/src/ddi_fw/datasets/ddi_mdl/indexes/train_fold_1.txt +0 -0
  16. {ddi_fw-0.0.100 → ddi_fw-0.0.102}/src/ddi_fw/datasets/ddi_mdl/indexes/train_fold_2.txt +0 -0
  17. {ddi_fw-0.0.100 → ddi_fw-0.0.102}/src/ddi_fw/datasets/ddi_mdl/indexes/train_fold_3.txt +0 -0
  18. {ddi_fw-0.0.100 → ddi_fw-0.0.102}/src/ddi_fw/datasets/ddi_mdl/indexes/train_fold_4.txt +0 -0
  19. {ddi_fw-0.0.100 → ddi_fw-0.0.102}/src/ddi_fw/datasets/ddi_mdl/indexes/train_indexes.txt +0 -0
  20. {ddi_fw-0.0.100 → ddi_fw-0.0.102}/src/ddi_fw/datasets/ddi_mdl/indexes/validation_fold_0.txt +0 -0
  21. {ddi_fw-0.0.100 → ddi_fw-0.0.102}/src/ddi_fw/datasets/ddi_mdl/indexes/validation_fold_1.txt +0 -0
  22. {ddi_fw-0.0.100 → ddi_fw-0.0.102}/src/ddi_fw/datasets/ddi_mdl/indexes/validation_fold_2.txt +0 -0
  23. {ddi_fw-0.0.100 → ddi_fw-0.0.102}/src/ddi_fw/datasets/ddi_mdl/indexes/validation_fold_3.txt +0 -0
  24. {ddi_fw-0.0.100 → ddi_fw-0.0.102}/src/ddi_fw/datasets/ddi_mdl/indexes/validation_fold_4.txt +0 -0
  25. {ddi_fw-0.0.100 → ddi_fw-0.0.102}/src/ddi_fw/datasets/ddi_mdl/indexes_old/test_indexes.txt +0 -0
  26. {ddi_fw-0.0.100 → ddi_fw-0.0.102}/src/ddi_fw/datasets/ddi_mdl/indexes_old/train_fold_0.txt +0 -0
  27. {ddi_fw-0.0.100 → ddi_fw-0.0.102}/src/ddi_fw/datasets/ddi_mdl/indexes_old/train_fold_1.txt +0 -0
  28. {ddi_fw-0.0.100 → ddi_fw-0.0.102}/src/ddi_fw/datasets/ddi_mdl/indexes_old/train_fold_2.txt +0 -0
  29. {ddi_fw-0.0.100 → ddi_fw-0.0.102}/src/ddi_fw/datasets/ddi_mdl/indexes_old/train_fold_3.txt +0 -0
  30. {ddi_fw-0.0.100 → ddi_fw-0.0.102}/src/ddi_fw/datasets/ddi_mdl/indexes_old/train_fold_4.txt +0 -0
  31. {ddi_fw-0.0.100 → ddi_fw-0.0.102}/src/ddi_fw/datasets/ddi_mdl/indexes_old/train_indexes.txt +0 -0
  32. {ddi_fw-0.0.100 → ddi_fw-0.0.102}/src/ddi_fw/datasets/ddi_mdl/indexes_old/validation_fold_0.txt +0 -0
  33. {ddi_fw-0.0.100 → ddi_fw-0.0.102}/src/ddi_fw/datasets/ddi_mdl/indexes_old/validation_fold_1.txt +0 -0
  34. {ddi_fw-0.0.100 → ddi_fw-0.0.102}/src/ddi_fw/datasets/ddi_mdl/indexes_old/validation_fold_2.txt +0 -0
  35. {ddi_fw-0.0.100 → ddi_fw-0.0.102}/src/ddi_fw/datasets/ddi_mdl/indexes_old/validation_fold_3.txt +0 -0
  36. {ddi_fw-0.0.100 → ddi_fw-0.0.102}/src/ddi_fw/datasets/ddi_mdl/indexes_old/validation_fold_4.txt +0 -0
  37. {ddi_fw-0.0.100 → ddi_fw-0.0.102}/src/ddi_fw/datasets/ddi_mdl/readme.md +0 -0
  38. {ddi_fw-0.0.100 → ddi_fw-0.0.102}/src/ddi_fw/datasets/embedding_generator.py +0 -0
  39. {ddi_fw-0.0.100 → ddi_fw-0.0.102}/src/ddi_fw/datasets/feature_vector_generation.py +0 -0
  40. {ddi_fw-0.0.100 → ddi_fw-0.0.102}/src/ddi_fw/datasets/idf_helper.py +0 -0
  41. {ddi_fw-0.0.100 → ddi_fw-0.0.102}/src/ddi_fw/datasets/mdf_sa_ddi/__init__.py +0 -0
  42. {ddi_fw-0.0.100 → ddi_fw-0.0.102}/src/ddi_fw/datasets/mdf_sa_ddi/base.py +0 -0
  43. {ddi_fw-0.0.100 → ddi_fw-0.0.102}/src/ddi_fw/datasets/mdf_sa_ddi/df_extraction_cleanxiaoyu50.csv +0 -0
  44. {ddi_fw-0.0.100 → ddi_fw-0.0.102}/src/ddi_fw/datasets/mdf_sa_ddi/drug_information_del_noDDIxiaoyu50.csv +0 -0
  45. {ddi_fw-0.0.100 → ddi_fw-0.0.102}/src/ddi_fw/datasets/mdf_sa_ddi/indexes/test_indexes.txt +0 -0
  46. {ddi_fw-0.0.100 → ddi_fw-0.0.102}/src/ddi_fw/datasets/mdf_sa_ddi/indexes/train_fold_0.txt +0 -0
  47. {ddi_fw-0.0.100 → ddi_fw-0.0.102}/src/ddi_fw/datasets/mdf_sa_ddi/indexes/train_fold_1.txt +0 -0
  48. {ddi_fw-0.0.100 → ddi_fw-0.0.102}/src/ddi_fw/datasets/mdf_sa_ddi/indexes/train_fold_2.txt +0 -0
  49. {ddi_fw-0.0.100 → ddi_fw-0.0.102}/src/ddi_fw/datasets/mdf_sa_ddi/indexes/train_fold_3.txt +0 -0
  50. {ddi_fw-0.0.100 → ddi_fw-0.0.102}/src/ddi_fw/datasets/mdf_sa_ddi/indexes/train_fold_4.txt +0 -0
  51. {ddi_fw-0.0.100 → ddi_fw-0.0.102}/src/ddi_fw/datasets/mdf_sa_ddi/indexes/train_indexes.txt +0 -0
  52. {ddi_fw-0.0.100 → ddi_fw-0.0.102}/src/ddi_fw/datasets/mdf_sa_ddi/indexes/validation_fold_0.txt +0 -0
  53. {ddi_fw-0.0.100 → ddi_fw-0.0.102}/src/ddi_fw/datasets/mdf_sa_ddi/indexes/validation_fold_1.txt +0 -0
  54. {ddi_fw-0.0.100 → ddi_fw-0.0.102}/src/ddi_fw/datasets/mdf_sa_ddi/indexes/validation_fold_2.txt +0 -0
  55. {ddi_fw-0.0.100 → ddi_fw-0.0.102}/src/ddi_fw/datasets/mdf_sa_ddi/indexes/validation_fold_3.txt +0 -0
  56. {ddi_fw-0.0.100 → ddi_fw-0.0.102}/src/ddi_fw/datasets/mdf_sa_ddi/indexes/validation_fold_4.txt +0 -0
  57. {ddi_fw-0.0.100 → ddi_fw-0.0.102}/src/ddi_fw/datasets/mdf_sa_ddi/mdf-sa-ddi.zip +0 -0
  58. {ddi_fw-0.0.100 → ddi_fw-0.0.102}/src/ddi_fw/datasets/setup_._py +0 -0
  59. {ddi_fw-0.0.100 → ddi_fw-0.0.102}/src/ddi_fw/drugbank/__init__.py +0 -0
  60. {ddi_fw-0.0.100 → ddi_fw-0.0.102}/src/ddi_fw/drugbank/drugbank.xsd +0 -0
  61. {ddi_fw-0.0.100 → ddi_fw-0.0.102}/src/ddi_fw/drugbank/drugbank_parser.py +0 -0
  62. {ddi_fw-0.0.100 → ddi_fw-0.0.102}/src/ddi_fw/drugbank/drugbank_processor.py +0 -0
  63. {ddi_fw-0.0.100 → ddi_fw-0.0.102}/src/ddi_fw/drugbank/drugbank_processor_org.py +0 -0
  64. {ddi_fw-0.0.100 → ddi_fw-0.0.102}/src/ddi_fw/drugbank/event_extractor.py +0 -0
  65. {ddi_fw-0.0.100 → ddi_fw-0.0.102}/src/ddi_fw/langchain/__init__.py +0 -0
  66. {ddi_fw-0.0.100 → ddi_fw-0.0.102}/src/ddi_fw/langchain/embeddings.py +0 -0
  67. {ddi_fw-0.0.100 → ddi_fw-0.0.102}/src/ddi_fw/langchain/sentence_splitter.py +0 -0
  68. {ddi_fw-0.0.100 → ddi_fw-0.0.102}/src/ddi_fw/ml/__init__.py +0 -0
  69. {ddi_fw-0.0.100 → ddi_fw-0.0.102}/src/ddi_fw/ml/evaluation_helper.py +0 -0
  70. {ddi_fw-0.0.100 → ddi_fw-0.0.102}/src/ddi_fw/ml/ml_helper.py +0 -0
  71. {ddi_fw-0.0.100 → ddi_fw-0.0.102}/src/ddi_fw/ml/model_wrapper.py +0 -0
  72. {ddi_fw-0.0.100 → ddi_fw-0.0.102}/src/ddi_fw/ml/pytorch_wrapper.py +0 -0
  73. {ddi_fw-0.0.100 → ddi_fw-0.0.102}/src/ddi_fw/ml/tensorflow_wrapper.py +0 -0
  74. {ddi_fw-0.0.100 → ddi_fw-0.0.102}/src/ddi_fw/ner/__init__.py +0 -0
  75. {ddi_fw-0.0.100 → ddi_fw-0.0.102}/src/ddi_fw/ner/mmlrestclient.py +0 -0
  76. {ddi_fw-0.0.100 → ddi_fw-0.0.102}/src/ddi_fw/ner/ner.py +0 -0
  77. {ddi_fw-0.0.100 → ddi_fw-0.0.102}/src/ddi_fw/pipeline/__init__.py +0 -0
  78. {ddi_fw-0.0.100 → ddi_fw-0.0.102}/src/ddi_fw/pipeline/multi_modal_combination_strategy.py +0 -0
  79. {ddi_fw-0.0.100 → ddi_fw-0.0.102}/src/ddi_fw/pipeline/multi_pipeline.py +0 -0
  80. {ddi_fw-0.0.100 → ddi_fw-0.0.102}/src/ddi_fw/pipeline/ner_pipeline.py +0 -0
  81. {ddi_fw-0.0.100 → ddi_fw-0.0.102}/src/ddi_fw/pipeline/pipeline.py +0 -0
  82. {ddi_fw-0.0.100 → ddi_fw-0.0.102}/src/ddi_fw/test/basic_test.py +0 -0
  83. {ddi_fw-0.0.100 → ddi_fw-0.0.102}/src/ddi_fw/test/combination_test.py +0 -0
  84. {ddi_fw-0.0.100 → ddi_fw-0.0.102}/src/ddi_fw/test/compress_json_test.py +0 -0
  85. {ddi_fw-0.0.100 → ddi_fw-0.0.102}/src/ddi_fw/test/date_test.py +0 -0
  86. {ddi_fw-0.0.100 → ddi_fw-0.0.102}/src/ddi_fw/test/idf_score.py +0 -0
  87. {ddi_fw-0.0.100 → ddi_fw-0.0.102}/src/ddi_fw/test/jaccard_similarity.py +0 -0
  88. {ddi_fw-0.0.100 → ddi_fw-0.0.102}/src/ddi_fw/test/mlfow_test.py +0 -0
  89. {ddi_fw-0.0.100 → ddi_fw-0.0.102}/src/ddi_fw/test/sklearn-tfidf.py +0 -0
  90. {ddi_fw-0.0.100 → ddi_fw-0.0.102}/src/ddi_fw/test/test.py +0 -0
  91. {ddi_fw-0.0.100 → ddi_fw-0.0.102}/src/ddi_fw/test/torch_cuda_test.py +0 -0
  92. {ddi_fw-0.0.100 → ddi_fw-0.0.102}/src/ddi_fw/test/type_guarding_test.py +0 -0
  93. {ddi_fw-0.0.100 → ddi_fw-0.0.102}/src/ddi_fw/utils/__init__.py +0 -0
  94. {ddi_fw-0.0.100 → ddi_fw-0.0.102}/src/ddi_fw/utils/enums.py +0 -0
  95. {ddi_fw-0.0.100 → ddi_fw-0.0.102}/src/ddi_fw/utils/package_helper.py +0 -0
  96. {ddi_fw-0.0.100 → ddi_fw-0.0.102}/src/ddi_fw/utils/py7zr_helper.py +0 -0
  97. {ddi_fw-0.0.100 → ddi_fw-0.0.102}/src/ddi_fw/utils/utils.py +0 -0
  98. {ddi_fw-0.0.100 → ddi_fw-0.0.102}/src/ddi_fw/utils/zip_helper.py +0 -0
  99. {ddi_fw-0.0.100 → ddi_fw-0.0.102}/src/ddi_fw.egg-info/SOURCES.txt +0 -0
  100. {ddi_fw-0.0.100 → ddi_fw-0.0.102}/src/ddi_fw.egg-info/dependency_links.txt +0 -0
  101. {ddi_fw-0.0.100 → ddi_fw-0.0.102}/src/ddi_fw.egg-info/requires.txt +0 -0
  102. {ddi_fw-0.0.100 → ddi_fw-0.0.102}/src/ddi_fw.egg-info/top_level.txt +0 -0
@@ -1,6 +1,6 @@
1
1
  Metadata-Version: 2.1
2
2
  Name: ddi_fw
3
- Version: 0.0.100
3
+ Version: 0.0.102
4
4
  Summary: Do not use :)
5
5
  Author-email: Kıvanç Bayraktar <bayraktarkivanc@gmail.com>
6
6
  Maintainer-email: Kıvanç Bayraktar <bayraktarkivanc@gmail.com>
@@ -5,7 +5,7 @@ build-backend = "setuptools.build_meta"
5
5
 
6
6
  [project]
7
7
  name = "ddi_fw"
8
- version = "0.0.100"
8
+ version = "0.0.102"
9
9
  description = "Do not use :)"
10
10
  readme = "README.md"
11
11
  authors = [
@@ -122,7 +122,7 @@ def generate_embeddings(df, config_file, new_model_names, collections=None, pers
122
122
  # print(f"Configuration for collection {id} not found.")
123
123
  # continue
124
124
 
125
- embedding_model_type = collection_config['embedding_model_tpe']
125
+ embedding_model_type = collection_config['embedding_model_type']
126
126
  text_splitters_types = collection_config['text_splitters_types']
127
127
  batch_size = collection_config['batch_size']
128
128
  columns = collection_config['columns']
@@ -135,7 +135,7 @@ def generate_embeddings(df, config_file, new_model_names, collections=None, pers
135
135
  # Assuming the classes for the embeddings and splitters are available
136
136
  try:
137
137
  model = get_import(embedding_model_type)(
138
- model_name=name, model_kwargs=c['model_kwargs'])
138
+ model_name=name, model_kwargs=collection_config['model_kwargs'])
139
139
  except:
140
140
  # print(f"Unknown embedding model: {embedding_model_type}")
141
141
  raise Exception(f"Unknown embedding model: {embedding_model_type}")
@@ -17,13 +17,19 @@ def create_kaggle_dataset(base_path: str, collections: list):
17
17
  # Step 1: Loop through each folder in base_path
18
18
  for folder_name in os.listdir(base_path):
19
19
  folder_path = os.path.join(base_path, folder_name)
20
-
20
+ metadata_file_path = os.path.join(folder_path, 'dataset-metadata.json')
21
+
21
22
  # Step 2: Get metadata for the current folder
22
23
  model_info = next((c for c in collections if c['id'] == folder_name), None)
23
24
  if model_info is None:
24
25
  continue # Skip if model info is not found
25
26
 
26
27
  title = model_info['kaggle_title']
28
+
29
+ if os.path.exists(metadata_file_path):
30
+ print(f"{title} has dataset-metadata.json file")
31
+ continue
32
+
27
33
  id = model_info['kaggle_id'].lower().replace(' ', '-')
28
34
  licenses = model_info['kaggle_licenses']
29
35
  description = model_info['kaggle_description']
@@ -41,7 +47,6 @@ def create_kaggle_dataset(base_path: str, collections: list):
41
47
  }
42
48
 
43
49
  # Step 4: Write the metadata to a JSON file in the folder
44
- metadata_file_path = os.path.join(folder_path, 'dataset-metadata.json')
45
50
  with open(metadata_file_path, 'w') as f:
46
51
  json.dump(metadata, f, indent=4)
47
52
 
@@ -1,6 +1,6 @@
1
1
  Metadata-Version: 2.1
2
2
  Name: ddi_fw
3
- Version: 0.0.100
3
+ Version: 0.0.102
4
4
  Summary: Do not use :)
5
5
  Author-email: Kıvanç Bayraktar <bayraktarkivanc@gmail.com>
6
6
  Maintainer-email: Kıvanç Bayraktar <bayraktarkivanc@gmail.com>
File without changes
File without changes
File without changes