PyPI - vectordb-bench - Versions diffs - 0.0.18__py3-none-any.whl → 0.0.20__py3-none-any.whl - Mend

vectordb-bench 0.0.18py3-none-any.whl → 0.0.20py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (105) hide show

vectordb_bench/__init__.py +49 -24
vectordb_bench/__main__.py +4 -3
vectordb_bench/backend/assembler.py +12 -13
vectordb_bench/backend/cases.py +56 -46
vectordb_bench/backend/clients/__init__.py +101 -14
vectordb_bench/backend/clients/aliyun_elasticsearch/aliyun_elasticsearch.py +26 -0
vectordb_bench/backend/clients/aliyun_elasticsearch/config.py +18 -0
vectordb_bench/backend/clients/aliyun_opensearch/aliyun_opensearch.py +345 -0
vectordb_bench/backend/clients/aliyun_opensearch/config.py +47 -0
vectordb_bench/backend/clients/alloydb/alloydb.py +58 -80
vectordb_bench/backend/clients/alloydb/cli.py +52 -35
vectordb_bench/backend/clients/alloydb/config.py +30 -30
vectordb_bench/backend/clients/api.py +8 -9
vectordb_bench/backend/clients/aws_opensearch/aws_opensearch.py +46 -47
vectordb_bench/backend/clients/aws_opensearch/cli.py +4 -7
vectordb_bench/backend/clients/aws_opensearch/config.py +13 -9
vectordb_bench/backend/clients/aws_opensearch/run.py +69 -59
vectordb_bench/backend/clients/chroma/chroma.py +38 -36
vectordb_bench/backend/clients/chroma/config.py +4 -2
vectordb_bench/backend/clients/elastic_cloud/config.py +5 -5
vectordb_bench/backend/clients/elastic_cloud/elastic_cloud.py +23 -22
vectordb_bench/backend/clients/memorydb/cli.py +8 -8
vectordb_bench/backend/clients/memorydb/config.py +2 -2
vectordb_bench/backend/clients/memorydb/memorydb.py +65 -53
vectordb_bench/backend/clients/milvus/cli.py +62 -80
vectordb_bench/backend/clients/milvus/config.py +31 -7
vectordb_bench/backend/clients/milvus/milvus.py +23 -26
vectordb_bench/backend/clients/pgdiskann/cli.py +29 -22
vectordb_bench/backend/clients/pgdiskann/config.py +29 -26
vectordb_bench/backend/clients/pgdiskann/pgdiskann.py +55 -73
vectordb_bench/backend/clients/pgvecto_rs/cli.py +9 -11
vectordb_bench/backend/clients/pgvecto_rs/config.py +8 -14
vectordb_bench/backend/clients/pgvecto_rs/pgvecto_rs.py +33 -34
vectordb_bench/backend/clients/pgvector/cli.py +40 -31
vectordb_bench/backend/clients/pgvector/config.py +63 -73
vectordb_bench/backend/clients/pgvector/pgvector.py +97 -98
vectordb_bench/backend/clients/pgvectorscale/cli.py +38 -24
vectordb_bench/backend/clients/pgvectorscale/config.py +14 -15
vectordb_bench/backend/clients/pgvectorscale/pgvectorscale.py +38 -43
vectordb_bench/backend/clients/pinecone/config.py +1 -0
vectordb_bench/backend/clients/pinecone/pinecone.py +14 -21
vectordb_bench/backend/clients/qdrant_cloud/config.py +11 -10
vectordb_bench/backend/clients/qdrant_cloud/qdrant_cloud.py +40 -31
vectordb_bench/backend/clients/redis/cli.py +6 -12
vectordb_bench/backend/clients/redis/config.py +7 -5
vectordb_bench/backend/clients/redis/redis.py +94 -58
vectordb_bench/backend/clients/test/cli.py +1 -2
vectordb_bench/backend/clients/test/config.py +2 -2
vectordb_bench/backend/clients/test/test.py +4 -5
vectordb_bench/backend/clients/weaviate_cloud/cli.py +3 -4
vectordb_bench/backend/clients/weaviate_cloud/config.py +2 -2
vectordb_bench/backend/clients/weaviate_cloud/weaviate_cloud.py +36 -22
vectordb_bench/backend/clients/zilliz_cloud/cli.py +14 -11
vectordb_bench/backend/clients/zilliz_cloud/config.py +2 -4
vectordb_bench/backend/clients/zilliz_cloud/zilliz_cloud.py +1 -1
vectordb_bench/backend/data_source.py +30 -18
vectordb_bench/backend/dataset.py +47 -27
vectordb_bench/backend/result_collector.py +2 -3
vectordb_bench/backend/runner/__init__.py +4 -6
vectordb_bench/backend/runner/mp_runner.py +85 -34
vectordb_bench/backend/runner/rate_runner.py +51 -23
vectordb_bench/backend/runner/read_write_runner.py +140 -46
vectordb_bench/backend/runner/serial_runner.py +99 -50
vectordb_bench/backend/runner/util.py +4 -19
vectordb_bench/backend/task_runner.py +95 -74
vectordb_bench/backend/utils.py +17 -9
vectordb_bench/base.py +0 -1
vectordb_bench/cli/cli.py +65 -60
vectordb_bench/cli/vectordbbench.py +6 -7
vectordb_bench/frontend/components/check_results/charts.py +8 -19
vectordb_bench/frontend/components/check_results/data.py +4 -16
vectordb_bench/frontend/components/check_results/filters.py +8 -16
vectordb_bench/frontend/components/check_results/nav.py +4 -4
vectordb_bench/frontend/components/check_results/priceTable.py +1 -3
vectordb_bench/frontend/components/check_results/stPageConfig.py +2 -1
vectordb_bench/frontend/components/concurrent/charts.py +12 -12
vectordb_bench/frontend/components/custom/displayCustomCase.py +17 -11
vectordb_bench/frontend/components/custom/displaypPrams.py +4 -2
vectordb_bench/frontend/components/custom/getCustomConfig.py +1 -2
vectordb_bench/frontend/components/custom/initStyle.py +1 -1
vectordb_bench/frontend/components/get_results/saveAsImage.py +2 -0
vectordb_bench/frontend/components/run_test/caseSelector.py +3 -9
vectordb_bench/frontend/components/run_test/dbConfigSetting.py +1 -4
vectordb_bench/frontend/components/run_test/dbSelector.py +1 -1
vectordb_bench/frontend/components/run_test/generateTasks.py +8 -8
vectordb_bench/frontend/components/run_test/submitTask.py +14 -18
vectordb_bench/frontend/components/tables/data.py +3 -6
vectordb_bench/frontend/config/dbCaseConfigs.py +108 -83
vectordb_bench/frontend/pages/concurrent.py +3 -5
vectordb_bench/frontend/pages/custom.py +30 -9
vectordb_bench/frontend/pages/quries_per_dollar.py +3 -3
vectordb_bench/frontend/pages/run_test.py +3 -7
vectordb_bench/frontend/utils.py +1 -1
vectordb_bench/frontend/vdb_benchmark.py +4 -6
vectordb_bench/interface.py +56 -26
vectordb_bench/log_util.py +59 -64
vectordb_bench/metric.py +10 -11
vectordb_bench/models.py +26 -43
{vectordb_bench-0.0.18.dist-info → vectordb_bench-0.0.20.dist-info}/METADATA +34 -42
vectordb_bench-0.0.20.dist-info/RECORD +135 -0
{vectordb_bench-0.0.18.dist-info → vectordb_bench-0.0.20.dist-info}/WHEEL +1 -1
vectordb_bench-0.0.18.dist-info/RECORD +0 -131
{vectordb_bench-0.0.18.dist-info → vectordb_bench-0.0.20.dist-info}/LICENSE +0 -0
{vectordb_bench-0.0.18.dist-info → vectordb_bench-0.0.20.dist-info}/entry_points.txt +0 -0
{vectordb_bench-0.0.18.dist-info → vectordb_bench-0.0.20.dist-info}/top_level.txt +0 -0

vectordb_bench/frontend/components/custom/getCustomConfig.py CHANGED Viewed

@@ -32,8 +32,7 @@ def get_custom_configs():
 def save_custom_configs(custom_configs: list[CustomDatasetConfig]):
     with open(config.CUSTOM_CONFIG_DIR, "w") as f:
-        json.dump([custom_config.dict()
-                   for custom_config in custom_configs], f, indent=4)
+        json.dump([custom_config.dict() for custom_config in custom_configs], f, indent=4)
 def generate_custom_case():

vectordb_bench/frontend/components/custom/initStyle.py CHANGED Viewed

@@ -12,4 +12,4 @@ def initStyle(st):
             */
         </style>""",
         unsafe_allow_html=True,
-    )
+    )

vectordb_bench/frontend/components/get_results/saveAsImage.py CHANGED Viewed

@@ -9,10 +9,12 @@ HTML_2_CANVAS_URL = "https://unpkg.com/html2canvas@1.4.1/dist/html2canvas.js"
 def load_unpkg(src: str) -> str:
     return requests.get(src).text
 def getResults(container, pageName="vectordb_bench"):
     container.subheader("Get results")
     saveAsImage(container, pageName)
 def saveAsImage(container, pageName):
     html2canvasJS = load_unpkg(HTML_2_CANVAS_URL)
     container.write()

vectordb_bench/frontend/components/run_test/caseSelector.py CHANGED Viewed

@@ -1,6 +1,4 @@
 from vectordb_bench.frontend.config.styles import *
-from vectordb_bench.backend.cases import CaseType
 from vectordb_bench.frontend.config.dbCaseConfigs import *
 from collections import defaultdict
@@ -23,8 +21,7 @@ def caseSelector(st, activedDbList: list[DB]):
     dbToCaseConfigs = defaultdict(lambda: defaultdict(dict))
     caseClusters = UI_CASE_CLUSTERS + [get_custom_case_cluter()]
     for caseCluster in caseClusters:
-        activedCaseList += caseClusterExpander(
-            st, caseCluster, dbToCaseClusterConfigs, activedDbList)
+        activedCaseList += caseClusterExpander(st, caseCluster, dbToCaseClusterConfigs, activedDbList)
     for db in dbToCaseClusterConfigs:
         for uiCaseItem in dbToCaseClusterConfigs[db]:
             for case in uiCaseItem.cases:
@@ -40,8 +37,7 @@ def caseClusterExpander(st, caseCluster: UICaseItemCluster, dbToCaseClusterConfi
         if uiCaseItem.isLine:
             addHorizontalLine(expander)
         else:
-            activedCases += caseItemCheckbox(expander,
-                                             dbToCaseClusterConfigs, uiCaseItem, activedDbList)
+            activedCases += caseItemCheckbox(expander, dbToCaseClusterConfigs, uiCaseItem, activedDbList)
     return activedCases
@@ -53,9 +49,7 @@ def caseItemCheckbox(st, dbToCaseClusterConfigs, uiCaseItem: UICaseItem, actived
     )
     if selected:
-        caseConfigSetting(
-            st.container(), dbToCaseClusterConfigs, uiCaseItem, activedDbList
-        )
+        caseConfigSetting(st.container(), dbToCaseClusterConfigs, uiCaseItem, activedDbList)
     return uiCaseItem.cases if selected else []

vectordb_bench/frontend/components/run_test/dbConfigSetting.py CHANGED Viewed

@@ -42,10 +42,7 @@ def dbConfigSettingItem(st, activeDb: DB):
     # db config (unique)
     for key, property in properties.items():
-        if (
-            key not in dbConfigClass.common_short_configs()
-            and key not in dbConfigClass.common_long_configs()
-        ):
+        if key not in dbConfigClass.common_short_configs() and key not in dbConfigClass.common_long_configs():
             column = columns[idx % DB_CONFIG_SETTING_COLUMNS]
             idx += 1
             dbConfig[key] = column.text_input(

vectordb_bench/frontend/components/run_test/dbSelector.py CHANGED Viewed

@@ -22,7 +22,7 @@ def dbSelector(st):
         dbIsActived[db] = column.checkbox(db.name)
         try:
             column.image(DB_TO_ICON.get(db, ""))
-        except MediaFileStorageError as e:
+        except MediaFileStorageError:
             column.warning(f"{db.name} image not available")
             pass
     activedDbList = [db for db in DB_LIST if dbIsActived[db]]

vectordb_bench/frontend/components/run_test/generateTasks.py CHANGED Viewed

@@ -7,13 +7,13 @@ def generate_tasks(activedDbList: list[DB], dbConfigs, activedCaseList: list[Cas
     for db in activedDbList:
         for case in activedCaseList:
             task = TaskConfig(
-                    db=db.value,
-                    db_config=dbConfigs[db],
-                    case_config=case,
-                    db_case_config=db.case_config_cls(
-                        allCaseConfigs[db][case].get(CaseConfigParamType.IndexType, None)
-                    )(**{key.value: value for key, value in allCaseConfigs[db][case].items()}),
-                )
+                db=db.value,
+                db_config=dbConfigs[db],
+                case_config=case,
+                db_case_config=db.case_config_cls(allCaseConfigs[db][case].get(CaseConfigParamType.IndexType, None))(
+                    **{key.value: value for key, value in allCaseConfigs[db][case].items()}
+                ),
+            )
             tasks.append(task)
     return tasks

vectordb_bench/frontend/components/run_test/submitTask.py CHANGED Viewed

@@ -1,6 +1,6 @@
 from datetime import datetime
-from vectordb_bench.frontend.config.styles import *
-from vectordb_bench.interface import benchMarkRunner
+from vectordb_bench.frontend.config import styles
+from vectordb_bench.interface import benchmark_runner
 def submitTask(st, tasks, isAllValid):
@@ -27,10 +27,8 @@ def submitTask(st, tasks, isAllValid):
 def taskLabelInput(st):
     defaultTaskLabel = datetime.now().strftime("%Y%m%d%H")
-    columns = st.columns(TASK_LABEL_INPUT_COLUMNS)
-    taskLabel = columns[0].text_input(
-        "task_label", defaultTaskLabel, label_visibility="collapsed"
-    )
+    columns = st.columns(styles.TASK_LABEL_INPUT_COLUMNS)
+    taskLabel = columns[0].text_input("task_label", defaultTaskLabel, label_visibility="collapsed")
     return taskLabel
@@ -46,10 +44,8 @@ def advancedSettings(st):
     )
     container = st.columns([1, 2])
-    k = container[0].number_input("k",min_value=1, value=100, label_visibility="collapsed")
-    container[1].caption(
-        "K value for number of nearest neighbors to search"
-    )
+    k = container[0].number_input("k", min_value=1, value=100, label_visibility="collapsed")
+    container[1].caption("K value for number of nearest neighbors to search")
     return index_already_exists, use_aliyun, k
@@ -58,20 +54,20 @@ def controlPanel(st, tasks, taskLabel, isAllValid):
     index_already_exists, use_aliyun, k = advancedSettings(st)
     def runHandler():
-        benchMarkRunner.set_drop_old(not index_already_exists)
+        benchmark_runner.set_drop_old(not index_already_exists)
         for task in tasks:
             task.case_config.k = k
-        benchMarkRunner.set_download_address(use_aliyun)
-        benchMarkRunner.run(tasks, taskLabel)
+        benchmark_runner.set_download_address(use_aliyun)
+        benchmark_runner.run(tasks, taskLabel)
     def stopHandler():
-        benchMarkRunner.stop_running()
+        benchmark_runner.stop_running()
-    isRunning = benchMarkRunner.has_running()
+    isRunning = benchmark_runner.has_running()
     if isRunning:
-        currentTaskId = benchMarkRunner.get_current_task_id()
-        tasksCount = benchMarkRunner.get_tasks_count()
+        currentTaskId = benchmark_runner.get_current_task_id()
+        tasksCount = benchmark_runner.get_tasks_count()
         text = f":running: Running Task {currentTaskId} / {tasksCount}"
         st.progress(currentTaskId / tasksCount, text=text)
@@ -89,7 +85,7 @@ def controlPanel(st, tasks, taskLabel, isAllValid):
         )
     else:
-        errorText = benchMarkRunner.latest_error or ""
+        errorText = benchmark_runner.latest_error or ""
         if len(errorText) > 0:
             st.error(errorText)
         disabled = True if len(tasks) == 0 or not isAllValid else False

vectordb_bench/frontend/components/tables/data.py CHANGED Viewed

@@ -1,12 +1,11 @@
 from dataclasses import asdict
-from vectordb_bench.backend.cases import CaseType
-from vectordb_bench.interface import benchMarkRunner
+from vectordb_bench.interface import benchmark_runner
 from vectordb_bench.models import CaseResult, ResultLabel
 import pandas as pd
 def getNewResults():
-    allResults = benchMarkRunner.get_results()
+    allResults = benchmark_runner.get_results()
     newResults: list[CaseResult] = []
     for res in allResults:
@@ -14,7 +13,6 @@ def getNewResults():
         for result in results:
             if result.label == ResultLabel.NORMAL:
                 newResults.append(result)
     df = pd.DataFrame(formatData(newResults))
     return df
@@ -26,7 +24,6 @@ def formatData(caseResults: list[CaseResult]):
         db = caseResult.task_config.db.value
         db_label = caseResult.task_config.db_config.db_label
         case_config = caseResult.task_config.case_config
-        db_case_config = caseResult.task_config.db_case_config
         case = case_config.case_id.case_cls()
         filter_rate = case.filter_rate
         dataset = case.dataset.data.name
@@ -41,4 +38,4 @@ def formatData(caseResults: list[CaseResult]):
                 **metrics,
             }
         )
-    return data
+    return data

vectordb-bench 0.0.18__py3-none-any.whl → 0.0.20__py3-none-any.whl

vectordb-bench 0.0.18py3-none-any.whl → 0.0.20py3-none-any.whl