PyPI - nucliadb - Versions diffs - 2.46.1.post382__py3-none-any.whl → 6.2.1.post2777__py3-none-any.whl - Mend

nucliadb 2.46.1.post382py3-none-any.whl → 6.2.1.post2777py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (431) hide show

migrations/0002_rollover_shards.py +1 -2
migrations/0003_allfields_key.py +2 -37
migrations/0004_rollover_shards.py +1 -2
migrations/0005_rollover_shards.py +1 -2
migrations/0006_rollover_shards.py +2 -4
migrations/0008_cleanup_leftover_rollover_metadata.py +1 -2
migrations/0009_upgrade_relations_and_texts_to_v2.py +5 -4
migrations/0010_fix_corrupt_indexes.py +11 -12
migrations/0011_materialize_labelset_ids.py +2 -18
migrations/0012_rollover_shards.py +6 -12
migrations/0013_rollover_shards.py +2 -4
migrations/0014_rollover_shards.py +5 -7
migrations/0015_targeted_rollover.py +6 -12
migrations/0016_upgrade_to_paragraphs_v2.py +27 -32
migrations/0017_multiple_writable_shards.py +3 -6
migrations/0018_purge_orphan_kbslugs.py +59 -0
migrations/0019_upgrade_to_paragraphs_v3.py +66 -0
migrations/0020_drain_nodes_from_cluster.py +83 -0
nucliadb/standalone/tests/unit/test_run.py → migrations/0021_overwrite_vectorsets_key.py +17 -18
nucliadb/tests/unit/test_openapi.py → migrations/0022_fix_paragraph_deletion_bug.py +16 -11
migrations/0023_backfill_pg_catalog.py +80 -0
migrations/0025_assign_models_to_kbs_v2.py +113 -0
migrations/0026_fix_high_cardinality_content_types.py +61 -0
migrations/0027_rollover_texts3.py +73 -0
nucliadb/ingest/fields/date.py → migrations/pg/0001_bootstrap.py +10 -12
migrations/pg/0002_catalog.py +42 -0
nucliadb/ingest/tests/unit/test_settings.py → migrations/pg/0003_catalog_kbid_index.py +5 -3
nucliadb/common/cluster/base.py +41 -24
nucliadb/common/cluster/discovery/base.py +6 -14
nucliadb/common/cluster/discovery/k8s.py +9 -19
nucliadb/common/cluster/discovery/manual.py +1 -3
nucliadb/common/cluster/discovery/single.py +1 -2
nucliadb/common/cluster/discovery/utils.py +1 -3
nucliadb/common/cluster/grpc_node_dummy.py +11 -16
nucliadb/common/cluster/index_node.py +10 -19
nucliadb/common/cluster/manager.py +223 -102
nucliadb/common/cluster/rebalance.py +42 -37
nucliadb/common/cluster/rollover.py +377 -204
nucliadb/common/cluster/settings.py +16 -9
nucliadb/common/cluster/standalone/grpc_node_binding.py +24 -76
nucliadb/common/cluster/standalone/index_node.py +4 -11
nucliadb/common/cluster/standalone/service.py +2 -6
nucliadb/common/cluster/standalone/utils.py +9 -6
nucliadb/common/cluster/utils.py +43 -29
nucliadb/common/constants.py +20 -0
nucliadb/common/context/__init__.py +6 -4
nucliadb/common/context/fastapi.py +8 -5
nucliadb/{tests/knowledgeboxes/__init__.py → common/counters.py} +8 -2
nucliadb/common/datamanagers/__init__.py +24 -5
nucliadb/common/datamanagers/atomic.py +102 -0
nucliadb/common/datamanagers/cluster.py +5 -5
nucliadb/common/datamanagers/entities.py +6 -16
nucliadb/common/datamanagers/fields.py +84 -0
nucliadb/common/datamanagers/kb.py +101 -24
nucliadb/common/datamanagers/labels.py +26 -56
nucliadb/common/datamanagers/processing.py +2 -6
nucliadb/common/datamanagers/resources.py +214 -117
nucliadb/common/datamanagers/rollover.py +77 -16
nucliadb/{ingest/orm → common/datamanagers}/synonyms.py +16 -28
nucliadb/common/datamanagers/utils.py +19 -11
nucliadb/common/datamanagers/vectorsets.py +110 -0
nucliadb/common/external_index_providers/base.py +257 -0
nucliadb/{ingest/tests/unit/test_cache.py → common/external_index_providers/exceptions.py} +9 -8
nucliadb/common/external_index_providers/manager.py +101 -0
nucliadb/common/external_index_providers/pinecone.py +933 -0
nucliadb/common/external_index_providers/settings.py +52 -0
nucliadb/common/http_clients/auth.py +3 -6
nucliadb/common/http_clients/processing.py +6 -11
nucliadb/common/http_clients/utils.py +1 -3
nucliadb/common/ids.py +240 -0
nucliadb/common/locking.py +43 -13
nucliadb/common/maindb/driver.py +11 -35
nucliadb/common/maindb/exceptions.py +6 -6
nucliadb/common/maindb/local.py +22 -9
nucliadb/common/maindb/pg.py +206 -111
nucliadb/common/maindb/utils.py +13 -44
nucliadb/common/models_utils/from_proto.py +479 -0
nucliadb/common/models_utils/to_proto.py +60 -0
nucliadb/common/nidx.py +260 -0
nucliadb/export_import/datamanager.py +25 -19
nucliadb/export_import/exceptions.py +8 -0
nucliadb/export_import/exporter.py +20 -7
nucliadb/export_import/importer.py +6 -11
nucliadb/export_import/models.py +5 -5
nucliadb/export_import/tasks.py +4 -4
nucliadb/export_import/utils.py +94 -54
nucliadb/health.py +1 -3
nucliadb/ingest/app.py +15 -11
nucliadb/ingest/consumer/auditing.py +30 -147
nucliadb/ingest/consumer/consumer.py +96 -52
nucliadb/ingest/consumer/materializer.py +10 -12
nucliadb/ingest/consumer/pull.py +12 -27
nucliadb/ingest/consumer/service.py +20 -19
nucliadb/ingest/consumer/shard_creator.py +7 -14
nucliadb/ingest/consumer/utils.py +1 -3
nucliadb/ingest/fields/base.py +139 -188
nucliadb/ingest/fields/conversation.py +18 -5
nucliadb/ingest/fields/exceptions.py +1 -4
nucliadb/ingest/fields/file.py +7 -25
nucliadb/ingest/fields/link.py +11 -16
nucliadb/ingest/fields/text.py +9 -4
nucliadb/ingest/orm/brain.py +255 -262
nucliadb/ingest/orm/broker_message.py +181 -0
nucliadb/ingest/orm/entities.py +36 -51
nucliadb/ingest/orm/exceptions.py +12 -0
nucliadb/ingest/orm/knowledgebox.py +334 -278
nucliadb/ingest/orm/processor/__init__.py +2 -697
nucliadb/ingest/orm/processor/auditing.py +117 -0
nucliadb/ingest/orm/processor/data_augmentation.py +164 -0
nucliadb/ingest/orm/processor/pgcatalog.py +84 -0
nucliadb/ingest/orm/processor/processor.py +752 -0
nucliadb/ingest/orm/processor/sequence_manager.py +1 -1
nucliadb/ingest/orm/resource.py +280 -520
nucliadb/ingest/orm/utils.py +25 -31
nucliadb/ingest/partitions.py +3 -9
nucliadb/ingest/processing.py +76 -81
nucliadb/ingest/py.typed +0 -0
nucliadb/ingest/serialize.py +37 -173
nucliadb/ingest/service/__init__.py +1 -3
nucliadb/ingest/service/writer.py +186 -577
nucliadb/ingest/settings.py +13 -22
nucliadb/ingest/utils.py +3 -6
nucliadb/learning_proxy.py +264 -51
nucliadb/metrics_exporter.py +30 -19
nucliadb/middleware/__init__.py +1 -3
nucliadb/migrator/command.py +1 -3
nucliadb/migrator/datamanager.py +13 -13
nucliadb/migrator/migrator.py +57 -37
nucliadb/migrator/settings.py +2 -1
nucliadb/migrator/utils.py +18 -10
nucliadb/purge/__init__.py +139 -33
nucliadb/purge/orphan_shards.py +7 -13
nucliadb/reader/__init__.py +1 -3
nucliadb/reader/api/models.py +3 -14
nucliadb/reader/api/v1/__init__.py +0 -1
nucliadb/reader/api/v1/download.py +27 -94
nucliadb/reader/api/v1/export_import.py +4 -4
nucliadb/reader/api/v1/knowledgebox.py +13 -13
nucliadb/reader/api/v1/learning_config.py +8 -12
nucliadb/reader/api/v1/resource.py +67 -93
nucliadb/reader/api/v1/services.py +70 -125
nucliadb/reader/app.py +16 -46
nucliadb/reader/lifecycle.py +18 -4
nucliadb/reader/py.typed +0 -0
nucliadb/reader/reader/notifications.py +10 -31
nucliadb/search/__init__.py +1 -3
nucliadb/search/api/v1/__init__.py +2 -2
nucliadb/search/api/v1/ask.py +112 -0
nucliadb/search/api/v1/catalog.py +184 -0
nucliadb/search/api/v1/feedback.py +17 -25
nucliadb/search/api/v1/find.py +41 -41
nucliadb/search/api/v1/knowledgebox.py +90 -62
nucliadb/search/api/v1/predict_proxy.py +2 -2
nucliadb/search/api/v1/resource/ask.py +66 -117
nucliadb/search/api/v1/resource/search.py +51 -72
nucliadb/search/api/v1/router.py +1 -0
nucliadb/search/api/v1/search.py +50 -197
nucliadb/search/api/v1/suggest.py +40 -54
nucliadb/search/api/v1/summarize.py +9 -5
nucliadb/search/api/v1/utils.py +2 -1
nucliadb/search/app.py +16 -48
nucliadb/search/lifecycle.py +10 -3
nucliadb/search/predict.py +176 -188
nucliadb/search/py.typed +0 -0
nucliadb/search/requesters/utils.py +41 -63
nucliadb/search/search/cache.py +149 -20
nucliadb/search/search/chat/ask.py +918 -0
nucliadb/search/{tests/unit/test_run.py → search/chat/exceptions.py} +14 -13
nucliadb/search/search/chat/images.py +41 -17
nucliadb/search/search/chat/prompt.py +851 -282
nucliadb/search/search/chat/query.py +274 -267
nucliadb/{writer/resource/slug.py → search/search/cut.py} +8 -6
nucliadb/search/search/fetch.py +43 -36
nucliadb/search/search/filters.py +9 -15
nucliadb/search/search/find.py +214 -54
nucliadb/search/search/find_merge.py +408 -391
nucliadb/search/search/hydrator.py +191 -0
nucliadb/search/search/merge.py +198 -234
nucliadb/search/search/metrics.py +73 -2
nucliadb/search/search/paragraphs.py +64 -106
nucliadb/search/search/pgcatalog.py +233 -0
nucliadb/search/search/predict_proxy.py +1 -1
nucliadb/search/search/query.py +386 -257
nucliadb/search/search/query_parser/exceptions.py +22 -0
nucliadb/search/search/query_parser/models.py +101 -0
nucliadb/search/search/query_parser/parser.py +183 -0
nucliadb/search/search/rank_fusion.py +204 -0
nucliadb/search/search/rerankers.py +270 -0
nucliadb/search/search/shards.py +4 -38
nucliadb/search/search/summarize.py +14 -18
nucliadb/search/search/utils.py +27 -4
nucliadb/search/settings.py +15 -1
nucliadb/standalone/api_router.py +4 -10
nucliadb/standalone/app.py +17 -14
nucliadb/standalone/auth.py +7 -21
nucliadb/standalone/config.py +9 -12
nucliadb/standalone/introspect.py +5 -5
nucliadb/standalone/lifecycle.py +26 -25
nucliadb/standalone/migrations.py +58 -0
nucliadb/standalone/purge.py +9 -8
nucliadb/standalone/py.typed +0 -0
nucliadb/standalone/run.py +25 -18
nucliadb/standalone/settings.py +10 -14
nucliadb/standalone/versions.py +15 -5
nucliadb/tasks/consumer.py +8 -12
nucliadb/tasks/producer.py +7 -6
nucliadb/tests/config.py +53 -0
nucliadb/train/__init__.py +1 -3
nucliadb/train/api/utils.py +1 -2
nucliadb/train/api/v1/shards.py +2 -2
nucliadb/train/api/v1/trainset.py +4 -6
nucliadb/train/app.py +14 -47
nucliadb/train/generator.py +10 -19
nucliadb/train/generators/field_classifier.py +7 -19
nucliadb/train/generators/field_streaming.py +156 -0
nucliadb/train/generators/image_classifier.py +12 -18
nucliadb/train/generators/paragraph_classifier.py +5 -9
nucliadb/train/generators/paragraph_streaming.py +6 -9
nucliadb/train/generators/question_answer_streaming.py +19 -20
nucliadb/train/generators/sentence_classifier.py +9 -15
nucliadb/train/generators/token_classifier.py +45 -36
nucliadb/train/generators/utils.py +14 -18
nucliadb/train/lifecycle.py +7 -3
nucliadb/train/nodes.py +23 -32
nucliadb/train/py.typed +0 -0
nucliadb/train/servicer.py +13 -21
nucliadb/train/settings.py +2 -6
nucliadb/train/types.py +13 -10
nucliadb/train/upload.py +3 -6
nucliadb/train/uploader.py +20 -25
nucliadb/train/utils.py +1 -1
nucliadb/writer/__init__.py +1 -3
nucliadb/writer/api/constants.py +0 -5
nucliadb/{ingest/fields/keywordset.py → writer/api/utils.py} +13 -10
nucliadb/writer/api/v1/export_import.py +102 -49
nucliadb/writer/api/v1/field.py +196 -620
nucliadb/writer/api/v1/knowledgebox.py +221 -71
nucliadb/writer/api/v1/learning_config.py +2 -2
nucliadb/writer/api/v1/resource.py +114 -216
nucliadb/writer/api/v1/services.py +64 -132
nucliadb/writer/api/v1/slug.py +61 -0
nucliadb/writer/api/v1/transaction.py +67 -0
nucliadb/writer/api/v1/upload.py +184 -215
nucliadb/writer/app.py +11 -61
nucliadb/writer/back_pressure.py +62 -43
nucliadb/writer/exceptions.py +0 -4
nucliadb/writer/lifecycle.py +21 -15
nucliadb/writer/py.typed +0 -0
nucliadb/writer/resource/audit.py +2 -1
nucliadb/writer/resource/basic.py +48 -62
nucliadb/writer/resource/field.py +45 -135
nucliadb/writer/resource/origin.py +1 -2
nucliadb/writer/settings.py +14 -5
nucliadb/writer/tus/__init__.py +17 -15
nucliadb/writer/tus/azure.py +111 -0
nucliadb/writer/tus/dm.py +17 -5
nucliadb/writer/tus/exceptions.py +1 -3
nucliadb/writer/tus/gcs.py +56 -84
nucliadb/writer/tus/local.py +21 -37
nucliadb/writer/tus/s3.py +28 -68
nucliadb/writer/tus/storage.py +5 -56
nucliadb/writer/vectorsets.py +125 -0
nucliadb-6.2.1.post2777.dist-info/METADATA +148 -0
nucliadb-6.2.1.post2777.dist-info/RECORD +343 -0
{nucliadb-2.46.1.post382.dist-info → nucliadb-6.2.1.post2777.dist-info}/WHEEL +1 -1
nucliadb/common/maindb/redis.py +0 -194
nucliadb/common/maindb/tikv.py +0 -412
nucliadb/ingest/fields/layout.py +0 -58
nucliadb/ingest/tests/conftest.py +0 -30
nucliadb/ingest/tests/fixtures.py +0 -771
nucliadb/ingest/tests/integration/consumer/__init__.py +0 -18
nucliadb/ingest/tests/integration/consumer/test_auditing.py +0 -80
nucliadb/ingest/tests/integration/consumer/test_materializer.py +0 -89
nucliadb/ingest/tests/integration/consumer/test_pull.py +0 -144
nucliadb/ingest/tests/integration/consumer/test_service.py +0 -81
nucliadb/ingest/tests/integration/consumer/test_shard_creator.py +0 -68
nucliadb/ingest/tests/integration/ingest/test_ingest.py +0 -691
nucliadb/ingest/tests/integration/ingest/test_processing_engine.py +0 -95
nucliadb/ingest/tests/integration/ingest/test_relations.py +0 -272
nucliadb/ingest/tests/unit/consumer/__init__.py +0 -18
nucliadb/ingest/tests/unit/consumer/test_auditing.py +0 -140
nucliadb/ingest/tests/unit/consumer/test_consumer.py +0 -69
nucliadb/ingest/tests/unit/consumer/test_pull.py +0 -60
nucliadb/ingest/tests/unit/consumer/test_shard_creator.py +0 -139
nucliadb/ingest/tests/unit/consumer/test_utils.py +0 -67
nucliadb/ingest/tests/unit/orm/__init__.py +0 -19
nucliadb/ingest/tests/unit/orm/test_brain.py +0 -247
nucliadb/ingest/tests/unit/orm/test_processor.py +0 -131
nucliadb/ingest/tests/unit/orm/test_resource.py +0 -275
nucliadb/ingest/tests/unit/test_partitions.py +0 -40
nucliadb/ingest/tests/unit/test_processing.py +0 -171
nucliadb/middleware/transaction.py +0 -117
nucliadb/reader/api/v1/learning_collector.py +0 -63
nucliadb/reader/tests/__init__.py +0 -19
nucliadb/reader/tests/conftest.py +0 -31
nucliadb/reader/tests/fixtures.py +0 -136
nucliadb/reader/tests/test_list_resources.py +0 -75
nucliadb/reader/tests/test_reader_file_download.py +0 -273
nucliadb/reader/tests/test_reader_resource.py +0 -379
nucliadb/reader/tests/test_reader_resource_field.py +0 -219
nucliadb/search/api/v1/chat.py +0 -258
nucliadb/search/api/v1/resource/chat.py +0 -94
nucliadb/search/tests/__init__.py +0 -19
nucliadb/search/tests/conftest.py +0 -33
nucliadb/search/tests/fixtures.py +0 -199
nucliadb/search/tests/node.py +0 -465
nucliadb/search/tests/unit/__init__.py +0 -18
nucliadb/search/tests/unit/api/__init__.py +0 -19
nucliadb/search/tests/unit/api/v1/__init__.py +0 -19
nucliadb/search/tests/unit/api/v1/resource/__init__.py +0 -19
nucliadb/search/tests/unit/api/v1/resource/test_ask.py +0 -67
nucliadb/search/tests/unit/api/v1/resource/test_chat.py +0 -97
nucliadb/search/tests/unit/api/v1/test_chat.py +0 -96
nucliadb/search/tests/unit/api/v1/test_predict_proxy.py +0 -98
nucliadb/search/tests/unit/api/v1/test_summarize.py +0 -93
nucliadb/search/tests/unit/search/__init__.py +0 -18
nucliadb/search/tests/unit/search/requesters/__init__.py +0 -18
nucliadb/search/tests/unit/search/requesters/test_utils.py +0 -210
nucliadb/search/tests/unit/search/search/__init__.py +0 -19
nucliadb/search/tests/unit/search/search/test_shards.py +0 -45
nucliadb/search/tests/unit/search/search/test_utils.py +0 -82
nucliadb/search/tests/unit/search/test_chat_prompt.py +0 -266
nucliadb/search/tests/unit/search/test_fetch.py +0 -108
nucliadb/search/tests/unit/search/test_filters.py +0 -125
nucliadb/search/tests/unit/search/test_paragraphs.py +0 -157
nucliadb/search/tests/unit/search/test_predict_proxy.py +0 -106
nucliadb/search/tests/unit/search/test_query.py +0 -201
nucliadb/search/tests/unit/test_app.py +0 -79
nucliadb/search/tests/unit/test_find_merge.py +0 -112
nucliadb/search/tests/unit/test_merge.py +0 -34
nucliadb/search/tests/unit/test_predict.py +0 -584
nucliadb/standalone/tests/__init__.py +0 -19
nucliadb/standalone/tests/conftest.py +0 -33
nucliadb/standalone/tests/fixtures.py +0 -38
nucliadb/standalone/tests/unit/__init__.py +0 -18
nucliadb/standalone/tests/unit/test_api_router.py +0 -61
nucliadb/standalone/tests/unit/test_auth.py +0 -169
nucliadb/standalone/tests/unit/test_introspect.py +0 -35
nucliadb/standalone/tests/unit/test_versions.py +0 -68
nucliadb/tests/benchmarks/__init__.py +0 -19
nucliadb/tests/benchmarks/test_search.py +0 -99
nucliadb/tests/conftest.py +0 -32
nucliadb/tests/fixtures.py +0 -736
nucliadb/tests/knowledgeboxes/philosophy_books.py +0 -203
nucliadb/tests/knowledgeboxes/ten_dummy_resources.py +0 -109
nucliadb/tests/migrations/__init__.py +0 -19
nucliadb/tests/migrations/test_migration_0017.py +0 -80
nucliadb/tests/tikv.py +0 -240
nucliadb/tests/unit/__init__.py +0 -19
nucliadb/tests/unit/common/__init__.py +0 -19
nucliadb/tests/unit/common/cluster/__init__.py +0 -19
nucliadb/tests/unit/common/cluster/discovery/__init__.py +0 -19
nucliadb/tests/unit/common/cluster/discovery/test_k8s.py +0 -170
nucliadb/tests/unit/common/cluster/standalone/__init__.py +0 -18
nucliadb/tests/unit/common/cluster/standalone/test_service.py +0 -113
nucliadb/tests/unit/common/cluster/standalone/test_utils.py +0 -59
nucliadb/tests/unit/common/cluster/test_cluster.py +0 -399
nucliadb/tests/unit/common/cluster/test_kb_shard_manager.py +0 -178
nucliadb/tests/unit/common/cluster/test_rollover.py +0 -279
nucliadb/tests/unit/common/maindb/__init__.py +0 -18
nucliadb/tests/unit/common/maindb/test_driver.py +0 -127
nucliadb/tests/unit/common/maindb/test_tikv.py +0 -53
nucliadb/tests/unit/common/maindb/test_utils.py +0 -81
nucliadb/tests/unit/common/test_context.py +0 -36
nucliadb/tests/unit/export_import/__init__.py +0 -19
nucliadb/tests/unit/export_import/test_datamanager.py +0 -37
nucliadb/tests/unit/export_import/test_utils.py +0 -294
nucliadb/tests/unit/migrator/__init__.py +0 -19
nucliadb/tests/unit/migrator/test_migrator.py +0 -87
nucliadb/tests/unit/tasks/__init__.py +0 -19
nucliadb/tests/unit/tasks/conftest.py +0 -42
nucliadb/tests/unit/tasks/test_consumer.py +0 -93
nucliadb/tests/unit/tasks/test_producer.py +0 -95
nucliadb/tests/unit/tasks/test_tasks.py +0 -60
nucliadb/tests/unit/test_field_ids.py +0 -49
nucliadb/tests/unit/test_health.py +0 -84
nucliadb/tests/unit/test_kb_slugs.py +0 -54
nucliadb/tests/unit/test_learning_proxy.py +0 -252
nucliadb/tests/unit/test_metrics_exporter.py +0 -77
nucliadb/tests/unit/test_purge.py +0 -138
nucliadb/tests/utils/__init__.py +0 -74
nucliadb/tests/utils/aiohttp_session.py +0 -44
nucliadb/tests/utils/broker_messages/__init__.py +0 -167
nucliadb/tests/utils/broker_messages/fields.py +0 -181
nucliadb/tests/utils/broker_messages/helpers.py +0 -33
nucliadb/tests/utils/entities.py +0 -78
nucliadb/train/api/v1/check.py +0 -60
nucliadb/train/tests/__init__.py +0 -19
nucliadb/train/tests/conftest.py +0 -29
nucliadb/train/tests/fixtures.py +0 -342
nucliadb/train/tests/test_field_classification.py +0 -122
nucliadb/train/tests/test_get_entities.py +0 -80
nucliadb/train/tests/test_get_info.py +0 -51
nucliadb/train/tests/test_get_ontology.py +0 -34
nucliadb/train/tests/test_get_ontology_count.py +0 -63
nucliadb/train/tests/test_image_classification.py +0 -222
nucliadb/train/tests/test_list_fields.py +0 -39
nucliadb/train/tests/test_list_paragraphs.py +0 -73
nucliadb/train/tests/test_list_resources.py +0 -39
nucliadb/train/tests/test_list_sentences.py +0 -71
nucliadb/train/tests/test_paragraph_classification.py +0 -123
nucliadb/train/tests/test_paragraph_streaming.py +0 -118
nucliadb/train/tests/test_question_answer_streaming.py +0 -239
nucliadb/train/tests/test_sentence_classification.py +0 -143
nucliadb/train/tests/test_token_classification.py +0 -136
nucliadb/train/tests/utils.py +0 -108
nucliadb/writer/layouts/__init__.py +0 -51
nucliadb/writer/layouts/v1.py +0 -59
nucliadb/writer/resource/vectors.py +0 -120
nucliadb/writer/tests/__init__.py +0 -19
nucliadb/writer/tests/conftest.py +0 -31
nucliadb/writer/tests/fixtures.py +0 -192
nucliadb/writer/tests/test_fields.py +0 -486
nucliadb/writer/tests/test_files.py +0 -743
nucliadb/writer/tests/test_knowledgebox.py +0 -49
nucliadb/writer/tests/test_reprocess_file_field.py +0 -139
nucliadb/writer/tests/test_resources.py +0 -546
nucliadb/writer/tests/test_service.py +0 -137
nucliadb/writer/tests/test_tus.py +0 -203
nucliadb/writer/tests/utils.py +0 -35
nucliadb/writer/tus/pg.py +0 -125
nucliadb-2.46.1.post382.dist-info/METADATA +0 -134
nucliadb-2.46.1.post382.dist-info/RECORD +0 -451
{nucliadb/ingest/tests → migrations/pg}/__init__.py +0 -0
/nucliadb/{ingest/tests/integration → common/external_index_providers}/__init__.py +0 -0
/nucliadb/{ingest/tests/integration/ingest → common/models_utils}/__init__.py +0 -0
/nucliadb/{ingest/tests/unit → search/search/query_parser}/__init__.py +0 -0
/nucliadb/{ingest/tests → tests}/vectors.py +0 -0
{nucliadb-2.46.1.post382.dist-info → nucliadb-6.2.1.post2777.dist-info}/entry_points.txt +0 -0
{nucliadb-2.46.1.post382.dist-info → nucliadb-6.2.1.post2777.dist-info}/top_level.txt +0 -0
{nucliadb-2.46.1.post382.dist-info → nucliadb-6.2.1.post2777.dist-info}/zip-safe +0 -0

nucliadb/common/cluster/settings.py CHANGED Viewed

@@ -18,8 +18,10 @@
 # along with this program. If not, see <http://www.gnu.org/licenses/>.
 #
 import enum
+from typing import Optional
-from pydantic import BaseSettings, Field
+from pydantic import Field
+from pydantic_settings import BaseSettings
 class ClusterDiscoveryMode(str, enum.Enum):
@@ -28,7 +30,7 @@ class ClusterDiscoveryMode(str, enum.Enum):
     SINGLE_NODE = "single_node"
-class StandaloneNodeRole(str, enum.Enum):
+class StandaloneNodeRole(enum.Enum):
     ALL = "all"
     INDEX = "index"
     WORKER = "worker"
@@ -55,16 +57,10 @@ class Settings(BaseSettings):
     # Node limits
     max_shard_paragraphs: int = Field(
-        default=250_000,
+        default=500_000,
         title="Max shard paragraphs",
         description="Maximum number of paragraphs to target per shard",
     )
-    max_shard_fields: int = Field(
-        default=125_000,
-        title="Max shard fields",
-        description="Maximum number of fields to target per shard. "
-        "If this is reached before max_shard_paragraphs, we will create a new shard",
-    )
     max_node_replicas: int = Field(
         default=800,
         title="Max node replicas",
@@ -76,6 +72,12 @@ class Settings(BaseSettings):
         description="Maximum number of paragraphs allowed on a single resource",
     )
+    drain_nodes: list[str] = Field(
+        default=[],
+        title="Drain nodes",
+        description="List of node IDs to ignore when creating new shards. It is used for draining nodes from a cluster. Example: ['1bf3bfe7-e164-4a19-a4d9-41372fc15aca',]",  # noqa: E501
+    )
     local_reader_threads: int = 5
     local_writer_threads: int = 5
@@ -84,6 +86,11 @@ class Settings(BaseSettings):
     cluster_discovery_kubernetes_selector: str = "appType=node"
     cluster_discovery_manual_addresses: list[str] = []
+    nidx_api_address: Optional[str] = Field(default=None, description="NIDX gRPC API address")
+    nidx_searcher_address: Optional[str] = Field(
+        default=None, description="NIDX gRPC searcher API address"
+    )
 settings = Settings()

nucliadb/common/cluster/standalone/grpc_node_binding.py CHANGED Viewed

@@ -30,6 +30,7 @@ from nucliadb_protos.nodereader_pb2 import (
     DocumentItem,
     EdgeList,
     GetShardRequest,
+    IdCollection,
     ParagraphItem,
     ParagraphSearchRequest,
     ParagraphSearchResponse,
@@ -46,17 +47,14 @@ from nucliadb_protos.noderesources_pb2 import (
     EmptyResponse,
     Resource,
     ResourceID,
-)
-from nucliadb_protos.noderesources_pb2 import Shard as NodeResourcesShard
-from nucliadb_protos.noderesources_pb2 import (
     ShardCreated,
     ShardId,
     ShardIds,
-    ShardMetadata,
     VectorSetID,
     VectorSetList,
 )
-from nucliadb_protos.nodewriter_pb2 import OpStatus
+from nucliadb_protos.noderesources_pb2 import Shard as NodeResourcesShard
+from nucliadb_protos.nodewriter_pb2 import NewShardRequest, OpStatus
 from ..settings import settings
@@ -69,8 +67,7 @@ except ImportError:  # pragma: no cover
     IndexNodeException = Exception
 try:
-    from nucliadb_node_binding import NodeReader  # type: ignore
-    from nucliadb_node_binding import NodeWriter  # type: ignore
+    from nucliadb_node_binding import NodeReader, NodeWriter
 except ImportError:  # pragma: no cover
     NodeReader = None
     NodeWriter = None
@@ -81,15 +78,11 @@ class StandaloneReaderWrapper:
     def __init__(self):
         if NodeReader is None:
-            raise ImportError(
-                "NucliaDB index node bindings are not installed (reader not found)"
-            )
+            raise ImportError("NucliaDB index node bindings are not installed (reader not found)")
         self.reader = NodeReader()
         self.executor = ThreadPoolExecutor(settings.local_reader_threads)
-    async def Search(
-        self, request: SearchRequest, retry: bool = False
-    ) -> SearchResponse:
+    async def Search(self, request: SearchRequest, retry: bool = False) -> SearchResponse:
         try:
             loop = asyncio.get_running_loop()
             result = await loop.run_in_executor(
@@ -113,30 +106,6 @@ class StandaloneReaderWrapper:
             else:
                 raise
-    async def ParagraphSearch(
-        self, request: ParagraphSearchRequest
-    ) -> ParagraphSearchResponse:
-        loop = asyncio.get_running_loop()
-        result = await loop.run_in_executor(
-            self.executor, self.reader.paragraph_search, request.SerializeToString()
-        )
-        pb_bytes = bytes(result)
-        pb = ParagraphSearchResponse()
-        pb.ParseFromString(pb_bytes)
-        return pb
-    async def RelationSearch(
-        self, request: RelationSearchRequest
-    ) -> RelationSearchResponse:
-        loop = asyncio.get_running_loop()
-        result = await loop.run_in_executor(
-            self.executor, self.reader.relation_search, request.SerializeToString()
-        )
-        pb_bytes = bytes(result)
-        pb = RelationSearchResponse()
-        pb.ParseFromString(pb_bytes)
-        return pb
     async def GetShard(self, request: GetShardRequest) -> NodeResourcesShard:
         loop = asyncio.get_running_loop()
         result = await loop.run_in_executor(
@@ -201,9 +170,7 @@ class StandaloneReaderWrapper:
             raise exception
         await loop.run_in_executor(self.executor, t1.join)
-    async def Paragraphs(
-        self, stream_request: StreamRequest
-    ) -> AsyncIterator[ParagraphItem]:
+    async def Paragraphs(self, stream_request: StreamRequest) -> AsyncIterator[ParagraphItem]:
         loop = asyncio.get_running_loop()
         q: asyncio.Queue[ParagraphItem] = asyncio.Queue(1)
         exception = None
@@ -249,30 +216,15 @@ class StandaloneReaderWrapper:
         edge_list.ParseFromString(pb_bytes)
         return edge_list
-async def Search(self, request: SearchRequest, retry: bool = False) -> SearchResponse:
-    try:
+    async def VectorIds(self, request: VectorSetID) -> IdCollection:
         loop = asyncio.get_running_loop()
         result = await loop.run_in_executor(
-            self.executor, self.reader.search, request.SerializeToString()
+            self.executor, self.reader.vector_ids, request.SerializeToString()
         )
         pb_bytes = bytes(result)
-        pb = SearchResponse()
-        pb.ParseFromString(pb_bytes)
-        return pb
-    except IndexNodeException as exc:
-        if "IO error" not in str(exc):
-            # ignore any other error
-            raise
-        # try some mitigations...
-        logger.error(f"IndexNodeException in Search: {request}", exc_info=True)
-        if not retry:
-            # reinit?
-            self.reader = NodeReader()
-            return await self.Search(request, retry=True)
-        else:
-            raise
+        ids = IdCollection()
+        ids.ParseFromString(pb_bytes)
+        return ids
 class StandaloneWriterWrapper:
@@ -281,13 +233,11 @@ class StandaloneWriterWrapper:
     def __init__(self):
         os.makedirs(settings.data_path, exist_ok=True)
         if NodeWriter is None:
-            raise ImportError(
-                "NucliaDB index node bindings are not installed (writer not found)"
-            )
+            raise ImportError("NucliaDB index node bindings are not installed (writer not found)")
         self.writer = NodeWriter()
         self.executor = ThreadPoolExecutor(settings.local_writer_threads)
-    async def NewShard(self, request: ShardMetadata) -> ShardCreated:
+    async def NewShard(self, request: NewShardRequest) -> ShardCreated:
         loop = asyncio.get_running_loop()
         resp = await loop.run_in_executor(
             self.executor, self.writer.new_shard, request.SerializeToString()
@@ -318,33 +268,33 @@ class StandaloneWriterWrapper:
         shard_ids.ParseFromString(pb_bytes)
         return shard_ids
-    async def RemoveVectorSet(self, request: VectorSetID):
+    async def AddVectorSet(self, request: VectorSetID):
         loop = asyncio.get_running_loop()
         resp = await loop.run_in_executor(
-            self.executor, self.writer.del_vectorset, request.SerializeToString()
+            self.executor, self.writer.add_vectorset, request.SerializeToString()
         )
         pb_bytes = bytes(resp)
         resp = OpStatus()
         resp.ParseFromString(pb_bytes)
         return resp
-    async def AddVectorSet(self, request: VectorSetID):
+    async def ListVectorSets(self, request: ShardId):
         loop = asyncio.get_running_loop()
         resp = await loop.run_in_executor(
-            self.executor, self.writer.set_vectorset, request.SerializeToString()
+            self.executor, self.writer.list_vectorsets, request.SerializeToString()
         )
         pb_bytes = bytes(resp)
-        resp = OpStatus()
+        resp = VectorSetList()
         resp.ParseFromString(pb_bytes)
         return resp
-    async def ListVectorSets(self, request: ShardId):
+    async def RemoveVectorSet(self, request: VectorSetID):
         loop = asyncio.get_running_loop()
         resp = await loop.run_in_executor(
-            self.executor, self.writer.get_vectorset, request.SerializeToString()
+            self.executor, self.writer.remove_vectorset, request.SerializeToString()
         )
         pb_bytes = bytes(resp)
-        resp = VectorSetList()
+        resp = OpStatus()
         resp.ParseFromString(pb_bytes)
         return resp
@@ -370,9 +320,7 @@ class StandaloneWriterWrapper:
     async def GC(self, request: ShardId) -> EmptyResponse:
         loop = asyncio.get_running_loop()
-        resp = await loop.run_in_executor(
-            self.executor, self.writer.gc, request.SerializeToString()
-        )
+        resp = await loop.run_in_executor(self.executor, self.writer.gc, request.SerializeToString())
         pb_bytes = bytes(resp)
         op_status = EmptyResponse()
         op_status.ParseFromString(pb_bytes)
@@ -389,7 +337,7 @@ READER_METHODS = {
     "RelationEdges": (ShardId, EdgeList),
 }
 WRITER_METHODS = {
-    "NewShard": (ShardMetadata, ShardCreated),
+    "NewShard": (NewShardRequest, ShardCreated),
     "DeleteShard": (ShardId, ShardId),
     "ListShards": (EmptyQuery, ShardIds),
     "RemoveVectorSet": (VectorSetID, OpStatus),

nucliadb/common/cluster/standalone/index_node.py CHANGED Viewed

@@ -20,10 +20,7 @@
 from typing import Any, Optional
 from nucliadb.common.cluster.base import AbstractIndexNode
-from nucliadb.common.cluster.grpc_node_dummy import (  # type: ignore
-    DummyReaderStub,
-    DummyWriterStub,
-)
+from nucliadb.common.cluster.grpc_node_dummy import DummyReaderStub, DummyWriterStub
 from nucliadb.common.cluster.settings import settings as cluster_settings
 from nucliadb.common.cluster.standalone import grpc_node_binding
 from nucliadb_protos import standalone_pb2, standalone_pb2_grpc
@@ -79,7 +76,7 @@ class ProxyCallerWrapper:
         else:
             grpc_address = address
         self._channel = get_traced_grpc_channel(grpc_address, "standalone_proxy")
-        self._stub = standalone_pb2_grpc.StandaloneClusterServiceStub(self._channel)  # type: ignore
+        self._stub = standalone_pb2_grpc.StandaloneClusterServiceStub(self._channel)
     def __getattr__(self, name):
         async def call(request):
@@ -95,9 +92,7 @@ class ProxyCallerWrapper:
                 else:
                     raise NotImplementedError(f"Unknown type {self._type}")
             except KeyError:
-                raise NotImplementedError(
-                    f"Unknown method for type {self._type}: {name}"
-                )
+                raise NotImplementedError(f"Unknown method for type {self._type}: {name}")
             return_value = return_type()
             return_value.ParseFromString(resp.payload)
             return return_value
@@ -116,9 +111,7 @@ class ProxyStandaloneIndexNode(StandaloneIndexNode):
         available_disk: int,
         dummy: bool = False,
     ):
-        super().__init__(
-            id, address, shard_count, available_disk=available_disk, dummy=dummy
-        )
+        super().__init__(id, address, shard_count, available_disk=available_disk, dummy=dummy)
         if dummy:
             return

nucliadb/common/cluster/standalone/service.py CHANGED Viewed

@@ -32,9 +32,7 @@ from nucliadb_protos import standalone_pb2, standalone_pb2_grpc
 from nucliadb_utils.grpc import get_traced_grpc_server
-class StandaloneClusterServiceServicer(
-    standalone_pb2_grpc.StandaloneClusterServiceServicer
-):
+class StandaloneClusterServiceServicer(standalone_pb2_grpc.StandaloneClusterServiceServicer):
     @backoff.on_exception(backoff.expo, (AioRpcError,), max_time=60)
     async def NodeAction(  # type: ignore
         self, request: standalone_pb2.NodeActionRequest, context
@@ -61,9 +59,7 @@ class StandaloneClusterServiceServicer(
         self, request: standalone_pb2.NodeInfoRequest, context
     ) -> standalone_pb2.NodeInfoResponse:
         index_node = get_self()
-        index_node.shard_count = len(
-            os.listdir(os.path.join(cluster_settings.data_path, "shards"))
-        )
+        index_node.shard_count = len(os.listdir(os.path.join(cluster_settings.data_path, "shards")))
         total_disk, _, available_disk = shutil.disk_usage(cluster_settings.data_path)
         return standalone_pb2.NodeInfoResponse(
             id=index_node.id,

nucliadb/common/cluster/standalone/utils.py CHANGED Viewed

@@ -56,9 +56,7 @@ def get_self() -> StandaloneIndexNode:
     make another grpc request since this node can service it directly.
     """
     if not is_index_node():
-        raise Exception(
-            "This node is not an Index Node. You should not reach this code path."
-        )
+        raise Exception("This node is not an Index Node. You should not reach this code path.")
     global _SELF_INDEX_NODE
     node_id = get_standalone_node_id()
     if _SELF_INDEX_NODE is None or node_id != _SELF_INDEX_NODE.id:
@@ -68,9 +66,7 @@ def get_self() -> StandaloneIndexNode:
             host = f"{hn}.{ns}"
         else:
             host = gethostname()
-        _SELF_INDEX_NODE = StandaloneIndexNode(
-            id=node_id, address=host, shard_count=0, available_disk=0
-        )
+        _SELF_INDEX_NODE = StandaloneIndexNode(id=node_id, address=host, shard_count=0, available_disk=0)
     try:
         _, _, available_disk = shutil.disk_usage(cluster_settings.data_path)
         _SELF_INDEX_NODE.available_disk = available_disk
@@ -95,3 +91,10 @@ def is_index_node() -> bool:
         StandaloneNodeRole.ALL,
         StandaloneNodeRole.INDEX,
     )
+def is_worker_node() -> bool:
+    return cluster_settings.standalone_node_role in (
+        StandaloneNodeRole.ALL,
+        StandaloneNodeRole.WORKER,
+    )

nucliadb/common/cluster/utils.py CHANGED Viewed

@@ -27,14 +27,20 @@ from nucliadb.common.cluster.discovery.utils import (
     setup_cluster_discovery,
     teardown_cluster_discovery,
 )
-from nucliadb.common.cluster.manager import KBShardManager, StandaloneKBShardManager
+from nucliadb.common.cluster.manager import (
+    KBShardManager,
+    StandaloneKBShardManager,
+    clear_index_nodes,
+)
 from nucliadb.common.cluster.settings import settings
 from nucliadb.common.cluster.standalone.service import (
     start_grpc as start_standalone_grpc,
 )
 from nucliadb.common.cluster.standalone.utils import is_index_node
-from nucliadb_protos import noderesources_pb2, writer_pb2
+from nucliadb.ingest.orm.resource import Resource
+from nucliadb_protos import nodereader_pb2, writer_pb2
 from nucliadb_utils import const
+from nucliadb_utils.settings import is_onprem_nucliadb
 from nucliadb_utils.utilities import Utility, clean_utility, get_utility, set_utility
 if TYPE_CHECKING:  # pragma: no cover
@@ -79,12 +85,18 @@ async def teardown_cluster():
         await std_server.stop(None)
         clean_utility(_STANDALONE_SERVER)
+    clear_index_nodes()
 def get_shard_manager() -> KBShardManager:
     return get_utility(Utility.SHARD_MANAGER)  # type: ignore
 async def wait_for_node(app_context: ApplicationContext, node_id: str) -> None:
+    if is_onprem_nucliadb():
+        # On onprem deployments indexing is synchronous right now, so we don't need to wait
+        return
     logged = False
     while True:
         # get raw js client
@@ -108,40 +120,44 @@ async def wait_for_node(app_context: ApplicationContext, node_id: str) -> None:
         await asyncio.sleep(sleep)
-@backoff.on_exception(
-    backoff.expo, (Exception,), jitter=backoff.random_jitter, max_tries=8
-)
+async def get_resource(kbid: str, resource_id: str) -> Optional[Resource]:
+    async with datamanagers.with_ro_transaction() as txn:
+        return await datamanagers.resources.get_resource(txn, kbid=kbid, rid=resource_id)
+@backoff.on_exception(backoff.expo, (Exception,), jitter=backoff.random_jitter, max_tries=8)
+async def get_resource_index_message(kbid: str, resource_id: str) -> Optional[nodereader_pb2.Resource]:
+    async with datamanagers.with_ro_transaction() as txn:
+        resource = await datamanagers.resources.get_resource(txn, kbid=kbid, rid=resource_id)
+        if resource is None:
+            logger.warning(
+                "Resource not found while indexing, skipping",
+                extra={"kbid": kbid, "resource_id": resource_id},
+            )
+            return None
+        resource_index_message = (await resource.generate_index_message(reindex=False)).brain
+        return resource_index_message
+@backoff.on_exception(backoff.expo, (Exception,), jitter=backoff.random_jitter, max_tries=8)
 async def index_resource_to_shard(
     app_context: ApplicationContext,
     kbid: str,
     resource_id: str,
     shard: writer_pb2.ShardObject,
-) -> Optional[noderesources_pb2.Resource]:
-    logger.warning(
-        "Indexing resource", extra={"kbid": kbid, "resource_id": resource_id}
-    )
+    resource_index_message: Optional[nodereader_pb2.Resource] = None,
+) -> None:
+    logger.info("Indexing resource", extra={"kbid": kbid, "resource_id": resource_id})
     sm = app_context.shard_manager
     partitioning = app_context.partitioning
-    async with datamanagers.with_transaction() as txn:
-        resource_index_message = (
-            await datamanagers.resources.get_resource_index_message(
-                txn, kbid=kbid, rid=resource_id
-            )
-        )
     if resource_index_message is None:
-        logger.warning(
-            "Resource index message not found while indexing, skipping",
-            extra={"kbid": kbid, "resource_id": resource_id},
-        )
-        return None
+        resource_index_message = await get_resource_index_message(kbid, resource_id)
+        if resource_index_message is None:
+            return
     partition = partitioning.generate_partition(kbid, resource_id)
-    await sm.add_resource(
-        shard, resource_index_message, txid=-1, partition=str(partition), kb=kbid
-    )
-    return resource_index_message
+    await sm.add_resource(shard, resource_index_message, txid=-1, partition=str(partition), kb=kbid)
 async def delete_resource_from_shard(
@@ -150,9 +166,7 @@ async def delete_resource_from_shard(
     resource_id: str,
     shard: writer_pb2.ShardObject,
 ) -> None:
-    logger.warning(
-        "Deleting resource", extra={"kbid": kbid, "resource_id": resource_id}
-    )
+    logger.info("Deleting resource", extra={"kbid": kbid, "resource_id": resource_id})
     sm = app_context.shard_manager
     partitioning = app_context.partitioning

nucliadb/common/constants.py ADDED Viewed

@@ -0,0 +1,20 @@
+# Copyright (C) 2021 Bosutech XXI S.L.
+#
+# nucliadb is offered under the AGPL v3.0 and as commercial software.
+# For commercial licensing, contact us at info@nuclia.com.
+#
+# AGPL:
+# This program is free software: you can redistribute it and/or modify
+# it under the terms of the GNU Affero General Public License as
+# published by the Free Software Foundation, either version 3 of the
+# License, or (at your option) any later version.
+#
+# This program is distributed in the hope that it will be useful,
+# but WITHOUT ANY WARRANTY; without even the implied warranty of
+# MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE. See the
+# GNU Affero General Public License for more details.
+#
+# You should have received a copy of the GNU Affero General Public License
+# along with this program. If not, see <http://www.gnu.org/licenses/>.
+#
+AVG_PARAGRAPH_SIZE_BYTES = 10_000

nucliadb/common/context/__init__.py CHANGED Viewed

@@ -24,14 +24,13 @@ from nucliadb.common.cluster.settings import in_standalone_mode
 from nucliadb.common.cluster.utils import setup_cluster, teardown_cluster
 from nucliadb.common.maindb.driver import Driver
 from nucliadb.common.maindb.utils import setup_driver, teardown_driver
+from nucliadb.common.nidx import start_nidx_utility, stop_nidx_utility
 from nucliadb_utils.indexing import IndexingUtility
 from nucliadb_utils.nats import NatsConnectionManager
 from nucliadb_utils.partition import PartitionUtility
 from nucliadb_utils.settings import indexing_settings
 from nucliadb_utils.storages.storage import Storage
 from nucliadb_utils.utilities import (
-    Utility,
-    clean_utility,
     get_storage,
     start_indexing_utility,
     start_nats_manager,
@@ -41,6 +40,7 @@ from nucliadb_utils.utilities import (
     stop_nats_manager,
     stop_partitioning_utility,
     stop_transaction_utility,
+    teardown_storage,
 )
@@ -79,18 +79,20 @@ class ApplicationContext:
             )
             self.indexing = await start_indexing_utility()
         self.transaction = await start_transaction_utility(self.service_name)
+        self.nidx = await start_nidx_utility()
     async def finalize(self) -> None:
         if not self._initialized:
             return
+        await stop_nidx_utility()
         await stop_transaction_utility()
         if not in_standalone_mode():
             await stop_indexing_utility()
             await stop_nats_manager()
         stop_partitioning_utility()
         await teardown_cluster()
         await teardown_driver()
-        await self.blob_storage.finalize()
-        clean_utility(Utility.STORAGE)
+        await teardown_storage()
         self._initialized = False

nucliadb/common/context/fastapi.py CHANGED Viewed

@@ -18,25 +18,28 @@
 # along with this program. If not, see <http://www.gnu.org/licenses/>.
 #
+from contextlib import asynccontextmanager
 from fastapi import FastAPI
 from starlette.routing import Mount
 from nucliadb.common.context import ApplicationContext
-def set_app_context(app: FastAPI):
+@asynccontextmanager
+async def inject_app_context(app: FastAPI):
     context = ApplicationContext()
     app.state.context = context
-    app.add_event_handler("startup", context.initialize)
-    app.add_event_handler("shutdown", context.finalize)
     # Need to add app context in all sub-applications
     for route in app.router.routes:
         if isinstance(route, Mount) and isinstance(route.app, FastAPI):
             route.app.state.context = context
-            route.app.add_event_handler("startup", context.initialize)
-            route.app.add_event_handler("shutdown", context.finalize)
+    await context.initialize()
+    yield context
+    await context.finalize()
 def get_app_context(application: FastAPI) -> ApplicationContext:

nucliadb/{tests/knowledgeboxes/__init__.py → common/counters.py} RENAMED Viewed

@@ -18,5 +18,11 @@
 # along with this program. If not, see <http://www.gnu.org/licenses/>.
 #
-from .philosophy_books import *  # noqa
-from .ten_dummy_resources import *  # noqa
+from dataclasses import dataclass
+@dataclass
+class IndexCounts:
+    fields: int
+    paragraphs: int
+    sentences: int

nucliadb/common/datamanagers/__init__.py CHANGED Viewed

@@ -28,17 +28,36 @@
 #   - First argument is always a transaction, all other arguments are keyword arguments and must be explicit
 #     (better for readability and code editors)
 # ==============================================================================
-from . import cluster, entities, exceptions, kb, labels, processing, resources, rollover
-from .utils import with_transaction
+from . import (
+    atomic,
+    cluster,
+    entities,
+    exceptions,
+    fields,
+    kb,
+    labels,
+    processing,
+    resources,
+    rollover,
+    synonyms,
+    vectorsets,
+)
+from .utils import with_ro_transaction, with_rw_transaction, with_transaction
 __all__ = (
+    "atomic",
     "cluster",
-    "kb",
     "entities",
+    "exceptions",
+    "fields",
+    "kb",
     "labels",
+    "processing",
     "resources",
     "rollover",
-    "processing",
-    "exceptions",
+    "synonyms",
+    "vectorsets",
     "with_transaction",
+    "with_rw_transaction",
+    "with_ro_transaction",
 )

nucliadb 2.46.1.post382__py3-none-any.whl → 6.2.1.post2777__py3-none-any.whl

nucliadb 2.46.1.post382py3-none-any.whl → 6.2.1.post2777py3-none-any.whl