PyPI - nucliadb - Versions diffs - 6.9.1.post5192__py3-none-any.whl → 6.10.0.post5705__py3-none-any.whl - Mend

nucliadb 6.9.1.post5192py3-none-any.whl → 6.10.0.post5705py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (231) hide show

migrations/0023_backfill_pg_catalog.py +2 -2
migrations/0029_backfill_field_status.py +3 -4
migrations/0032_remove_old_relations.py +2 -3
migrations/0038_backfill_catalog_field_labels.py +2 -2
migrations/0039_backfill_converation_splits_metadata.py +2 -2
migrations/0041_reindex_conversations.py +137 -0
migrations/pg/0010_shards_index.py +34 -0
nucliadb/search/api/v1/resource/utils.py → migrations/pg/0011_catalog_statistics.py +5 -6
migrations/pg/0012_catalog_statistics_undo.py +26 -0
nucliadb/backups/create.py +2 -15
nucliadb/backups/restore.py +4 -15
nucliadb/backups/tasks.py +4 -1
nucliadb/common/back_pressure/cache.py +2 -3
nucliadb/common/back_pressure/materializer.py +7 -13
nucliadb/common/back_pressure/settings.py +6 -6
nucliadb/common/back_pressure/utils.py +1 -0
nucliadb/common/cache.py +9 -9
nucliadb/common/catalog/interface.py +12 -12
nucliadb/common/catalog/pg.py +41 -29
nucliadb/common/catalog/utils.py +3 -3
nucliadb/common/cluster/manager.py +5 -4
nucliadb/common/cluster/rebalance.py +483 -114
nucliadb/common/cluster/rollover.py +25 -9
nucliadb/common/cluster/settings.py +3 -8
nucliadb/common/cluster/utils.py +34 -8
nucliadb/common/context/__init__.py +7 -8
nucliadb/common/context/fastapi.py +1 -2
nucliadb/common/datamanagers/__init__.py +2 -4
nucliadb/common/datamanagers/atomic.py +4 -2
nucliadb/common/datamanagers/cluster.py +1 -2
nucliadb/common/datamanagers/fields.py +3 -4
nucliadb/common/datamanagers/kb.py +6 -6
nucliadb/common/datamanagers/labels.py +2 -3
nucliadb/common/datamanagers/resources.py +10 -33
nucliadb/common/datamanagers/rollover.py +5 -7
nucliadb/common/datamanagers/search_configurations.py +1 -2
nucliadb/common/datamanagers/synonyms.py +1 -2
nucliadb/common/datamanagers/utils.py +4 -4
nucliadb/common/datamanagers/vectorsets.py +4 -4
nucliadb/common/external_index_providers/base.py +32 -5
nucliadb/common/external_index_providers/manager.py +4 -5
nucliadb/common/filter_expression.py +128 -40
nucliadb/common/http_clients/processing.py +12 -23
nucliadb/common/ids.py +6 -4
nucliadb/common/locking.py +1 -2
nucliadb/common/maindb/driver.py +9 -8
nucliadb/common/maindb/local.py +5 -5
nucliadb/common/maindb/pg.py +9 -8
nucliadb/common/nidx.py +3 -4
nucliadb/export_import/datamanager.py +4 -3
nucliadb/export_import/exporter.py +11 -19
nucliadb/export_import/importer.py +13 -6
nucliadb/export_import/tasks.py +2 -0
nucliadb/export_import/utils.py +6 -18
nucliadb/health.py +2 -2
nucliadb/ingest/app.py +8 -8
nucliadb/ingest/consumer/consumer.py +8 -10
nucliadb/ingest/consumer/pull.py +3 -8
nucliadb/ingest/consumer/service.py +3 -3
nucliadb/ingest/consumer/utils.py +1 -1
nucliadb/ingest/fields/base.py +28 -49
nucliadb/ingest/fields/conversation.py +12 -12
nucliadb/ingest/fields/exceptions.py +1 -2
nucliadb/ingest/fields/file.py +22 -8
nucliadb/ingest/fields/link.py +7 -7
nucliadb/ingest/fields/text.py +2 -3
nucliadb/ingest/orm/brain_v2.py +78 -64
nucliadb/ingest/orm/broker_message.py +2 -4
nucliadb/ingest/orm/entities.py +10 -209
nucliadb/ingest/orm/index_message.py +4 -4
nucliadb/ingest/orm/knowledgebox.py +18 -27
nucliadb/ingest/orm/processor/auditing.py +1 -3
nucliadb/ingest/orm/processor/data_augmentation.py +1 -2
nucliadb/ingest/orm/processor/processor.py +27 -27
nucliadb/ingest/orm/processor/sequence_manager.py +1 -2
nucliadb/ingest/orm/resource.py +72 -70
nucliadb/ingest/orm/utils.py +1 -1
nucliadb/ingest/processing.py +17 -17
nucliadb/ingest/serialize.py +202 -145
nucliadb/ingest/service/writer.py +3 -109
nucliadb/ingest/settings.py +3 -4
nucliadb/ingest/utils.py +1 -2
nucliadb/learning_proxy.py +11 -11
nucliadb/metrics_exporter.py +5 -4
nucliadb/middleware/__init__.py +82 -1
nucliadb/migrator/datamanager.py +3 -4
nucliadb/migrator/migrator.py +1 -2
nucliadb/migrator/models.py +1 -2
nucliadb/migrator/settings.py +1 -2
nucliadb/models/internal/augment.py +614 -0
nucliadb/models/internal/processing.py +19 -19
nucliadb/openapi.py +2 -2
nucliadb/purge/__init__.py +3 -8
nucliadb/purge/orphan_shards.py +1 -2
nucliadb/reader/__init__.py +5 -0
nucliadb/reader/api/models.py +6 -13
nucliadb/reader/api/v1/download.py +59 -38
nucliadb/reader/api/v1/export_import.py +4 -4
nucliadb/reader/api/v1/learning_config.py +24 -4
nucliadb/reader/api/v1/resource.py +61 -9
nucliadb/reader/api/v1/services.py +18 -14
nucliadb/reader/app.py +3 -1
nucliadb/reader/reader/notifications.py +1 -2
nucliadb/search/api/v1/__init__.py +2 -0
nucliadb/search/api/v1/ask.py +3 -4
nucliadb/search/api/v1/augment.py +585 -0
nucliadb/search/api/v1/catalog.py +11 -15
nucliadb/search/api/v1/find.py +16 -22
nucliadb/search/api/v1/hydrate.py +25 -25
nucliadb/search/api/v1/knowledgebox.py +1 -2
nucliadb/search/api/v1/predict_proxy.py +1 -2
nucliadb/search/api/v1/resource/ask.py +7 -7
nucliadb/search/api/v1/resource/ingestion_agents.py +5 -6
nucliadb/search/api/v1/resource/search.py +9 -11
nucliadb/search/api/v1/retrieve.py +130 -0
nucliadb/search/api/v1/search.py +28 -32
nucliadb/search/api/v1/suggest.py +11 -14
nucliadb/search/api/v1/summarize.py +1 -2
nucliadb/search/api/v1/utils.py +2 -2
nucliadb/search/app.py +3 -2
nucliadb/search/augmentor/__init__.py +21 -0
nucliadb/search/augmentor/augmentor.py +232 -0
nucliadb/search/augmentor/fields.py +704 -0
nucliadb/search/augmentor/metrics.py +24 -0
nucliadb/search/augmentor/paragraphs.py +334 -0
nucliadb/search/augmentor/resources.py +238 -0
nucliadb/search/augmentor/utils.py +33 -0
nucliadb/search/lifecycle.py +3 -1
nucliadb/search/predict.py +24 -17
nucliadb/search/predict_models.py +8 -9
nucliadb/search/requesters/utils.py +11 -10
nucliadb/search/search/cache.py +19 -23
nucliadb/search/search/chat/ask.py +88 -59
nucliadb/search/search/chat/exceptions.py +3 -5
nucliadb/search/search/chat/fetcher.py +201 -0
nucliadb/search/search/chat/images.py +6 -4
nucliadb/search/search/chat/old_prompt.py +1375 -0
nucliadb/search/search/chat/parser.py +510 -0
nucliadb/search/search/chat/prompt.py +563 -615
nucliadb/search/search/chat/query.py +449 -36
nucliadb/search/search/chat/rpc.py +85 -0
nucliadb/search/search/fetch.py +3 -4
nucliadb/search/search/filters.py +8 -11
nucliadb/search/search/find.py +33 -31
nucliadb/search/search/find_merge.py +124 -331
nucliadb/search/search/graph_strategy.py +14 -12
nucliadb/search/search/hydrator/__init__.py +3 -152
nucliadb/search/search/hydrator/fields.py +92 -50
nucliadb/search/search/hydrator/images.py +7 -7
nucliadb/search/search/hydrator/paragraphs.py +42 -26
nucliadb/search/search/hydrator/resources.py +20 -16
nucliadb/search/search/ingestion_agents.py +5 -5
nucliadb/search/search/merge.py +90 -94
nucliadb/search/search/metrics.py +10 -9
nucliadb/search/search/paragraphs.py +7 -9
nucliadb/search/search/predict_proxy.py +13 -9
nucliadb/search/search/query.py +14 -86
nucliadb/search/search/query_parser/fetcher.py +51 -82
nucliadb/search/search/query_parser/models.py +19 -20
nucliadb/search/search/query_parser/old_filters.py +20 -19
nucliadb/search/search/query_parser/parsers/ask.py +4 -5
nucliadb/search/search/query_parser/parsers/catalog.py +5 -6
nucliadb/search/search/query_parser/parsers/common.py +5 -6
nucliadb/search/search/query_parser/parsers/find.py +6 -26
nucliadb/search/search/query_parser/parsers/graph.py +13 -23
nucliadb/search/search/query_parser/parsers/retrieve.py +207 -0
nucliadb/search/search/query_parser/parsers/search.py +15 -53
nucliadb/search/search/query_parser/parsers/unit_retrieval.py +8 -29
nucliadb/search/search/rank_fusion.py +18 -13
nucliadb/search/search/rerankers.py +5 -6
nucliadb/search/search/retrieval.py +300 -0
nucliadb/search/search/summarize.py +5 -6
nucliadb/search/search/utils.py +3 -4
nucliadb/search/settings.py +1 -2
nucliadb/standalone/api_router.py +1 -1
nucliadb/standalone/app.py +4 -3
nucliadb/standalone/auth.py +5 -6
nucliadb/standalone/lifecycle.py +2 -2
nucliadb/standalone/run.py +2 -4
nucliadb/standalone/settings.py +5 -6
nucliadb/standalone/versions.py +3 -4
nucliadb/tasks/consumer.py +13 -8
nucliadb/tasks/models.py +2 -1
nucliadb/tasks/producer.py +3 -3
nucliadb/tasks/retries.py +8 -7
nucliadb/train/api/utils.py +1 -3
nucliadb/train/api/v1/shards.py +1 -2
nucliadb/train/api/v1/trainset.py +1 -2
nucliadb/train/app.py +1 -1
nucliadb/train/generator.py +4 -4
nucliadb/train/generators/field_classifier.py +2 -2
nucliadb/train/generators/field_streaming.py +6 -6
nucliadb/train/generators/image_classifier.py +2 -2
nucliadb/train/generators/paragraph_classifier.py +2 -2
nucliadb/train/generators/paragraph_streaming.py +2 -2
nucliadb/train/generators/question_answer_streaming.py +2 -2
nucliadb/train/generators/sentence_classifier.py +2 -2
nucliadb/train/generators/token_classifier.py +3 -2
nucliadb/train/generators/utils.py +6 -5
nucliadb/train/nodes.py +3 -3
nucliadb/train/resource.py +6 -8
nucliadb/train/settings.py +3 -4
nucliadb/train/types.py +11 -11
nucliadb/train/upload.py +3 -2
nucliadb/train/uploader.py +1 -2
nucliadb/train/utils.py +1 -2
nucliadb/writer/api/v1/export_import.py +4 -1
nucliadb/writer/api/v1/field.py +7 -11
nucliadb/writer/api/v1/knowledgebox.py +3 -4
nucliadb/writer/api/v1/resource.py +9 -20
nucliadb/writer/api/v1/services.py +10 -132
nucliadb/writer/api/v1/upload.py +73 -72
nucliadb/writer/app.py +8 -2
nucliadb/writer/resource/basic.py +12 -15
nucliadb/writer/resource/field.py +7 -5
nucliadb/writer/resource/origin.py +7 -0
nucliadb/writer/settings.py +2 -3
nucliadb/writer/tus/__init__.py +2 -3
nucliadb/writer/tus/azure.py +1 -3
nucliadb/writer/tus/dm.py +3 -3
nucliadb/writer/tus/exceptions.py +3 -4
nucliadb/writer/tus/gcs.py +5 -6
nucliadb/writer/tus/s3.py +2 -3
nucliadb/writer/tus/storage.py +3 -3
{nucliadb-6.9.1.post5192.dist-info → nucliadb-6.10.0.post5705.dist-info}/METADATA +9 -10
nucliadb-6.10.0.post5705.dist-info/RECORD +410 -0
nucliadb/common/datamanagers/entities.py +0 -139
nucliadb-6.9.1.post5192.dist-info/RECORD +0 -392
{nucliadb-6.9.1.post5192.dist-info → nucliadb-6.10.0.post5705.dist-info}/WHEEL +0 -0
{nucliadb-6.9.1.post5192.dist-info → nucliadb-6.10.0.post5705.dist-info}/entry_points.txt +0 -0
{nucliadb-6.9.1.post5192.dist-info → nucliadb-6.10.0.post5705.dist-info}/top_level.txt +0 -0

nucliadb/train/nodes.py CHANGED Viewed

@@ -17,7 +17,7 @@
 # You should have received a copy of the GNU Affero General Public License
 # along with this program. If not, see <http://www.gnu.org/licenses/>.
 #
-from typing import AsyncIterator, Optional
+from collections.abc import AsyncIterator
 from nucliadb.common import datamanagers
 from nucliadb.common.cluster import manager
@@ -62,7 +62,7 @@ class TrainShardManager(manager.KBShardManager):
         return shard_object.nidx_shard_id
-    async def get_kb_obj(self, txn: Transaction, kbid: str) -> Optional[KnowledgeBox]:
+    async def get_kb_obj(self, txn: Transaction, kbid: str) -> KnowledgeBox | None:
         if kbid is None:
             return None
@@ -72,7 +72,7 @@ class TrainShardManager(manager.KBShardManager):
         kbobj = KnowledgeBox(txn, self.storage, kbid)
         return kbobj
-    async def get_kb_entities_manager(self, txn: Transaction, kbid: str) -> Optional[EntitiesManager]:
+    async def get_kb_entities_manager(self, txn: Transaction, kbid: str) -> EntitiesManager | None:
         kbobj = await self.get_kb_obj(txn, kbid)
         if kbobj is None:
             return None

nucliadb/train/resource.py CHANGED Viewed

@@ -19,7 +19,7 @@
 #
 from __future__ import annotations
-from typing import AsyncIterator, MutableMapping, Optional
+from collections.abc import AsyncIterator, MutableMapping
 from nucliadb.common import datamanagers
 from nucliadb.ingest.orm.resource import Resource
@@ -69,9 +69,7 @@ async def iterate_sentences(
             # return any
             vectorset_id = None
             async with datamanagers.with_ro_transaction() as txn:
-                async for vectorset_id, vs in datamanagers.vectorsets.iter(
-                    txn=txn, kbid=resource.kb.kbid
-                ):
+                async for vectorset_id, vs in datamanagers.vectorsets.iter(txn=txn, kbid=resource.kbid):
                     break
             assert vectorset_id is not None, "All KBs must have at least a vectorset"
             vo = await field.get_vectors(vectorset_id, vs.storage_key_kind)
@@ -81,7 +79,7 @@ async def iterate_sentences(
         if fm is None:
             continue
-        field_metadatas: list[tuple[Optional[str], FieldMetadata]] = [(None, fm.metadata)]
+        field_metadatas: list[tuple[str | None, FieldMetadata]] = [(None, fm.metadata)]
         for subfield_metadata, splitted_metadata in fm.split_metadata.items():
             field_metadatas.append((subfield_metadata, splitted_metadata))
@@ -188,7 +186,7 @@ async def iterate_paragraphs(
         if fm is None:
             continue
-        field_metadatas: list[tuple[Optional[str], FieldMetadata]] = [(None, fm.metadata)]
+        field_metadatas: list[tuple[str | None, FieldMetadata]] = [(None, fm.metadata)]
         for subfield_metadata, splitted_metadata in fm.split_metadata.items():
             field_metadatas.append((subfield_metadata, splitted_metadata))
@@ -264,7 +262,7 @@ async def iterate_fields(
         if fm is None:
             continue
-        field_metadatas: list[tuple[Optional[str], FieldMetadata]] = [(None, fm.metadata)]
+        field_metadatas: list[tuple[str | None, FieldMetadata]] = [(None, fm.metadata)]
         for subfield_metadata, splitted_metadata in fm.split_metadata.items():
             field_metadatas.append((subfield_metadata, splitted_metadata))
@@ -319,7 +317,7 @@ async def generate_train_resource(
         if fm is None:
             continue
-        field_metadatas: list[tuple[Optional[str], FieldMetadata]] = [(None, fm.metadata)]
+        field_metadatas: list[tuple[str | None, FieldMetadata]] = [(None, fm.metadata)]
         for subfield_metadata, splitted_metadata in fm.split_metadata.items():
             field_metadatas.append((subfield_metadata, splitted_metadata))

nucliadb/train/settings.py CHANGED Viewed

@@ -17,17 +17,16 @@
 # You should have received a copy of the GNU Affero General Public License
 # along with this program. If not, see <http://www.gnu.org/licenses/>.
 #
-from typing import Optional
 from nucliadb.ingest.settings import DriverSettings
 class Settings(DriverSettings):
     grpc_port: int = 8031
-    train_grpc_address: Optional[str] = None
+    train_grpc_address: str | None = None
-    nuclia_learning_url: Optional[str] = "https://nuclia.cloud/api/v1/learning/"
-    nuclia_learning_apikey: Optional[str] = None
+    nuclia_learning_url: str | None = "https://nuclia.cloud/api/v1/learning/"
+    nuclia_learning_apikey: str | None = None
     internal_counter_api: str = "http://search.nuclia.svc.cluster.local:8030/api/v1/kb/{kbid}/counters"

nucliadb/train/types.py CHANGED Viewed

@@ -17,20 +17,20 @@
 # You should have received a copy of the GNU Affero General Public License
 # along with this program. If not, see <http://www.gnu.org/licenses/>.
 #
-from typing import TypeVar, Union
+from typing import TypeVar
 from nucliadb_protos import dataset_pb2 as dpb
-TrainBatch = Union[
-    dpb.FieldClassificationBatch,
-    dpb.ImageClassificationBatch,
-    dpb.ParagraphClassificationBatch,
-    dpb.ParagraphStreamingBatch,
-    dpb.QuestionAnswerStreamingBatch,
-    dpb.SentenceClassificationBatch,
-    dpb.TokenClassificationBatch,
-    dpb.FieldStreamingBatch,
-]
+TrainBatch = (
+    dpb.FieldClassificationBatch
+    | dpb.ImageClassificationBatch
+    | dpb.ParagraphClassificationBatch
+    | dpb.ParagraphStreamingBatch
+    | dpb.QuestionAnswerStreamingBatch
+    | dpb.SentenceClassificationBatch
+    | dpb.TokenClassificationBatch
+    | dpb.FieldStreamingBatch
+)
 T = TypeVar(
     "T",

nucliadb/train/upload.py CHANGED Viewed

@@ -20,8 +20,9 @@
 import argparse
 import asyncio
 import importlib.metadata
+import inspect
 from asyncio import tasks
-from typing import Callable
+from collections.abc import Callable
 from nucliadb.train.uploader import start_upload
 from nucliadb_telemetry import errors
@@ -89,7 +90,7 @@ def run() -> None:
     finally:
         try:
             for finalizer in finalizers:
-                if asyncio.iscoroutinefunction(finalizer):
+                if inspect.iscoroutinefunction(finalizer):
                     loop.run_until_complete(finalizer())
                 else:
                     finalizer()

nucliadb/train/uploader.py CHANGED Viewed

@@ -17,7 +17,6 @@
 # You should have received a copy of the GNU Affero General Public License
 # along with this program. If not, see <http://www.gnu.org/licenses/>.
 #
-from typing import Optional
 import aiohttp
@@ -97,7 +96,7 @@ class UploadServicer:
             response.status = GetLabelsResponse.Status.NOTFOUND
             return response
         response.kb.uuid = kbid
-        labels: Optional[Labels] = await datamanagers.atomic.labelset.get_all(kbid=kbid)
+        labels: Labels | None = await datamanagers.atomic.labelset.get_all(kbid=kbid)
         if labels is not None:
             response.labels.CopyFrom(labels)
         return response

nucliadb/train/utils.py CHANGED Viewed

@@ -17,7 +17,6 @@
 # You should have received a copy of the GNU Affero General Public License
 # along with this program. If not, see <http://www.gnu.org/licenses/>.
 #
-from typing import Optional
 from grpc import aio
 from grpc_health.v1 import health, health_pb2_grpc
@@ -37,7 +36,7 @@ from nucliadb_utils.utilities import (
 )
-async def start_train_grpc(service_name: Optional[str] = None):
+async def start_train_grpc(service_name: str | None = None):
     actual_service = get_utility(Utility.TRAIN)
     if actual_service is not None:
         return

nucliadb/writer/api/v1/export_import.py CHANGED Viewed

@@ -17,8 +17,8 @@
 # You should have received a copy of the GNU Affero General Public License
 # along with this program. If not, see <http://www.gnu.org/licenses/>.
 #
+from collections.abc import AsyncGenerator
 from datetime import datetime
-from typing import AsyncGenerator
 from uuid import uuid4
 from fastapi_versioning import version
@@ -66,6 +66,7 @@ from nucliadb_utils.authentication import requires_one
     summary="Start an export of a Knowledge Box",
     tags=["Knowledge Boxes"],
     response_model=CreateExportResponse,
+    include_in_schema=False,
 )
 @requires_one([NucliaDBRoles.MANAGER, NucliaDBRoles.WRITER])
 @version(1)
@@ -91,6 +92,7 @@ async def start_kb_export_endpoint(request: Request, kbid: str):
     tags=["Knowledge Boxes"],
     response_model=NewImportedKbResponse,
     openapi_extra={"x-hidden-operation": True},
+    include_in_schema=False,
 )
 @requires_one([NucliaDBRoles.MANAGER, NucliaDBRoles.WRITER])
 @version(1)
@@ -140,6 +142,7 @@ async def kb_create_and_import_endpoint(request: Request):
     summary="Start an import to a Knowledge Box",
     tags=["Knowledge Boxes"],
     response_model=CreateImportResponse,
+    include_in_schema=False,
 )
 @requires_one([NucliaDBRoles.MANAGER, NucliaDBRoles.WRITER])
 @version(1)

nucliadb/writer/api/v1/field.py CHANGED Viewed

@@ -17,8 +17,9 @@
 # You should have received a copy of the GNU Affero General Public License
 # along with this program. If not, see <http://www.gnu.org/licenses/>.
 #
+from collections.abc import Callable
 from inspect import iscoroutinefunction
-from typing import TYPE_CHECKING, Annotated, Callable, List, Optional, Type, Union
+from typing import TYPE_CHECKING, Annotated
 import pydantic
 from fastapi import HTTPException, Query, Response
@@ -72,12 +73,7 @@ if TYPE_CHECKING:  # pragma: no cover
 else:
     FIELD_TYPE_NAME_TO_FIELD_TYPE_MAP: dict[models.FieldTypeName, int]
-FieldModelType = Union[
-    models.TextField,
-    models.LinkField,
-    models.InputConversationField,
-    models.FileField,
-]
+FieldModelType = models.TextField | models.LinkField | models.InputConversationField | models.FileField
 FIELD_TYPE_NAME_TO_FIELD_TYPE_MAP = {
     models.FieldTypeName.FILE: resources_pb2.FieldType.FILE,
@@ -278,7 +274,7 @@ async def parse_file_field_adapter(
     )
-FIELD_PARSERS_MAP: dict[Type, Callable] = {
+FIELD_PARSERS_MAP: dict[type, Callable] = {
     models.TextField: parse_text_field_adapter,
     models.LinkField: parse_link_field_adapter,
     models.InputConversationField: parse_conversation_field_adapter,
@@ -463,7 +459,7 @@ async def append_messages_to_conversation_field_rslug_prefix(
     kbid: str,
     rslug: str,
     field_id: FieldIdString,
-    messages: List[models.InputMessage],
+    messages: list[models.InputMessage],
 ) -> ResourceFieldAdded:
     try:
         field = models.InputConversationField(messages=messages)
@@ -488,7 +484,7 @@ async def append_messages_to_conversation_field_rid_prefix(
     kbid: str,
     rid: str,
     field_id: FieldIdString,
-    messages: List[models.InputMessage],
+    messages: list[models.InputMessage],
 ) -> ResourceFieldAdded:
     try:
         field = models.InputConversationField(messages=messages)
@@ -550,7 +546,7 @@ async def reprocess_file_field(
     rid: str,
     field_id: FieldIdString,
     x_nucliadb_user: Annotated[str, X_NUCLIADB_USER] = "",
-    x_file_password: Annotated[Optional[str], X_FILE_PASSWORD] = None,
+    x_file_password: Annotated[str | None, X_FILE_PASSWORD] = None,
     reset_title: bool = Query(
         default=False,
         description="Reset the title of the resource so that the file or link computed titles are set after processing.",

nucliadb/writer/api/v1/knowledgebox.py CHANGED Viewed

@@ -17,10 +17,9 @@
 # You should have received a copy of the GNU Affero General Public License
 # along with this program. If not, see <http://www.gnu.org/licenses/>.
 #
-import asyncio
 from functools import partial
-from fastapi import HTTPException
+from fastapi import BackgroundTasks, HTTPException
 from fastapi_versioning import version
 from starlette.requests import Request
@@ -184,7 +183,7 @@ async def update_kb(request: Request, kbid: str, item: KnowledgeBoxConfig) -> Kn
 )
 @requires(NucliaDBRoles.MANAGER)
 @version(1)
-async def delete_kb(request: Request, kbid: str) -> KnowledgeBoxObj:
+async def delete_kb(request: Request, kbid: str, background: BackgroundTasks) -> KnowledgeBoxObj:
     driver = get_driver()
     try:
         await KnowledgeBox.delete(driver, kbid=kbid)
@@ -208,6 +207,6 @@ async def delete_kb(request: Request, kbid: str) -> KnowledgeBoxObj:
     # be nice and notify processing this KB is being deleted so we waste
     # resources
     processing = get_processing()
-    asyncio.create_task(processing.delete_from_processing(kbid=kbid))
+    background.add_task(processing.delete_from_processing, kbid=kbid)
     return KnowledgeBoxObj(uuid=kbid)

nucliadb/writer/api/v1/resource.py CHANGED Viewed

@@ -17,13 +17,12 @@
 # You should have received a copy of the GNU Affero General Public License
 # along with this program. If not, see <http://www.gnu.org/licenses/>.
 #
-import asyncio
 import contextlib
 from time import time
-from typing import Annotated, Optional
+from typing import Annotated
 from uuid import uuid4
-from fastapi import HTTPException, Query, Response
+from fastapi import BackgroundTasks, HTTPException, Query, Response
 from fastapi_versioning import version
 from starlette.requests import Request
@@ -498,12 +497,10 @@ async def _reprocess_resource(
 @requires(NucliaDBRoles.WRITER)
 @version(1)
 async def delete_resource_rslug_prefix(
-    request: Request,
-    kbid: str,
-    rslug: str,
+    request: Request, kbid: str, rslug: str, background: BackgroundTasks
 ):
     rid = await get_rid_from_slug_or_raise_error(kbid, rslug)
-    return await _delete_resource(request, kbid, rid)
+    return await _delete_resource(request, kbid, rid, background)
 @api.delete(
@@ -514,19 +511,11 @@ async def delete_resource_rslug_prefix(
 )
 @requires(NucliaDBRoles.WRITER)
 @version(1)
-async def delete_resource_rid_prefix(
-    request: Request,
-    kbid: str,
-    rid: str,
-):
-    return await _delete_resource(request, kbid, rid)
+async def delete_resource_rid_prefix(request: Request, kbid: str, rid: str, background: BackgroundTasks):
+    return await _delete_resource(request, kbid, rid, background)
-async def _delete_resource(
-    request: Request,
-    kbid: str,
-    rid: str,
-):
+async def _delete_resource(request: Request, kbid: str, rid: str, background: BackgroundTasks):
     await validate_rid_exists_or_raise_error(kbid, rid)
     partitioning = get_partitioning()
@@ -541,7 +530,7 @@ async def _delete_resource(
     parse_audit(writer.audit, request)
     await transaction.commit(writer, partition)
     processing = get_processing()
-    asyncio.create_task(processing.delete_from_processing(kbid=kbid, resource_id=rid))
+    background.add_task(processing.delete_from_processing, kbid=kbid, resource_id=rid)
     return Response(status_code=204)
@@ -637,7 +626,7 @@ def needs_resource_reindex(item: UpdateResourcePayload) -> bool:
     )
-async def maybe_send_to_process(toprocess: PushPayload, partition) -> Optional[int]:
+async def maybe_send_to_process(toprocess: PushPayload, partition) -> int | None:
     if not needs_reprocess(toprocess):
         return None

nucliadb/writer/api/v1/services.py CHANGED Viewed

@@ -17,152 +17,22 @@
 # You should have received a copy of the GNU Affero General Public License
 # along with this program. If not, see <http://www.gnu.org/licenses/>.
 #
-from fastapi import HTTPException, Response
+from fastapi import Body, HTTPException, Path, Response
 from fastapi_versioning import version
 from starlette.requests import Request
 from nucliadb.common import datamanagers
 from nucliadb.common.datamanagers.exceptions import KnowledgeBoxNotFound
 from nucliadb.common.models_utils import to_proto
-from nucliadb.models.responses import (
-    HTTPConflict,
-    HTTPInternalServerError,
-    HTTPNotFound,
-)
 from nucliadb.writer.api.v1.router import KB_PREFIX, api
 from nucliadb_models.configuration import SearchConfiguration
-from nucliadb_models.entities import (
-    CreateEntitiesGroupPayload,
-    UpdateEntitiesGroupPayload,
-)
 from nucliadb_models.labels import LabelSet
 from nucliadb_models.resource import NucliaDBRoles
 from nucliadb_models.synonyms import KnowledgeBoxSynonyms
 from nucliadb_protos import writer_pb2
 from nucliadb_protos.knowledgebox_pb2 import Label as LabelPB
 from nucliadb_protos.knowledgebox_pb2 import LabelSet as LabelSetPB
-from nucliadb_protos.writer_pb2 import (
-    DelEntitiesRequest,
-    NewEntitiesGroupRequest,
-    NewEntitiesGroupResponse,
-    OpStatusWriter,
-    UpdateEntitiesGroupRequest,
-    UpdateEntitiesGroupResponse,
-)
 from nucliadb_utils.authentication import requires
-from nucliadb_utils.utilities import get_ingest
-@api.post(
-    f"/{KB_PREFIX}/{{kbid}}/entitiesgroups",
-    status_code=200,
-    summary="Create Knowledge Box Entities Group",
-    tags=["Knowledge Box Services"],
-    openapi_extra={"x-operation_order": 1},
-)
-@requires(NucliaDBRoles.WRITER)
-@version(1)
-async def create_entities_group(request: Request, kbid: str, item: CreateEntitiesGroupPayload):
-    ingest = get_ingest()
-    pbrequest: NewEntitiesGroupRequest = NewEntitiesGroupRequest()
-    pbrequest.kb.uuid = kbid
-    pbrequest.group = item.group
-    pbrequest.entities.custom = True
-    if item.title:
-        pbrequest.entities.title = item.title
-    if item.color:
-        pbrequest.entities.color = item.color
-    for key, entity in item.entities.items():
-        entitypb = pbrequest.entities.entities[key]
-        entitypb.value = entity.value
-        entitypb.merged = entity.merged
-        entitypb.deleted = False
-        entitypb.represents.extend(entity.represents)
-    status: NewEntitiesGroupResponse = await ingest.NewEntitiesGroup(pbrequest)  # type: ignore
-    if status.status == NewEntitiesGroupResponse.Status.OK:
-        return
-    elif status.status == NewEntitiesGroupResponse.Status.KB_NOT_FOUND:
-        return HTTPNotFound(detail="Knowledge Box does not exist")
-    elif status.status == NewEntitiesGroupResponse.Status.ALREADY_EXISTS:
-        return HTTPConflict(
-            detail=f"Entities group {item.group} already exists in this Knowledge box",
-        )
-    elif status.status == NewEntitiesGroupResponse.Status.ERROR:
-        return HTTPInternalServerError(detail="Error on settings entities on a Knowledge box")
-@api.patch(
-    f"/{KB_PREFIX}/{{kbid}}/entitiesgroup/{{group}}",
-    status_code=200,
-    summary="Update Knowledge Box Entities Group",
-    tags=["Knowledge Box Services"],
-    openapi_extra={"x-operation_order": 2},
-)
-@requires(NucliaDBRoles.WRITER)
-@version(1)
-async def update_entities_group(
-    request: Request, kbid: str, group: str, item: UpdateEntitiesGroupPayload
-):
-    ingest = get_ingest()
-    pbrequest: UpdateEntitiesGroupRequest = UpdateEntitiesGroupRequest()
-    pbrequest.kb.uuid = kbid
-    pbrequest.group = group
-    pbrequest.title = item.title or ""
-    pbrequest.color = item.color or ""
-    for name, entity in item.add.items():
-        entitypb = pbrequest.add[name]
-        entitypb.value = entity.value
-        entitypb.merged = entity.merged
-        entitypb.represents.extend(entity.represents)
-    for name, entity in item.update.items():
-        entitypb = pbrequest.update[name]
-        entitypb.value = entity.value
-        entitypb.merged = entity.merged
-        entitypb.represents.extend(entity.represents)
-    pbrequest.delete.extend(item.delete)
-    status: UpdateEntitiesGroupResponse = await ingest.UpdateEntitiesGroup(pbrequest)  # type: ignore
-    if status.status == UpdateEntitiesGroupResponse.Status.OK:
-        return
-    elif status.status == UpdateEntitiesGroupResponse.Status.KB_NOT_FOUND:
-        return HTTPNotFound(detail="Knowledge Box does not exist")
-    elif status.status == UpdateEntitiesGroupResponse.Status.ENTITIES_GROUP_NOT_FOUND:
-        return HTTPNotFound(detail="Entities group does not exist")
-    elif status.status == UpdateEntitiesGroupResponse.Status.ERROR:
-        return HTTPInternalServerError(detail="Error on settings entities on a Knowledge box")
-@api.delete(
-    f"/{KB_PREFIX}/{{kbid}}/entitiesgroup/{{group}}",
-    status_code=200,
-    summary="Delete Knowledge Box Entities",
-    tags=["Knowledge Box Services"],
-    openapi_extra={"x-operation_order": 3},
-)
-@requires(NucliaDBRoles.WRITER)
-@version(1)
-async def delete_entities(request: Request, kbid: str, group: str):
-    ingest = get_ingest()
-    pbrequest: DelEntitiesRequest = DelEntitiesRequest()
-    pbrequest.kb.uuid = kbid
-    pbrequest.group = group
-    status: OpStatusWriter = await ingest.DelEntities(pbrequest)  # type: ignore
-    if status.status == OpStatusWriter.Status.OK:
-        return None
-    elif status.status == OpStatusWriter.Status.NOTFOUND:
-        raise HTTPException(status_code=404, detail="Knowledge Box does not exist")
-    elif status.status == OpStatusWriter.Status.ERROR:
-        raise HTTPException(status_code=500, detail="Error on deleting entities from a Knowledge box")
-    return Response(status_code=204)
 @api.post(
@@ -174,7 +44,15 @@ async def delete_entities(request: Request, kbid: str, group: str):
 )
 @requires(NucliaDBRoles.WRITER)
 @version(1)
-async def set_labelset_endpoint(request: Request, kbid: str, labelset: str, item: LabelSet):
+async def set_labelset_endpoint(
+    request: Request,
+    kbid: str,
+    labelset: str = Path(
+        title="The ID of the labelset to create or update. This is a unique identifier that should be used at search time.",
+        examples=["categories", "movie-genres", "document-types"],
+    ),
+    item: LabelSet = Body(...),
+):
     if item.title is None:
         item.title = labelset

nucliadb 6.9.1.post5192__py3-none-any.whl → 6.10.0.post5705__py3-none-any.whl

nucliadb 6.9.1.post5192py3-none-any.whl → 6.10.0.post5705py3-none-any.whl