PyPI - nucliadb - Versions diffs - 6.7.2.post4874__py3-none-any.whl → 6.10.0.post5705__py3-none-any.whl - Mend

nucliadb 6.7.2.post4874py3-none-any.whl → 6.10.0.post5705py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (246) hide show

migrations/0023_backfill_pg_catalog.py +8 -4
migrations/0028_extracted_vectors_reference.py +1 -1
migrations/0029_backfill_field_status.py +3 -4
migrations/0032_remove_old_relations.py +2 -3
migrations/0038_backfill_catalog_field_labels.py +8 -4
migrations/0039_backfill_converation_splits_metadata.py +106 -0
migrations/0040_migrate_search_configurations.py +79 -0
migrations/0041_reindex_conversations.py +137 -0
migrations/pg/0010_shards_index.py +34 -0
nucliadb/search/api/v1/resource/utils.py → migrations/pg/0011_catalog_statistics.py +5 -6
migrations/pg/0012_catalog_statistics_undo.py +26 -0
nucliadb/backups/create.py +2 -15
nucliadb/backups/restore.py +4 -15
nucliadb/backups/tasks.py +4 -1
nucliadb/common/back_pressure/cache.py +2 -3
nucliadb/common/back_pressure/materializer.py +7 -13
nucliadb/common/back_pressure/settings.py +6 -6
nucliadb/common/back_pressure/utils.py +1 -0
nucliadb/common/cache.py +9 -9
nucliadb/common/catalog/__init__.py +79 -0
nucliadb/common/catalog/dummy.py +36 -0
nucliadb/common/catalog/interface.py +85 -0
nucliadb/{search/search/pgcatalog.py → common/catalog/pg.py} +330 -232
nucliadb/common/catalog/utils.py +56 -0
nucliadb/common/cluster/manager.py +8 -23
nucliadb/common/cluster/rebalance.py +484 -112
nucliadb/common/cluster/rollover.py +36 -9
nucliadb/common/cluster/settings.py +4 -9
nucliadb/common/cluster/utils.py +34 -8
nucliadb/common/context/__init__.py +7 -8
nucliadb/common/context/fastapi.py +1 -2
nucliadb/common/datamanagers/__init__.py +2 -4
nucliadb/common/datamanagers/atomic.py +9 -2
nucliadb/common/datamanagers/cluster.py +1 -2
nucliadb/common/datamanagers/fields.py +3 -4
nucliadb/common/datamanagers/kb.py +6 -6
nucliadb/common/datamanagers/labels.py +2 -3
nucliadb/common/datamanagers/resources.py +10 -33
nucliadb/common/datamanagers/rollover.py +5 -7
nucliadb/common/datamanagers/search_configurations.py +1 -2
nucliadb/common/datamanagers/synonyms.py +1 -2
nucliadb/common/datamanagers/utils.py +4 -4
nucliadb/common/datamanagers/vectorsets.py +4 -4
nucliadb/common/external_index_providers/base.py +32 -5
nucliadb/common/external_index_providers/manager.py +5 -34
nucliadb/common/external_index_providers/settings.py +1 -27
nucliadb/common/filter_expression.py +129 -41
nucliadb/common/http_clients/exceptions.py +8 -0
nucliadb/common/http_clients/processing.py +16 -23
nucliadb/common/http_clients/utils.py +3 -0
nucliadb/common/ids.py +82 -58
nucliadb/common/locking.py +1 -2
nucliadb/common/maindb/driver.py +9 -8
nucliadb/common/maindb/local.py +5 -5
nucliadb/common/maindb/pg.py +9 -8
nucliadb/common/nidx.py +22 -5
nucliadb/common/vector_index_config.py +1 -1
nucliadb/export_import/datamanager.py +4 -3
nucliadb/export_import/exporter.py +11 -19
nucliadb/export_import/importer.py +13 -6
nucliadb/export_import/tasks.py +2 -0
nucliadb/export_import/utils.py +6 -18
nucliadb/health.py +2 -2
nucliadb/ingest/app.py +8 -8
nucliadb/ingest/consumer/consumer.py +8 -10
nucliadb/ingest/consumer/pull.py +10 -8
nucliadb/ingest/consumer/service.py +5 -30
nucliadb/ingest/consumer/shard_creator.py +16 -5
nucliadb/ingest/consumer/utils.py +1 -1
nucliadb/ingest/fields/base.py +37 -49
nucliadb/ingest/fields/conversation.py +55 -9
nucliadb/ingest/fields/exceptions.py +1 -2
nucliadb/ingest/fields/file.py +22 -8
nucliadb/ingest/fields/link.py +7 -7
nucliadb/ingest/fields/text.py +2 -3
nucliadb/ingest/orm/brain_v2.py +89 -57
nucliadb/ingest/orm/broker_message.py +2 -4
nucliadb/ingest/orm/entities.py +10 -209
nucliadb/ingest/orm/index_message.py +128 -113
nucliadb/ingest/orm/knowledgebox.py +91 -59
nucliadb/ingest/orm/processor/auditing.py +1 -3
nucliadb/ingest/orm/processor/data_augmentation.py +1 -2
nucliadb/ingest/orm/processor/processor.py +98 -153
nucliadb/ingest/orm/processor/sequence_manager.py +1 -2
nucliadb/ingest/orm/resource.py +82 -71
nucliadb/ingest/orm/utils.py +1 -1
nucliadb/ingest/partitions.py +12 -1
nucliadb/ingest/processing.py +17 -17
nucliadb/ingest/serialize.py +202 -145
nucliadb/ingest/service/writer.py +15 -114
nucliadb/ingest/settings.py +36 -15
nucliadb/ingest/utils.py +1 -2
nucliadb/learning_proxy.py +23 -26
nucliadb/metrics_exporter.py +20 -6
nucliadb/middleware/__init__.py +82 -1
nucliadb/migrator/datamanager.py +4 -11
nucliadb/migrator/migrator.py +1 -2
nucliadb/migrator/models.py +1 -2
nucliadb/migrator/settings.py +1 -2
nucliadb/models/internal/augment.py +614 -0
nucliadb/models/internal/processing.py +19 -19
nucliadb/openapi.py +2 -2
nucliadb/purge/__init__.py +3 -8
nucliadb/purge/orphan_shards.py +1 -2
nucliadb/reader/__init__.py +5 -0
nucliadb/reader/api/models.py +6 -13
nucliadb/reader/api/v1/download.py +59 -38
nucliadb/reader/api/v1/export_import.py +4 -4
nucliadb/reader/api/v1/knowledgebox.py +37 -9
nucliadb/reader/api/v1/learning_config.py +33 -14
nucliadb/reader/api/v1/resource.py +61 -9
nucliadb/reader/api/v1/services.py +18 -14
nucliadb/reader/app.py +3 -1
nucliadb/reader/reader/notifications.py +1 -2
nucliadb/search/api/v1/__init__.py +3 -0
nucliadb/search/api/v1/ask.py +3 -4
nucliadb/search/api/v1/augment.py +585 -0
nucliadb/search/api/v1/catalog.py +15 -19
nucliadb/search/api/v1/find.py +16 -22
nucliadb/search/api/v1/hydrate.py +328 -0
nucliadb/search/api/v1/knowledgebox.py +1 -2
nucliadb/search/api/v1/predict_proxy.py +1 -2
nucliadb/search/api/v1/resource/ask.py +28 -8
nucliadb/search/api/v1/resource/ingestion_agents.py +5 -6
nucliadb/search/api/v1/resource/search.py +9 -11
nucliadb/search/api/v1/retrieve.py +130 -0
nucliadb/search/api/v1/search.py +28 -32
nucliadb/search/api/v1/suggest.py +11 -14
nucliadb/search/api/v1/summarize.py +1 -2
nucliadb/search/api/v1/utils.py +2 -2
nucliadb/search/app.py +3 -2
nucliadb/search/augmentor/__init__.py +21 -0
nucliadb/search/augmentor/augmentor.py +232 -0
nucliadb/search/augmentor/fields.py +704 -0
nucliadb/search/augmentor/metrics.py +24 -0
nucliadb/search/augmentor/paragraphs.py +334 -0
nucliadb/search/augmentor/resources.py +238 -0
nucliadb/search/augmentor/utils.py +33 -0
nucliadb/search/lifecycle.py +3 -1
nucliadb/search/predict.py +33 -19
nucliadb/search/predict_models.py +8 -9
nucliadb/search/requesters/utils.py +11 -10
nucliadb/search/search/cache.py +19 -42
nucliadb/search/search/chat/ask.py +131 -59
nucliadb/search/search/chat/exceptions.py +3 -5
nucliadb/search/search/chat/fetcher.py +201 -0
nucliadb/search/search/chat/images.py +6 -4
nucliadb/search/search/chat/old_prompt.py +1375 -0
nucliadb/search/search/chat/parser.py +510 -0
nucliadb/search/search/chat/prompt.py +563 -615
nucliadb/search/search/chat/query.py +453 -32
nucliadb/search/search/chat/rpc.py +85 -0
nucliadb/search/search/fetch.py +3 -4
nucliadb/search/search/filters.py +8 -11
nucliadb/search/search/find.py +33 -31
nucliadb/search/search/find_merge.py +124 -331
nucliadb/search/search/graph_strategy.py +14 -12
nucliadb/search/search/hydrator/__init__.py +49 -0
nucliadb/search/search/hydrator/fields.py +217 -0
nucliadb/search/search/hydrator/images.py +130 -0
nucliadb/search/search/hydrator/paragraphs.py +323 -0
nucliadb/search/search/hydrator/resources.py +60 -0
nucliadb/search/search/ingestion_agents.py +5 -5
nucliadb/search/search/merge.py +90 -94
nucliadb/search/search/metrics.py +24 -7
nucliadb/search/search/paragraphs.py +7 -9
nucliadb/search/search/predict_proxy.py +44 -18
nucliadb/search/search/query.py +14 -86
nucliadb/search/search/query_parser/fetcher.py +51 -82
nucliadb/search/search/query_parser/models.py +19 -48
nucliadb/search/search/query_parser/old_filters.py +20 -19
nucliadb/search/search/query_parser/parsers/ask.py +5 -6
nucliadb/search/search/query_parser/parsers/catalog.py +7 -11
nucliadb/search/search/query_parser/parsers/common.py +21 -13
nucliadb/search/search/query_parser/parsers/find.py +6 -29
nucliadb/search/search/query_parser/parsers/graph.py +18 -28
nucliadb/search/search/query_parser/parsers/retrieve.py +207 -0
nucliadb/search/search/query_parser/parsers/search.py +15 -56
nucliadb/search/search/query_parser/parsers/unit_retrieval.py +8 -29
nucliadb/search/search/rank_fusion.py +18 -13
nucliadb/search/search/rerankers.py +6 -7
nucliadb/search/search/retrieval.py +300 -0
nucliadb/search/search/summarize.py +5 -6
nucliadb/search/search/utils.py +3 -4
nucliadb/search/settings.py +1 -2
nucliadb/standalone/api_router.py +1 -1
nucliadb/standalone/app.py +4 -3
nucliadb/standalone/auth.py +5 -6
nucliadb/standalone/lifecycle.py +2 -2
nucliadb/standalone/run.py +5 -4
nucliadb/standalone/settings.py +5 -6
nucliadb/standalone/versions.py +3 -4
nucliadb/tasks/consumer.py +13 -8
nucliadb/tasks/models.py +2 -1
nucliadb/tasks/producer.py +3 -3
nucliadb/tasks/retries.py +8 -7
nucliadb/train/api/utils.py +1 -3
nucliadb/train/api/v1/shards.py +1 -2
nucliadb/train/api/v1/trainset.py +1 -2
nucliadb/train/app.py +1 -1
nucliadb/train/generator.py +4 -4
nucliadb/train/generators/field_classifier.py +2 -2
nucliadb/train/generators/field_streaming.py +6 -6
nucliadb/train/generators/image_classifier.py +2 -2
nucliadb/train/generators/paragraph_classifier.py +2 -2
nucliadb/train/generators/paragraph_streaming.py +2 -2
nucliadb/train/generators/question_answer_streaming.py +2 -2
nucliadb/train/generators/sentence_classifier.py +4 -10
nucliadb/train/generators/token_classifier.py +3 -2
nucliadb/train/generators/utils.py +6 -5
nucliadb/train/nodes.py +3 -3
nucliadb/train/resource.py +6 -8
nucliadb/train/settings.py +3 -4
nucliadb/train/types.py +11 -11
nucliadb/train/upload.py +3 -2
nucliadb/train/uploader.py +1 -2
nucliadb/train/utils.py +1 -2
nucliadb/writer/api/v1/export_import.py +4 -1
nucliadb/writer/api/v1/field.py +15 -14
nucliadb/writer/api/v1/knowledgebox.py +18 -56
nucliadb/writer/api/v1/learning_config.py +5 -4
nucliadb/writer/api/v1/resource.py +9 -20
nucliadb/writer/api/v1/services.py +10 -132
nucliadb/writer/api/v1/upload.py +73 -72
nucliadb/writer/app.py +8 -2
nucliadb/writer/resource/basic.py +12 -15
nucliadb/writer/resource/field.py +43 -5
nucliadb/writer/resource/origin.py +7 -0
nucliadb/writer/settings.py +2 -3
nucliadb/writer/tus/__init__.py +2 -3
nucliadb/writer/tus/azure.py +5 -7
nucliadb/writer/tus/dm.py +3 -3
nucliadb/writer/tus/exceptions.py +3 -4
nucliadb/writer/tus/gcs.py +15 -22
nucliadb/writer/tus/s3.py +2 -3
nucliadb/writer/tus/storage.py +3 -3
{nucliadb-6.7.2.post4874.dist-info → nucliadb-6.10.0.post5705.dist-info}/METADATA +10 -11
nucliadb-6.10.0.post5705.dist-info/RECORD +410 -0
nucliadb/common/datamanagers/entities.py +0 -139
nucliadb/common/external_index_providers/pinecone.py +0 -894
nucliadb/ingest/orm/processor/pgcatalog.py +0 -129
nucliadb/search/search/hydrator.py +0 -197
nucliadb-6.7.2.post4874.dist-info/RECORD +0 -383
{nucliadb-6.7.2.post4874.dist-info → nucliadb-6.10.0.post5705.dist-info}/WHEEL +0 -0
{nucliadb-6.7.2.post4874.dist-info → nucliadb-6.10.0.post5705.dist-info}/entry_points.txt +0 -0
{nucliadb-6.7.2.post4874.dist-info → nucliadb-6.10.0.post5705.dist-info}/top_level.txt +0 -0

nucliadb/writer/resource/field.py CHANGED Viewed

@@ -19,15 +19,15 @@
 #
 import dataclasses
 from datetime import datetime
-from typing import Optional, Union
+from fastapi import HTTPException
 from google.protobuf.json_format import MessageToDict
 import nucliadb_models as models
 from nucliadb.common import datamanagers
 from nucliadb.common.maindb.driver import Transaction
 from nucliadb.common.models_utils import from_proto, to_proto
-from nucliadb.ingest.fields.conversation import Conversation
+from nucliadb.ingest.fields.conversation import MAX_CONVERSATION_MESSAGES, Conversation
 from nucliadb.ingest.orm.resource import Resource as ORMResource
 from nucliadb.models.internal import processing as processing_models
 from nucliadb.models.internal.processing import ClassificationLabel, PushConversation, PushPayload
@@ -87,7 +87,7 @@ async def extract_file_field(
     resource: ORMResource,
     toprocess: PushPayload,
     resource_classifications: ResourceClassifications,
-    password: Optional[str] = None,
+    password: str | None = None,
 ):
     field_type = resources_pb2.FieldType.FILE
     field = await resource.get_field(field_id, field_type)
@@ -182,7 +182,7 @@ async def extract_fields(resource: ORMResource, toprocess: PushPayload):
 async def parse_fields(
     writer: BrokerMessage,
     toprocess: PushPayload,
-    item: Union[CreateResourcePayload, UpdateResourcePayload],
+    item: CreateResourcePayload | UpdateResourcePayload,
     kbid: str,
     uuid: str,
     x_skip_store: bool,
@@ -227,6 +227,7 @@ async def parse_fields(
             kbid,
             uuid,
             resource_classifications,
+            replace_field=True,
         )
@@ -430,11 +431,15 @@ async def parse_conversation_field(
     kbid: str,
     uuid: str,
     resource_classifications: ResourceClassifications,
+    replace_field: bool,
 ) -> None:
+    if not replace_field:
+        # Appending messages to conversation
+        await _conversation_append_checks(kbid, uuid, key, conversation_field)
     classif_labels = resource_classifications.for_field(key, resources_pb2.FieldType.CONVERSATION)
     storage = await get_storage(service_name=SERVICE_NAME)
     processing = get_processing()
-    field_value = resources_pb2.Conversation()
+    field_value = resources_pb2.Conversation(replace_field=replace_field)
     convs = processing_models.PushConversation()
     for message in conversation_field.messages:
         cm = resources_pb2.Message()
@@ -543,3 +548,36 @@ async def get_stored_resource_classifications(
             classif = ClassificationLabel(labelset=f_classif.labelset, label=f_classif.label)
             rc.field_level.setdefault(fid, set()).add(classif)
     return rc
+async def _conversation_append_checks(
+    kbid: str, rid: str, field_id: str, input: models.InputConversationField
+):
+    async with datamanagers.with_ro_transaction() as txn:
+        resource_obj = await ORMResource.get(txn, kbid=kbid, rid=rid)
+        if resource_obj is None:
+            return
+        conv: Conversation = await resource_obj.get_field(
+            field_id, resources_pb2.FieldType.CONVERSATION, load=False
+        )
+        # Make sure that the max number of messages is not exceeded
+        current_message_count = (await conv.get_metadata()).total
+        if (
+            MAX_CONVERSATION_MESSAGES is not None
+            and (len(input.messages) + current_message_count) > MAX_CONVERSATION_MESSAGES
+        ):
+            raise HTTPException(
+                status_code=422,
+                detail=f"Conversation fields cannot have more than {MAX_CONVERSATION_MESSAGES} messages.",
+            )
+        # Make sure input messages use unique idents
+        existing_message_ids = set((await conv.get_splits_metadata()).metadata.keys())
+        input_message_ids = {message.ident for message in input.messages}
+        intersection = input_message_ids.intersection(existing_message_ids)
+        if intersection != set():
+            raise HTTPException(
+                status_code=422,
+                detail=f"Message identifiers must be unique field={field_id}: {list(intersection)[:50]}",
+            )

nucliadb/writer/resource/origin.py CHANGED Viewed

@@ -42,6 +42,13 @@ def parse_origin(origin: Origin, origin_payload: InputOrigin):
         origin.metadata.update(origin_payload.metadata)
     if origin_payload.path:
         origin.path = origin_payload.path
+    if origin_payload.sync_metadata is not None:
+        origin.sync_metadata.CopyFrom(
+            resources_pb2.SyncMetadata(
+                file_id=origin_payload.sync_metadata.file_id,
+                auth_provider=origin_payload.sync_metadata.auth_provider,
+            )
+        )
     origin.source = Origin.Source.API

nucliadb/writer/settings.py CHANGED Viewed

@@ -17,15 +17,14 @@
 # You should have received a copy of the GNU Affero General Public License
 # along with this program. If not, see <http://www.gnu.org/licenses/>.
 #
-from typing import Optional
 from pydantic_settings import BaseSettings
 class Settings(BaseSettings):
     dm_enabled: bool = True
-    dm_redis_host: Optional[str] = None
-    dm_redis_port: Optional[int] = None
+    dm_redis_host: str | None = None
+    dm_redis_port: int | None = None
 settings = Settings()

nucliadb/writer/tus/__init__.py CHANGED Viewed

@@ -18,7 +18,6 @@
 # along with this program. If not, see <http://www.gnu.org/licenses/>.
 #
 from dataclasses import dataclass
-from typing import Optional
 from nucliadb.writer.settings import settings as writer_settings
 from nucliadb.writer.tus.dm import FileDataManager, RedisFileDataManagerFactory
@@ -37,8 +36,8 @@ class TusStorageDriver:
     manager: FileStorageManager
-DRIVER: Optional[TusStorageDriver] = None
-REDIS_FILE_DATA_MANAGER_FACTORY: Optional[RedisFileDataManagerFactory] = None
+DRIVER: TusStorageDriver | None = None
+REDIS_FILE_DATA_MANAGER_FACTORY: RedisFileDataManagerFactory | None = None
 async def initialize():

nucliadb/writer/tus/azure.py CHANGED Viewed

@@ -19,15 +19,12 @@
 #
 from __future__ import annotations
-from typing import Optional
 from nucliadb.writer import logger
 from nucliadb.writer.tus.dm import FileDataManager
 from nucliadb.writer.tus.storage import BlobStore, FileStorageManager
 from nucliadb_protos.resources_pb2 import CloudFile
 from nucliadb_utils.storages import CHUNK_SIZE
 from nucliadb_utils.storages.azure import AzureObjectStore
-from nucliadb_utils.storages.exceptions import ObjectNotFoundError
 from nucliadb_utils.storages.utils import ObjectMetadata
@@ -41,7 +38,7 @@ class AzureBlobStore(BlobStore):
             logger.exception("Error closing AzureBlobStore")
         self._object_store = None
-    async def initialize(self, account_url: str, connection_string: Optional[str] = None):
+    async def initialize(self, account_url: str, connection_string: str | None = None):
         self.bucket = "nucliadb-{kbid}"
         self.source = CloudFile.Source.AZURE
         self._object_store = AzureObjectStore(account_url, connection_string=connection_string)
@@ -63,7 +60,7 @@ class AzureBlobStore(BlobStore):
 class AzureFileStorageManager(FileStorageManager):
     storage: AzureBlobStore
     chunk_size = CHUNK_SIZE
-    min_upload_size = None
+    min_upload_size = CHUNK_SIZE
     @property
     def object_store(self) -> AzureObjectStore:
@@ -87,7 +84,7 @@ class AzureFileStorageManager(FileStorageManager):
         bucket = self.storage.get_bucket_name(kbid)
         try:
             await self.object_store.delete(bucket, uri)
-        except ObjectNotFoundError:
+        except KeyError:
             logger.warning(
                 "Attempt to delete an upload but not found",
                 extra={"uri": uri, "kbid": kbid, "bucket": bucket},
@@ -108,4 +105,5 @@ class AzureFileStorageManager(FileStorageManager):
         return path
     def validate_intermediate_chunk(self, uploaded_bytes: int):
-        pass
+        if uploaded_bytes < self.min_upload_size:
+            raise ValueError(f"Intermediate chunks cannot be smaller than {self.min_upload_size} bytes")

nucliadb/writer/tus/dm.py CHANGED Viewed

@@ -18,7 +18,7 @@
 # along with this program. If not, see <http://www.gnu.org/licenses/>.
 #
 import time
-from typing import Any, Optional
+from typing import Any
 import backoff
 import orjson
@@ -43,7 +43,7 @@ DATA: dict[str, Any] = {}
 class FileDataManager:
-    _data: Optional[dict[str, Any]] = None
+    _data: dict[str, Any] | None = None
     _loaded = False
     key = None
     _ttl = 60 * 50 * 5  # 5 minutes should be plenty of time between activity
@@ -63,7 +63,7 @@ class FileDataManager:
         if self._data and "last_activity" in self._data:
             # check for another active upload, fail if we're screwing with
             # someone else
-            last_activity: Optional[int] = self._data.get("last_activity")
+            last_activity: int | None = self._data.get("last_activity")
             if last_activity and (time.time() - last_activity) < self._ttl:
                 if request.headers and request.headers.get("tus-override-upload", "0") != "1":
                     raise HTTPPreconditionFailed(

nucliadb/writer/tus/exceptions.py CHANGED Viewed

@@ -17,7 +17,6 @@
 # You should have received a copy of the GNU Affero General Public License
 # along with this program. If not, see <http://www.gnu.org/licenses/>.
 #
-from typing import Optional
 from starlette.exceptions import HTTPException as StarletteHTTPException
@@ -27,11 +26,11 @@ class InvalidTUSMetadata(Exception):
 class HTTPException(StarletteHTTPException):
-    _status_code: Optional[int] = None
+    _status_code: int | None = None
-    def __init__(self, detail: Optional[str] = None):
+    def __init__(self, detail: str | None = None):
         if self._status_code:
-            super(HTTPException, self).__init__(status_code=self._status_code, detail=detail)
+            super().__init__(status_code=self._status_code, detail=detail)
         else:
             raise AttributeError("Status code not defined")

nucliadb/writer/tus/gcs.py CHANGED Viewed

@@ -28,7 +28,6 @@ import tempfile
 import uuid
 from concurrent.futures import ThreadPoolExecutor
 from copy import deepcopy
-from typing import Optional
 from urllib.parse import quote_plus
 import aiohttp
@@ -74,16 +73,22 @@ RETRIABLE_EXCEPTIONS = (
 class GCloudBlobStore(BlobStore):
-    session: Optional[aiohttp.ClientSession] = None
+    _session: aiohttp.ClientSession | None = None
     loop = None
     upload_url: str
     object_base_url: str
-    json_credentials: Optional[str]
+    json_credentials: str | None
     bucket: str
     location: str
     project: str
     executor = ThreadPoolExecutor(max_workers=5)
+    @property
+    def session(self) -> aiohttp.ClientSession:
+        if self._session is None:  # pragma: no cover
+            raise AttributeError("Session not initialized")
+        return self._session
     async def get_access_headers(self):
         if self._credentials is None:
             return {}
@@ -106,8 +111,9 @@ class GCloudBlobStore(BlobStore):
             return access_token.access_token
     async def finalize(self):
-        if self.session is not None:
-            await self.session.close()
+        if self._session is not None:
+            await self._session.close()
+            self._session = None
     async def initialize(
         self,
@@ -116,7 +122,7 @@ class GCloudBlobStore(BlobStore):
         project: str,
         bucket_labels,
         object_base_url: str,
-        json_credentials: Optional[str],
+        json_credentials: str | None,
     ):
         self.bucket = bucket
         self.source = CloudFile.Source.GCS
@@ -124,7 +130,7 @@ class GCloudBlobStore(BlobStore):
         self.project = project
         self.bucket_labels = bucket_labels
         self.object_base_url = object_base_url + "/storage/v1/b"
-        self.upload_url = object_base_url + "/upload/storage/v1/b/{bucket}/o?uploadType=resumable"  # noqa
+        self.upload_url = object_base_url + "/upload/storage/v1/b/{bucket}/o?uploadType=resumable"
         self.json_credentials = json_credentials
         self._credentials = None
@@ -143,12 +149,9 @@ class GCloudBlobStore(BlobStore):
                 self._credentials = None
         loop = asyncio.get_event_loop()
-        self.session = aiohttp.ClientSession(loop=loop, timeout=TIMEOUT)
+        self._session = aiohttp.ClientSession(loop=loop, timeout=TIMEOUT)
     async def check_exists(self, bucket_name: str):
-        if self.session is None:
-            raise AttributeError()
         headers = await self.get_access_headers()
         # Using object access url instead of bucket access to avoid
         # giving admin permission to the SA, needed to GET a bucket
@@ -163,8 +166,6 @@ class GCloudBlobStore(BlobStore):
         return False
     async def create_bucket(self, bucket_name: str):
-        if self.session is None:
-            raise AttributeError()
         headers = await self.get_access_headers()
         url = f"{self.object_base_url}?project={self.project}"
@@ -199,10 +200,6 @@ class GCloudFileStorageManager(FileStorageManager):
         _resumable_uri : uri to resumable upload
         _uri : finished uploaded image
         """
-        if self.storage.session is None:
-            raise AttributeError()
         upload_file_id = dm.get("upload_file_id")
         if upload_file_id is not None:
             await self.delete_upload(upload_file_id, kbid)
@@ -287,8 +284,6 @@ class GCloudFileStorageManager(FileStorageManager):
     @backoff.on_exception(backoff.expo, RETRIABLE_EXCEPTIONS, jitter=backoff.random_jitter, max_tries=4)
     async def _append(self, dm: FileDataManager, data, offset):
-        if self.storage.session is None:
-            raise AttributeError()
         if dm.size:
             size = str(dm.size)
         else:
@@ -315,7 +310,7 @@ class GCloudFileStorageManager(FileStorageManager):
             },
             data=data,
         ) as call:
-            text = await call.text()  # noqa
+            text = await call.text()
             if call.status not in [200, 201, 308]:
                 raise GoogleCloudException(f"{call.status}: {text}")
             return call
@@ -353,8 +348,6 @@ class GCloudFileStorageManager(FileStorageManager):
     @backoff.on_exception(backoff.expo, RETRIABLE_EXCEPTIONS, jitter=backoff.random_jitter, max_tries=4)
     async def finish(self, dm: FileDataManager):
         if dm.size == 0:
-            if self.storage.session is None:
-                raise AttributeError()
             # In case of empty file, we need to send a PUT request with empty body
             # and Content-Range header set to "bytes */0"
             headers = {

nucliadb/writer/tus/s3.py CHANGED Viewed

@@ -22,7 +22,6 @@ from __future__ import annotations
 import base64
 import uuid
 from contextlib import AsyncExitStack
-from typing import Optional
 import aiobotocore  # type: ignore
 import aiohttp
@@ -195,8 +194,8 @@ class S3BlobStore(BlobStore):
         endpoint_url,
         region_name,
         bucket,
-        bucket_tags: Optional[dict[str, str]] = None,
-        kms_key_id: Optional[str] = None,
+        bucket_tags: dict[str, str] | None = None,
+        kms_key_id: str | None = None,
     ):
         self.bucket = bucket
         self.bucket_tags = bucket_tags

nucliadb/writer/tus/storage.py CHANGED Viewed

@@ -19,7 +19,7 @@
 #
 from __future__ import annotations
-from typing import AsyncIterator, Optional
+from collections.abc import AsyncIterator
 from nucliadb.writer.tus.dm import FileDataManager
 from nucliadb_protos.resources_pb2 import CloudFile
@@ -47,13 +47,13 @@ class BlobStore:
 class FileStorageManager:
     chunk_size: int
-    min_upload_size: Optional[int] = None
+    min_upload_size: int | None = None
     def __init__(self, storage: BlobStore):
         self.storage = storage
     def iter_data(
-        self, uri: str, kbid: str, headers: Optional[dict[str, str]] = None
+        self, uri: str, kbid: str, headers: dict[str, str] | None = None
     ) -> AsyncIterator[bytes]:
         raise NotImplementedError()

{nucliadb-6.7.2.post4874.dist-info → nucliadb-6.10.0.post5705.dist-info}/METADATA RENAMED Viewed

@@ -1,6 +1,6 @@
 Metadata-Version: 2.4
 Name: nucliadb
-Version: 6.7.2.post4874
+Version: 6.10.0.post5705
 Summary: NucliaDB
 Author-email: Nuclia <nucliadb@nuclia.com>
 License-Expression: AGPL-3.0-or-later
@@ -12,20 +12,19 @@ Classifier: Development Status :: 4 - Beta
 Classifier: Intended Audience :: Developers
 Classifier: Intended Audience :: Information Technology
 Classifier: Programming Language :: Python
-Classifier: Programming Language :: Python :: 3.9
 Classifier: Programming Language :: Python :: 3.10
 Classifier: Programming Language :: Python :: 3.11
 Classifier: Programming Language :: Python :: 3.12
 Classifier: Programming Language :: Python :: 3 :: Only
-Requires-Python: <4,>=3.9
+Requires-Python: <4,>=3.10
 Description-Content-Type: text/markdown
-Requires-Dist: nucliadb-telemetry[all]>=6.7.2.post4874
-Requires-Dist: nucliadb-utils[cache,fastapi,storages]>=6.7.2.post4874
-Requires-Dist: nucliadb-protos>=6.7.2.post4874
-Requires-Dist: nucliadb-models>=6.7.2.post4874
-Requires-Dist: nidx-protos>=6.7.2.post4874
+Requires-Dist: nucliadb-telemetry[all]>=6.10.0.post5705
+Requires-Dist: nucliadb-utils[cache,fastapi,storages]>=6.10.0.post5705
+Requires-Dist: nucliadb-protos[grpc]>=6.10.0.post5705
+Requires-Dist: nucliadb-models>=6.10.0.post5705
+Requires-Dist: nidx-protos[grpc]>=6.10.0.post5705
 Requires-Dist: nucliadb-admin-assets>=1.0.0.post1224
-Requires-Dist: nuclia-models>=0.46.0
+Requires-Dist: nuclia-models>=0.50.0
 Requires-Dist: uvicorn[standard]
 Requires-Dist: argdantic
 Requires-Dist: aiohttp>=3.11.11
@@ -35,7 +34,7 @@ Requires-Dist: aiofiles>=0.8.0
 Requires-Dist: psutil>=5.9.7
 Requires-Dist: types-psutil>=5.9.5.17
 Requires-Dist: types-aiofiles>=0.8.3
-Requires-Dist: protobuf<6,>=5
+Requires-Dist: protobuf>=5
 Requires-Dist: types-protobuf<6,>=5
 Requires-Dist: grpcio>=1.71.0
 Requires-Dist: grpcio-health-checking>=1.71.0
@@ -57,7 +56,7 @@ Requires-Dist: jwcrypto>=1.5.6
 Requires-Dist: pyyaml>=5.1
 Requires-Dist: fastapi-versioning>=0.10.0
 Requires-Dist: fastapi>=0.95.2
-Requires-Dist: sentry-sdk>=2.8.0
+Requires-Dist: sentry-sdk[fastapi]>=2.8.0
 Requires-Dist: pyjwt>=2.4.0
 Requires-Dist: mmh3>=3.0.0
 Requires-Dist: httpx>=0.23.0

nucliadb 6.7.2.post4874__py3-none-any.whl → 6.10.0.post5705__py3-none-any.whl

nucliadb 6.7.2.post4874py3-none-any.whl → 6.10.0.post5705py3-none-any.whl