PyPI - nucliadb - Versions diffs - 6.9.1.post5192__py3-none-any.whl → 6.10.0.post5705__py3-none-any.whl - Mend

nucliadb 6.9.1.post5192py3-none-any.whl → 6.10.0.post5705py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (231) hide show

migrations/0023_backfill_pg_catalog.py +2 -2
migrations/0029_backfill_field_status.py +3 -4
migrations/0032_remove_old_relations.py +2 -3
migrations/0038_backfill_catalog_field_labels.py +2 -2
migrations/0039_backfill_converation_splits_metadata.py +2 -2
migrations/0041_reindex_conversations.py +137 -0
migrations/pg/0010_shards_index.py +34 -0
nucliadb/search/api/v1/resource/utils.py → migrations/pg/0011_catalog_statistics.py +5 -6
migrations/pg/0012_catalog_statistics_undo.py +26 -0
nucliadb/backups/create.py +2 -15
nucliadb/backups/restore.py +4 -15
nucliadb/backups/tasks.py +4 -1
nucliadb/common/back_pressure/cache.py +2 -3
nucliadb/common/back_pressure/materializer.py +7 -13
nucliadb/common/back_pressure/settings.py +6 -6
nucliadb/common/back_pressure/utils.py +1 -0
nucliadb/common/cache.py +9 -9
nucliadb/common/catalog/interface.py +12 -12
nucliadb/common/catalog/pg.py +41 -29
nucliadb/common/catalog/utils.py +3 -3
nucliadb/common/cluster/manager.py +5 -4
nucliadb/common/cluster/rebalance.py +483 -114
nucliadb/common/cluster/rollover.py +25 -9
nucliadb/common/cluster/settings.py +3 -8
nucliadb/common/cluster/utils.py +34 -8
nucliadb/common/context/__init__.py +7 -8
nucliadb/common/context/fastapi.py +1 -2
nucliadb/common/datamanagers/__init__.py +2 -4
nucliadb/common/datamanagers/atomic.py +4 -2
nucliadb/common/datamanagers/cluster.py +1 -2
nucliadb/common/datamanagers/fields.py +3 -4
nucliadb/common/datamanagers/kb.py +6 -6
nucliadb/common/datamanagers/labels.py +2 -3
nucliadb/common/datamanagers/resources.py +10 -33
nucliadb/common/datamanagers/rollover.py +5 -7
nucliadb/common/datamanagers/search_configurations.py +1 -2
nucliadb/common/datamanagers/synonyms.py +1 -2
nucliadb/common/datamanagers/utils.py +4 -4
nucliadb/common/datamanagers/vectorsets.py +4 -4
nucliadb/common/external_index_providers/base.py +32 -5
nucliadb/common/external_index_providers/manager.py +4 -5
nucliadb/common/filter_expression.py +128 -40
nucliadb/common/http_clients/processing.py +12 -23
nucliadb/common/ids.py +6 -4
nucliadb/common/locking.py +1 -2
nucliadb/common/maindb/driver.py +9 -8
nucliadb/common/maindb/local.py +5 -5
nucliadb/common/maindb/pg.py +9 -8
nucliadb/common/nidx.py +3 -4
nucliadb/export_import/datamanager.py +4 -3
nucliadb/export_import/exporter.py +11 -19
nucliadb/export_import/importer.py +13 -6
nucliadb/export_import/tasks.py +2 -0
nucliadb/export_import/utils.py +6 -18
nucliadb/health.py +2 -2
nucliadb/ingest/app.py +8 -8
nucliadb/ingest/consumer/consumer.py +8 -10
nucliadb/ingest/consumer/pull.py +3 -8
nucliadb/ingest/consumer/service.py +3 -3
nucliadb/ingest/consumer/utils.py +1 -1
nucliadb/ingest/fields/base.py +28 -49
nucliadb/ingest/fields/conversation.py +12 -12
nucliadb/ingest/fields/exceptions.py +1 -2
nucliadb/ingest/fields/file.py +22 -8
nucliadb/ingest/fields/link.py +7 -7
nucliadb/ingest/fields/text.py +2 -3
nucliadb/ingest/orm/brain_v2.py +78 -64
nucliadb/ingest/orm/broker_message.py +2 -4
nucliadb/ingest/orm/entities.py +10 -209
nucliadb/ingest/orm/index_message.py +4 -4
nucliadb/ingest/orm/knowledgebox.py +18 -27
nucliadb/ingest/orm/processor/auditing.py +1 -3
nucliadb/ingest/orm/processor/data_augmentation.py +1 -2
nucliadb/ingest/orm/processor/processor.py +27 -27
nucliadb/ingest/orm/processor/sequence_manager.py +1 -2
nucliadb/ingest/orm/resource.py +72 -70
nucliadb/ingest/orm/utils.py +1 -1
nucliadb/ingest/processing.py +17 -17
nucliadb/ingest/serialize.py +202 -145
nucliadb/ingest/service/writer.py +3 -109
nucliadb/ingest/settings.py +3 -4
nucliadb/ingest/utils.py +1 -2
nucliadb/learning_proxy.py +11 -11
nucliadb/metrics_exporter.py +5 -4
nucliadb/middleware/__init__.py +82 -1
nucliadb/migrator/datamanager.py +3 -4
nucliadb/migrator/migrator.py +1 -2
nucliadb/migrator/models.py +1 -2
nucliadb/migrator/settings.py +1 -2
nucliadb/models/internal/augment.py +614 -0
nucliadb/models/internal/processing.py +19 -19
nucliadb/openapi.py +2 -2
nucliadb/purge/__init__.py +3 -8
nucliadb/purge/orphan_shards.py +1 -2
nucliadb/reader/__init__.py +5 -0
nucliadb/reader/api/models.py +6 -13
nucliadb/reader/api/v1/download.py +59 -38
nucliadb/reader/api/v1/export_import.py +4 -4
nucliadb/reader/api/v1/learning_config.py +24 -4
nucliadb/reader/api/v1/resource.py +61 -9
nucliadb/reader/api/v1/services.py +18 -14
nucliadb/reader/app.py +3 -1
nucliadb/reader/reader/notifications.py +1 -2
nucliadb/search/api/v1/__init__.py +2 -0
nucliadb/search/api/v1/ask.py +3 -4
nucliadb/search/api/v1/augment.py +585 -0
nucliadb/search/api/v1/catalog.py +11 -15
nucliadb/search/api/v1/find.py +16 -22
nucliadb/search/api/v1/hydrate.py +25 -25
nucliadb/search/api/v1/knowledgebox.py +1 -2
nucliadb/search/api/v1/predict_proxy.py +1 -2
nucliadb/search/api/v1/resource/ask.py +7 -7
nucliadb/search/api/v1/resource/ingestion_agents.py +5 -6
nucliadb/search/api/v1/resource/search.py +9 -11
nucliadb/search/api/v1/retrieve.py +130 -0
nucliadb/search/api/v1/search.py +28 -32
nucliadb/search/api/v1/suggest.py +11 -14
nucliadb/search/api/v1/summarize.py +1 -2
nucliadb/search/api/v1/utils.py +2 -2
nucliadb/search/app.py +3 -2
nucliadb/search/augmentor/__init__.py +21 -0
nucliadb/search/augmentor/augmentor.py +232 -0
nucliadb/search/augmentor/fields.py +704 -0
nucliadb/search/augmentor/metrics.py +24 -0
nucliadb/search/augmentor/paragraphs.py +334 -0
nucliadb/search/augmentor/resources.py +238 -0
nucliadb/search/augmentor/utils.py +33 -0
nucliadb/search/lifecycle.py +3 -1
nucliadb/search/predict.py +24 -17
nucliadb/search/predict_models.py +8 -9
nucliadb/search/requesters/utils.py +11 -10
nucliadb/search/search/cache.py +19 -23
nucliadb/search/search/chat/ask.py +88 -59
nucliadb/search/search/chat/exceptions.py +3 -5
nucliadb/search/search/chat/fetcher.py +201 -0
nucliadb/search/search/chat/images.py +6 -4
nucliadb/search/search/chat/old_prompt.py +1375 -0
nucliadb/search/search/chat/parser.py +510 -0
nucliadb/search/search/chat/prompt.py +563 -615
nucliadb/search/search/chat/query.py +449 -36
nucliadb/search/search/chat/rpc.py +85 -0
nucliadb/search/search/fetch.py +3 -4
nucliadb/search/search/filters.py +8 -11
nucliadb/search/search/find.py +33 -31
nucliadb/search/search/find_merge.py +124 -331
nucliadb/search/search/graph_strategy.py +14 -12
nucliadb/search/search/hydrator/__init__.py +3 -152
nucliadb/search/search/hydrator/fields.py +92 -50
nucliadb/search/search/hydrator/images.py +7 -7
nucliadb/search/search/hydrator/paragraphs.py +42 -26
nucliadb/search/search/hydrator/resources.py +20 -16
nucliadb/search/search/ingestion_agents.py +5 -5
nucliadb/search/search/merge.py +90 -94
nucliadb/search/search/metrics.py +10 -9
nucliadb/search/search/paragraphs.py +7 -9
nucliadb/search/search/predict_proxy.py +13 -9
nucliadb/search/search/query.py +14 -86
nucliadb/search/search/query_parser/fetcher.py +51 -82
nucliadb/search/search/query_parser/models.py +19 -20
nucliadb/search/search/query_parser/old_filters.py +20 -19
nucliadb/search/search/query_parser/parsers/ask.py +4 -5
nucliadb/search/search/query_parser/parsers/catalog.py +5 -6
nucliadb/search/search/query_parser/parsers/common.py +5 -6
nucliadb/search/search/query_parser/parsers/find.py +6 -26
nucliadb/search/search/query_parser/parsers/graph.py +13 -23
nucliadb/search/search/query_parser/parsers/retrieve.py +207 -0
nucliadb/search/search/query_parser/parsers/search.py +15 -53
nucliadb/search/search/query_parser/parsers/unit_retrieval.py +8 -29
nucliadb/search/search/rank_fusion.py +18 -13
nucliadb/search/search/rerankers.py +5 -6
nucliadb/search/search/retrieval.py +300 -0
nucliadb/search/search/summarize.py +5 -6
nucliadb/search/search/utils.py +3 -4
nucliadb/search/settings.py +1 -2
nucliadb/standalone/api_router.py +1 -1
nucliadb/standalone/app.py +4 -3
nucliadb/standalone/auth.py +5 -6
nucliadb/standalone/lifecycle.py +2 -2
nucliadb/standalone/run.py +2 -4
nucliadb/standalone/settings.py +5 -6
nucliadb/standalone/versions.py +3 -4
nucliadb/tasks/consumer.py +13 -8
nucliadb/tasks/models.py +2 -1
nucliadb/tasks/producer.py +3 -3
nucliadb/tasks/retries.py +8 -7
nucliadb/train/api/utils.py +1 -3
nucliadb/train/api/v1/shards.py +1 -2
nucliadb/train/api/v1/trainset.py +1 -2
nucliadb/train/app.py +1 -1
nucliadb/train/generator.py +4 -4
nucliadb/train/generators/field_classifier.py +2 -2
nucliadb/train/generators/field_streaming.py +6 -6
nucliadb/train/generators/image_classifier.py +2 -2
nucliadb/train/generators/paragraph_classifier.py +2 -2
nucliadb/train/generators/paragraph_streaming.py +2 -2
nucliadb/train/generators/question_answer_streaming.py +2 -2
nucliadb/train/generators/sentence_classifier.py +2 -2
nucliadb/train/generators/token_classifier.py +3 -2
nucliadb/train/generators/utils.py +6 -5
nucliadb/train/nodes.py +3 -3
nucliadb/train/resource.py +6 -8
nucliadb/train/settings.py +3 -4
nucliadb/train/types.py +11 -11
nucliadb/train/upload.py +3 -2
nucliadb/train/uploader.py +1 -2
nucliadb/train/utils.py +1 -2
nucliadb/writer/api/v1/export_import.py +4 -1
nucliadb/writer/api/v1/field.py +7 -11
nucliadb/writer/api/v1/knowledgebox.py +3 -4
nucliadb/writer/api/v1/resource.py +9 -20
nucliadb/writer/api/v1/services.py +10 -132
nucliadb/writer/api/v1/upload.py +73 -72
nucliadb/writer/app.py +8 -2
nucliadb/writer/resource/basic.py +12 -15
nucliadb/writer/resource/field.py +7 -5
nucliadb/writer/resource/origin.py +7 -0
nucliadb/writer/settings.py +2 -3
nucliadb/writer/tus/__init__.py +2 -3
nucliadb/writer/tus/azure.py +1 -3
nucliadb/writer/tus/dm.py +3 -3
nucliadb/writer/tus/exceptions.py +3 -4
nucliadb/writer/tus/gcs.py +5 -6
nucliadb/writer/tus/s3.py +2 -3
nucliadb/writer/tus/storage.py +3 -3
{nucliadb-6.9.1.post5192.dist-info → nucliadb-6.10.0.post5705.dist-info}/METADATA +9 -10
nucliadb-6.10.0.post5705.dist-info/RECORD +410 -0
nucliadb/common/datamanagers/entities.py +0 -139
nucliadb-6.9.1.post5192.dist-info/RECORD +0 -392
{nucliadb-6.9.1.post5192.dist-info → nucliadb-6.10.0.post5705.dist-info}/WHEEL +0 -0
{nucliadb-6.9.1.post5192.dist-info → nucliadb-6.10.0.post5705.dist-info}/entry_points.txt +0 -0
{nucliadb-6.9.1.post5192.dist-info → nucliadb-6.10.0.post5705.dist-info}/top_level.txt +0 -0

nucliadb/search/search/chat/rpc.py ADDED Viewed

@@ -0,0 +1,85 @@
+# Copyright (C) 2021 Bosutech XXI S.L.
+#
+# nucliadb is offered under the AGPL v3.0 and as commercial software.
+# For commercial licensing, contact us at info@nuclia.com.
+#
+# AGPL:
+# This program is free software: you can redistribute it and/or modify
+# it under the terms of the GNU Affero General Public License as
+# published by the Free Software Foundation, either version 3 of the
+# License, or (at your option) any later version.
+#
+# This program is distributed in the hope that it will be useful,
+# but WITHOUT ANY WARRANTY; without even the implied warranty of
+# MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE. See the
+# GNU Affero General Public License for more details.
+#
+# You should have received a copy of the GNU Affero General Public License
+# along with this program. If not, see <http://www.gnu.org/licenses/>.
+#
+from nucliadb.common.ids import FieldId
+from nucliadb.search.search.metrics import Metrics
+from nucliadb_models.augment import AugmentRequest, AugmentResponse
+from nucliadb_models.labels import KnowledgeBoxLabels
+from nucliadb_models.retrieval import RetrievalRequest, RetrievalResponse
+from nucliadb_models.search import FindRequest, Image, KnowledgeboxFindResults, NucliaDBClientType
+# TODO(decoupled-ask): replace this for a sdk.find call when moving /ask to RAO
+async def find(
+    kbid: str,
+    item: FindRequest,
+    x_ndb_client: NucliaDBClientType,
+    x_nucliadb_user: str,
+    x_forwarded_for: str,
+    # REVIEW(decoupled-ask): once in an SDK metrics, we'll lose track of metrics
+    metrics: Metrics,
+) -> tuple[KnowledgeboxFindResults, bool]:
+    from nucliadb.search.search.find import find
+    results, incomplete, _ = await find(
+        kbid, item, x_ndb_client, x_nucliadb_user, x_forwarded_for, metrics
+    )
+    return results, incomplete
+# TODO(decoupled-ask): replace this for a sdk.retrieve call when moving /ask to RAO
+async def retrieve(
+    kbid: str,
+    item: RetrievalRequest,
+    *,
+    x_ndb_client: NucliaDBClientType,
+    x_nucliadb_user: str,
+    x_forwarded_for: str,
+) -> RetrievalResponse:
+    from nucliadb.search.api.v1.retrieve import retrieve_endpoint
+    return await retrieve_endpoint(
+        kbid,
+        item,
+        x_ndb_client=x_ndb_client,
+        x_nucliadb_user=x_nucliadb_user,
+        x_forwarded_for=x_forwarded_for,
+    )
+# TODO(decoupled-ask): replace this for a sdk.augment call when moving /ask to RAO
+async def augment(kbid: str, item: AugmentRequest) -> AugmentResponse:
+    from nucliadb.search.api.v1.augment import augment_endpoint
+    return await augment_endpoint(kbid, item)
+# TODO(decoupled-ask): replace this for a sdk.labelsets call when moving /ask to RAO
+async def labelsets(kbid: str) -> KnowledgeBoxLabels:
+    from nucliadb.reader.api.v1.services import get_labelsets
+    return await get_labelsets(kbid)
+# TODO(decoupled-ask): replace this for a sdk.download call when moving /ask to RAO
+async def download_image(kbid: str, field_id: FieldId, path: str, *, mime_type: str) -> Image | None:
+    from nucliadb.search.search.hydrator.images import download_image
+    return await download_image(kbid, field_id, path, mime_type=mime_type)

nucliadb/search/search/fetch.py CHANGED Viewed

@@ -19,7 +19,6 @@
 #
 import asyncio
 from contextvars import ContextVar
-from typing import Optional
 from nidx_protos.nodereader_pb2 import DocumentResult, ParagraphResult
@@ -36,7 +35,7 @@ from nucliadb_protos.resources_pb2 import Paragraph
 from nucliadb_utils import const
 from nucliadb_utils.utilities import has_feature
-rcache: ContextVar[Optional[dict[str, ResourceORM]]] = ContextVar("rcache", default=None)
+rcache: ContextVar[dict[str, ResourceORM] | None] = ContextVar("rcache", default=None)
 async def fetch_resources(
@@ -79,7 +78,7 @@ async def fetch_resources(
 async def get_paragraph_from_resource(
     orm_resource: ResourceORM, result: ParagraphResult
-) -> Optional[Paragraph]:
+) -> Paragraph | None:
     _, field_type, field = result.field.split("/")
     field_type_int = FIELD_TYPE_STR_TO_PB[field_type]
     field_obj = await orm_resource.get_field(field, field_type_int, load=False)
@@ -144,7 +143,7 @@ async def get_labels_paragraph(result: ParagraphResult, kbid: str) -> list[str]:
 async def get_seconds_paragraph(
     result: ParagraphResult, kbid: str
-) -> Optional[tuple[list[int], list[int]]]:
+) -> tuple[list[int], list[int]] | None:
     orm_resource = await cache.get_resource(kbid, result.uuid)
     if orm_resource is None:

nucliadb/search/search/filters.py CHANGED Viewed

@@ -18,7 +18,7 @@
 # along with this program. If not, see <http://www.gnu.org/licenses/>.
 #
 from collections.abc import Iterator
-from typing import Any, Optional, Union
+from typing import Any
 from nucliadb.common.exceptions import InvalidQueryError
 from nucliadb_models.labels import translate_alias_to_system_label
@@ -108,7 +108,7 @@ def split_labels_by_type(
 def is_paragraph_labelset_kind(labelset_id: str, classification_labels: knowledgebox_pb2.Labels) -> bool:
     try:
-        labelset: Optional[knowledgebox_pb2.LabelSet] = classification_labels.labelset.get(labelset_id)
+        labelset: knowledgebox_pb2.LabelSet | None = classification_labels.labelset.get(labelset_id)
         if labelset is None:
             return False
         return knowledgebox_pb2.LabelSet.LabelSetKind.PARAGRAPHS in labelset.kind
@@ -117,7 +117,7 @@ def is_paragraph_labelset_kind(labelset_id: str, classification_labels: knowledg
         return False
-def flatten_filter_literals(filters: Union[list[str], dict[str, Any]]) -> list[str]:
+def flatten_filter_literals(filters: list[str] | dict[str, Any]) -> list[str]:
     if isinstance(filters, list):
         return filters
     else:
@@ -130,20 +130,17 @@ def iter_filter_expression_literals(expression: dict[str, Any]) -> Iterator[str]
         return
     if "not" in expression:
-        for label in iter_filter_expression_literals(expression["not"]):
-            yield label
+        yield from iter_filter_expression_literals(expression["not"])
         return
     if "and" in expression:
         for and_term in expression["and"]:
-            for label in iter_filter_expression_literals(and_term):
-                yield label
+            yield from iter_filter_expression_literals(and_term)
         return
     if "or" in expression:
         for or_term in expression["or"]:
-            for label in iter_filter_expression_literals(or_term):
-                yield label
+            yield from iter_filter_expression_literals(or_term)
         return
@@ -151,7 +148,7 @@ def has_classification_label_filters(filters: list[str]) -> bool:
     return any(label.startswith(CLASSIFICATION_LABEL_PREFIX) for label in filters)
-def convert_to_node_filters(filters: Union[list[str], list[Filter]]) -> dict[str, Any]:
+def convert_to_node_filters(filters: list[str] | list[Filter]) -> dict[str, Any]:
     if len(filters) == 0:
         return {}
@@ -161,7 +158,7 @@ def convert_to_node_filters(filters: Union[list[str], list[Filter]]) -> dict[str
     return {"and": [convert_filter_to_node_schema(fltr) for fltr in filters]}
-def convert_filter_to_node_schema(fltr: Union[str, Filter]) -> dict[str, Any]:
+def convert_filter_to_node_schema(fltr: str | Filter) -> dict[str, Any]:
     if isinstance(fltr, str):
         return {"literal": fltr}

nucliadb/search/search/find.py CHANGED Viewed

@@ -23,7 +23,6 @@ from time import time
 from nucliadb.common.external_index_providers.base import ExternalIndexManager
 from nucliadb.common.external_index_providers.manager import get_external_index_manager
 from nucliadb.common.models_utils import to_proto
-from nucliadb.search.requesters.utils import Method, nidx_query
 from nucliadb.search.search.find_merge import (
     build_find_response,
     compose_find_resources,
@@ -38,14 +37,16 @@ from nucliadb.search.search.metrics import (
 )
 from nucliadb.search.search.query_parser.models import ParsedQuery
 from nucliadb.search.search.query_parser.parsers import parse_find
-from nucliadb.search.search.query_parser.parsers.unit_retrieval import legacy_convert_retrieval_to_proto
-from nucliadb.search.search.rank_fusion import (
-    get_rank_fusion,
+from nucliadb.search.search.query_parser.parsers.unit_retrieval import (
+    convert_retrieval_to_proto,
+    get_rephrased_query,
+    is_incomplete,
 )
 from nucliadb.search.search.rerankers import (
     RerankingOptions,
     get_reranker,
 )
+from nucliadb.search.search.retrieval import text_block_search
 from nucliadb.search.settings import settings
 from nucliadb_models.search import (
     FindRequest,
@@ -68,18 +69,16 @@ async def find(
 ) -> tuple[KnowledgeboxFindResults, bool, ParsedQuery]:
     external_index_manager = await get_external_index_manager(kbid=kbid)
     if external_index_manager is not None:
-        return await _external_index_retrieval(
+        return await _external_index_find(
             kbid,
             item,
             external_index_manager,
         )
     else:
-        return await _index_node_retrieval(
-            kbid, item, x_ndb_client, x_nucliadb_user, x_forwarded_for, metrics
-        )
+        return await _ndb_index_find(kbid, item, x_ndb_client, x_nucliadb_user, x_forwarded_for, metrics)
-async def _index_node_retrieval(
+async def _ndb_index_find(
     kbid: str,
     item: FindRequest,
     x_ndb_client: NucliaDBClientType,
@@ -95,32 +94,37 @@ async def _index_node_retrieval(
         assert parsed.retrieval.rank_fusion is not None and parsed.retrieval.reranker is not None, (
             "find parser must provide rank fusion and reranker algorithms"
         )
-        rank_fusion = get_rank_fusion(parsed.retrieval.rank_fusion)
         reranker = get_reranker(parsed.retrieval.reranker)
-        (
-            pb_query,
-            incomplete_results,
-            autofilters,
-            rephrased_query,
-        ) = await legacy_convert_retrieval_to_proto(parsed)
+        incomplete_results = is_incomplete(parsed.retrieval)
+        rephrased_query = get_rephrased_query(parsed)
     with metrics.time("index_search"):
-        results, queried_shards = await nidx_query(kbid, Method.SEARCH, pb_query)
+        text_blocks, pb_query, pb_response, queried_shards = await text_block_search(
+            kbid, parsed.retrieval
+        )
     # Rank fusion merge, cut, hydrate and rerank
     with metrics.time("results_merge"):
-        search_results = await build_find_response(
-            results,
-            retrieval=parsed.retrieval,
-            kbid=kbid,
-            query=pb_query.body,
-            rephrased_query=rephrased_query,
+        resource_hydration_options = ResourceHydrationOptions(
             show=item.show,
             extracted=item.extracted,
             field_type_filter=item.field_type_filter,
+        )
+        text_block_hydration_options = TextBlockHydrationOptions(
             highlight=item.highlight,
-            rank_fusion_algorithm=rank_fusion,
+            ematches=pb_response.paragraph.ematches,  # type: ignore
+        )
+        search_results = await build_find_response(
+            pb_response,
+            text_blocks,
+            pb_response.graph,
+            retrieval=parsed.retrieval,
+            kbid=kbid,
+            query=item.query,
+            rephrased_query=rephrased_query,
             reranker=reranker,
+            resource_hydration_options=resource_hydration_options,
+            text_block_hydration_options=text_block_hydration_options,
         )
     search_time = time() - start_time
@@ -137,7 +141,6 @@ async def _index_node_retrieval(
         )
     search_results.shards = queried_shards
-    search_results.autofilters = autofilters
     ndb_time = metrics["index_search"] + metrics["results_merge"]
     if metrics["index_search"] > settings.slow_node_query_log_threshold:
@@ -168,7 +171,7 @@ async def _index_node_retrieval(
     return search_results, incomplete_results, parsed
-async def _external_index_retrieval(
+async def _external_index_find(
     kbid: str,
     item: FindRequest,
     external_index_manager: ExternalIndexManager,
@@ -180,12 +183,12 @@ async def _external_index_retrieval(
     parsed = await parse_find(kbid, item)
     assert parsed.retrieval.reranker is not None, "find parser must provide a reranking algorithm"
     reranker = get_reranker(parsed.retrieval.reranker)
-    search_request, incomplete_results, _, rephrased_query = await legacy_convert_retrieval_to_proto(
-        parsed
-    )
+    incomplete_results = is_incomplete(parsed.retrieval)
+    rephrased_query = get_rephrased_query(parsed)
+    search_request = convert_retrieval_to_proto(parsed.retrieval)
     # Query index
-    query_results = await external_index_manager.query(search_request)  # noqa
+    query_results = await external_index_manager.query(search_request)
     # Hydrate and rerank results
     text_blocks, resources, best_matches = await hydrate_and_rerank(
@@ -220,7 +223,6 @@ async def _external_index_retrieval(
         page_number=0,
         page_size=item.top_k,
         relations=None,  # Not implemented for external indexes yet
-        autofilters=[],  # Not implemented for external indexes yet
         min_score=results_min_score,
         best_matches=best_matches,
         # These are not used for external indexes

nucliadb 6.9.1.post5192__py3-none-any.whl → 6.10.0.post5705__py3-none-any.whl

nucliadb 6.9.1.post5192py3-none-any.whl → 6.10.0.post5705py3-none-any.whl