PyPI - rapidata - Versions diffs - 1.1.0__py3-none-any.whl → 1.2.0__py3-none-any.whl - Mend

rapidata 1.1.0py3-none-any.whl → 1.2.0py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (40) hide show

rapidata/__init__.py +1 -0
rapidata/api_client/__init__.py +5 -3
rapidata/api_client/api/__init__.py +2 -0
rapidata/api_client/api/campaign_api.py +8 -4
rapidata/api_client/api/coco_api.py +4 -2
rapidata/api_client/api/compare_workflow_api.py +2 -1
rapidata/api_client/api/datapoint_api.py +6 -3
rapidata/api_client/api/dataset_api.py +16 -8
rapidata/api_client/api/identity_api.py +329 -50
rapidata/api_client/api/newsletter_api.py +4 -2
rapidata/api_client/api/order_api.py +40 -20
rapidata/api_client/api/pipeline_api.py +6 -3
rapidata/api_client/api/rapid_api.py +10 -5
rapidata/api_client/api/rapidata_identity_api_api.py +272 -0
rapidata/api_client/api/simple_workflow_api.py +2 -1
rapidata/api_client/api/user_info_api.py +272 -0
rapidata/api_client/api/validation_api.py +14 -7
rapidata/api_client/api/workflow_api.py +18 -9
rapidata/api_client/models/__init__.py +3 -3
rapidata/api_client/models/issue_auth_token_result.py +1 -1
rapidata/api_client/models/legacy_issue_client_auth_token_result.py +87 -0
rapidata/api_client/models/legacy_request_password_reset_command.py +98 -0
rapidata/api_client/models/legacy_submit_password_reset_command.py +102 -0
rapidata/api_client_README.md +10 -3
rapidata/rapidata_client/__init__.py +13 -2
rapidata/rapidata_client/assets/multi_asset.py +2 -0
rapidata/rapidata_client/dataset/rapidata_dataset.py +19 -15
rapidata/rapidata_client/dataset/validation_set_builder.py +1 -1
rapidata/rapidata_client/order/rapidata_order.py +49 -18
rapidata/rapidata_client/order/rapidata_order_builder.py +23 -34
rapidata/rapidata_client/selection/__init__.py +1 -0
rapidata/rapidata_client/selection/capped_selection.py +25 -0
rapidata/rapidata_client/simple_builders/__init__.py +0 -0
rapidata/rapidata_client/simple_builders/simple_classification_builders.py +14 -9
rapidata/rapidata_client/simple_builders/simple_compare_builders.py +6 -3
rapidata/service/openapi_service.py +15 -0
{rapidata-1.1.0.dist-info → rapidata-1.2.0.dist-info}/METADATA +1 -1
{rapidata-1.1.0.dist-info → rapidata-1.2.0.dist-info}/RECORD +40 -33
{rapidata-1.1.0.dist-info → rapidata-1.2.0.dist-info}/LICENSE +0 -0
{rapidata-1.1.0.dist-info → rapidata-1.2.0.dist-info}/WHEEL +0 -0

rapidata/api_client/models/legacy_submit_password_reset_command.py ADDED Viewed

@@ -0,0 +1,102 @@
+# coding: utf-8
+"""
+    Rapidata.Dataset
+    No description provided (generated by Openapi Generator https://github.com/openapitools/openapi-generator)
+    The version of the OpenAPI document: v1
+    Generated by OpenAPI Generator (https://openapi-generator.tech)
+    Do not edit the class manually.
+"""  # noqa: E501
+from __future__ import annotations
+import pprint
+import re  # noqa: F401
+import json
+from pydantic import BaseModel, ConfigDict, Field, StrictStr, field_validator
+from typing import Any, ClassVar, Dict, List
+from typing import Optional, Set
+from typing_extensions import Self
+class LegacySubmitPasswordResetCommand(BaseModel):
+    """
+    LegacySubmitPasswordResetCommand
+    """ # noqa: E501
+    t: StrictStr = Field(description="Discriminator value for LegacySubmitPasswordResetCommand", alias="_t")
+    user_id: StrictStr = Field(alias="userId")
+    password: StrictStr
+    password_repeated: StrictStr = Field(alias="passwordRepeated")
+    reset_token: StrictStr = Field(alias="resetToken")
+    __properties: ClassVar[List[str]] = ["_t", "userId", "password", "passwordRepeated", "resetToken"]
+    @field_validator('t')
+    def t_validate_enum(cls, value):
+        """Validates the enum"""
+        if value not in set(['LegacySubmitPasswordResetCommand']):
+            raise ValueError("must be one of enum values ('LegacySubmitPasswordResetCommand')")
+        return value
+    model_config = ConfigDict(
+        populate_by_name=True,
+        validate_assignment=True,
+        protected_namespaces=(),
+    )
+    def to_str(self) -> str:
+        """Returns the string representation of the model using alias"""
+        return pprint.pformat(self.model_dump(by_alias=True))
+    def to_json(self) -> str:
+        """Returns the JSON representation of the model using alias"""
+        # TODO: pydantic v2: use .model_dump_json(by_alias=True, exclude_unset=True) instead
+        return json.dumps(self.to_dict())
+    @classmethod
+    def from_json(cls, json_str: str) -> Optional[Self]:
+        """Create an instance of LegacySubmitPasswordResetCommand from a JSON string"""
+        return cls.from_dict(json.loads(json_str))
+    def to_dict(self) -> Dict[str, Any]:
+        """Return the dictionary representation of the model using alias.
+        This has the following differences from calling pydantic's
+        `self.model_dump(by_alias=True)`:
+        * `None` is only added to the output dict for nullable fields that
+          were set at model initialization. Other fields with value `None`
+          are ignored.
+        """
+        excluded_fields: Set[str] = set([
+        ])
+        _dict = self.model_dump(
+            by_alias=True,
+            exclude=excluded_fields,
+            exclude_none=True,
+        )
+        return _dict
+    @classmethod
+    def from_dict(cls, obj: Optional[Dict[str, Any]]) -> Optional[Self]:
+        """Create an instance of LegacySubmitPasswordResetCommand from a dict"""
+        if obj is None:
+            return None
+        if not isinstance(obj, dict):
+            return cls.model_validate(obj)
+        _obj = cls.model_validate({
+            "_t": obj.get("_t") if obj.get("_t") is not None else 'LegacySubmitPasswordResetCommand',
+            "userId": obj.get("userId"),
+            "password": obj.get("password"),
+            "passwordRepeated": obj.get("passwordRepeated"),
+            "resetToken": obj.get("resetToken")
+        })
+        return _obj

rapidata/api_client_README.md CHANGED Viewed

@@ -97,6 +97,7 @@ Class | Method | HTTP request | Description
 *IdentityApi* | [**identity_get_client_auth_token_post**](rapidata/api_client/docs/IdentityApi.md#identity_get_client_auth_token_post) | **POST** /Identity/GetClientAuthToken | Issues a new auth token using the client credentials.
 *IdentityApi* | [**identity_index_post**](rapidata/api_client/docs/IdentityApi.md#identity_index_post) | **POST** /Identity/Index | Logs in a user by username or email and password.
 *IdentityApi* | [**identity_logout_post**](rapidata/api_client/docs/IdentityApi.md#identity_logout_post) | **POST** /Identity/Logout | Logs out the current user by deleting the refresh token cookie.
+*IdentityApi* | [**identity_register_temporary_post**](rapidata/api_client/docs/IdentityApi.md#identity_register_temporary_post) | **POST** /Identity/RegisterTemporary | Registers and logs in a temporary customer.
 *IdentityApi* | [**identity_request_reset_post**](rapidata/api_client/docs/IdentityApi.md#identity_request_reset_post) | **POST** /Identity/RequestReset | Request a password reset for a user.
 *IdentityApi* | [**identity_signup_post**](rapidata/api_client/docs/IdentityApi.md#identity_signup_post) | **POST** /Identity/Signup | Signs up a new user.
 *IdentityApi* | [**identity_submit_reset_post**](rapidata/api_client/docs/IdentityApi.md#identity_submit_reset_post) | **POST** /Identity/SubmitReset | Updates the password of a user after a password reset request.
@@ -131,7 +132,9 @@ Class | Method | HTTP request | Description
 *RapidApi* | [**rapid_query_validation_rapids_get**](rapidata/api_client/docs/RapidApi.md#rapid_query_validation_rapids_get) | **GET** /Rapid/QueryValidationRapids | Queries the validation rapids for a specific validation set.
 *RapidApi* | [**rapid_skip_user_guess_post**](rapidata/api_client/docs/RapidApi.md#rapid_skip_user_guess_post) | **POST** /Rapid/SkipUserGuess | Skips a Rapid for the user.
 *RapidApi* | [**rapid_validate_current_rapid_bag_get**](rapidata/api_client/docs/RapidApi.md#rapid_validate_current_rapid_bag_get) | **GET** /Rapid/ValidateCurrentRapidBag | Validates that the rapids associated with the current user are active.
+*RapidataIdentityAPIApi* | [**root_get**](rapidata/api_client/docs/RapidataIdentityAPIApi.md#root_get) | **GET** / |
 *SimpleWorkflowApi* | [**simple_workflow_get_result_overview_get**](rapidata/api_client/docs/SimpleWorkflowApi.md#simple_workflow_get_result_overview_get) | **GET** /SimpleWorkflow/GetResultOverview | Get the result overview for a simple workflow.
+*UserInfoApi* | [**connect_userinfo_get**](rapidata/api_client/docs/UserInfoApi.md#connect_userinfo_get) | **GET** /connect/userinfo | Retrieves information about the authenticated user.
 *ValidationApi* | [**validation_add_validation_rapid_post**](rapidata/api_client/docs/ValidationApi.md#validation_add_validation_rapid_post) | **POST** /Validation/AddValidationRapid | Adds a new validation rapid to the specified validation set.
 *ValidationApi* | [**validation_add_validation_text_rapid_post**](rapidata/api_client/docs/ValidationApi.md#validation_add_validation_text_rapid_post) | **POST** /Validation/AddValidationTextRapid | Adds a new validation rapid to the specified validation set.
 *ValidationApi* | [**validation_create_validation_set_post**](rapidata/api_client/docs/ValidationApi.md#validation_create_validation_set_post) | **POST** /Validation/CreateValidationSet | Creates a new empty validation set.
@@ -273,9 +276,11 @@ Class | Method | HTTP request | Description
  - [ImportValidationSetFromFileResult](rapidata/api_client/docs/ImportValidationSetFromFileResult.md)
  - [InProgressRapidModel](rapidata/api_client/docs/InProgressRapidModel.md)
  - [IssueAuthTokenResult](rapidata/api_client/docs/IssueAuthTokenResult.md)
- - [IssueClientAuthTokenResult](rapidata/api_client/docs/IssueClientAuthTokenResult.md)
  - [LabelingSelection](rapidata/api_client/docs/LabelingSelection.md)
  - [LanguageUserFilterModel](rapidata/api_client/docs/LanguageUserFilterModel.md)
+ - [LegacyIssueClientAuthTokenResult](rapidata/api_client/docs/LegacyIssueClientAuthTokenResult.md)
+ - [LegacyRequestPasswordResetCommand](rapidata/api_client/docs/LegacyRequestPasswordResetCommand.md)
+ - [LegacySubmitPasswordResetCommand](rapidata/api_client/docs/LegacySubmitPasswordResetCommand.md)
  - [Line](rapidata/api_client/docs/Line.md)
  - [LinePayload](rapidata/api_client/docs/LinePayload.md)
  - [LinePoint](rapidata/api_client/docs/LinePoint.md)
@@ -334,7 +339,6 @@ Class | Method | HTTP request | Description
  - [RapidResultModel](rapidata/api_client/docs/RapidResultModel.md)
  - [RapidResultModelResult](rapidata/api_client/docs/RapidResultModelResult.md)
  - [RapidSkippedModel](rapidata/api_client/docs/RapidSkippedModel.md)
- - [RequestPasswordResetCommand](rapidata/api_client/docs/RequestPasswordResetCommand.md)
  - [RootFilter](rapidata/api_client/docs/RootFilter.md)
  - [SendCompletionMailStepModel](rapidata/api_client/docs/SendCompletionMailStepModel.md)
  - [Shape](rapidata/api_client/docs/Shape.md)
@@ -354,7 +358,6 @@ Class | Method | HTTP request | Description
  - [StaticSelection](rapidata/api_client/docs/StaticSelection.md)
  - [SubmitCocoModel](rapidata/api_client/docs/SubmitCocoModel.md)
  - [SubmitCocoResult](rapidata/api_client/docs/SubmitCocoResult.md)
- - [SubmitPasswordResetCommand](rapidata/api_client/docs/SubmitPasswordResetCommand.md)
  - [TextAsset](rapidata/api_client/docs/TextAsset.md)
  - [TextAssetModel](rapidata/api_client/docs/TextAssetModel.md)
  - [TextMetadata](rapidata/api_client/docs/TextMetadata.md)
@@ -403,6 +406,10 @@ Authentication schemes defined for the API:
 - **API key parameter name**: Authorization
 - **Location**: HTTP header
+<a id="oauth2"></a>
+### oauth2
 ## Author

rapidata/rapidata_client/__init__.py CHANGED Viewed

@@ -1,13 +1,24 @@
 from .rapidata_client import RapidataClient
-from .workflow import ClassifyWorkflow, TranscriptionWorkflow, CompareWorkflow, FreeTextWorkflow
+from .workflow import (
+    ClassifyWorkflow,
+    TranscriptionWorkflow,
+    CompareWorkflow,
+    FreeTextWorkflow,
+)
 from .selection import (
     DemographicSelection,
     LabelingSelection,
     ValidationSelection,
     ConditionalValidationSelection,
+    CappedSelection,
 )
 from .referee import NaiveReferee, ClassifyEarlyStoppingReferee
-from .metadata import PrivateTextMetadata, PublicTextMetadata, PromptMetadata, TranscriptionMetadata
+from .metadata import (
+    PrivateTextMetadata,
+    PublicTextMetadata,
+    PromptMetadata,
+    TranscriptionMetadata,
+)
 from .feature_flags import FeatureFlags
 from .country_codes import CountryCodes
 from .assets import MediaAsset, TextAsset, MultiAsset

rapidata/rapidata_client/assets/multi_asset.py CHANGED Viewed

@@ -23,6 +23,8 @@ class MultiAsset(BaseAsset):
         Args:
             assets (List[BaseAsset]): A list of BaseAsset instances to be managed together.
         """
+        if len(assets) != 2:
+            raise ValueError("Assets must come in pairs for comparison tasks.")
         self.assets = assets
     def __len__(self) -> int:

rapidata/rapidata_client/dataset/rapidata_dataset.py CHANGED Viewed

@@ -9,6 +9,7 @@ from rapidata.api_client.models.upload_text_sources_to_dataset_model import (
     UploadTextSourcesToDatasetModel,
 )
 from rapidata.rapidata_client.metadata.base_metadata import Metadata
+from rapidata.rapidata_client.assets import TextAsset, MediaAsset, MultiAsset
 from rapidata.service import LocalFileService
 from rapidata.service.openapi_service import OpenAPIService
 from concurrent.futures import ThreadPoolExecutor, as_completed
@@ -22,7 +23,8 @@ class RapidataDataset:
         self.openapi_service = openapi_service
         self.local_file_service = LocalFileService()
-    def add_texts(self, texts: list[str]):
+    def add_texts(self, text_assets: list[TextAsset]):
+        texts = [text.text for text in text_assets]
         model = UploadTextSourcesToDatasetModel(
             datasetId=self.dataset_id, textSources=texts
         )
@@ -32,24 +34,26 @@ class RapidataDataset:
     def add_media_from_paths(
         self,
-        media_paths: list[str | list[str]],
+        media_paths: list[MediaAsset | MultiAsset],
         metadata: list[Metadata] | None = None,
         max_workers: int = 10,
     ):
         if metadata is not None and len(metadata) != len(media_paths):
             raise ValueError(
-                "metadata must be None or have the same length as image_paths"
+                "metadata must be None or have the same length as media_paths"
             )
-        def upload_datapoint(media_paths_rapid: str | list[str], meta: Metadata | None) -> None:
-            if isinstance(media_paths_rapid, list) and not all(
-                os.path.exists(media_path) for media_path in media_paths_rapid
-            ):
-                raise FileNotFoundError(f"File not found: {media_paths_rapid}")
-            elif isinstance(media_paths_rapid, str) and not os.path.exists(
-                media_paths_rapid
-            ):
-                raise FileNotFoundError(f"File not found: {media_paths_rapid}")
+        def upload_datapoint(media_asset: MediaAsset | MultiAsset, meta: Metadata | None) -> None:
+            if isinstance(media_asset, MediaAsset):
+                paths = [media_asset.path]
+            elif isinstance(media_asset, MultiAsset):
+                paths = [asset.path for asset in media_asset.assets if isinstance(asset, MediaAsset)]
+            else:
+                raise ValueError(f"Unsupported asset type: {type(media_asset)}")
+            assert all(
+                os.path.exists(media_path) for media_path in paths
+            ), "All media paths must exist on the local filesystem."
             meta_model = meta.to_model() if meta else None
             model = DatapointMetadataModel(
@@ -63,14 +67,14 @@ class RapidataDataset:
             self.openapi_service.dataset_api.dataset_create_datapoint_post(
                 model=model,
-                files=media_paths_rapid if isinstance(media_paths_rapid, list) else [media_paths_rapid] # type: ignore
+                files=paths # type: ignore
             )
         total_uploads = len(media_paths)
         with ThreadPoolExecutor(max_workers=max_workers) as executor:
             futures = [
-                executor.submit(upload_datapoint, media_paths, meta)
-                for media_paths, meta in zip_longest(media_paths, metadata or [])
+                executor.submit(upload_datapoint, media_asset, meta)
+                for media_asset, meta in zip_longest(media_paths, metadata or [])
             ]
             with tqdm(total=total_uploads, desc="Uploading datapoints") as pbar:

rapidata/rapidata_client/dataset/validation_set_builder.py CHANGED Viewed

@@ -209,7 +209,7 @@ class ValidationSetBuilder:
                 payload=payload,
                 truths=model_truth,
                 metadata=metadata,
-                randomCorrectProbability=1 / len(transcription),
+                randomCorrectProbability = 1 / len(transcription_words),
             )
         )

rapidata/rapidata_client/order/rapidata_order.py CHANGED Viewed

@@ -3,7 +3,9 @@ from rapidata.rapidata_client.dataset.rapidata_dataset import RapidataDataset
 from rapidata.service.openapi_service import OpenAPIService
 import json
 from rapidata.api_client.exceptions import ApiException
+from typing import cast
+from rapidata.api_client.models.workflow_artifact_model import WorkflowArtifactModel
+from tqdm import tqdm
 class RapidataOrder:
     """
@@ -26,6 +28,7 @@ class RapidataOrder:
         self.openapi_service = openapi_service
         self.order_id = order_id
         self._dataset = dataset
+        self._workflow_id = None
     def submit(self):
         """
@@ -49,27 +52,55 @@ class RapidataOrder:
         """
         return self.openapi_service.order_api.order_get_by_id_get(self.order_id)
-    def wait_for_done(self):
+    def display_progress_bar(self, refresh_rate=5):
         """
-        Blocking call that waits for the order to be done. Exponential backoff is used to check the status of the order.
+        Displays a progress bar for the order processing using tqdm.
+        :param refresh_rate: How often to refresh the progress bar, in seconds.
+        :type refresh_rate: float
         """
-        wait_time = 1
-        back_off_factor = 1.1
-        minimum_poll_interval = 60  # 1 minute
-        while True:
-            time.sleep(wait_time)
-            result = self.get_status()
-            if result.state == "ManualReview":
-                print(
-                    "Order is in manual review. Please contact support for approval. Will continue polling."
-                )
+        total_rapids = self._get_total_rapids()
+        with tqdm(total=total_rapids, desc="Processing order", unit="rapids") as pbar:
+            completed_rapids = 0
+            while True:
+                current_completed = self._get_completed_rapids()
+                if current_completed > completed_rapids:
+                    pbar.update(current_completed - completed_rapids)
+                    completed_rapids = current_completed
+                if completed_rapids >= total_rapids:
+                    break
+                time.sleep(refresh_rate)
-            if result.state == "Completed" or result.state == "Failed":
+    def _get_workflow_id(self):
+        if self._workflow_id:
+            return self._workflow_id
+        for _ in range(2):
+            try:
+                order_result = self.openapi_service.order_api.order_get_by_id_get(self.order_id)
+                pipeline = self.openapi_service.pipeline_api.pipeline_id_get(order_result.pipeline_id)
+                self._workflow_id = cast(WorkflowArtifactModel, pipeline.artifacts["workflow-artifact"].actual_instance).workflow_id
                 break
-            wait_time = max(
-                minimum_poll_interval, wait_time * back_off_factor
-            )  # poll at least every 10 minutes
+            except Exception:
+                time.sleep(2)
+        if not self._workflow_id:
+            raise Exception("Order has not started yet. Please wait for a few seconds and try again.")
+        return self._workflow_id
+    def _get_total_rapids(self):
+        workflow_id = self._get_workflow_id()
+        return self.openapi_service.workflow_api.workflow_get_progress_get(workflow_id).total
+    def _get_completed_rapids(self):
+        workflow_id = self._get_workflow_id()
+        return self.openapi_service.workflow_api.workflow_get_progress_get(workflow_id).completed
+    def get_progress_percentage(self):
+        workflow_id = self._get_workflow_id()
+        progress = self.openapi_service.workflow_api.workflow_get_progress_get(workflow_id)
+        return progress.completion_percentage
     def get_results(self):
         """

rapidata/rapidata_client/order/rapidata_order_builder.py CHANGED Viewed

@@ -28,6 +28,10 @@ from rapidata.service.openapi_service import OpenAPIService
 from rapidata.rapidata_client.workflow.compare_workflow import CompareWorkflow
+from rapidata.rapidata_client.assets import MediaAsset, TextAsset, MultiAsset
+from typing import cast, Sequence
 class RapidataOrderBuilder:
     """Builder object for creating Rapidata orders.
@@ -55,7 +59,6 @@ class RapidataOrderBuilder:
         self._openapi_service = openapi_service
         self._workflow: Workflow | None = None
         self._referee: Referee | None = None
-        self._media_paths: list[str | list[str]] = []
         self._metadata: list[Metadata] | None = None
         self._aggregator: AggregatorType | None = None
         self._validation_set_id: str | None = None
@@ -65,8 +68,7 @@ class RapidataOrderBuilder:
         self._selections: list[Selection] = []
         self._rapids_per_bag: int = 2
         self._priority: int = 50
-        self._texts: list[str] | None = None
-        self._media_paths: list[str | list[str]] = []
+        self._assets: list[MediaAsset] | list[TextAsset] | list[MultiAsset] = []
     def _to_model(self) -> CreateOrderModel:
         """
@@ -143,8 +145,12 @@ class RapidataOrderBuilder:
         if isinstance(
             self._workflow, CompareWorkflow
         ):  # Temporary fix; will be handled by backend in the future
+            assert all(isinstance(item, MultiAsset) for item in self._assets), (
+                "The media paths must be of type MultiAsset for comparison tasks."
+            )
+            media_paths = cast(list[MultiAsset], self._assets)
             assert all(
-                [len(path) == 2 for path in self._media_paths]
+                [len(path) == 2 for path in media_paths]
             ), "The media paths must come in pairs for comparison tasks."
         result = self._openapi_service.order_api.order_create_post(
@@ -159,22 +165,18 @@ class RapidataOrderBuilder:
             openapi_service=self._openapi_service,
         )
-        if self._media_paths and self._texts:
-            raise ValueError(
-                "You cannot provide both media paths and texts to the same order."
-            )
-        if not self._media_paths and not self._texts:
+        if not self._assets:
             raise ValueError(
-                "You must provide either media paths or texts to the order."
+                "You must provide assets to start the order."
             )
+        if all(isinstance(item, TextAsset) for item in self._assets):
+            assets = cast(list[TextAsset], self._assets)
+            order.dataset.add_texts(assets)
-        if self._texts:
-            order.dataset.add_texts(self._texts)
-        if self._media_paths:
+        elif all(isinstance(item, (MediaAsset, MultiAsset)) for item in self._assets):
+            assets = cast(list[MediaAsset | MultiAsset], self._assets)
             order.dataset.add_media_from_paths(
-                self._media_paths, self._metadata, max_workers
+                assets, self._metadata, max_workers
             )
         if submit:
@@ -210,34 +212,21 @@ class RapidataOrderBuilder:
     def media(
         self,
-        media_paths: list[str | list[str]],
-        metadata: list[Metadata] | None = None,
+        asset: list[MediaAsset] | list[TextAsset] | list[MultiAsset],
+        metadata: Sequence[Metadata] | None = None,
     ) -> "RapidataOrderBuilder":
         """
         Set the media assets for the order.
         Args:
-            media_paths (list[str | list[str]]): The paths of the media assets to be set.
+            media_paths (list[MediaAsset] | list[TextAsset] | list[MultiAsset]): The paths of the media assets to be set.
             metadata (list[Metadata] | None, optional): Metadata for the media assets. Defaults to None.
         Returns:
             RapidataOrderBuilder: The updated RapidataOrderBuilder instance.
         """
-        self._media_paths = media_paths
-        self._metadata = metadata
-        return self
-    def texts(self, texts: list[str]) -> "RapidataOrderBuilder":
-        """
-        Set the TextAssets for the order.
-        Args:
-            texts (list[str]): The texts to be set.
-        Returns:
-            RapidataOrderBuilder: The updated RapidataOrderBuilder instance.
-        """
-        self._texts = texts
+        self._assets = asset
+        self._metadata = metadata # type: ignore
         return self
     def feature_flags(self, feature_flags: FeatureFlags) -> "RapidataOrderBuilder":

rapidata/rapidata_client/selection/__init__.py CHANGED Viewed

@@ -3,3 +3,4 @@ from .demographic_selection import DemographicSelection
 from .labeling_selection import LabelingSelection
 from .validation_selection import ValidationSelection
 from .conditional_validation_selection import ConditionalValidationSelection
+from .capped_selection import CappedSelection

rapidata/rapidata_client/selection/capped_selection.py ADDED Viewed

@@ -0,0 +1,25 @@
+from rapidata.api_client.models.capped_selection import (
+    CappedSelection as CappedSelectionModel,
+)
+from rapidata.api_client.models.capped_selection_selections_inner import (
+    CappedSelectionSelectionsInner,
+)
+from rapidata.rapidata_client.selection.base_selection import Selection
+from typing import Sequence
+class CappedSelection(Selection):
+    def __init__(self, selections: Sequence[Selection], max_rapids: int):
+        self.selections = selections
+        self.max_rapids = max_rapids
+    def to_model(self):
+        return CappedSelectionModel(
+            _t="CappedSelection",
+            selections=[
+                CappedSelectionSelectionsInner(selection.to_model())
+                for selection in self.selections
+            ],
+            max_rapids=self.max_rapids,
+        )

rapidata/rapidata_client/simple_builders/__init__.py ADDED Viewed

File without changes

rapidata/rapidata_client/simple_builders/simple_classification_builders.py CHANGED Viewed

@@ -7,6 +7,8 @@ from rapidata.rapidata_client.workflow.classify_workflow import ClassifyWorkflow
 from rapidata.rapidata_client.selection.validation_selection import ValidationSelection
 from rapidata.rapidata_client.selection.labeling_selection import LabelingSelection
 from rapidata.service.openapi_service import OpenAPIService
+from rapidata.rapidata_client.assets import MediaAsset
+from typing import Sequence
 class ClassificationOrderBuilder:
     def __init__(self, name: str, question: str, options: list[str], media_paths: list[str], openapi_service: OpenAPIService):
@@ -19,7 +21,7 @@ class ClassificationOrderBuilder:
         self._metadata = None
         self._validation_set_id = None
-    def metadata(self, metadata: list[Metadata]):
+    def metadata(self, metadata: Sequence[Metadata]):
         """Set the metadata for the classification order. Has to be the same lenght as the media paths."""
         self._metadata = metadata
         return self
@@ -28,27 +30,29 @@ class ClassificationOrderBuilder:
         """Set the number of responses required for the classification order."""
         self._responses_required = responses_required
         return self
     def probability_threshold(self, probability_threshold: float):
         """Set the probability threshold for early stopping."""
         self._probability_threshold = probability_threshold
         return self
     def validation_set_id(self, validation_set_id: str):
         """Set the validation set ID for the classification order."""
         self._validation_set_id = validation_set_id
         return self
     def create(self, submit: bool = True, max_upload_workers: int = 10):
         if self._probability_threshold and self._responses_required:
             referee = ClassifyEarlyStoppingReferee(
                 max_vote_count=self._responses_required,
                 threshold=self._probability_threshold
             )
         else:
             referee = NaiveReferee(required_guesses=self._responses_required)
+        assets = [MediaAsset(path=media_path) for media_path in self._media_paths]
         selection: list[Selection] = ([ValidationSelection(amount=1, validation_set_id=self._validation_set_id), LabelingSelection(amount=2)]
                      if self._validation_set_id
                      else [LabelingSelection(amount=3)])
@@ -61,14 +65,15 @@ class ClassificationOrderBuilder:
                 )
             )
             .referee(referee)
-            .media(self._media_paths, metadata=self._metadata) # type: ignore
+            .media(assets, metadata=self._metadata) # type: ignore
             .selections(selection)
             .create(submit=submit, max_workers=max_upload_workers))
         return order
 class ClassificationMediaBuilder:
+    "test"
     def __init__(self, name: str, question: str, options: list[str], openapi_service: OpenAPIService):
         self._openapi_service = openapi_service
         self._name = name
@@ -85,7 +90,7 @@ class ClassificationMediaBuilder:
         if self._media_paths is None:
             raise ValueError("Media paths are required")
         return ClassificationOrderBuilder(self._name, self._question, self._options, self._media_paths, openapi_service=self._openapi_service)
 class ClassificationOptionsBuilder:
     def __init__(self, name: str, question: str, openapi_service: OpenAPIService):

rapidata/rapidata_client/simple_builders/simple_compare_builders.py CHANGED Viewed

@@ -1,11 +1,13 @@
 from rapidata.service.openapi_service import OpenAPIService
-from rapidata.rapidata_client.metadata.base_metadata import Metadata
+from rapidata.rapidata_client.metadata import Metadata
 from rapidata.rapidata_client.order.rapidata_order_builder import RapidataOrderBuilder
 from rapidata.rapidata_client.workflow.compare_workflow import CompareWorkflow
 from rapidata.rapidata_client.referee.naive_referee import NaiveReferee
 from rapidata.rapidata_client.selection.validation_selection import ValidationSelection
 from rapidata.rapidata_client.selection.labeling_selection import LabelingSelection
 from rapidata.rapidata_client.selection.base_selection import Selection
+from rapidata.rapidata_client.assets import MultiAsset, MediaAsset
+from typing import Sequence
 class CompareOrderBuilder:
     def __init__(self, name:str, criteria: str, media_paths: list[list[str]], openapi_service: OpenAPIService):
@@ -22,7 +24,7 @@ class CompareOrderBuilder:
         self._responses_required = responses_required
         return self
-    def metadata(self, metadata: list[Metadata]) -> 'CompareOrderBuilder':
+    def metadata(self, metadata: Sequence[Metadata]) -> 'CompareOrderBuilder':
         """Set the metadata for the comparison order. Has to be the same shape as the media paths."""
         self._metadata = metadata
         return self
@@ -37,6 +39,7 @@ class CompareOrderBuilder:
                      if self._validation_set_id
                      else [LabelingSelection(amount=3)])
+        media_paths = [MultiAsset([MediaAsset(path=path) for path in paths]) for paths in self._media_paths]
         order = (self._order_builder
             .workflow(
                 CompareWorkflow(
@@ -44,7 +47,7 @@ class CompareOrderBuilder:
                 )
             )
             .referee(NaiveReferee(required_guesses=self._responses_required))
-            .media(self._media_paths, metadata=self._metadata) # type: ignore
+            .media(media_paths, metadata=self._metadata) # type: ignore
             .selections(selection)
             .create(submit=submit, max_workers=max_upload_workers))

rapidata 1.1.0__py3-none-any.whl → 1.2.0__py3-none-any.whl

rapidata 1.1.0py3-none-any.whl → 1.2.0py3-none-any.whl