PyPI - orca-sdk - Versions diffs - 0.1.10__py3-none-any.whl → 0.1.12__py3-none-any.whl - Mend

orca-sdk 0.1.10py3-none-any.whl → 0.1.12py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (33) hide show

orca_sdk/__init__.py +3 -3
orca_sdk/_utils/analysis_ui.py +4 -1
orca_sdk/_utils/auth.py +2 -3
orca_sdk/_utils/common.py +24 -1
orca_sdk/_utils/prediction_result_ui.py +4 -1
orca_sdk/_utils/torch_parsing.py +77 -0
orca_sdk/_utils/torch_parsing_test.py +142 -0
orca_sdk/_utils/value_parser.py +44 -17
orca_sdk/_utils/value_parser_test.py +6 -5
orca_sdk/async_client.py +234 -22
orca_sdk/classification_model.py +203 -66
orca_sdk/classification_model_test.py +85 -25
orca_sdk/client.py +234 -20
orca_sdk/conftest.py +97 -16
orca_sdk/credentials_test.py +5 -8
orca_sdk/datasource.py +44 -21
orca_sdk/datasource_test.py +8 -2
orca_sdk/embedding_model.py +15 -33
orca_sdk/embedding_model_test.py +30 -1
orca_sdk/memoryset.py +558 -425
orca_sdk/memoryset_test.py +120 -185
orca_sdk/regression_model.py +186 -65
orca_sdk/regression_model_test.py +62 -3
orca_sdk/telemetry.py +16 -7
{orca_sdk-0.1.10.dist-info → orca_sdk-0.1.12.dist-info}/METADATA +4 -8
orca_sdk-0.1.12.dist-info/RECORD +38 -0
orca_sdk/_shared/__init__.py +0 -10
orca_sdk/_shared/metrics.py +0 -634
orca_sdk/_shared/metrics_test.py +0 -570
orca_sdk/_utils/data_parsing.py +0 -129
orca_sdk/_utils/data_parsing_test.py +0 -244
orca_sdk-0.1.10.dist-info/RECORD +0 -41
{orca_sdk-0.1.10.dist-info → orca_sdk-0.1.12.dist-info}/WHEEL +0 -0

orca_sdk/regression_model.py CHANGED Viewed

@@ -1,25 +1,33 @@
 from __future__ import annotations
-import logging
 from contextlib import contextmanager
 from datetime import datetime
-from typing import Any, Generator, Iterable, Literal, cast, overload
-from datasets import Dataset
+from typing import (
+    TYPE_CHECKING,
+    Any,
+    Generator,
+    Iterable,
+    Literal,
+    Sequence,
+    cast,
+    overload,
+)
-from ._shared.metrics import RegressionMetrics, calculate_regression_metrics
-from ._utils.common import UNSET, CreateMode, DropMode
+from ._utils.common import UNSET, CreateMode, DropMode, logger
 from .client import (
     ListPredictionsRequest,
     OrcaClient,
     PredictiveModelUpdate,
     RARHeadType,
+)
+from .client import RegressionMetrics as RegressionMetricsResponse
+from .client import (
     RegressionModelMetadata,
     RegressionPredictionRequest,
 )
 from .datasource import Datasource
 from .job import Job
-from .memoryset import ScoredMemoryset
+from .memoryset import ConsistencyLevel, ScoredMemoryset
 from .telemetry import (
     RegressionPrediction,
     TelemetryMode,
@@ -27,7 +35,107 @@ from .telemetry import (
     _parse_feedback,
 )
-logger = logging.getLogger(__name__)
+if TYPE_CHECKING:
+    # Peer dependency - user has datasets if they have a Dataset object
+    from datasets import Dataset as HFDataset  # type: ignore
+    from pandas import DataFrame as PandasDataFrame  # type: ignore
+class RegressionMetrics:
+    """
+    Metrics for evaluating regression model performance.
+    Attributes:
+        coverage: Percentage of predictions that are not none
+        mse: Mean squared error of the predictions
+        rmse: Root mean squared error of the predictions
+        mae: Mean absolute error of the predictions
+        r2: R-squared score (coefficient of determination) of the predictions
+        explained_variance: Explained variance score of the predictions
+        loss: Mean squared error loss of the predictions
+        anomaly_score_mean: Mean of anomaly scores across the dataset
+        anomaly_score_median: Median of anomaly scores across the dataset
+        anomaly_score_variance: Variance of anomaly scores across the dataset
+    """
+    coverage: float
+    mse: float
+    rmse: float
+    mae: float
+    r2: float
+    explained_variance: float
+    loss: float
+    anomaly_score_mean: float | None
+    anomaly_score_median: float | None
+    anomaly_score_variance: float | None
+    def __init__(self, response: RegressionMetricsResponse):
+        self.coverage = response["coverage"]
+        self.mse = response["mse"]
+        self.rmse = response["rmse"]
+        self.mae = response["mae"]
+        self.r2 = response["r2"]
+        self.explained_variance = response["explained_variance"]
+        self.loss = response["loss"]
+        self.anomaly_score_mean = response.get("anomaly_score_mean")
+        self.anomaly_score_median = response.get("anomaly_score_median")
+        self.anomaly_score_variance = response.get("anomaly_score_variance")
+        for warning in response.get("warnings", []):
+            logger.warning(warning)
+    def __repr__(self) -> str:
+        return (
+            "RegressionMetrics({\n"
+            + f"    mae: {self.mae:.4f},\n"
+            + f"    rmse: {self.rmse:.4f},\n"
+            + f"    r2: {self.r2:.4f},\n"
+            + (
+                f"    anomaly_score: {self.anomaly_score_mean:.4f} ± {self.anomaly_score_variance:.4f},\n"
+                if self.anomaly_score_mean
+                else ""
+            )
+            + "})"
+        )
+    @classmethod
+    def compute(
+        cls,
+        predictions: Sequence[RegressionPrediction],
+    ) -> RegressionMetrics:
+        """
+        Compute regression metrics from a list of predictions.
+        Params:
+            predictions: List of RegressionPrediction objects with expected_score set
+        Returns:
+            RegressionMetrics with computed metrics
+        Raises:
+            ValueError: If any prediction is missing expected_score
+        """
+        if len(predictions) > 100_000:
+            raise ValueError("Too many predictions, maximum is 100,000")
+        if any(p.expected_score is None for p in predictions):
+            raise ValueError("All predictions must have expected_score set")
+        expected_scores = [cast(float, p.expected_score) for p in predictions]
+        predicted_scores = [p.score for p in predictions]
+        anomaly_scores = (
+            None
+            if any(p.anomaly_score is None for p in predictions)
+            else [cast(float, p.anomaly_score) for p in predictions]
+        )
+        client = OrcaClient._resolve_client()
+        response = client.POST(
+            "/regression_model/metrics",
+            json={
+                "expected_scores": expected_scores,
+                "predicted_scores": predicted_scores,
+                "anomaly_scores": anomaly_scores,
+            },
+        )
+        return cls(response)
 class RegressionModel:
@@ -105,7 +213,7 @@ class RegressionModel:
             is raised.
         """
         if self._last_prediction_was_batch:
-            logging.warning(
+            logger.warning(
                 "Last prediction was part of a batch prediction, returning the last prediction from the batch"
             )
         if self._last_prediction is None:
@@ -212,7 +320,7 @@ class RegressionModel:
             List of handles to all regression models in the OrcaCloud
         """
         client = OrcaClient._resolve_client()
-        return [cls(metadata) for metadata in client.GET("/regression_model")]
+        return [cls(metadata) for metadata in client.GET("/regression_model", params={})]
     @classmethod
     def drop(cls, name_or_id: str, if_not_exists: DropMode = "error"):
@@ -233,7 +341,7 @@ class RegressionModel:
         try:
             client = OrcaClient._resolve_client()
             client.DELETE("/regression_model/{name_or_id}", params={"name_or_id": name_or_id})
-            logging.info(f"Deleted model {name_or_id}")
+            logger.info(f"Deleted model {name_or_id}")
         except LookupError:
             if if_not_exists == "error":
                 raise
@@ -297,6 +405,7 @@ class RegressionModel:
         ] = "include_global",
         use_gpu: bool = True,
         batch_size: int = 100,
+        consistency_level: ConsistencyLevel = "Bounded",
     ) -> RegressionPrediction: ...
     @overload
@@ -316,6 +425,7 @@ class RegressionModel:
         ] = "include_global",
         use_gpu: bool = True,
         batch_size: int = 100,
+        consistency_level: ConsistencyLevel = "Bounded",
     ) -> list[RegressionPrediction]: ...
     # TODO: add filter support
@@ -335,6 +445,7 @@ class RegressionModel:
         ] = "include_global",
         use_gpu: bool = True,
         batch_size: int = 100,
+        consistency_level: ConsistencyLevel = "Bounded",
     ) -> RegressionPrediction | list[RegressionPrediction]:
         """
         Make predictions using the regression model.
@@ -383,15 +494,13 @@ class RegressionModel:
         client = OrcaClient._resolve_client()
         # Convert to list for batching
-        values = value if isinstance(value, list) else [value]
+        values = [value] if isinstance(value, str) else list(value)
         if isinstance(expected_scores, list) and len(expected_scores) != len(values):
             raise ValueError("Invalid input: \n\texpected_scores must be the same length as values")
         if isinstance(partition_id, list) and len(partition_id) != len(values):
             raise ValueError("Invalid input: \n\tpartition_id must be the same length as values")
-        if isinstance(expected_scores, list):
-            expected_scores = expected_scores
-        elif expected_scores is not None:
+        if expected_scores is not None and isinstance(expected_scores, (float, int)):
             expected_scores = [float(expected_scores)] * len(values)
         predictions: list[RegressionPrediction] = []
@@ -410,6 +519,7 @@ class RegressionModel:
                 "use_lookup_cache": use_lookup_cache,
                 "ignore_unlabeled": ignore_unlabeled,
                 "partition_filter_mode": partition_filter_mode,
+                "consistency_level": consistency_level,
             }
             if partition_filter_mode != "ignore_partitions":
                 request_json["partition_ids"] = (
@@ -426,6 +536,7 @@ class RegressionModel:
             if telemetry_on and any(p["prediction_id"] is None for p in response):
                 raise RuntimeError("Failed to save prediction to database.")
+            batch_expected = batch_expected_scores or [None] * len(batch_values)
             predictions.extend(
                 RegressionPrediction(
                     prediction_id=prediction["prediction_id"],
@@ -438,8 +549,9 @@ class RegressionModel:
                     model=self,
                     logits=None,
                     input_value=input_value,
+                    expected_score=exp_score,
                 )
-                for prediction, input_value in zip(response, batch_values)
+                for prediction, input_value, exp_score in zip(response, batch_values, batch_expected)
             )
         self._last_prediction_was_batch = isinstance(value, list)
@@ -581,25 +693,14 @@ class RegressionModel:
                 params={"model_name_or_id": self.id, "job_id": response["job_id"]},
             )
             assert res["result"] is not None
-            return RegressionMetrics(
-                coverage=res["result"].get("coverage"),
-                mse=res["result"].get("mse"),
-                rmse=res["result"].get("rmse"),
-                mae=res["result"].get("mae"),
-                r2=res["result"].get("r2"),
-                explained_variance=res["result"].get("explained_variance"),
-                loss=res["result"].get("loss"),
-                anomaly_score_mean=res["result"].get("anomaly_score_mean"),
-                anomaly_score_median=res["result"].get("anomaly_score_median"),
-                anomaly_score_variance=res["result"].get("anomaly_score_variance"),
-            )
+            return RegressionMetrics(res["result"])
         job = Job(response["job_id"], get_value)
         return job if background else job.result()
-    def _evaluate_dataset(
+    def _evaluate_local(
         self,
-        dataset: Dataset,
+        data: Iterable[dict[str, Any]],
         value_column: str,
         score_column: str,
         record_predictions: bool,
@@ -612,37 +713,42 @@ class RegressionModel:
             "ignore_partitions", "include_global", "exclude_global", "only_global"
         ] = "include_global",
     ) -> RegressionMetrics:
-        if len(dataset) == 0:
-            raise ValueError("Evaluation dataset cannot be empty")
-        if any(x is None for x in dataset[score_column]):
-            raise ValueError("Evaluation dataset cannot contain None values in the score column")
-        predictions = [
-            prediction
-            for i in range(0, len(dataset), batch_size)
-            for prediction in self.predict(
-                dataset[i : i + batch_size][value_column],
-                expected_scores=dataset[i : i + batch_size][score_column],
-                tags=tags,
-                save_telemetry="sync" if record_predictions else "off",
-                prompt=prompt,
-                ignore_unlabeled=ignore_unlabeled,
-                partition_id=dataset[i : i + batch_size][partition_column] if partition_column else None,
-                partition_filter_mode=partition_filter_mode,
-            )
-        ]
-        return calculate_regression_metrics(
-            expected_scores=dataset[score_column],
-            predicted_scores=[p.score for p in predictions],
-            anomaly_scores=[p.anomaly_score for p in predictions],
+        values: list[str] = []
+        expected_scores: list[float] = []
+        partition_ids: list[str | None] | None = [] if partition_column else None
+        for sample in data:
+            if len(values) >= 100_000:
+                raise ValueError("Upload a Datasource to evaluate against more than 100,000 samples.")
+            values.append(sample[value_column])
+            expected_score = sample[score_column]
+            if expected_score is None:
+                raise ValueError("Expected score is required for all samples")
+            expected_scores.append(expected_score)
+            if partition_ids is not None and partition_column:
+                partition_ids.append(sample[partition_column])
+        if not values:
+            raise ValueError("Evaluation data cannot be empty")
+        predictions = self.predict(
+            values,
+            expected_scores=expected_scores,
+            tags=tags,
+            save_telemetry="sync" if record_predictions else "off",
+            prompt=prompt,
+            ignore_unlabeled=ignore_unlabeled,
+            partition_id=partition_ids,
+            partition_filter_mode=partition_filter_mode,
+            batch_size=batch_size,
         )
+        return RegressionMetrics.compute(predictions)
     @overload
     def evaluate(
         self,
-        data: Datasource | Dataset,
+        data: Datasource,
         *,
         value_column: str = "value",
         score_column: str = "score",
@@ -663,7 +769,7 @@ class RegressionModel:
     @overload
     def evaluate(
         self,
-        data: Datasource | Dataset,
+        data: Datasource | HFDataset | PandasDataFrame | Iterable[dict[str, Any]],
         *,
         value_column: str = "value",
         score_column: str = "score",
@@ -683,7 +789,7 @@ class RegressionModel:
     def evaluate(
         self,
-        data: Datasource | Dataset,
+        data: Datasource | HFDataset | PandasDataFrame | Iterable[dict[str, Any]],
         *,
         value_column: str = "value",
         score_column: str = "score",
@@ -703,12 +809,13 @@ class RegressionModel:
         Evaluate the regression model on a given dataset or datasource
         Params:
-            data: Dataset or Datasource to evaluate the model on
+            data: the data to evaluate the model on. This can be an Orca [`Datasource`][orca_sdk.datasource.Datasource],
+                a Hugging Face [`Dataset`][datasets.Dataset], a pandas [`DataFrame`][pandas.DataFrame], or an iterable of dictionaries.
             value_column: Name of the column that contains the input values to the model
             score_column: Name of the column containing the expected scores
             record_predictions: Whether to record [`RegressionPrediction`][orca_sdk.telemetry.RegressionPrediction]s for analysis
             tags: Optional tags to add to the recorded [`RegressionPrediction`][orca_sdk.telemetry.RegressionPrediction]s
-            batch_size: Batch size for processing Dataset inputs (only used when input is a Dataset)
+            batch_size: Batch size for processing the data inputs (not used for Datasource inputs)
             prompt: Optional prompt for instruction-tuned embedding models
             subsample: Optional number (int) of rows to sample or fraction (float in (0, 1]) of data to sample for evaluation.
             background: Whether to run the operation in the background and return a job handle
@@ -752,9 +859,25 @@ class RegressionModel:
                 partition_column=partition_column,
                 partition_filter_mode=partition_filter_mode,
             )
-        elif isinstance(data, Dataset):
-            return self._evaluate_dataset(
-                dataset=data,
+        else:
+            if background:
+                raise ValueError("Background evaluation is only supported for Datasource inputs")
+            try:
+                import pandas as pd  # type: ignore
+                if isinstance(data, pd.DataFrame):
+                    data = data.to_dict(orient="records")  # type: ignore
+            except ImportError:
+                pass
+            if not hasattr(data, "__iter__"):
+                raise ValueError(
+                    f"Invalid data type: {type(data).__name__}. "
+                    "Expected Iterable[dict], HuggingFace Dataset, or pandas DataFrame."
+                )
+            return self._evaluate_local(
+                data=cast(Iterable[dict[str, Any]], data),
                 value_column=value_column,
                 score_column=score_column,
                 record_predictions=record_predictions,
@@ -765,8 +888,6 @@ class RegressionModel:
                 partition_column=partition_column,
                 partition_filter_mode=partition_filter_mode,
             )
-        else:
-            raise ValueError(f"Invalid data type: {type(data)}")
     @contextmanager
     def use_memoryset(self, memoryset_override: ScoredMemoryset) -> Generator[None, None, None]:

orca_sdk/regression_model_test.py CHANGED Viewed

@@ -90,6 +90,12 @@ def test_list_models_unauthorized(unauthorized_client, regression_model: Regress
         assert RegressionModel.all() == []
+def test_memoryset_regression_models_property(regression_model: RegressionModel, scored_memoryset: ScoredMemoryset):
+    models = scored_memoryset.regression_models
+    assert len(models) > 0
+    assert any(model.id == regression_model.id for model in models)
 def test_update_model_attributes(regression_model: RegressionModel):
     regression_model.description = "New description"
     assert regression_model.description == "New description"
@@ -144,10 +150,34 @@ def test_delete_memoryset_before_model_constraint_violation(hf_dataset):
         ScoredMemoryset.drop(memoryset.id)
-@pytest.mark.parametrize("data_type", ["dataset", "datasource"])
+def test_delete_memoryset_with_model_cascade(hf_dataset):
+    """Test that cascade=False prevents deletion and cascade=True allows it."""
+    memoryset = ScoredMemoryset.from_hf_dataset("test_memoryset_cascade_delete_regression", hf_dataset)
+    model = RegressionModel.create("test_regression_model_cascade_delete", memoryset)
+    # Verify model exists
+    assert RegressionModel.open(model.name) is not None
+    # Without cascade, deletion should fail
+    with pytest.raises(RuntimeError):
+        ScoredMemoryset.drop(memoryset.id, cascade=False)
+    # Model should still exist
+    assert RegressionModel.exists(model.name)
+    # With cascade, deletion should succeed
+    ScoredMemoryset.drop(memoryset.id, cascade=True)
+    # Model should be deleted along with the memoryset
+    assert not RegressionModel.exists(model.name)
+    assert not ScoredMemoryset.exists(memoryset.name)
+@pytest.mark.parametrize("data_type", ["dataset", "datasource", "list"])
 def test_evaluate(
     regression_model: RegressionModel,
     eval_datasource: Datasource,
+    eval_data: list[dict],
     eval_dataset: Dataset,
     data_type,
 ):
@@ -155,7 +185,11 @@ def test_evaluate(
     result = (
         regression_model.evaluate(eval_dataset)
         if data_type == "dataset"
-        else regression_model.evaluate(eval_datasource)
+        else (
+            regression_model.evaluate(eval_datasource)
+            if data_type == "datasource"
+            else regression_model.evaluate(eval_data)
+        )
     )
     assert isinstance(result, RegressionMetrics)
@@ -336,6 +370,8 @@ def test_predict(regression_model: RegressionModel):
     assert len(predictions) == 2
     assert predictions[0].prediction_id is not None
     assert predictions[1].prediction_id is not None
+    assert predictions[0].score is not None
+    assert predictions[1].score is not None
     assert np.allclose(predictions[0].score, 0.1)
     assert np.allclose(predictions[1].score, 0.9)
     assert 0 <= predictions[0].confidence <= 1
@@ -472,7 +508,7 @@ def test_record_prediction_feedback(regression_model: RegressionModel):
         {
             "prediction_id": p.prediction_id,
             "category": "accurate",
-            "value": abs(p.score - expected_score) < 0.2,
+            "value": abs(p.score - expected_score) < 0.2 if p.score is not None else False,
         }
         for expected_score, p in zip(expected_scores, predictions)
     )
@@ -509,11 +545,19 @@ def test_predict_with_memoryset_override(regression_model: RegressionModel, hf_d
     with regression_model.use_memoryset(inverted_scored_memoryset):
         override_predictions = regression_model.predict(["This is excellent!", "This is terrible!"])
         # With inverted scores, the predictions should be different
+        assert original_predictions[0].score is not None
+        assert original_predictions[1].score is not None
+        assert override_predictions[0].score is not None
+        assert override_predictions[1].score is not None
         assert abs(override_predictions[0].score - original_predictions[0].score) > 0.1
         assert abs(override_predictions[1].score - original_predictions[1].score) > 0.1
     # After exiting context, predictions should be back to normal
     new_predictions = regression_model.predict(["This is excellent!", "This is terrible!"])
+    assert new_predictions[0].score is not None
+    assert new_predictions[1].score is not None
+    assert original_predictions[0].score is not None
+    assert original_predictions[1].score is not None
     assert abs(new_predictions[0].score - original_predictions[0].score) < 0.1
     assert abs(new_predictions[1].score - original_predictions[1].score) < 0.1
@@ -593,3 +637,18 @@ def test_drop(regression_model):
     name = regression_model.name
     RegressionModel.drop(name)
     assert not RegressionModel.exists(name)
+def test_predict_with_empty_partition(fully_partitioned_regression_resources):
+    datasource, memoryset, regression_model = fully_partitioned_regression_resources
+    assert memoryset.length == 15
+    with pytest.raises(RuntimeError, match="lookup failed to return the correct number of memories"):
+        regression_model.predict("i love cats", partition_filter_mode="only_global")
+    with pytest.raises(RuntimeError, match="lookup failed to return the correct number of memories"):
+        regression_model.predict("i love cats", partition_filter_mode="exclude_global", partition_id="p_does_not_exist")
+    with pytest.raises(RuntimeError, match="lookup failed to return the correct number of memories"):
+        regression_model.evaluate(datasource, partition_filter_mode="only_global")

orca_sdk/telemetry.py CHANGED Viewed

@@ -1,14 +1,13 @@
 from __future__ import annotations
-import logging
 import os
 from abc import ABC
 from datetime import datetime
-from typing import TYPE_CHECKING, Any, Iterable, Literal, Self, cast, overload
+from typing import TYPE_CHECKING, Any, Iterable, Literal, Self, overload
 from httpx import Timeout
-from ._utils.common import UNSET
+from ._utils.common import UNSET, logger
 from .client import (
     LabelPredictionWithMemoriesAndFeedback,
     OrcaClient,
@@ -118,7 +117,7 @@ class FeedbackCategory:
         """
         client = OrcaClient._resolve_client()
         client.DELETE("/telemetry/feedback_category/{name_or_id}", params={"name_or_id": name})
-        logging.info(f"Deleted feedback category {name} with all associated feedback")
+        logger.info(f"Deleted feedback category {name} with all associated feedback")
     def __repr__(self):
         return "FeedbackCategory({" + f"name: {self.name}, " + f"value_type: {self.value_type}" + "})"
@@ -175,6 +174,8 @@ class PredictionBase(ABC):
         telemetry: LabelPredictionWithMemoriesAndFeedback | ScorePredictionWithMemoriesAndFeedback | None = None,
         logits: list[float] | None = None,
         input_value: str | None = None,
+        expected_label: int | None = None,
+        expected_score: float | None = None,
     ):
         self.prediction_id = prediction_id
         self.label = label
@@ -187,6 +188,8 @@ class PredictionBase(ABC):
         self.__telemetry = telemetry if telemetry else None
         self.logits = logits
         self._input_value = input_value
+        self._expected_label = expected_label
+        self._expected_score = expected_score
     @property
     def _telemetry(self) -> LabelPredictionWithMemoriesAndFeedback | ScorePredictionWithMemoriesAndFeedback:
@@ -537,7 +540,7 @@ class ClassificationPrediction(PredictionBase):
         memoryset: Memoryset that was used to lookup memories to ground the prediction
     """
-    label: int
+    label: int | None
     label_name: str
     logits: list[float] | None
     model: ClassificationModel
@@ -562,11 +565,15 @@ class ClassificationPrediction(PredictionBase):
     @property
     def expected_label(self) -> int | None:
+        if self._expected_label is not None:
+            return self._expected_label
         assert "label" in self._telemetry
         return self._telemetry["expected_label"]
     @property
     def expected_label_name(self) -> str | None:
+        if self._expected_label is not None:
+            return self.memoryset.label_names[self._expected_label]
         assert "label" in self._telemetry
         return self._telemetry["expected_label_name"]
@@ -692,14 +699,14 @@ class RegressionPrediction(PredictionBase):
         memoryset: Memoryset that was used to lookup memories to ground the prediction
     """
-    score: float
+    score: float | None
     model: RegressionModel
     memoryset: ScoredMemoryset
     def __repr__(self):
         return (
             "RegressionPrediction({"
-            + f"score: {self.score:.2f}, "
+            + (f"score: {self.score:.2f}, " if self.score is not None else "score: None, ")
             + f"confidence: {self.confidence:.2f}, "
             + (f"anomaly_score: {self.anomaly_score:.2f}, " if self.anomaly_score is not None else "")
             + f"input_value: '{str(self.input_value)[:100] + '...' if len(str(self.input_value)) > 100 else self.input_value}'"
@@ -720,6 +727,8 @@ class RegressionPrediction(PredictionBase):
     @property
     def expected_score(self) -> float | None:
+        if self._expected_score is not None:
+            return self._expected_score
         assert "score" in self._telemetry
         return self._telemetry["expected_score"]

{orca_sdk-0.1.10.dist-info → orca_sdk-0.1.12.dist-info}/METADATA RENAMED Viewed

@@ -1,6 +1,6 @@
 Metadata-Version: 2.4
 Name: orca_sdk
-Version: 0.1.10
+Version: 0.1.12
 Summary: SDK for interacting with Orca Services
 License-Expression: Apache-2.0
 Author: Orca DB Inc.
@@ -11,16 +11,12 @@ Classifier: Programming Language :: Python :: 3.11
 Classifier: Programming Language :: Python :: 3.12
 Classifier: Programming Language :: Python :: 3.13
 Classifier: Programming Language :: Python :: 3.14
-Requires-Dist: datasets (>=4.4.0,<5)
-Requires-Dist: gradio (>=6.0.0,<7)
+Provides-Extra: ui
+Requires-Dist: gradio (>=6.0.0) ; extra == "ui"
 Requires-Dist: httpx (>=0.28.1)
 Requires-Dist: httpx-retries (>=0.4.3,<0.5.0)
-Requires-Dist: numpy (>=2.1.0,<3)
-Requires-Dist: pandas (>=2.2.3,<3)
-Requires-Dist: pyarrow (>=22.0.0,<23)
 Requires-Dist: python-dotenv (>=1.1.0)
-Requires-Dist: scikit-learn (>=1.6.1,<2)
-Requires-Dist: torch (>=2.8.0,<3)
+Requires-Dist: tqdm (>=4.67.2,<5.0.0)
 Description-Content-Type: text/markdown
 <!--

orca-sdk 0.1.10__py3-none-any.whl → 0.1.12__py3-none-any.whl

orca-sdk 0.1.10py3-none-any.whl → 0.1.12py3-none-any.whl