PyPI - fiddler-evals - Versions diffs - 0.1.1.dev12__tar.gz → 0.1.1.dev13__tar.gz - Mend

{fiddler_evals-0.1.1.dev12/fiddler_evals.egg-info → fiddler_evals-0.1.1.dev13}/PKG-INFO +1 -1

fiddler_evals-0.1.1.dev13/fiddler_evals/VERSION +1 -0

{fiddler_evals-0.1.1.dev12 → fiddler_evals-0.1.1.dev13}/fiddler_evals/entities/dataset.py +4 -1

{fiddler_evals-0.1.1.dev12 → fiddler_evals-0.1.1.dev13}/fiddler_evals/runner/experiment_result_publisher.py +1 -1

{fiddler_evals-0.1.1.dev12 → fiddler_evals-0.1.1.dev13}/fiddler_evals/runner/experiment_runner.py +5 -0

{fiddler_evals-0.1.1.dev12 → fiddler_evals-0.1.1.dev13}/fiddler_evals/runner/tests/test_evaluate.py +18 -1

{fiddler_evals-0.1.1.dev12 → fiddler_evals-0.1.1.dev13/fiddler_evals.egg-info}/PKG-INFO +1 -1

{fiddler_evals-0.1.1.dev12 → fiddler_evals-0.1.1.dev13}/pyproject.toml +1 -1

fiddler_evals-0.1.1.dev12/fiddler_evals/VERSION +0 -1

{fiddler_evals-0.1.1.dev12 → fiddler_evals-0.1.1.dev13}/MANIFEST.in +0 -0

{fiddler_evals-0.1.1.dev12 → fiddler_evals-0.1.1.dev13}/PUBLIC.md +0 -0

{fiddler_evals-0.1.1.dev12 → fiddler_evals-0.1.1.dev13}/README.md +0 -0

{fiddler_evals-0.1.1.dev12 → fiddler_evals-0.1.1.dev13}/fiddler_evals/__init__.py +0 -0

{fiddler_evals-0.1.1.dev12 → fiddler_evals-0.1.1.dev13}/fiddler_evals/configs.py +0 -0

{fiddler_evals-0.1.1.dev12 → fiddler_evals-0.1.1.dev13}/fiddler_evals/conftest.py +0 -0

{fiddler_evals-0.1.1.dev12 → fiddler_evals-0.1.1.dev13}/fiddler_evals/connection.py +0 -0

{fiddler_evals-0.1.1.dev12 → fiddler_evals-0.1.1.dev13}/fiddler_evals/constants.py +0 -0

{fiddler_evals-0.1.1.dev12 → fiddler_evals-0.1.1.dev13}/fiddler_evals/decorators.py +0 -0

{fiddler_evals-0.1.1.dev12 → fiddler_evals-0.1.1.dev13}/fiddler_evals/entities/__init__.py +0 -0

{fiddler_evals-0.1.1.dev12 → fiddler_evals-0.1.1.dev13}/fiddler_evals/entities/application.py +0 -0

{fiddler_evals-0.1.1.dev12 → fiddler_evals-0.1.1.dev13}/fiddler_evals/entities/base.py +0 -0

{fiddler_evals-0.1.1.dev12 → fiddler_evals-0.1.1.dev13}/fiddler_evals/entities/experiment.py +0 -0

{fiddler_evals-0.1.1.dev12 → fiddler_evals-0.1.1.dev13}/fiddler_evals/entities/project.py +0 -0

{fiddler_evals-0.1.1.dev12 → fiddler_evals-0.1.1.dev13}/fiddler_evals/entities/tests/__init__.py +0 -0

{fiddler_evals-0.1.1.dev12 → fiddler_evals-0.1.1.dev13}/fiddler_evals/entities/tests/test_application.py +0 -0

{fiddler_evals-0.1.1.dev12 → fiddler_evals-0.1.1.dev13}/fiddler_evals/entities/tests/test_dataset.py +0 -0

{fiddler_evals-0.1.1.dev12 → fiddler_evals-0.1.1.dev13}/fiddler_evals/entities/tests/test_dataset_items.py +0 -0

{fiddler_evals-0.1.1.dev12 → fiddler_evals-0.1.1.dev13}/fiddler_evals/entities/tests/test_experiment.py +0 -0

{fiddler_evals-0.1.1.dev12 → fiddler_evals-0.1.1.dev13}/fiddler_evals/entities/tests/test_experiment_items.py +0 -0

{fiddler_evals-0.1.1.dev12 → fiddler_evals-0.1.1.dev13}/fiddler_evals/entities/tests/test_experiment_results.py +0 -0

{fiddler_evals-0.1.1.dev12 → fiddler_evals-0.1.1.dev13}/fiddler_evals/entities/tests/test_project.py +0 -0

{fiddler_evals-0.1.1.dev12 → fiddler_evals-0.1.1.dev13}/fiddler_evals/evaluators/__init__.py +0 -0

{fiddler_evals-0.1.1.dev12 → fiddler_evals-0.1.1.dev13}/fiddler_evals/evaluators/answer_relevance.py +0 -0

{fiddler_evals-0.1.1.dev12 → fiddler_evals-0.1.1.dev13}/fiddler_evals/evaluators/base.py +0 -0

{fiddler_evals-0.1.1.dev12 → fiddler_evals-0.1.1.dev13}/fiddler_evals/evaluators/coherence.py +0 -0

{fiddler_evals-0.1.1.dev12 → fiddler_evals-0.1.1.dev13}/fiddler_evals/evaluators/conciseness.py +0 -0

{fiddler_evals-0.1.1.dev12 → fiddler_evals-0.1.1.dev13}/fiddler_evals/evaluators/eval_fn.py +0 -0

{fiddler_evals-0.1.1.dev12 → fiddler_evals-0.1.1.dev13}/fiddler_evals/evaluators/ftl_prompt_safety.py +0 -0

{fiddler_evals-0.1.1.dev12 → fiddler_evals-0.1.1.dev13}/fiddler_evals/evaluators/ftl_response_faithfulness.py +0 -0

{fiddler_evals-0.1.1.dev12 → fiddler_evals-0.1.1.dev13}/fiddler_evals/evaluators/regex.py +0 -0

{fiddler_evals-0.1.1.dev12 → fiddler_evals-0.1.1.dev13}/fiddler_evals/evaluators/sentiment.py +0 -0

{fiddler_evals-0.1.1.dev12 → fiddler_evals-0.1.1.dev13}/fiddler_evals/evaluators/tests/__init__.py +0 -0

{fiddler_evals-0.1.1.dev12 → fiddler_evals-0.1.1.dev13}/fiddler_evals/evaluators/tests/test_answer_relevance.py +0 -0

{fiddler_evals-0.1.1.dev12 → fiddler_evals-0.1.1.dev13}/fiddler_evals/evaluators/tests/test_coherence.py +0 -0

{fiddler_evals-0.1.1.dev12 → fiddler_evals-0.1.1.dev13}/fiddler_evals/evaluators/tests/test_conciseness.py +0 -0

{fiddler_evals-0.1.1.dev12 → fiddler_evals-0.1.1.dev13}/fiddler_evals/evaluators/tests/test_eval_fn.py +0 -0

{fiddler_evals-0.1.1.dev12 → fiddler_evals-0.1.1.dev13}/fiddler_evals/evaluators/tests/test_ftl_prompt_safety.py +0 -0

{fiddler_evals-0.1.1.dev12 → fiddler_evals-0.1.1.dev13}/fiddler_evals/evaluators/tests/test_ftl_response_faithfulness.py +0 -0

{fiddler_evals-0.1.1.dev12 → fiddler_evals-0.1.1.dev13}/fiddler_evals/evaluators/tests/test_regex.py +0 -0

{fiddler_evals-0.1.1.dev12 → fiddler_evals-0.1.1.dev13}/fiddler_evals/evaluators/tests/test_sentiment.py +0 -0

{fiddler_evals-0.1.1.dev12 → fiddler_evals-0.1.1.dev13}/fiddler_evals/evaluators/tests/test_topic_classification.py +0 -0

{fiddler_evals-0.1.1.dev12 → fiddler_evals-0.1.1.dev13}/fiddler_evals/evaluators/tests/test_toxicity.py +0 -0

{fiddler_evals-0.1.1.dev12 → fiddler_evals-0.1.1.dev13}/fiddler_evals/evaluators/topic.py +0 -0

{fiddler_evals-0.1.1.dev12 → fiddler_evals-0.1.1.dev13}/fiddler_evals/evaluators/toxicity.py +0 -0

{fiddler_evals-0.1.1.dev12 → fiddler_evals-0.1.1.dev13}/fiddler_evals/exceptions.py +0 -0

{fiddler_evals-0.1.1.dev12 → fiddler_evals-0.1.1.dev13}/fiddler_evals/libs/__init__.py +0 -0

{fiddler_evals-0.1.1.dev12 → fiddler_evals-0.1.1.dev13}/fiddler_evals/libs/http_client.py +0 -0

{fiddler_evals-0.1.1.dev12 → fiddler_evals-0.1.1.dev13}/fiddler_evals/libs/json_encoder.py +0 -0

{fiddler_evals-0.1.1.dev12 → fiddler_evals-0.1.1.dev13}/fiddler_evals/libs/semver.py +0 -0

{fiddler_evals-0.1.1.dev12 → fiddler_evals-0.1.1.dev13}/fiddler_evals/libs/tests/__init__.py +0 -0

{fiddler_evals-0.1.1.dev12 → fiddler_evals-0.1.1.dev13}/fiddler_evals/libs/tests/test_json_encoder.py +0 -0

{fiddler_evals-0.1.1.dev12 → fiddler_evals-0.1.1.dev13}/fiddler_evals/libs/tests/test_request_client.py +0 -0

{fiddler_evals-0.1.1.dev12 → fiddler_evals-0.1.1.dev13}/fiddler_evals/pydantic_models/__init__.py +0 -0

{fiddler_evals-0.1.1.dev12 → fiddler_evals-0.1.1.dev13}/fiddler_evals/pydantic_models/application.py +0 -0

{fiddler_evals-0.1.1.dev12 → fiddler_evals-0.1.1.dev13}/fiddler_evals/pydantic_models/base.py +0 -0

{fiddler_evals-0.1.1.dev12 → fiddler_evals-0.1.1.dev13}/fiddler_evals/pydantic_models/compact.py +0 -0

{fiddler_evals-0.1.1.dev12 → fiddler_evals-0.1.1.dev13}/fiddler_evals/pydantic_models/dataset.py +0 -0

{fiddler_evals-0.1.1.dev12 → fiddler_evals-0.1.1.dev13}/fiddler_evals/pydantic_models/error.py +0 -0

{fiddler_evals-0.1.1.dev12 → fiddler_evals-0.1.1.dev13}/fiddler_evals/pydantic_models/evaluator.py +0 -0

{fiddler_evals-0.1.1.dev12 → fiddler_evals-0.1.1.dev13}/fiddler_evals/pydantic_models/experiment.py +0 -0

{fiddler_evals-0.1.1.dev12 → fiddler_evals-0.1.1.dev13}/fiddler_evals/pydantic_models/filter_query.py +0 -0

{fiddler_evals-0.1.1.dev12 → fiddler_evals-0.1.1.dev13}/fiddler_evals/pydantic_models/project.py +0 -0

{fiddler_evals-0.1.1.dev12 → fiddler_evals-0.1.1.dev13}/fiddler_evals/pydantic_models/response.py +0 -0

{fiddler_evals-0.1.1.dev12 → fiddler_evals-0.1.1.dev13}/fiddler_evals/pydantic_models/score.py +0 -0

{fiddler_evals-0.1.1.dev12 → fiddler_evals-0.1.1.dev13}/fiddler_evals/pydantic_models/server_info.py +0 -0

{fiddler_evals-0.1.1.dev12 → fiddler_evals-0.1.1.dev13}/fiddler_evals/runner/__init__.py +0 -0

{fiddler_evals-0.1.1.dev12 → fiddler_evals-0.1.1.dev13}/fiddler_evals/runner/evaluation.py +0 -0

{fiddler_evals-0.1.1.dev12 → fiddler_evals-0.1.1.dev13}/fiddler_evals/runner/executor.py +0 -0

{fiddler_evals-0.1.1.dev12 → fiddler_evals-0.1.1.dev13}/fiddler_evals/runner/tests/__init__.py +0 -0

{fiddler_evals-0.1.1.dev12 → fiddler_evals-0.1.1.dev13}/fiddler_evals/runner/tests/test_experiment_result_publisher.py +0 -0

{fiddler_evals-0.1.1.dev12 → fiddler_evals-0.1.1.dev13}/fiddler_evals/tests/__init__.py +0 -0

{fiddler_evals-0.1.1.dev12 → fiddler_evals-0.1.1.dev13}/fiddler_evals/tests/constants.py +0 -0

{fiddler_evals-0.1.1.dev12 → fiddler_evals-0.1.1.dev13}/fiddler_evals/tests/test_connection.py +0 -0

{fiddler_evals-0.1.1.dev12 → fiddler_evals-0.1.1.dev13}/fiddler_evals/tests/test_decorators.py +0 -0

{fiddler_evals-0.1.1.dev12 → fiddler_evals-0.1.1.dev13}/fiddler_evals/utils/__init__.py +0 -0

{fiddler_evals-0.1.1.dev12 → fiddler_evals-0.1.1.dev13}/fiddler_evals/utils/environment.py +0 -0

{fiddler_evals-0.1.1.dev12 → fiddler_evals-0.1.1.dev13}/fiddler_evals/utils/pd.py +0 -0

{fiddler_evals-0.1.1.dev12 → fiddler_evals-0.1.1.dev13}/fiddler_evals/utils/tests/__init__.py +0 -0

{fiddler_evals-0.1.1.dev12 → fiddler_evals-0.1.1.dev13}/fiddler_evals/utils/tests/test_environment.py +0 -0

{fiddler_evals-0.1.1.dev12 → fiddler_evals-0.1.1.dev13}/fiddler_evals/utils/tqdm.py +0 -0

{fiddler_evals-0.1.1.dev12 → fiddler_evals-0.1.1.dev13}/fiddler_evals/version.py +0 -0

{fiddler_evals-0.1.1.dev12 → fiddler_evals-0.1.1.dev13}/fiddler_evals.egg-info/SOURCES.txt +0 -0

{fiddler_evals-0.1.1.dev12 → fiddler_evals-0.1.1.dev13}/fiddler_evals.egg-info/dependency_links.txt +0 -0

{fiddler_evals-0.1.1.dev12 → fiddler_evals-0.1.1.dev13}/fiddler_evals.egg-info/requires.txt +0 -0

{fiddler_evals-0.1.1.dev12 → fiddler_evals-0.1.1.dev13}/fiddler_evals.egg-info/top_level.txt +0 -0

{fiddler_evals-0.1.1.dev12 → fiddler_evals-0.1.1.dev13}/setup.cfg +0 -0

@@ -1,6 +1,6 @@
 Metadata-Version: 2.4
 Name: fiddler-evals
-Version: 0.1.1.dev12
+Version: 0.1.1.dev13
 Summary: Python SDK for evaluating LLM Applications
 Author-email: Fiddler AI <support@fiddler.ai>
 Maintainer-email: Fiddler AI <support@fiddler.ai>

@@ -732,7 +732,10 @@ class Dataset(BaseEntity):
             with list(dataset.get_items()) if you need to iterate multiple times or get
             the total count. The iterator fetches items lazily from the API.
         """
-        for item in self._paginate(url=f"{self._get_url(self.id)}/items"):
+        # Read upto 1K dataset items in a call to reduce network calls and latency
+        for item in self._paginate(
+            url=f"{self._get_url(self.id)}/items", page_size=1000
+        ):
             yield DatasetItem(**item)
     @handle_api_error

@@ -61,7 +61,7 @@ class ExperimentResultPublisher:
             # Auto-flush when batch size is reached
             if len(self._buffer) >= self._batch_size:
-                logger.info(
+                logger.debug(
                     "Flushing experiment result buffer of size %d", len(self._buffer)
                 )
                 self._flush_internal()

@@ -656,6 +656,11 @@ class ExperimentRunner:
             self._dataset.name,
         )
+        # Mark the experiment as in progress
+        self._experiment.update(
+            status=ExperimentStatus.IN_PROGRESS,
+        )
         # Use a thread pool to process the dataset items when max_workers > 1
         if self._max_workers > 1:
             results = thread_map(

@@ -1,3 +1,4 @@
+import json
 from datetime import datetime
 from typing import Any
 from unittest import mock
@@ -147,7 +148,23 @@ def test_evaluate_with_regex_with_kwargs_mapping() -> None:
         json=EXPERIMENT_API_RESPONSE,
     )
-    # Mock experiment updation
+    # Mock experiment status update to IN_PROGRESS with request body verification
+    in_progress_response = EXPERIMENT_API_RESPONSE.copy()
+    in_progress_response["data"]["status"] = ExperimentStatus.IN_PROGRESS
+    def in_progress_callback(request):
+        # Verify that the request body contains the correct status
+        request_body = json.loads(request.body)
+        assert request_body["status"] == ExperimentStatus.IN_PROGRESS
+        return (200, {}, json.dumps(in_progress_response))
+    responses.add_callback(
+        responses.PATCH,
+        url=f"{URL}/v3/evals/experiments/{EXPERIMENT_ID}",
+        callback=in_progress_callback,
+    )
+    # Mock experiment updation to COMPLETED
     updated_response = EXPERIMENT_API_RESPONSE.copy()
     updated_response["data"]["status"] = ExperimentStatus.COMPLETED
     responses.patch(

@@ -1,6 +1,6 @@
 [project]
 name = "fiddler-evals"
-version = "0.1.1.dev12"
+version = "0.1.1.dev13"
 authors = [
   { name = "Fiddler AI", email = "support@fiddler.ai" },
 ]

	@@ -0,0 +1 @@
1	+ 0.1.1.dev13

	@@ -1 +0,0 @@
1	- 0.1.1.dev12

fiddler-evals 0.1.1.dev12__tar.gz → 0.1.1.dev13__tar.gz

fiddler-evals 0.1.1.dev12tar.gz → 0.1.1.dev13tar.gz