PyPI - edsl - Versions diffs - 0.1.54__py3-none-any.whl → 0.1.55__py3-none-any.whl - Mend

edsl 0.1.54py3-none-any.whl → 0.1.55py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (101) hide show

edsl/__init__.py +8 -1
edsl/__init__original.py +134 -0
edsl/__version__.py +1 -1
edsl/agents/agent.py +29 -0
edsl/agents/agent_list.py +36 -1
edsl/base/base_class.py +281 -151
edsl/buckets/__init__.py +8 -3
edsl/buckets/bucket_collection.py +9 -3
edsl/buckets/model_buckets.py +4 -2
edsl/buckets/token_bucket.py +2 -2
edsl/buckets/token_bucket_client.py +5 -3
edsl/caching/cache.py +131 -62
edsl/caching/cache_entry.py +70 -58
edsl/caching/sql_dict.py +17 -0
edsl/cli.py +99 -0
edsl/config/config_class.py +16 -0
edsl/conversation/__init__.py +31 -0
edsl/coop/coop.py +276 -242
edsl/coop/coop_jobs_objects.py +59 -0
edsl/coop/coop_objects.py +29 -0
edsl/coop/coop_regular_objects.py +26 -0
edsl/coop/utils.py +24 -19
edsl/dataset/dataset.py +338 -101
edsl/db_list/sqlite_list.py +349 -0
edsl/inference_services/__init__.py +40 -5
edsl/inference_services/exceptions.py +11 -0
edsl/inference_services/services/anthropic_service.py +5 -2
edsl/inference_services/services/aws_bedrock.py +6 -2
edsl/inference_services/services/azure_ai.py +6 -2
edsl/inference_services/services/google_service.py +3 -2
edsl/inference_services/services/mistral_ai_service.py +6 -2
edsl/inference_services/services/open_ai_service.py +6 -2
edsl/inference_services/services/perplexity_service.py +6 -2
edsl/inference_services/services/test_service.py +94 -5
edsl/interviews/answering_function.py +167 -59
edsl/interviews/interview.py +124 -72
edsl/interviews/interview_task_manager.py +10 -0
edsl/invigilators/invigilators.py +9 -0
edsl/jobs/async_interview_runner.py +146 -104
edsl/jobs/data_structures.py +6 -4
edsl/jobs/decorators.py +61 -0
edsl/jobs/fetch_invigilator.py +61 -18
edsl/jobs/html_table_job_logger.py +14 -2
edsl/jobs/jobs.py +180 -104
edsl/jobs/jobs_component_constructor.py +2 -2
edsl/jobs/jobs_interview_constructor.py +2 -0
edsl/jobs/jobs_remote_inference_logger.py +4 -0
edsl/jobs/jobs_runner_status.py +30 -25
edsl/jobs/progress_bar_manager.py +79 -0
edsl/jobs/remote_inference.py +35 -1
edsl/key_management/key_lookup_builder.py +6 -1
edsl/language_models/language_model.py +86 -6
edsl/language_models/model.py +10 -3
edsl/language_models/price_manager.py +45 -75
edsl/language_models/registry.py +5 -0
edsl/notebooks/notebook.py +77 -10
edsl/questions/VALIDATION_README.md +134 -0
edsl/questions/__init__.py +24 -1
edsl/questions/exceptions.py +21 -0
edsl/questions/question_dict.py +201 -16
edsl/questions/question_multiple_choice_with_other.py +624 -0
edsl/questions/question_registry.py +2 -1
edsl/questions/templates/multiple_choice_with_other/__init__.py +0 -0
edsl/questions/templates/multiple_choice_with_other/answering_instructions.jinja +15 -0
edsl/questions/templates/multiple_choice_with_other/question_presentation.jinja +17 -0
edsl/questions/validation_analysis.py +185 -0
edsl/questions/validation_cli.py +131 -0
edsl/questions/validation_html_report.py +404 -0
edsl/questions/validation_logger.py +136 -0
edsl/results/result.py +63 -16
edsl/results/results.py +702 -171
edsl/scenarios/construct_download_link.py +16 -3
edsl/scenarios/directory_scanner.py +226 -226
edsl/scenarios/file_methods.py +5 -0
edsl/scenarios/file_store.py +117 -6
edsl/scenarios/handlers/__init__.py +5 -1
edsl/scenarios/handlers/mp4_file_store.py +104 -0
edsl/scenarios/handlers/webm_file_store.py +104 -0
edsl/scenarios/scenario.py +120 -101
edsl/scenarios/scenario_list.py +800 -727
edsl/scenarios/scenario_list_gc_test.py +146 -0
edsl/scenarios/scenario_list_memory_test.py +214 -0
edsl/scenarios/scenario_list_source_refactor.md +35 -0
edsl/scenarios/scenario_selector.py +5 -4
edsl/scenarios/scenario_source.py +1990 -0
edsl/scenarios/tests/test_scenario_list_sources.py +52 -0
edsl/surveys/survey.py +22 -0
edsl/tasks/__init__.py +4 -2
edsl/tasks/task_history.py +198 -36
edsl/tests/scenarios/test_ScenarioSource.py +51 -0
edsl/tests/scenarios/test_scenario_list_sources.py +51 -0
edsl/utilities/__init__.py +2 -1
edsl/utilities/decorators.py +121 -0
edsl/utilities/memory_debugger.py +1010 -0
{edsl-0.1.54.dist-info → edsl-0.1.55.dist-info}/METADATA +51 -76
{edsl-0.1.54.dist-info → edsl-0.1.55.dist-info}/RECORD +99 -75
edsl/jobs/jobs_runner_asyncio.py +0 -281
edsl/language_models/unused/fake_openai_service.py +0 -60
{edsl-0.1.54.dist-info → edsl-0.1.55.dist-info}/LICENSE +0 -0
{edsl-0.1.54.dist-info → edsl-0.1.55.dist-info}/WHEEL +0 -0
{edsl-0.1.54.dist-info → edsl-0.1.55.dist-info}/entry_points.txt +0 -0

edsl/jobs/jobs.py CHANGED Viewed

@@ -18,7 +18,6 @@ who need to run complex simulations with language models.
 from __future__ import annotations
 import asyncio
 from typing import Optional, Union, TypeVar, Callable, cast
-from functools import wraps
 from typing import (
     Literal,
@@ -31,10 +30,27 @@ from ..base import Base
 from ..utilities import remove_edsl_version
 from ..coop import CoopServerResponseError
-from ..buckets import BucketCollection
+# Import BucketCollection with an import_module to avoid early binding
+from importlib import import_module
+def get_bucket_collection():
+    buckets_module = import_module("edsl.buckets")
+    return buckets_module.BucketCollection
 from ..scenarios import Scenario, ScenarioList
 from ..surveys import Survey
-from ..interviews import Interview
+# Use import_module to avoid circular import with interviews
+from importlib import import_module
+def get_interview():
+    interviews_module = import_module("edsl.interviews.interview")
+    return interviews_module.Interview
 from .exceptions import JobsValueError, JobsImplementationError
 from .jobs_pricing_estimation import JobsPrompts
@@ -42,6 +58,7 @@ from .remote_inference import JobsRemoteInferenceHandler
 from .jobs_checks import JobsChecks
 from .data_structures import RunEnvironment, RunParameters, RunConfig
 from .check_survey_scenario_compatibility import CheckSurveyScenarioCompatibility
+from .decorators import with_config
 if TYPE_CHECKING:
@@ -59,65 +76,6 @@ if TYPE_CHECKING:
 VisibilityType = Literal["private", "public", "unlisted"]
-try:
-    from typing import ParamSpec
-except ImportError:
-    from typing_extensions import ParamSpec
-P = ParamSpec("P")
-T = TypeVar("T")
-def with_config(f: Callable[P, T]) -> Callable[P, T]:
-    """
-    Decorator that processes function parameters to match the RunConfig dataclass structure.
-    This decorator is used primarily with the run() and run_async() methods to provide
-    a consistent interface for job configuration while maintaining a clean API.
-    The decorator:
-    1. Extracts environment-related parameters into a RunEnvironment instance
-    2. Extracts execution-related parameters into a RunParameters instance
-    3. Combines both into a single RunConfig object
-    4. Passes this RunConfig to the decorated function as a keyword argument
-    Parameters:
-        f (Callable): The function to decorate, typically run() or run_async()
-    Returns:
-        Callable: A wrapped function that accepts all RunConfig parameters directly
-    Example:
-        @with_config
-        def run(self, *, config: RunConfig) -> Results:
-            # Function can now access config.parameters and config.environment
-    """
-    parameter_fields = {
-        name: field.default
-        for name, field in RunParameters.__dataclass_fields__.items()
-    }
-    environment_fields = {
-        name: field.default
-        for name, field in RunEnvironment.__dataclass_fields__.items()
-    }
-    # Combined fields dict used for reference during development
-    # combined = {**parameter_fields, **environment_fields}
-    @wraps(f)
-    def wrapper(*args: P.args, **kwargs: P.kwargs) -> T:
-        environment = RunEnvironment(
-            **{k: v for k, v in kwargs.items() if k in environment_fields}
-        )
-        parameters = RunParameters(
-            **{k: v for k, v in kwargs.items() if k in parameter_fields}
-        )
-        config = RunConfig(environment=environment, parameters=parameters)
-        return f(*args, config=config)
-    return cast(Callable[P, T], wrapper)
 class Jobs(Base):
     """
     A collection of agents, scenarios, models, and a survey that orchestrates interviews.
@@ -220,7 +178,7 @@ class Jobs(Base):
         self.run_config.add_cache(cache)
         return self
-    def using_bucket_collection(self, bucket_collection: "BucketCollection") -> Jobs:
+    def using_bucket_collection(self, bucket_collection) -> Jobs:
         """
         Add a BucketCollection to the job.
@@ -238,7 +196,7 @@ class Jobs(Base):
         self.run_config.add_key_lookup(key_lookup)
         return self
-    def using(self, obj: Union[Cache, BucketCollection, KeyLookup]) -> Jobs:
+    def using(self, obj) -> Jobs:
         """
         Add a Cache, BucketCollection, or KeyLookup to the job.
@@ -247,6 +205,8 @@ class Jobs(Base):
         from ..caching import Cache
         from ..key_management import KeyLookup
+        BucketCollection = get_bucket_collection()
         if isinstance(obj, Cache):
             self.using_cache(obj)
         elif isinstance(obj, BucketCollection):
@@ -428,7 +388,7 @@ class Jobs(Base):
         :param iterations: the number of iterations to run
         """
-        return JobsPrompts(self).estimate_job_cost(iterations)
+        return JobsPrompts.from_jobs(self).estimate_job_cost(iterations)
     def estimate_job_cost_from_external_prices(
         self, price_lookup: dict, iterations: int = 1
@@ -453,7 +413,7 @@ class Jobs(Base):
         self.models = self.models or [Model()]
         self.scenarios = self.scenarios or [Scenario()]
-    def generate_interviews(self) -> Generator[Interview, None, None]:
+    def generate_interviews(self) -> Generator:
         """
         Generate interviews.
@@ -485,7 +445,7 @@ class Jobs(Base):
             filename=filename
         )
-    def interviews(self) -> list[Interview]:
+    def interviews(self) -> list:
         """
         Return a list of :class:`edsl.jobs.interviews.Interview` objects.
@@ -508,6 +468,9 @@ class Jobs(Base):
         This is useful when you have, say, a list of failed interviews and you want to create
         a new job with only those interviews.
         """
+        if not interview_list:
+            raise JobsValueError("Cannot create Jobs from empty interview list")
         survey = interview_list[0].survey
         # get all the models
         models = list(set([interview.model for interview in interview_list]))
@@ -516,7 +479,7 @@ class Jobs(Base):
         jobs._interviews = interview_list
         return jobs
-    def create_bucket_collection(self) -> BucketCollection:
+    def create_bucket_collection(self):
         """
         Create a collection of buckets for each model.
@@ -529,6 +492,7 @@ class Jobs(Base):
         >>> bc
         BucketCollection(...)
         """
+        BucketCollection = get_bucket_collection()
         bc = BucketCollection.from_models(self.models)
         if self.run_config.environment.key_lookup is not None:
@@ -645,19 +609,109 @@ class Jobs(Base):
             jc.check_api_keys()
     async def _execute_with_remote_cache(self, run_job_async: bool) -> Results:
-        # Remote cache usage determination happens inside this method
-        # use_remote_cache = self.use_remote_cache()
-        from .jobs_runner_asyncio import JobsRunnerAsyncio
+        """Core interview execution logic for jobs execution."""
+        # Import needed modules inline to avoid early binding
+        import os
+        import time
+        import gc
+        import weakref
+        import asyncio
         from ..caching import Cache
+        from ..results import Results, Result
+        from ..tasks import TaskHistory
+        from ..utilities.decorators import jupyter_nb_handler
+        from ..utilities.memory_debugger import MemoryDebugger
+        from .jobs_runner_status import JobsRunnerStatus
+        from .async_interview_runner import AsyncInterviewRunner
+        from .progress_bar_manager import ProgressBarManager
+        from .results_exceptions_handler import ResultsExceptionsHandler
         assert isinstance(self.run_config.environment.cache, Cache)
-        runner = JobsRunnerAsyncio(self, environment=self.run_config.environment)
+        # Create the RunConfig for the job
+        run_config = RunConfig(
+            parameters=self.run_config.parameters,
+            environment=self.run_config.environment,
+        )
+        # Setup JobsRunnerStatus if needed
+        if self.run_config.environment.jobs_runner_status is None:
+            self.run_config.environment.jobs_runner_status = JobsRunnerStatus(
+                self, n=self.run_config.parameters.n
+            )
+        # Create a shared function to process interview results
+        async def process_interviews(interview_runner, results_obj):
+            prev_interview_ref = None
+            async for result, interview, idx in interview_runner.run():
+                # Set the order attribute on the result for correct ordering
+                result.order = idx
+                # Collect results
+                # results_obj.append(result)
+                # key = results_obj.shelve_result(result)
+                results_obj.add_task_history_entry(interview)
+                results_obj.insert_sorted(result)
+                # Memory management: Set up reference for next iteration and clear old references
+                prev_interview_ref = weakref.ref(interview)
+                if hasattr(interview, "clear_references"):
+                    interview.clear_references()
+                # Force garbage collection
+                del result
+                del interview
+            # Finalize results object with cache and bucket collection
+            # results_obj.insert_from_shelf()
+            results_obj.cache = results_obj.relevant_cache(
+                self.run_config.environment.cache
+            )
+            results_obj.bucket_collection = (
+                self.run_config.environment.bucket_collection
+            )
+            return results_obj
+        # Core execution logic
+        interview_runner = AsyncInterviewRunner(self, run_config)
+        # Create an initial Results object with appropriate traceback settings
+        results = Results(
+            survey=self.survey,
+            data=[],
+            task_history=TaskHistory(
+                include_traceback=not self.run_config.parameters.progress_bar
+            ),
+        )
         if run_job_async:
-            results = await runner.run_async(self.run_config.parameters)
+            # For async execution mode (simplified path without progress bar)
+            await process_interviews(interview_runner, results)
         else:
-            results = runner.run(self.run_config.parameters)
+            # For synchronous execution mode (with progress bar)
+            with ProgressBarManager(
+                self, run_config, self.run_config.parameters
+            ) as stop_event:
+                try:
+                    await process_interviews(interview_runner, results)
+                except KeyboardInterrupt:
+                    print("Keyboard interrupt received. Stopping gracefully...")
+                    results = Results(
+                        survey=self.survey, data=[], task_history=TaskHistory()
+                    )
+                except Exception as e:
+                    if self.run_config.parameters.stop_on_exception:
+                        raise
+                    results = Results(
+                        survey=self.survey, data=[], task_history=TaskHistory()
+                    )
+        # Process any exceptions in the results
+        if results:
+            ResultsExceptionsHandler(
+                results, self.run_config.parameters
+            ).handle_exceptions()
         return results
     @property
@@ -668,55 +722,72 @@ class Jobs(Base):
             return len(self) * self.run_config.parameters.n
     def _run(self, config: RunConfig) -> Union[None, "Results"]:
-        "Shared code for run and run_async"
-        if config.environment.cache is not None:
-            self.run_config.environment.cache = config.environment.cache
-        if config.environment.jobs_runner_status is not None:
-            self.run_config.environment.jobs_runner_status = (
-                config.environment.jobs_runner_status
-            )
+        """
+        Shared code for run and run_async methods.
-        if config.environment.bucket_collection is not None:
-            self.run_config.environment.bucket_collection = (
-                config.environment.bucket_collection
-            )
+        This method handles all pre-execution setup including:
+        1. Transferring configuration settings from the input config
+        2. Ensuring all required objects (agents, models, scenarios) exist
+        3. Checking API keys and remote execution availability
+        4. Setting up caching and bucket collections
+        5. Attempting remote execution if appropriate
-        if config.environment.key_lookup is not None:
-            self.run_config.environment.key_lookup = config.environment.key_lookup
+        Returns:
+            Tuple containing (Results, reason) if remote execution succeeds,
+            or (None, reason) if local execution should proceed
+        """
+        # Apply configuration from input config to self.run_config
+        for attr_name in [
+            "cache",
+            "jobs_runner_status",
+            "bucket_collection",
+            "key_lookup",
+        ]:
+            if getattr(config.environment, attr_name) is not None:
+                setattr(
+                    self.run_config.environment,
+                    attr_name,
+                    getattr(config.environment, attr_name),
+                )
-        # replace the parameters with the ones from the config
+        # Replace parameters with the ones from the config
         self.run_config.parameters = config.parameters
+        # Make sure all required objects exist
         self.replace_missing_objects()
         self._prepare_to_run()
         self._check_if_remote_keys_ok()
+        # Setup caching
+        from ..caching import CacheHandler, Cache
         if (
             self.run_config.environment.cache is None
             or self.run_config.environment.cache is True
         ):
-            from ..caching import CacheHandler
             self.run_config.environment.cache = CacheHandler().get_cache()
-        if self.run_config.environment.cache is False:
-            from ..caching import Cache
+        elif self.run_config.environment.cache is False:
             self.run_config.environment.cache = Cache(immediate_write=False)
-        # first try to run the job remotely
+        # Try to run the job remotely first
         results, reason = self._remote_results(config)
         if results is not None:
             return results, reason
+        # If we need to run locally, ensure keys and resources are ready
         self._check_if_local_keys_ok()
-        if config.environment.bucket_collection is None:
+        # Create bucket collection if it doesn't exist
+        if self.run_config.environment.bucket_collection is None:
             self.run_config.environment.bucket_collection = (
                 self.create_bucket_collection()
             )
+        else:
+            # Ensure models are properly added to the bucket collection
+            for model in self.models:
+                self.run_config.environment.bucket_collection.add_model(model)
+        # Update bucket collection from key lookup if both exist
         if (
             self.run_config.environment.key_lookup is not None
             and self.run_config.environment.bucket_collection is not None
@@ -756,6 +827,8 @@ class Jobs(Base):
             cache (Cache, optional): Cache object to store results
             bucket_collection (BucketCollection, optional): Object to track API calls
             key_lookup (KeyLookup, optional): Object to manage API keys
+            memory_threshold (int, optional): Memory threshold in bytes for the Results object's SQLList,
+                controlling when data is offloaded to SQLite storage
         Returns:
             Results: A Results object containing all responses and metadata
@@ -814,6 +887,8 @@ class Jobs(Base):
             cache (Cache, optional): Cache object to store results
             bucket_collection (BucketCollection, optional): Object to track API calls
             key_lookup (KeyLookup, optional): Object to manage API keys
+            memory_threshold (int, optional): Memory threshold in bytes for the Results object's SQLList,
+                controlling when data is offloaded to SQLite storage
         Returns:
             Results: A Results object containing all responses and metadata
@@ -991,17 +1066,18 @@ class Jobs(Base):
         base_survey = Survey(questions=[q1, q2])
-        scenario_list = ScenarioList(
-            [
-                Scenario({"period": f"morning{addition}"}),
-                Scenario({"period": "afternoon"}),
-            ]
-        )
+        scenarios = [
+            Scenario({"period": f"morning{addition}"}),
+            Scenario({"period": "afternoon"}),
+        ]
+        scenario_list = ScenarioList(data=scenarios)
         if test_model:
             job = base_survey.by(m).by(scenario_list).by(joy_agent, sad_agent)
         else:
             job = base_survey.by(scenario_list).by(joy_agent, sad_agent)
+        assert len(scenario_list) == 2
         return job
     def code(self):

edsl/jobs/jobs_component_constructor.py CHANGED Viewed

@@ -1,6 +1,6 @@
 from typing import Union, Sequence, TYPE_CHECKING
 from .exceptions import JobsValueError
+from ..scenarios import ScenarioList
 if TYPE_CHECKING:
     from ..agents import Agent
     from ..language_models import LanguageModel
@@ -96,7 +96,7 @@ class JobsComponentConstructor:
             >>> did_user_pass_a_sequence(1)
             False
             """
-            return len(args) == 1 and isinstance(args[0], Sequence)
+            return len(args) == 1 and (isinstance(args[0], Sequence) or isinstance(args[0], ScenarioList))
         if did_user_pass_a_sequence(args):
             container_class = JobsComponentConstructor._get_container_class(args[0][0])

edsl/jobs/jobs_interview_constructor.py CHANGED Viewed

@@ -50,6 +50,8 @@ class InterviewsConstructor:
                 },
             )
 if __name__ == "__main__":
+    #test_gc()
     import doctest
     doctest.testmod()

edsl/jobs/jobs_remote_inference_logger.py CHANGED Viewed

@@ -30,6 +30,8 @@ class JobsInfo:
     error_report_url: str = None
     results_uuid: str = None
     results_url: str = None
+    completed_interviews: int = None
+    failed_interviews: int = None
     pretty_names = {
         "job_uuid": "Job UUID",
@@ -53,6 +55,8 @@ class JobLogger(ABC):
             "error_report_url",
             "results_uuid",
             "results_url",
+            "completed_interviews",
+            "failed_interviews",
         ],
         value: str,
     ):

edsl/jobs/jobs_runner_status.py CHANGED Viewed

@@ -10,7 +10,7 @@ from typing import Any, Dict, Optional, TYPE_CHECKING
 from uuid import UUID
 if TYPE_CHECKING:
-    from .jobs_runner_asyncio import JobsRunnerAsyncio
+    from .jobs import Jobs
 @dataclass
@@ -65,14 +65,14 @@ class StatisticsTracker:
 class JobsRunnerStatusBase(ABC):
     def __init__(
         self,
-        jobs_runner: "JobsRunnerAsyncio",
+        jobs: "Jobs",
         n: int,
         refresh_rate: float = 1,
         endpoint_url: Optional[str] = "http://localhost:8000",
         job_uuid: Optional[UUID] = None,
         api_key: str = None,
     ):
-        self.jobs_runner = jobs_runner
+        self.jobs = jobs
         self.job_uuid = job_uuid
         self.base_url = f"{endpoint_url}"
         self.refresh_rate = refresh_rate
@@ -86,10 +86,10 @@ class JobsRunnerStatusBase(ABC):
             "unfixed_exceptions",
             "throughput",
         ]
-        self.num_total_interviews = n * len(self.jobs_runner)
+        self.num_total_interviews = n * len(self.jobs)
         self.distinct_models = list(
-            set(model.model for model in self.jobs_runner.jobs.models)
+            set(model.model for model in self.jobs.models)
         )
         self.stats_tracker = StatisticsTracker(
@@ -151,26 +151,31 @@ class JobsRunnerStatusBase(ABC):
         }
         model_queues = {}
-        # for model, bucket in self.jobs_runner.bucket_collection.items():
-        for model, bucket in self.jobs_runner.environment.bucket_collection.items():
-            model_name = model.model
-            model_queues[model_name] = {
-                "language_model_name": model_name,
-                "requests_bucket": {
-                    "completed": bucket.requests_bucket.num_released,
-                    "requested": bucket.requests_bucket.num_requests,
-                    "tokens_returned": bucket.requests_bucket.tokens_returned,
-                    "target_rate": round(bucket.requests_bucket.target_rate, 1),
-                    "current_rate": round(bucket.requests_bucket.get_throughput(), 1),
-                },
-                "tokens_bucket": {
-                    "completed": bucket.tokens_bucket.num_released,
-                    "requested": bucket.tokens_bucket.num_requests,
-                    "tokens_returned": bucket.tokens_bucket.tokens_returned,
-                    "target_rate": round(bucket.tokens_bucket.target_rate, 1),
-                    "current_rate": round(bucket.tokens_bucket.get_throughput(), 1),
-                },
-            }
+        # Check if bucket collection exists and is not empty
+        if (hasattr(self.jobs, 'run_config') and
+            hasattr(self.jobs.run_config, 'environment') and
+            hasattr(self.jobs.run_config.environment, 'bucket_collection') and
+            self.jobs.run_config.environment.bucket_collection):
+            for model, bucket in self.jobs.run_config.environment.bucket_collection.items():
+                model_name = model.model
+                model_queues[model_name] = {
+                    "language_model_name": model_name,
+                    "requests_bucket": {
+                        "completed": bucket.requests_bucket.num_released,
+                        "requested": bucket.requests_bucket.num_requests,
+                        "tokens_returned": bucket.requests_bucket.tokens_returned,
+                        "target_rate": round(bucket.requests_bucket.target_rate, 1),
+                        "current_rate": round(bucket.requests_bucket.get_throughput(), 1),
+                    },
+                    "tokens_bucket": {
+                        "completed": bucket.tokens_bucket.num_released,
+                        "requested": bucket.tokens_bucket.num_requests,
+                        "tokens_returned": bucket.tokens_bucket.tokens_returned,
+                        "target_rate": round(bucket.tokens_bucket.target_rate, 1),
+                        "current_rate": round(bucket.tokens_bucket.get_throughput(), 1),
+                    },
+                }
         status_dict["language_model_queues"] = model_queues
         return status_dict

edsl/jobs/progress_bar_manager.py ADDED Viewed

@@ -0,0 +1,79 @@
+"""
+Progress bar management for asynchronous job execution.
+This module provides a context manager for handling progress bar setup and thread
+management during job execution. It coordinates the display and updating of progress
+bars, particularly for remote tracking via the Expected Parrot API.
+"""
+import threading
+import warnings
+from ..coop import Coop
+from .jobs_runner_status import JobsRunnerStatus
+class ProgressBarManager:
+    """Context manager for handling progress bar setup and thread management.
+    This class manages the progress bar display and updating during job execution,
+    particularly for remote tracking via the Expected Parrot API.
+    It handles:
+    1. Setting up a status tracking object
+    2. Creating and managing a background thread for progress updates
+    3. Properly cleaning up resources when execution completes
+    """
+    def __init__(self, jobs, run_config, parameters):
+        self.parameters = parameters
+        self.jobs = jobs
+        # Set up progress tracking
+        coop = Coop()
+        endpoint_url = coop.get_progress_bar_url()
+        # Set up jobs status object
+        params = {
+            "jobs": jobs,
+            "n": parameters.n,
+            "endpoint_url": endpoint_url,
+            "job_uuid": parameters.job_uuid,
+        }
+        # If the jobs_runner_status is already set, use it directly
+        if run_config.environment.jobs_runner_status is not None:
+            self.jobs_runner_status = run_config.environment.jobs_runner_status
+        else:
+            # Otherwise create a new one
+            self.jobs_runner_status = JobsRunnerStatus(**params)
+        # Store on run_config for use by other components
+        run_config.environment.jobs_runner_status = self.jobs_runner_status
+        self.progress_thread = None
+        self.stop_event = threading.Event()
+    def __enter__(self):
+        if self.parameters.progress_bar and self.jobs_runner_status.has_ep_api_key():
+            self.jobs_runner_status.setup()
+            self.progress_thread = threading.Thread(
+                target=self._run_progress_bar,
+                args=(self.stop_event, self.jobs_runner_status)
+            )
+            self.progress_thread.start()
+        elif self.parameters.progress_bar:
+            warnings.warn(
+                "You need an Expected Parrot API key to view job progress bars."
+            )
+        return self.stop_event
+    def __exit__(self, exc_type, exc_val, exc_tb):
+        self.stop_event.set()
+        if self.progress_thread is not None:
+            self.progress_thread.join()
+    @staticmethod
+    def _run_progress_bar(stop_event, jobs_runner_status):
+        """Runs the progress bar in a separate thread."""
+        jobs_runner_status.update_progress(stop_event)

edsl 0.1.54__py3-none-any.whl → 0.1.55__py3-none-any.whl

edsl 0.1.54py3-none-any.whl → 0.1.55py3-none-any.whl