PyPI - edsl - Versions diffs - 0.1.38__py3-none-any.whl → 0.1.38.dev1__py3-none-any.whl - Mend

edsl 0.1.38py3-none-any.whl → 0.1.38.dev1py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (86) hide show

edsl/Base.py +34 -63
edsl/BaseDiff.py +7 -7
edsl/__init__.py +1 -2
edsl/__version__.py +1 -1
edsl/agents/Agent.py +11 -23
edsl/agents/AgentList.py +23 -86
edsl/agents/Invigilator.py +7 -18
edsl/agents/InvigilatorBase.py +19 -0
edsl/agents/PromptConstructor.py +4 -5
edsl/auto/SurveyCreatorPipeline.py +1 -1
edsl/auto/utilities.py +1 -1
edsl/base/Base.py +13 -3
edsl/config.py +0 -8
edsl/conjure/AgentConstructionMixin.py +160 -0
edsl/conjure/Conjure.py +62 -0
edsl/conjure/InputData.py +659 -0
edsl/conjure/InputDataCSV.py +48 -0
edsl/conjure/InputDataMixinQuestionStats.py +182 -0
edsl/conjure/InputDataPyRead.py +91 -0
edsl/conjure/InputDataSPSS.py +8 -0
edsl/conjure/InputDataStata.py +8 -0
edsl/conjure/QuestionOptionMixin.py +76 -0
edsl/conjure/QuestionTypeMixin.py +23 -0
edsl/conjure/RawQuestion.py +65 -0
edsl/conjure/SurveyResponses.py +7 -0
edsl/conjure/__init__.py +9 -0
edsl/conjure/examples/placeholder.txt +0 -0
edsl/{utilities → conjure}/naming_utilities.py +1 -1
edsl/conjure/utilities.py +201 -0
edsl/coop/coop.py +7 -77
edsl/data/Cache.py +17 -45
edsl/data/CacheEntry.py +3 -8
edsl/data/RemoteCacheSync.py +19 -0
edsl/enums.py +0 -2
edsl/exceptions/agents.py +0 -4
edsl/inference_services/GoogleService.py +15 -7
edsl/inference_services/registry.py +0 -2
edsl/jobs/Jobs.py +559 -110
edsl/jobs/buckets/TokenBucket.py +0 -3
edsl/jobs/interviews/Interview.py +7 -7
edsl/jobs/runners/JobsRunnerAsyncio.py +28 -156
edsl/jobs/runners/JobsRunnerStatus.py +196 -194
edsl/jobs/tasks/TaskHistory.py +19 -27
edsl/language_models/LanguageModel.py +90 -52
edsl/language_models/ModelList.py +14 -67
edsl/language_models/registry.py +4 -57
edsl/notebooks/Notebook.py +8 -7
edsl/prompts/Prompt.py +3 -8
edsl/questions/QuestionBase.py +30 -38
edsl/questions/QuestionBaseGenMixin.py +1 -1
edsl/questions/QuestionBasePromptsMixin.py +17 -0
edsl/questions/QuestionExtract.py +4 -3
edsl/questions/QuestionFunctional.py +3 -10
edsl/questions/derived/QuestionTopK.py +0 -2
edsl/questions/question_registry.py +6 -36
edsl/results/Dataset.py +15 -146
edsl/results/DatasetExportMixin.py +217 -231
edsl/results/DatasetTree.py +4 -134
edsl/results/Result.py +16 -31
edsl/results/Results.py +65 -159
edsl/scenarios/FileStore.py +13 -187
edsl/scenarios/Scenario.py +18 -73
edsl/scenarios/ScenarioList.py +76 -251
edsl/surveys/MemoryPlan.py +1 -1
edsl/surveys/Rule.py +5 -1
edsl/surveys/RuleCollection.py +1 -1
edsl/surveys/Survey.py +19 -25
edsl/surveys/SurveyFlowVisualizationMixin.py +9 -67
edsl/surveys/instructions/ChangeInstruction.py +7 -9
edsl/surveys/instructions/Instruction.py +7 -21
edsl/templates/error_reporting/interview_details.html +3 -3
edsl/templates/error_reporting/interviews.html +9 -18
edsl/utilities/utilities.py +0 -15
{edsl-0.1.38.dist-info → edsl-0.1.38.dev1.dist-info}/METADATA +1 -2
{edsl-0.1.38.dist-info → edsl-0.1.38.dev1.dist-info}/RECORD +77 -71
edsl/exceptions/cache.py +0 -5
edsl/inference_services/PerplexityService.py +0 -163
edsl/jobs/JobsChecks.py +0 -147
edsl/jobs/JobsPrompts.py +0 -268
edsl/jobs/JobsRemoteInferenceHandler.py +0 -239
edsl/results/CSSParameterizer.py +0 -108
edsl/results/TableDisplay.py +0 -198
edsl/results/table_display.css +0 -78
edsl/scenarios/ScenarioJoin.py +0 -127
{edsl-0.1.38.dist-info → edsl-0.1.38.dev1.dist-info}/LICENSE +0 -0
{edsl-0.1.38.dist-info → edsl-0.1.38.dev1.dist-info}/WHEEL +0 -0

edsl/jobs/buckets/TokenBucket.py CHANGED Viewed

@@ -220,9 +220,6 @@ class TokenBucket:
         elapsed_time = now - start_time
-        if elapsed_time == 0:
-            return self.num_released / 0.001
         return (self.num_released / elapsed_time) * 60
         # # Filter log entries within the time window

edsl/jobs/interviews/Interview.py CHANGED Viewed

@@ -159,7 +159,7 @@ class Interview:
         return self.task_creators.interview_status
     # region: Serialization
-    def to_dict(self, include_exceptions=True, add_edsl_version=True) -> dict[str, Any]:
+    def _to_dict(self, include_exceptions=True) -> dict[str, Any]:
         """Return a dictionary representation of the Interview instance.
         This is just for hashing purposes.
@@ -168,10 +168,10 @@ class Interview:
         1217840301076717434
         """
         d = {
-            "agent": self.agent.to_dict(add_edsl_version=add_edsl_version),
-            "survey": self.survey.to_dict(add_edsl_version=add_edsl_version),
-            "scenario": self.scenario.to_dict(add_edsl_version=add_edsl_version),
-            "model": self.model.to_dict(add_edsl_version=add_edsl_version),
+            "agent": self.agent._to_dict(),
+            "survey": self.survey._to_dict(),
+            "scenario": self.scenario._to_dict(),
+            "model": self.model._to_dict(),
             "iteration": self.iteration,
             "exceptions": {},
         }
@@ -202,11 +202,11 @@ class Interview:
     def __hash__(self) -> int:
         from edsl.utilities.utilities import dict_hash
-        return dict_hash(self.to_dict(include_exceptions=False, add_edsl_version=False))
+        return dict_hash(self._to_dict(include_exceptions=False))
     def __eq__(self, other: "Interview") -> bool:
         """
-        >>> from edsl.jobs.interviews.Interview import Interview; i = Interview.example(); d = i.to_dict(); i2 = Interview.from_dict(d); i == i2
+        >>> from edsl.jobs.interviews.Interview import Interview; i = Interview.example(); d = i._to_dict(); i2 = Interview.from_dict(d); i == i2
         True
         """
         return hash(self) == hash(other)

edsl/jobs/runners/JobsRunnerAsyncio.py CHANGED Viewed

@@ -2,14 +2,13 @@ from __future__ import annotations
 import time
 import asyncio
 import threading
-import warnings
-from typing import Coroutine, List, AsyncGenerator, Optional, Union, Generator, Type
-from uuid import UUID
+from typing import Coroutine, List, AsyncGenerator, Optional, Union, Generator
+from contextlib import contextmanager
 from collections import UserList
 from edsl.results.Results import Results
 from edsl.jobs.interviews.Interview import Interview
-from edsl.jobs.runners.JobsRunnerStatus import JobsRunnerStatus, JobsRunnerStatusBase
+from edsl.jobs.runners.JobsRunnerStatus import JobsRunnerStatus
 from edsl.jobs.tasks.TaskHistory import TaskHistory
 from edsl.jobs.buckets.BucketCollection import BucketCollection
@@ -37,61 +36,11 @@ class JobsRunnerAsyncio:
     The Jobs object is a collection of interviews that are to be run.
     """
-    MAX_CONCURRENT_DEFAULT = 500
     def __init__(self, jobs: "Jobs"):
         self.jobs = jobs
         self.interviews: List["Interview"] = jobs.interviews()
         self.bucket_collection: "BucketCollection" = jobs.bucket_collection
         self.total_interviews: List["Interview"] = []
-        self._initialized = threading.Event()
-        from edsl.config import CONFIG
-        self.MAX_CONCURRENT = int(CONFIG.get("EDSL_MAX_CONCURRENT_TASKS"))
-        # print(f"MAX_CONCURRENT: {self.MAX_CONCURRENT}")
-    # async def run_async_generator(
-    #     self,
-    #     cache: Cache,
-    #     n: int = 1,
-    #     stop_on_exception: bool = False,
-    #     sidecar_model: Optional[LanguageModel] = None,
-    #     total_interviews: Optional[List["Interview"]] = None,
-    #     raise_validation_errors: bool = False,
-    # ) -> AsyncGenerator["Result", None]:
-    #     """Creates the tasks, runs them asynchronously, and returns the results as a Results object.
-    #     Completed tasks are yielded as they are completed.
-    #     :param n: how many times to run each interview
-    #     :param stop_on_exception: Whether to stop the interview if an exception is raised
-    #     :param sidecar_model: a language model to use in addition to the interview's model
-    #     :param total_interviews: A list of interviews to run can be provided instead.
-    #     :param raise_validation_errors: Whether to raise validation errors
-    #     """
-    #     tasks = []
-    #     if total_interviews:  # was already passed in total interviews
-    #         self.total_interviews = total_interviews
-    #     else:
-    #         self.total_interviews = list(
-    #             self._populate_total_interviews(n=n)
-    #         )  # Populate self.total_interviews before creating tasks
-    #     self._initialized.set()  # Signal that we're ready
-    #     for interview in self.total_interviews:
-    #         interviewing_task = self._build_interview_task(
-    #             interview=interview,
-    #             stop_on_exception=stop_on_exception,
-    #             sidecar_model=sidecar_model,
-    #             raise_validation_errors=raise_validation_errors,
-    #         )
-    #         tasks.append(asyncio.create_task(interviewing_task))
-    #     for task in asyncio.as_completed(tasks):
-    #         result = await task
-    #         self.jobs_runner_status.add_completed_interview(result)
-    #         yield result
     async def run_async_generator(
         self,
@@ -102,10 +51,9 @@ class JobsRunnerAsyncio:
         total_interviews: Optional[List["Interview"]] = None,
         raise_validation_errors: bool = False,
     ) -> AsyncGenerator["Result", None]:
-        """Creates and processes tasks asynchronously, yielding results as they complete.
+        """Creates the tasks, runs them asynchronously, and returns the results as a Results object.
-        Tasks are created and processed in a streaming fashion rather than building the full list upfront.
-        Results are yielded as soon as they are available.
+        Completed tasks are yielded as they are completed.
         :param n: how many times to run each interview
         :param stop_on_exception: Whether to stop the interview if an exception is raised
@@ -113,70 +61,27 @@ class JobsRunnerAsyncio:
         :param total_interviews: A list of interviews to run can be provided instead.
         :param raise_validation_errors: Whether to raise validation errors
         """
-        # Initialize interviews iterator
-        if total_interviews:
-            interviews_iter = iter(total_interviews)
+        tasks = []
+        if total_interviews:  # was already passed in total interviews
             self.total_interviews = total_interviews
         else:
-            interviews_iter = self._populate_total_interviews(n=n)
-            self.total_interviews = list(interviews_iter)
-            interviews_iter = iter(self.total_interviews)  # Create fresh iterator
-        self._initialized.set()  # Signal that we're ready
+            self.total_interviews = list(
+                self._populate_total_interviews(n=n)
+            )  # Populate self.total_interviews before creating tasks
-        # Keep track of active tasks
-        active_tasks = set()
+        for interview in self.total_interviews:
+            interviewing_task = self._build_interview_task(
+                interview=interview,
+                stop_on_exception=stop_on_exception,
+                sidecar_model=sidecar_model,
+                raise_validation_errors=raise_validation_errors,
+            )
+            tasks.append(asyncio.create_task(interviewing_task))
-        try:
-            while True:
-                # Add new tasks if we're below max_concurrent and there are more interviews
-                while len(active_tasks) < self.MAX_CONCURRENT:
-                    try:
-                        interview = next(interviews_iter)
-                        task = asyncio.create_task(
-                            self._build_interview_task(
-                                interview=interview,
-                                stop_on_exception=stop_on_exception,
-                                sidecar_model=sidecar_model,
-                                raise_validation_errors=raise_validation_errors,
-                            )
-                        )
-                        active_tasks.add(task)
-                        # Add callback to remove task from set when done
-                        task.add_done_callback(active_tasks.discard)
-                    except StopIteration:
-                        break
-                if not active_tasks:
-                    break
-                # Wait for next completed task
-                done, _ = await asyncio.wait(
-                    active_tasks, return_when=asyncio.FIRST_COMPLETED
-                )
-                # Process completed tasks
-                for task in done:
-                    try:
-                        result = await task
-                        self.jobs_runner_status.add_completed_interview(result)
-                        yield result
-                    except Exception as e:
-                        if stop_on_exception:
-                            # Cancel remaining tasks
-                            for t in active_tasks:
-                                if not t.done():
-                                    t.cancel()
-                            raise
-                        else:
-                            # Log error and continue
-                            # logger.error(f"Task failed with error: {e}")
-                            continue
-        finally:
-            # Ensure we cancel any remaining tasks if we exit early
-            for task in active_tasks:
-                if not task.done():
-                    task.cancel()
+        for task in asyncio.as_completed(tasks):
+            result = await task
+            self.jobs_runner_status.add_completed_interview(result)
+            yield result
     def _populate_total_interviews(
         self, n: int = 1
@@ -337,25 +242,11 @@ class JobsRunnerAsyncio:
             if len(results.task_history.indices) > 5:
                 msg += f"Exceptions were raised in the following interviews: {results.task_history.indices}.\n"
-            import sys
-            print(msg, file=sys.stderr)
-            from edsl.config import CONFIG
-            if CONFIG.get("EDSL_OPEN_EXCEPTION_REPORT_URL") == "True":
-                open_in_browser = True
-            elif CONFIG.get("EDSL_OPEN_EXCEPTION_REPORT_URL") == "False":
-                open_in_browser = False
-            else:
-                raise Exception(
-                    "EDSL_OPEN_EXCEPTION_REPORT_URL", "must be either True or False"
-                )
-            # print("open_in_browser", open_in_browser)
+            print(msg)
+            # this is where exceptions are opening up
             filepath = results.task_history.html(
                 cta="Open report to see details.",
-                open_in_browser=open_in_browser,
+                open_in_browser=True,
                 return_link=True,
             )
@@ -384,8 +275,6 @@ class JobsRunnerAsyncio:
         stop_on_exception: bool = False,
         progress_bar: bool = False,
         sidecar_model: Optional[LanguageModel] = None,
-        jobs_runner_status: Optional[Type[JobsRunnerStatusBase]] = None,
-        job_uuid: Optional[UUID] = None,
         print_exceptions: bool = True,
         raise_validation_errors: bool = False,
     ) -> "Coroutine":
@@ -397,19 +286,7 @@ class JobsRunnerAsyncio:
         self.cache = cache
         self.sidecar_model = sidecar_model
-        from edsl.coop import Coop
-        coop = Coop()
-        endpoint_url = coop.get_progress_bar_url()
-        if jobs_runner_status is not None:
-            self.jobs_runner_status = jobs_runner_status(
-                self, n=n, endpoint_url=endpoint_url, job_uuid=job_uuid
-            )
-        else:
-            self.jobs_runner_status = JobsRunnerStatus(
-                self, n=n, endpoint_url=endpoint_url, job_uuid=job_uuid
-            )
+        self.jobs_runner_status = JobsRunnerStatus(self, n=n)
         stop_event = threading.Event()
@@ -429,16 +306,11 @@ class JobsRunnerAsyncio:
             """Runs the progress bar in a separate thread."""
             self.jobs_runner_status.update_progress(stop_event)
-        if progress_bar and self.jobs_runner_status.has_ep_api_key():
-            self.jobs_runner_status.setup()
+        if progress_bar:
             progress_thread = threading.Thread(
                 target=run_progress_bar, args=(stop_event,)
             )
             progress_thread.start()
-        elif progress_bar:
-            warnings.warn(
-                "You need an Expected Parrot API key to view job progress bars."
-            )
         exception_to_raise = None
         try:
@@ -453,7 +325,7 @@ class JobsRunnerAsyncio:
             stop_event.set()
         finally:
             stop_event.set()
-            if progress_bar and self.jobs_runner_status.has_ep_api_key():
+            if progress_bar:
                 # self.jobs_runner_status.stop_event.set()
                 if progress_thread:
                     progress_thread.join()

edsl 0.1.38__py3-none-any.whl → 0.1.38.dev1__py3-none-any.whl

edsl 0.1.38py3-none-any.whl → 0.1.38.dev1py3-none-any.whl