PyPI - edsl - Versions diffs - 0.1.15__py3-none-any.whl → 0.1.40__py3-none-any.whl - Mend

edsl 0.1.15py3-none-any.whl → 0.1.40py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (407) hide show

edsl/Base.py +348 -38
edsl/BaseDiff.py +260 -0
edsl/TemplateLoader.py +24 -0
edsl/__init__.py +45 -10
edsl/__version__.py +1 -1
edsl/agents/Agent.py +842 -144
edsl/agents/AgentList.py +521 -25
edsl/agents/Invigilator.py +250 -374
edsl/agents/InvigilatorBase.py +257 -0
edsl/agents/PromptConstructor.py +272 -0
edsl/agents/QuestionInstructionPromptBuilder.py +128 -0
edsl/agents/QuestionTemplateReplacementsBuilder.py +137 -0
edsl/agents/descriptors.py +43 -13
edsl/agents/prompt_helpers.py +129 -0
edsl/agents/question_option_processor.py +172 -0
edsl/auto/AutoStudy.py +130 -0
edsl/auto/StageBase.py +243 -0
edsl/auto/StageGenerateSurvey.py +178 -0
edsl/auto/StageLabelQuestions.py +125 -0
edsl/auto/StagePersona.py +61 -0
edsl/auto/StagePersonaDimensionValueRanges.py +88 -0
edsl/auto/StagePersonaDimensionValues.py +74 -0
edsl/auto/StagePersonaDimensions.py +69 -0
edsl/auto/StageQuestions.py +74 -0
edsl/auto/SurveyCreatorPipeline.py +21 -0
edsl/auto/utilities.py +218 -0
edsl/base/Base.py +279 -0
edsl/config.py +115 -113
edsl/conversation/Conversation.py +290 -0
edsl/conversation/car_buying.py +59 -0
edsl/conversation/chips.py +95 -0
edsl/conversation/mug_negotiation.py +81 -0
edsl/conversation/next_speaker_utilities.py +93 -0
edsl/coop/CoopFunctionsMixin.py +15 -0
edsl/coop/ExpectedParrotKeyHandler.py +125 -0
edsl/coop/PriceFetcher.py +54 -0
edsl/coop/__init__.py +1 -0
edsl/coop/coop.py +1029 -134
edsl/coop/utils.py +131 -0
edsl/data/Cache.py +560 -89
edsl/data/CacheEntry.py +230 -0
edsl/data/CacheHandler.py +168 -0
edsl/data/RemoteCacheSync.py +186 -0
edsl/data/SQLiteDict.py +292 -0
edsl/data/__init__.py +5 -3
edsl/data/orm.py +6 -33
edsl/data_transfer_models.py +74 -27
edsl/enums.py +165 -8
edsl/exceptions/BaseException.py +21 -0
edsl/exceptions/__init__.py +52 -46
edsl/exceptions/agents.py +33 -15
edsl/exceptions/cache.py +5 -0
edsl/exceptions/coop.py +8 -0
edsl/exceptions/general.py +34 -0
edsl/exceptions/inference_services.py +5 -0
edsl/exceptions/jobs.py +15 -0
edsl/exceptions/language_models.py +46 -1
edsl/exceptions/questions.py +80 -5
edsl/exceptions/results.py +16 -5
edsl/exceptions/scenarios.py +29 -0
edsl/exceptions/surveys.py +13 -10
edsl/inference_services/AnthropicService.py +106 -0
edsl/inference_services/AvailableModelCacheHandler.py +184 -0
edsl/inference_services/AvailableModelFetcher.py +215 -0
edsl/inference_services/AwsBedrock.py +118 -0
edsl/inference_services/AzureAI.py +215 -0
edsl/inference_services/DeepInfraService.py +18 -0
edsl/inference_services/GoogleService.py +143 -0
edsl/inference_services/GroqService.py +20 -0
edsl/inference_services/InferenceServiceABC.py +80 -0
edsl/inference_services/InferenceServicesCollection.py +138 -0
edsl/inference_services/MistralAIService.py +120 -0
edsl/inference_services/OllamaService.py +18 -0
edsl/inference_services/OpenAIService.py +236 -0
edsl/inference_services/PerplexityService.py +160 -0
edsl/inference_services/ServiceAvailability.py +135 -0
edsl/inference_services/TestService.py +90 -0
edsl/inference_services/TogetherAIService.py +172 -0
edsl/inference_services/data_structures.py +134 -0
edsl/inference_services/models_available_cache.py +118 -0
edsl/inference_services/rate_limits_cache.py +25 -0
edsl/inference_services/registry.py +41 -0
edsl/inference_services/write_available.py +10 -0
edsl/jobs/AnswerQuestionFunctionConstructor.py +223 -0
edsl/jobs/Answers.py +21 -20
edsl/jobs/FetchInvigilator.py +47 -0
edsl/jobs/InterviewTaskManager.py +98 -0
edsl/jobs/InterviewsConstructor.py +50 -0
edsl/jobs/Jobs.py +684 -206
edsl/jobs/JobsChecks.py +172 -0
edsl/jobs/JobsComponentConstructor.py +189 -0
edsl/jobs/JobsPrompts.py +270 -0
edsl/jobs/JobsRemoteInferenceHandler.py +311 -0
edsl/jobs/JobsRemoteInferenceLogger.py +239 -0
edsl/jobs/RequestTokenEstimator.py +30 -0
edsl/jobs/async_interview_runner.py +138 -0
edsl/jobs/buckets/BucketCollection.py +104 -0
edsl/jobs/buckets/ModelBuckets.py +65 -0
edsl/jobs/buckets/TokenBucket.py +283 -0
edsl/jobs/buckets/TokenBucketAPI.py +211 -0
edsl/jobs/buckets/TokenBucketClient.py +191 -0
edsl/jobs/check_survey_scenario_compatibility.py +85 -0
edsl/jobs/data_structures.py +120 -0
edsl/jobs/decorators.py +35 -0
edsl/jobs/interviews/Interview.py +392 -0
edsl/jobs/interviews/InterviewExceptionCollection.py +99 -0
edsl/jobs/interviews/InterviewExceptionEntry.py +186 -0
edsl/jobs/interviews/InterviewStatistic.py +63 -0
edsl/jobs/interviews/InterviewStatisticsCollection.py +25 -0
edsl/jobs/interviews/InterviewStatusDictionary.py +78 -0
edsl/jobs/interviews/InterviewStatusLog.py +92 -0
edsl/jobs/interviews/ReportErrors.py +66 -0
edsl/jobs/interviews/interview_status_enum.py +9 -0
edsl/jobs/jobs_status_enums.py +9 -0
edsl/jobs/loggers/HTMLTableJobLogger.py +304 -0
edsl/jobs/results_exceptions_handler.py +98 -0
edsl/jobs/runners/JobsRunnerAsyncio.py +151 -110
edsl/jobs/runners/JobsRunnerStatus.py +298 -0
edsl/jobs/tasks/QuestionTaskCreator.py +244 -0
edsl/jobs/tasks/TaskCreators.py +64 -0
edsl/jobs/tasks/TaskHistory.py +470 -0
edsl/jobs/tasks/TaskStatusLog.py +23 -0
edsl/jobs/tasks/task_status_enum.py +161 -0
edsl/jobs/tokens/InterviewTokenUsage.py +27 -0
edsl/jobs/tokens/TokenUsage.py +34 -0
edsl/language_models/ComputeCost.py +63 -0
edsl/language_models/LanguageModel.py +507 -386
edsl/language_models/ModelList.py +164 -0
edsl/language_models/PriceManager.py +127 -0
edsl/language_models/RawResponseHandler.py +106 -0
edsl/language_models/RegisterLanguageModelsMeta.py +184 -0
edsl/language_models/__init__.py +1 -8
edsl/language_models/fake_openai_call.py +15 -0
edsl/language_models/fake_openai_service.py +61 -0
edsl/language_models/key_management/KeyLookup.py +63 -0
edsl/language_models/key_management/KeyLookupBuilder.py +273 -0
edsl/language_models/key_management/KeyLookupCollection.py +38 -0
edsl/language_models/key_management/__init__.py +0 -0
edsl/language_models/key_management/models.py +131 -0
edsl/language_models/model.py +256 -0
edsl/language_models/repair.py +109 -41
edsl/language_models/utilities.py +65 -0
edsl/notebooks/Notebook.py +263 -0
edsl/notebooks/NotebookToLaTeX.py +142 -0
edsl/notebooks/__init__.py +1 -0
edsl/prompts/Prompt.py +222 -93
edsl/prompts/__init__.py +1 -1
edsl/questions/ExceptionExplainer.py +77 -0
edsl/questions/HTMLQuestion.py +103 -0
edsl/questions/QuestionBase.py +518 -0
edsl/questions/QuestionBasePromptsMixin.py +221 -0
edsl/questions/QuestionBudget.py +164 -67
edsl/questions/QuestionCheckBox.py +281 -62
edsl/questions/QuestionDict.py +343 -0
edsl/questions/QuestionExtract.py +136 -50
edsl/questions/QuestionFreeText.py +79 -55
edsl/questions/QuestionFunctional.py +138 -41
edsl/questions/QuestionList.py +184 -57
edsl/questions/QuestionMatrix.py +265 -0
edsl/questions/QuestionMultipleChoice.py +293 -69
edsl/questions/QuestionNumerical.py +109 -56
edsl/questions/QuestionRank.py +244 -49
edsl/questions/Quick.py +41 -0
edsl/questions/SimpleAskMixin.py +74 -0
edsl/questions/__init__.py +9 -6
edsl/questions/{AnswerValidatorMixin.py → answer_validator_mixin.py} +153 -38
edsl/questions/compose_questions.py +13 -7
edsl/questions/data_structures.py +20 -0
edsl/questions/decorators.py +21 -0
edsl/questions/derived/QuestionLikertFive.py +28 -26
edsl/questions/derived/QuestionLinearScale.py +41 -28
edsl/questions/derived/QuestionTopK.py +34 -26
edsl/questions/derived/QuestionYesNo.py +40 -27
edsl/questions/descriptors.py +228 -74
edsl/questions/loop_processor.py +149 -0
edsl/questions/prompt_templates/question_budget.jinja +13 -0
edsl/questions/prompt_templates/question_checkbox.jinja +32 -0
edsl/questions/prompt_templates/question_extract.jinja +11 -0
edsl/questions/prompt_templates/question_free_text.jinja +3 -0
edsl/questions/prompt_templates/question_linear_scale.jinja +11 -0
edsl/questions/prompt_templates/question_list.jinja +17 -0
edsl/questions/prompt_templates/question_multiple_choice.jinja +33 -0
edsl/questions/prompt_templates/question_numerical.jinja +37 -0
edsl/questions/question_base_gen_mixin.py +168 -0
edsl/questions/question_registry.py +130 -46
edsl/questions/register_questions_meta.py +71 -0
edsl/questions/response_validator_abc.py +188 -0
edsl/questions/response_validator_factory.py +34 -0
edsl/questions/settings.py +5 -2
edsl/questions/templates/__init__.py +0 -0
edsl/questions/templates/budget/__init__.py +0 -0
edsl/questions/templates/budget/answering_instructions.jinja +7 -0
edsl/questions/templates/budget/question_presentation.jinja +7 -0
edsl/questions/templates/checkbox/__init__.py +0 -0
edsl/questions/templates/checkbox/answering_instructions.jinja +10 -0
edsl/questions/templates/checkbox/question_presentation.jinja +22 -0
edsl/questions/templates/dict/__init__.py +0 -0
edsl/questions/templates/dict/answering_instructions.jinja +21 -0
edsl/questions/templates/dict/question_presentation.jinja +1 -0
edsl/questions/templates/extract/__init__.py +0 -0
edsl/questions/templates/extract/answering_instructions.jinja +7 -0
edsl/questions/templates/extract/question_presentation.jinja +1 -0
edsl/questions/templates/free_text/__init__.py +0 -0
edsl/questions/templates/free_text/answering_instructions.jinja +0 -0
edsl/questions/templates/free_text/question_presentation.jinja +1 -0
edsl/questions/templates/likert_five/__init__.py +0 -0
edsl/questions/templates/likert_five/answering_instructions.jinja +10 -0
edsl/questions/templates/likert_five/question_presentation.jinja +12 -0
edsl/questions/templates/linear_scale/__init__.py +0 -0
edsl/questions/templates/linear_scale/answering_instructions.jinja +5 -0
edsl/questions/templates/linear_scale/question_presentation.jinja +5 -0
edsl/questions/templates/list/__init__.py +0 -0
edsl/questions/templates/list/answering_instructions.jinja +4 -0
edsl/questions/templates/list/question_presentation.jinja +5 -0
edsl/questions/templates/matrix/__init__.py +1 -0
edsl/questions/templates/matrix/answering_instructions.jinja +5 -0
edsl/questions/templates/matrix/question_presentation.jinja +20 -0
edsl/questions/templates/multiple_choice/__init__.py +0 -0
edsl/questions/templates/multiple_choice/answering_instructions.jinja +9 -0
edsl/questions/templates/multiple_choice/html.jinja +0 -0
edsl/questions/templates/multiple_choice/question_presentation.jinja +12 -0
edsl/questions/templates/numerical/__init__.py +0 -0
edsl/questions/templates/numerical/answering_instructions.jinja +7 -0
edsl/questions/templates/numerical/question_presentation.jinja +7 -0
edsl/questions/templates/rank/__init__.py +0 -0
edsl/questions/templates/rank/answering_instructions.jinja +11 -0
edsl/questions/templates/rank/question_presentation.jinja +15 -0
edsl/questions/templates/top_k/__init__.py +0 -0
edsl/questions/templates/top_k/answering_instructions.jinja +8 -0
edsl/questions/templates/top_k/question_presentation.jinja +22 -0
edsl/questions/templates/yes_no/__init__.py +0 -0
edsl/questions/templates/yes_no/answering_instructions.jinja +6 -0
edsl/questions/templates/yes_no/question_presentation.jinja +12 -0
edsl/results/CSSParameterizer.py +108 -0
edsl/results/Dataset.py +550 -19
edsl/results/DatasetExportMixin.py +594 -0
edsl/results/DatasetTree.py +295 -0
edsl/results/MarkdownToDocx.py +122 -0
edsl/results/MarkdownToPDF.py +111 -0
edsl/results/Result.py +477 -173
edsl/results/Results.py +987 -269
edsl/results/ResultsExportMixin.py +28 -125
edsl/results/ResultsGGMixin.py +83 -15
edsl/results/TableDisplay.py +125 -0
edsl/results/TextEditor.py +50 -0
edsl/results/__init__.py +1 -1
edsl/results/file_exports.py +252 -0
edsl/results/results_fetch_mixin.py +33 -0
edsl/results/results_selector.py +145 -0
edsl/results/results_tools_mixin.py +98 -0
edsl/results/smart_objects.py +96 -0
edsl/results/table_data_class.py +12 -0
edsl/results/table_display.css +78 -0
edsl/results/table_renderers.py +118 -0
edsl/results/tree_explore.py +115 -0
edsl/scenarios/ConstructDownloadLink.py +109 -0
edsl/scenarios/DocumentChunker.py +102 -0
edsl/scenarios/DocxScenario.py +16 -0
edsl/scenarios/FileStore.py +543 -0
edsl/scenarios/PdfExtractor.py +40 -0
edsl/scenarios/Scenario.py +431 -62
edsl/scenarios/ScenarioHtmlMixin.py +65 -0
edsl/scenarios/ScenarioList.py +1415 -45
edsl/scenarios/ScenarioListExportMixin.py +45 -0
edsl/scenarios/ScenarioListPdfMixin.py +239 -0
edsl/scenarios/__init__.py +2 -0
edsl/scenarios/directory_scanner.py +96 -0
edsl/scenarios/file_methods.py +85 -0
edsl/scenarios/handlers/__init__.py +13 -0
edsl/scenarios/handlers/csv.py +49 -0
edsl/scenarios/handlers/docx.py +76 -0
edsl/scenarios/handlers/html.py +37 -0
edsl/scenarios/handlers/json.py +111 -0
edsl/scenarios/handlers/latex.py +5 -0
edsl/scenarios/handlers/md.py +51 -0
edsl/scenarios/handlers/pdf.py +68 -0
edsl/scenarios/handlers/png.py +39 -0
edsl/scenarios/handlers/pptx.py +105 -0
edsl/scenarios/handlers/py.py +294 -0
edsl/scenarios/handlers/sql.py +313 -0
edsl/scenarios/handlers/sqlite.py +149 -0
edsl/scenarios/handlers/txt.py +33 -0
edsl/scenarios/scenario_join.py +131 -0
edsl/scenarios/scenario_selector.py +156 -0
edsl/shared.py +1 -0
edsl/study/ObjectEntry.py +173 -0
edsl/study/ProofOfWork.py +113 -0
edsl/study/SnapShot.py +80 -0
edsl/study/Study.py +521 -0
edsl/study/__init__.py +4 -0
edsl/surveys/ConstructDAG.py +92 -0
edsl/surveys/DAG.py +92 -11
edsl/surveys/EditSurvey.py +221 -0
edsl/surveys/InstructionHandler.py +100 -0
edsl/surveys/Memory.py +9 -4
edsl/surveys/MemoryManagement.py +72 -0
edsl/surveys/MemoryPlan.py +156 -35
edsl/surveys/Rule.py +221 -74
edsl/surveys/RuleCollection.py +241 -61
edsl/surveys/RuleManager.py +172 -0
edsl/surveys/Simulator.py +75 -0
edsl/surveys/Survey.py +1079 -339
edsl/surveys/SurveyCSS.py +273 -0
edsl/surveys/SurveyExportMixin.py +235 -40
edsl/surveys/SurveyFlowVisualization.py +181 -0
edsl/surveys/SurveyQualtricsImport.py +284 -0
edsl/surveys/SurveyToApp.py +141 -0
edsl/surveys/__init__.py +4 -2
edsl/surveys/base.py +19 -3
edsl/surveys/descriptors.py +17 -6
edsl/surveys/instructions/ChangeInstruction.py +48 -0
edsl/surveys/instructions/Instruction.py +56 -0
edsl/surveys/instructions/InstructionCollection.py +82 -0
edsl/surveys/instructions/__init__.py +0 -0
edsl/templates/error_reporting/base.html +24 -0
edsl/templates/error_reporting/exceptions_by_model.html +35 -0
edsl/templates/error_reporting/exceptions_by_question_name.html +17 -0
edsl/templates/error_reporting/exceptions_by_type.html +17 -0
edsl/templates/error_reporting/interview_details.html +116 -0
edsl/templates/error_reporting/interviews.html +19 -0
edsl/templates/error_reporting/overview.html +5 -0
edsl/templates/error_reporting/performance_plot.html +2 -0
edsl/templates/error_reporting/report.css +74 -0
edsl/templates/error_reporting/report.html +118 -0
edsl/templates/error_reporting/report.js +25 -0
edsl/tools/__init__.py +1 -0
edsl/tools/clusters.py +192 -0
edsl/tools/embeddings.py +27 -0
edsl/tools/embeddings_plotting.py +118 -0
edsl/tools/plotting.py +112 -0
edsl/tools/summarize.py +18 -0
edsl/utilities/PrettyList.py +56 -0
edsl/utilities/SystemInfo.py +5 -0
edsl/utilities/__init__.py +21 -20
edsl/utilities/ast_utilities.py +3 -0
edsl/utilities/data/Registry.py +2 -0
edsl/utilities/decorators.py +41 -0
edsl/utilities/gcp_bucket/__init__.py +0 -0
edsl/utilities/gcp_bucket/cloud_storage.py +96 -0
edsl/utilities/interface.py +310 -60
edsl/utilities/is_notebook.py +18 -0
edsl/utilities/is_valid_variable_name.py +11 -0
edsl/utilities/naming_utilities.py +263 -0
edsl/utilities/remove_edsl_version.py +24 -0
edsl/utilities/repair_functions.py +28 -0
edsl/utilities/restricted_python.py +70 -0
edsl/utilities/utilities.py +203 -13
edsl-0.1.40.dist-info/METADATA +111 -0
edsl-0.1.40.dist-info/RECORD +362 -0
{edsl-0.1.15.dist-info → edsl-0.1.40.dist-info}/WHEEL +1 -1
edsl/agents/AgentListExportMixin.py +0 -24
edsl/coop/old.py +0 -31
edsl/data/Database.py +0 -141
edsl/data/crud.py +0 -121
edsl/jobs/Interview.py +0 -435
edsl/jobs/JobsRunner.py +0 -63
edsl/jobs/JobsRunnerStatusMixin.py +0 -115
edsl/jobs/base.py +0 -47
edsl/jobs/buckets.py +0 -178
edsl/jobs/runners/JobsRunnerDryRun.py +0 -19
edsl/jobs/runners/JobsRunnerStreaming.py +0 -54
edsl/jobs/task_management.py +0 -215
edsl/jobs/token_tracking.py +0 -78
edsl/language_models/DeepInfra.py +0 -69
edsl/language_models/OpenAI.py +0 -98
edsl/language_models/model_interfaces/GeminiPro.py +0 -66
edsl/language_models/model_interfaces/LanguageModelOpenAIFour.py +0 -8
edsl/language_models/model_interfaces/LanguageModelOpenAIThreeFiveTurbo.py +0 -8
edsl/language_models/model_interfaces/LlamaTwo13B.py +0 -21
edsl/language_models/model_interfaces/LlamaTwo70B.py +0 -21
edsl/language_models/model_interfaces/Mixtral8x7B.py +0 -24
edsl/language_models/registry.py +0 -81
edsl/language_models/schemas.py +0 -15
edsl/language_models/unused/ReplicateBase.py +0 -83
edsl/prompts/QuestionInstructionsBase.py +0 -6
edsl/prompts/library/agent_instructions.py +0 -29
edsl/prompts/library/agent_persona.py +0 -17
edsl/prompts/library/question_budget.py +0 -26
edsl/prompts/library/question_checkbox.py +0 -32
edsl/prompts/library/question_extract.py +0 -19
edsl/prompts/library/question_freetext.py +0 -14
edsl/prompts/library/question_linear_scale.py +0 -20
edsl/prompts/library/question_list.py +0 -22
edsl/prompts/library/question_multiple_choice.py +0 -44
edsl/prompts/library/question_numerical.py +0 -31
edsl/prompts/library/question_rank.py +0 -21
edsl/prompts/prompt_config.py +0 -33
edsl/prompts/registry.py +0 -185
edsl/questions/Question.py +0 -240
edsl/report/InputOutputDataTypes.py +0 -134
edsl/report/RegressionMixin.py +0 -28
edsl/report/ReportOutputs.py +0 -1228
edsl/report/ResultsFetchMixin.py +0 -106
edsl/report/ResultsOutputMixin.py +0 -14
edsl/report/demo.ipynb +0 -645
edsl/results/ResultsDBMixin.py +0 -184
edsl/surveys/SurveyFlowVisualizationMixin.py +0 -92
edsl/trackers/Tracker.py +0 -91
edsl/trackers/TrackerAPI.py +0 -196
edsl/trackers/TrackerTasks.py +0 -70
edsl/utilities/pastebin.py +0 -141
edsl-0.1.15.dist-info/METADATA +0 -69
edsl-0.1.15.dist-info/RECORD +0 -142
/edsl/{language_models/model_interfaces → inference_services}/__init__.py +0 -0
/edsl/{report/__init__.py → jobs/runners/JobsRunnerStatusData.py} +0 -0
/edsl/{trackers/__init__.py → language_models/ServiceDataSources.py} +0 -0
{edsl-0.1.15.dist-info → edsl-0.1.40.dist-info}/LICENSE +0 -0

edsl/jobs/results_exceptions_handler.py ADDED Viewed

@@ -0,0 +1,98 @@
+from typing import Optional, TYPE_CHECKING, Protocol
+import sys
+from edsl.scenarios.FileStore import HTMLFileStore
+from edsl.config import CONFIG
+from edsl.coop.coop import Coop
+class ResultsProtocol(Protocol):
+    """Protocol defining the required interface for Results objects."""
+    @property
+    def has_unfixed_exceptions(self) -> bool: ...
+    @property
+    def task_history(self) -> "TaskHistoryProtocol": ...
+class TaskHistoryProtocol(Protocol):
+    """Protocol defining the required interface for TaskHistory objects."""
+    @property
+    def indices(self) -> list: ...
+    def html(self, cta: str, open_in_browser: bool, return_link: bool) -> str: ...
+class RunParametersProtocol(Protocol):
+    """Protocol defining the required interface for RunParameters objects."""
+    @property
+    def print_exceptions(self) -> bool: ...
+class ResultsExceptionsHandler:
+    """Handles exception reporting and display functionality."""
+    def __init__(
+        self, results: ResultsProtocol, parameters: RunParametersProtocol
+    ) -> None:
+        self.results = results
+        self.parameters = parameters
+        self.open_in_browser = self._get_browser_setting()
+        self.remote_logging = self._get_remote_logging_setting()
+    def _get_browser_setting(self) -> bool:
+        """Determine if exceptions should be opened in browser based on config."""
+        setting = CONFIG.get("EDSL_OPEN_EXCEPTION_REPORT_URL")
+        if setting == "True":
+            return True
+        elif setting == "False":
+            return False
+        else:
+            raise Exception(
+                "EDSL_OPEN_EXCEPTION_REPORT_URL must be either True or False"
+            )
+    def _get_remote_logging_setting(self) -> bool:
+        """Get remote logging setting from coop."""
+        try:
+            coop = Coop()
+            return coop.edsl_settings["remote_logging"]
+        except Exception as e:
+            # print(e)
+            return False
+    def _generate_error_message(self, indices) -> str:
+        """Generate appropriate error message based on number of exceptions."""
+        msg = f"Exceptions were raised in {len(indices)} interviews.\n"
+        if len(indices) > 5:
+            msg += f"Exceptions were raised in the following interviews: {indices}.\n"
+        return msg
+    def handle_exceptions(self) -> None:
+        """Handle exceptions by printing messages and generating reports as needed."""
+        if not (
+            self.results.has_unfixed_exceptions and self.parameters.print_exceptions
+        ):
+            return
+        # Print error message
+        error_msg = self._generate_error_message(self.results.task_history.indices)
+        print(error_msg, file=sys.stderr)
+        # Generate HTML report
+        filepath = self.results.task_history.html(
+            cta="Open report to see details.",
+            open_in_browser=self.open_in_browser,
+            return_link=True,
+        )
+        # Handle remote logging if enabled
+        if self.remote_logging:
+            filestore = HTMLFileStore(filepath)
+            coop_details = filestore.push(description="Error report")
+            print(coop_details)
+        print("Also see: https://docs.expectedparrot.com/en/latest/exceptions.html")

edsl/jobs/runners/JobsRunnerAsyncio.py CHANGED Viewed

@@ -1,122 +1,163 @@
+from __future__ import annotations
 import time
 import asyncio
-from typing import Coroutine, List, AsyncGenerator
+import threading
+import warnings
+from typing import TYPE_CHECKING
-from rich.live import Live
-from rich.console import Console
-from edsl.results import Results, Result
-from edsl.jobs.JobsRunner import JobsRunner
-from edsl.jobs.Interview import Interview
+from edsl.results.Results import Results
+from edsl.jobs.runners.JobsRunnerStatus import JobsRunnerStatus
+from edsl.jobs.tasks.TaskHistory import TaskHistory
 from edsl.utilities.decorators import jupyter_nb_handler
+from edsl.jobs.async_interview_runner import AsyncInterviewRunner
+from edsl.jobs.data_structures import RunEnvironment, RunParameters, RunConfig
-from edsl.jobs.JobsRunnerStatusMixin import JobsRunnerStatusMixin
-class JobsRunnerAsyncio(JobsRunner, JobsRunnerStatusMixin):
-    runner_name = "asyncio"
-    async def run_async(
-        self, n=1, verbose=False, sleep=0, debug=False, progress_bar=False
-    ) -> AsyncGenerator[Result, None]:
-        """Creates the tasks, runs them asynchronously, and returns the results as a Results object.
-        Completed tasks are yielded as they are completed.
-        """
-        tasks = self._create_all_interview_tasks(self.interviews, debug)
-        for task in asyncio.as_completed(tasks):
-            result = await task
-            yield result
-    def _create_all_interview_tasks(self, interviews, debug) -> List[asyncio.Task]:
-        """Creates an awaitable task for each interview."""
-        tasks = []
-        for i, interview in enumerate(interviews):
-            interviewing_task = self._interview_task(interview, i, debug)
-            tasks.append(asyncio.create_task(interviewing_task))
-        return tasks
-    async def _interview_task(
-        self, interview: Interview, i: int, debug: bool
-    ) -> Result:
-        """Conducts an interview and returns the result."""
-        # the model buckets are used to track usage rates
-        model_buckets = self.bucket_collection[interview.model]
-        # get the results of the interview
-        answer, valid_results = await interview.async_conduct_interview(
-            debug=debug, model_buckets=model_buckets
-        )
-        # breakpoint()
-        # we should have a valid result for each question
-        answer_key_names = {k for k in set(answer.keys()) if not k.endswith("_comment")}
-        assert len(valid_results) == len(answer_key_names)
-        question_name_to_prompts = dict({})
-        for result in valid_results:
-            question_name = result["question_name"]
-            question_name_to_prompts[question_name] = {
-                "user_prompt": result["prompts"]["user_prompt"],
-                "system_prompt": result["prompts"]["system_prompt"],
-            }
-        prompt_dictionary = {}
-        for answer_key_name in answer_key_names:
-            prompt_dictionary[
-                answer_key_name + "_user_prompt"
-            ] = question_name_to_prompts[answer_key_name]["user_prompt"]
-            prompt_dictionary[
-                answer_key_name + "_system_prompt"
-            ] = question_name_to_prompts[answer_key_name]["system_prompt"]
-        raw_model_results_dictionary = {}
-        for result in valid_results:
-            question_name = result["question_name"]
-            raw_model_results_dictionary[
-                question_name + "_raw_model_response"
-            ] = result["raw_model_response"]
-        result = Result(
-            agent=interview.agent,
-            scenario=interview.scenario,
-            model=interview.model,
-            iteration=i,
-            answer=answer,
-            prompt=prompt_dictionary,
-            raw_model_response=raw_model_results_dictionary,
-        )
-        return result
+if TYPE_CHECKING:
+    from edsl.jobs.Jobs import Jobs
-    @jupyter_nb_handler
-    async def run(
-        self, n=1, verbose=True, sleep=0, debug=False, progress_bar=False
-    ) -> Coroutine:
-        """Runs a collection of interviews, handling both async and sync contexts."""
-        verbose = True
-        console = Console()
+class JobsRunnerAsyncio:
+    """A class for running a collection of interviews asynchronously.
+    It gets instaniated from a Jobs object.
+    The Jobs object is a collection of interviews that are to be run.
+    """
+    def __init__(self, jobs: "Jobs", environment: RunEnvironment):
+        self.jobs = jobs
+        self.environment = environment
+    def __len__(self):
+        return len(self.jobs)
+    async def run_async(self, parameters: RunParameters) -> Results:
+        """Used for some other modules that have a non-standard way of running interviews."""
+        self.environment.jobs_runner_status = JobsRunnerStatus(self, n=parameters.n)
         data = []
-        start_time = time.monotonic()
-        live = None
-        if progress_bar:
-            live = Live(
-                self._generate_status_table(data, 0),
-                console=console,
-                refresh_per_second=10,
-            )
-            live.__enter__()  # Manually enter the Live context
-        async for result in self.run_async(n, verbose, sleep, debug, progress_bar):
-            end_time = time.monotonic()
-            elapsed_time = end_time - start_time
+        task_history = TaskHistory(include_traceback=False)
+        run_config = RunConfig(parameters=parameters, environment=self.environment)
+        result_generator = AsyncInterviewRunner(self.jobs, run_config)
+        async for result, interview in result_generator.run():
             data.append(result)
+            task_history.add_interview(interview)
-            if progress_bar:
-                live.update(self._generate_status_table(data, elapsed_time))
+        results = Results(survey=self.jobs.survey, task_history=task_history, data=data)
-        if progress_bar:
-            live.update(self._generate_status_table(data, elapsed_time))
-            await asyncio.sleep(0.5)  # short delay to show the final status
-            live.__exit__(None, None, None)  # Manually exit the Live context
+        relevant_cache = results.relevant_cache(self.environment.cache)
+        return Results(
+            survey=self.jobs.survey,
+            task_history=task_history,
+            data=data,
+            cache=relevant_cache,
+        )
+    def simple_run(self):
+        data = asyncio.run(self.run_async())
         return Results(survey=self.jobs.survey, data=data)
+    @jupyter_nb_handler
+    async def run(self, parameters: RunParameters) -> Results:
+        """Runs a collection of interviews, handling both async and sync contexts."""
+        run_config = RunConfig(parameters=parameters, environment=self.environment)
+        self.start_time = time.monotonic()
+        self.completed = False
+        from edsl.coop import Coop
+        coop = Coop()
+        endpoint_url = coop.get_progress_bar_url()
+        def set_up_jobs_runner_status(jobs_runner_status):
+            if jobs_runner_status is not None:
+                return jobs_runner_status(
+                    self,
+                    n=parameters.n,
+                    endpoint_url=endpoint_url,
+                    job_uuid=parameters.job_uuid,
+                )
+            else:
+                return JobsRunnerStatus(
+                    self,
+                    n=parameters.n,
+                    endpoint_url=endpoint_url,
+                    job_uuid=parameters.job_uuid,
+                )
+        run_config.environment.jobs_runner_status = set_up_jobs_runner_status(
+            self.environment.jobs_runner_status
+        )
+        async def get_results(results) -> None:
+            """Conducted the interviews and append to the results list."""
+            result_generator = AsyncInterviewRunner(self.jobs, run_config)
+            async for result, interview in result_generator.run():
+                results.append(result)
+                results.task_history.add_interview(interview)
+            self.completed = True
+        def run_progress_bar(stop_event, jobs_runner_status) -> None:
+            """Runs the progress bar in a separate thread."""
+            jobs_runner_status.update_progress(stop_event)
+        def set_up_progress_bar(progress_bar: bool, jobs_runner_status):
+            progress_thread = None
+            if progress_bar and jobs_runner_status.has_ep_api_key():
+                jobs_runner_status.setup()
+                progress_thread = threading.Thread(
+                    target=run_progress_bar, args=(stop_event, jobs_runner_status)
+                )
+                progress_thread.start()
+            elif progress_bar:
+                warnings.warn(
+                    "You need an Expected Parrot API key to view job progress bars."
+                )
+            return progress_thread
+        results = Results(
+            survey=self.jobs.survey,
+            data=[],
+            task_history=TaskHistory(),
+            #           cache=self.environment.cache.new_entries_cache(),
+        )
+        stop_event = threading.Event()
+        progress_thread = set_up_progress_bar(
+            parameters.progress_bar, run_config.environment.jobs_runner_status
+        )
+        exception_to_raise = None
+        try:
+            await get_results(results)
+        except KeyboardInterrupt:
+            print("Keyboard interrupt received. Stopping gracefully...")
+            stop_event.set()
+        except Exception as e:
+            if parameters.stop_on_exception:
+                exception_to_raise = e
+            stop_event.set()
+        finally:
+            stop_event.set()
+            if progress_thread is not None:
+                progress_thread.join()
+            if exception_to_raise:
+                raise exception_to_raise
+            relevant_cache = results.relevant_cache(self.environment.cache)
+            results.cache = relevant_cache
+            # breakpoint()
+            results.bucket_collection = self.environment.bucket_collection
+            from edsl.jobs.results_exceptions_handler import ResultsExceptionsHandler
+            results_exceptions_handler = ResultsExceptionsHandler(results, parameters)
+            results_exceptions_handler.handle_exceptions()
+            return results

edsl/jobs/runners/JobsRunnerStatus.py ADDED Viewed

@@ -0,0 +1,298 @@
+from __future__ import annotations
+import os
+import time
+import requests
+from abc import ABC, abstractmethod
+from dataclasses import dataclass
+from collections import defaultdict
+from typing import Any, Dict, Optional
+from uuid import UUID
+@dataclass
+class ModelInfo:
+    model_name: str
+    TPM_limit_k: float
+    RPM_limit_k: float
+    num_tasks_waiting: int
+    token_usage_info: dict
+class StatisticsTracker:
+    def __init__(self, total_interviews: int, distinct_models: list[str]):
+        self.start_time = time.time()
+        self.total_interviews = total_interviews
+        self.completed_count = 0
+        self.completed_by_model = defaultdict(int)
+        self.distinct_models = distinct_models
+        self.total_exceptions = 0
+        self.unfixed_exceptions = 0
+    def add_completed_interview(
+        self, model: str, num_exceptions: int = 0, num_unfixed: int = 0
+    ):
+        self.completed_count += 1
+        self.completed_by_model[model] += 1
+        self.total_exceptions += num_exceptions
+        self.unfixed_exceptions += num_unfixed
+    def get_elapsed_time(self) -> float:
+        return time.time() - self.start_time
+    def get_average_time_per_interview(self) -> float:
+        return (
+            self.get_elapsed_time() / self.completed_count
+            if self.completed_count > 0
+            else 0
+        )
+    def get_throughput(self) -> float:
+        elapsed = self.get_elapsed_time()
+        return self.completed_count / elapsed if elapsed > 0 else 0
+    def get_estimated_time_remaining(self) -> float:
+        if self.completed_count == 0:
+            return 0
+        avg_time = self.get_average_time_per_interview()
+        remaining = self.total_interviews - self.completed_count
+        return avg_time * remaining
+class JobsRunnerStatusBase(ABC):
+    def __init__(
+        self,
+        jobs_runner: "JobsRunnerAsyncio",
+        n: int,
+        refresh_rate: float = 1,
+        endpoint_url: Optional[str] = "http://localhost:8000",
+        job_uuid: Optional[UUID] = None,
+        api_key: str = None,
+    ):
+        self.jobs_runner = jobs_runner
+        self.job_uuid = job_uuid
+        self.base_url = f"{endpoint_url}"
+        self.refresh_rate = refresh_rate
+        self.statistics = [
+            "elapsed_time",
+            "total_interviews_requested",
+            "completed_interviews",
+            "average_time_per_interview",
+            "estimated_time_remaining",
+            "exceptions",
+            "unfixed_exceptions",
+            "throughput",
+        ]
+        self.num_total_interviews = n * len(self.jobs_runner)
+        self.distinct_models = list(
+            set(model.model for model in self.jobs_runner.jobs.models)
+        )
+        self.stats_tracker = StatisticsTracker(
+            total_interviews=self.num_total_interviews,
+            distinct_models=self.distinct_models,
+        )
+        self.api_key = api_key or os.getenv("EXPECTED_PARROT_API_KEY")
+    @abstractmethod
+    def has_ep_api_key(self):
+        """Checks if the user has an Expected Parrot API key."""
+        pass
+    def get_status_dict(self) -> Dict[str, Any]:
+        """Converts current status into a JSON-serializable dictionary."""
+        # Get all statistics
+        stats = {}
+        for stat_name in self.statistics:
+            stat = self._compute_statistic(stat_name)
+            name, value = list(stat.items())[0]
+            stats[name] = value
+        # Get model-specific progress
+        model_progress = {}
+        target_per_model = int(self.num_total_interviews / len(self.distinct_models))
+        for model in self.distinct_models:
+            completed = self.stats_tracker.completed_by_model[model]
+            model_progress[model] = {
+                "completed": completed,
+                "total": target_per_model,
+                "percent": (
+                    (completed / target_per_model * 100) if target_per_model > 0 else 0
+                ),
+            }
+        status_dict = {
+            "overall_progress": {
+                "completed": self.stats_tracker.completed_count,
+                "total": self.num_total_interviews,
+                "percent": (
+                    (
+                        self.stats_tracker.completed_count
+                        / self.num_total_interviews
+                        * 100
+                    )
+                    if self.num_total_interviews > 0
+                    else 0
+                ),
+            },
+            "language_model_progress": model_progress,
+            "statistics": stats,
+            "status": (
+                "completed"
+                if self.stats_tracker.completed_count >= self.num_total_interviews
+                else "running"
+            ),
+        }
+        model_queues = {}
+        # for model, bucket in self.jobs_runner.bucket_collection.items():
+        for model, bucket in self.jobs_runner.environment.bucket_collection.items():
+            model_name = model.model
+            model_queues[model_name] = {
+                "language_model_name": model_name,
+                "requests_bucket": {
+                    "completed": bucket.requests_bucket.num_released,
+                    "requested": bucket.requests_bucket.num_requests,
+                    "tokens_returned": bucket.requests_bucket.tokens_returned,
+                    "target_rate": round(bucket.requests_bucket.target_rate, 1),
+                    "current_rate": round(bucket.requests_bucket.get_throughput(), 1),
+                },
+                "tokens_bucket": {
+                    "completed": bucket.tokens_bucket.num_released,
+                    "requested": bucket.tokens_bucket.num_requests,
+                    "tokens_returned": bucket.tokens_bucket.tokens_returned,
+                    "target_rate": round(bucket.tokens_bucket.target_rate, 1),
+                    "current_rate": round(bucket.tokens_bucket.get_throughput(), 1),
+                },
+            }
+        status_dict["language_model_queues"] = model_queues
+        return status_dict
+    def add_completed_interview(self, result):
+        """Records a completed interview without storing the full interview data."""
+        self.stats_tracker.add_completed_interview(
+            model=result.model.model,
+            num_exceptions=(
+                len(result.exceptions) if hasattr(result, "exceptions") else 0
+            ),
+            num_unfixed=(
+                result.exceptions.num_unfixed() if hasattr(result, "exceptions") else 0
+            ),
+        )
+    def _compute_statistic(self, stat_name: str):
+        """Computes individual statistics based on the stats tracker."""
+        if stat_name == "elapsed_time":
+            value = self.stats_tracker.get_elapsed_time()
+            return {"elapsed_time": (value, 1, "sec.")}
+        elif stat_name == "total_interviews_requested":
+            return {"total_interviews_requested": (self.num_total_interviews, None, "")}
+        elif stat_name == "completed_interviews":
+            return {
+                "completed_interviews": (self.stats_tracker.completed_count, None, "")
+            }
+        elif stat_name == "average_time_per_interview":
+            value = self.stats_tracker.get_average_time_per_interview()
+            return {"average_time_per_interview": (value, 2, "sec.")}
+        elif stat_name == "estimated_time_remaining":
+            value = self.stats_tracker.get_estimated_time_remaining()
+            return {"estimated_time_remaining": (value, 1, "sec.")}
+        elif stat_name == "exceptions":
+            return {"exceptions": (self.stats_tracker.total_exceptions, None, "")}
+        elif stat_name == "unfixed_exceptions":
+            return {
+                "unfixed_exceptions": (self.stats_tracker.unfixed_exceptions, None, "")
+            }
+        elif stat_name == "throughput":
+            value = self.stats_tracker.get_throughput()
+            return {"throughput": (value, 2, "interviews/sec.")}
+    def update_progress(self, stop_event):
+        while not stop_event.is_set():
+            self.send_status_update()
+            time.sleep(self.refresh_rate)
+        self.send_status_update()
+    @abstractmethod
+    def setup(self):
+        """Conducts any setup needed prior to sending status updates."""
+        pass
+    @abstractmethod
+    def send_status_update(self):
+        """Updates the current status of the job."""
+        pass
+class JobsRunnerStatus(JobsRunnerStatusBase):
+    @property
+    def create_url(self) -> str:
+        return f"{self.base_url}/api/v0/local-job"
+    @property
+    def viewing_url(self) -> str:
+        return f"{self.base_url}/home/local-job-progress/{str(self.job_uuid)}"
+    @property
+    def update_url(self) -> str:
+        return f"{self.base_url}/api/v0/local-job/{str(self.job_uuid)}"
+    def setup(self) -> None:
+        """Creates a local job on Coop if one does not already exist."""
+        headers = {
+            "Content-Type": "application/json",
+            "Authorization": f"Bearer {self.api_key or 'None'}",
+        }
+        if self.job_uuid is None:
+            response = requests.post(
+                self.create_url,
+                headers=headers,
+                timeout=1,
+            )
+            response.raise_for_status()
+            data = response.json()
+            self.job_uuid = data.get("job_uuid")
+        print(f"Running with progress bar. View progress at {self.viewing_url}")
+    def send_status_update(self) -> None:
+        """Sends current status to the web endpoint using the instance's job_uuid."""
+        try:
+            status_dict = self.get_status_dict()
+            status_dict["job_id"] = str(self.job_uuid)
+            headers = {
+                "Content-Type": "application/json",
+                "Authorization": f"Bearer {self.api_key or 'None'}",
+            }
+            response = requests.patch(
+                self.update_url,
+                json=status_dict,
+                headers=headers,
+                timeout=1,
+            )
+            response.raise_for_status()
+        except requests.exceptions.RequestException as e:
+            print(f"Failed to send status update for job {self.job_uuid}: {e}")
+    def has_ep_api_key(self) -> bool:
+        """Returns True if the user has an Expected Parrot API key."""
+        return self.api_key is not None
+if __name__ == "__main__":
+    import doctest
+    doctest.testmod(optionflags=doctest.ELLIPSIS)

edsl 0.1.15__py3-none-any.whl → 0.1.40__py3-none-any.whl

edsl 0.1.15py3-none-any.whl → 0.1.40py3-none-any.whl