PyPI - edsl - Versions diffs - 0.1.46__py3-none-any.whl → 0.1.48__py3-none-any.whl - Mend

edsl 0.1.46py3-none-any.whl → 0.1.48py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (328) hide show

edsl/__init__.py +44 -39
edsl/__version__.py +1 -1
edsl/agents/__init__.py +4 -2
edsl/agents/{Agent.py → agent.py} +442 -152
edsl/agents/{AgentList.py → agent_list.py} +220 -162
edsl/agents/descriptors.py +46 -7
edsl/{exceptions/agents.py → agents/exceptions.py} +3 -12
edsl/base/__init__.py +75 -0
edsl/base/base_class.py +1303 -0
edsl/base/data_transfer_models.py +114 -0
edsl/base/enums.py +215 -0
edsl/base.py +8 -0
edsl/buckets/__init__.py +25 -0
edsl/buckets/bucket_collection.py +324 -0
edsl/buckets/model_buckets.py +206 -0
edsl/buckets/token_bucket.py +502 -0
edsl/{jobs/buckets/TokenBucketAPI.py → buckets/token_bucket_api.py} +1 -1
edsl/buckets/token_bucket_client.py +509 -0
edsl/caching/__init__.py +20 -0
edsl/caching/cache.py +814 -0
edsl/caching/cache_entry.py +427 -0
edsl/{data/CacheHandler.py → caching/cache_handler.py} +14 -15
edsl/caching/exceptions.py +24 -0
edsl/caching/orm.py +30 -0
edsl/{data/RemoteCacheSync.py → caching/remote_cache_sync.py} +3 -3
edsl/caching/sql_dict.py +441 -0
edsl/config/__init__.py +8 -0
edsl/config/config_class.py +177 -0
edsl/config.py +4 -176
edsl/conversation/Conversation.py +7 -7
edsl/conversation/car_buying.py +4 -4
edsl/conversation/chips.py +6 -6
edsl/coop/__init__.py +25 -2
edsl/coop/coop.py +430 -113
edsl/coop/{ExpectedParrotKeyHandler.py → ep_key_handling.py} +86 -10
edsl/coop/exceptions.py +62 -0
edsl/coop/price_fetcher.py +126 -0
edsl/coop/utils.py +89 -24
edsl/data_transfer_models.py +5 -72
edsl/dataset/__init__.py +10 -0
edsl/{results/Dataset.py → dataset/dataset.py} +116 -36
edsl/dataset/dataset_operations_mixin.py +1492 -0
edsl/{results/DatasetTree.py → dataset/dataset_tree.py} +156 -75
edsl/{results/TableDisplay.py → dataset/display/table_display.py} +18 -7
edsl/{results → dataset/display}/table_renderers.py +58 -2
edsl/{results → dataset}/file_exports.py +4 -5
edsl/{results → dataset}/smart_objects.py +2 -2
edsl/enums.py +5 -205
edsl/inference_services/__init__.py +5 -0
edsl/inference_services/{AvailableModelCacheHandler.py → available_model_cache_handler.py} +2 -3
edsl/inference_services/{AvailableModelFetcher.py → available_model_fetcher.py} +8 -14
edsl/inference_services/data_structures.py +3 -2
edsl/{exceptions/inference_services.py → inference_services/exceptions.py} +1 -1
edsl/inference_services/{InferenceServiceABC.py → inference_service_abc.py} +1 -1
edsl/inference_services/{InferenceServicesCollection.py → inference_services_collection.py} +8 -7
edsl/inference_services/registry.py +4 -41
edsl/inference_services/{ServiceAvailability.py → service_availability.py} +5 -25
edsl/inference_services/services/__init__.py +31 -0
edsl/inference_services/{AnthropicService.py → services/anthropic_service.py} +3 -3
edsl/inference_services/{AwsBedrock.py → services/aws_bedrock.py} +2 -2
edsl/inference_services/{AzureAI.py → services/azure_ai.py} +2 -2
edsl/inference_services/{DeepInfraService.py → services/deep_infra_service.py} +1 -3
edsl/inference_services/{DeepSeekService.py → services/deep_seek_service.py} +2 -4
edsl/inference_services/{GoogleService.py → services/google_service.py} +5 -4
edsl/inference_services/{GroqService.py → services/groq_service.py} +1 -1
edsl/inference_services/{MistralAIService.py → services/mistral_ai_service.py} +3 -3
edsl/inference_services/{OllamaService.py → services/ollama_service.py} +1 -7
edsl/inference_services/{OpenAIService.py → services/open_ai_service.py} +5 -6
edsl/inference_services/{PerplexityService.py → services/perplexity_service.py} +12 -12
edsl/inference_services/{TestService.py → services/test_service.py} +7 -6
edsl/inference_services/{TogetherAIService.py → services/together_ai_service.py} +2 -6
edsl/inference_services/{XAIService.py → services/xai_service.py} +1 -1
edsl/inference_services/write_available.py +1 -2
edsl/instructions/__init__.py +6 -0
edsl/{surveys/instructions/Instruction.py → instructions/instruction.py} +11 -6
edsl/{surveys/instructions/InstructionCollection.py → instructions/instruction_collection.py} +10 -5
edsl/{surveys/InstructionHandler.py → instructions/instruction_handler.py} +3 -3
edsl/{jobs/interviews → interviews}/ReportErrors.py +2 -2
edsl/interviews/__init__.py +4 -0
edsl/{jobs/AnswerQuestionFunctionConstructor.py → interviews/answering_function.py} +45 -18
edsl/{jobs/interviews/InterviewExceptionEntry.py → interviews/exception_tracking.py} +107 -22
edsl/interviews/interview.py +638 -0
edsl/{jobs/interviews/InterviewStatusDictionary.py → interviews/interview_status_dictionary.py} +21 -12
edsl/{jobs/interviews/InterviewStatusLog.py → interviews/interview_status_log.py} +16 -7
edsl/{jobs/InterviewTaskManager.py → interviews/interview_task_manager.py} +12 -7
edsl/{jobs/RequestTokenEstimator.py → interviews/request_token_estimator.py} +8 -3
edsl/{jobs/interviews/InterviewStatistic.py → interviews/statistics.py} +36 -10
edsl/invigilators/__init__.py +38 -0
edsl/invigilators/invigilator_base.py +477 -0
edsl/{agents/Invigilator.py → invigilators/invigilators.py} +263 -10
edsl/invigilators/prompt_constructor.py +476 -0
edsl/{agents → invigilators}/prompt_helpers.py +2 -1
edsl/{agents/QuestionInstructionPromptBuilder.py → invigilators/question_instructions_prompt_builder.py} +18 -13
edsl/{agents → invigilators}/question_option_processor.py +96 -21
edsl/{agents/QuestionTemplateReplacementsBuilder.py → invigilators/question_template_replacements_builder.py} +64 -12
edsl/jobs/__init__.py +7 -1
edsl/jobs/async_interview_runner.py +99 -35
edsl/jobs/check_survey_scenario_compatibility.py +7 -5
edsl/jobs/data_structures.py +153 -22
edsl/{exceptions/jobs.py → jobs/exceptions.py} +2 -1
edsl/jobs/{FetchInvigilator.py → fetch_invigilator.py} +4 -4
edsl/jobs/{loggers/HTMLTableJobLogger.py → html_table_job_logger.py} +6 -2
edsl/jobs/{Jobs.py → jobs.py} +321 -155
edsl/jobs/{JobsChecks.py → jobs_checks.py} +15 -7
edsl/jobs/{JobsComponentConstructor.py → jobs_component_constructor.py} +20 -17
edsl/jobs/{InterviewsConstructor.py → jobs_interview_constructor.py} +10 -5
edsl/jobs/jobs_pricing_estimation.py +347 -0
edsl/jobs/{JobsRemoteInferenceLogger.py → jobs_remote_inference_logger.py} +4 -3
edsl/jobs/jobs_runner_asyncio.py +282 -0
edsl/jobs/{JobsRemoteInferenceHandler.py → remote_inference.py} +19 -22
edsl/jobs/results_exceptions_handler.py +2 -2
edsl/key_management/__init__.py +28 -0
edsl/key_management/key_lookup.py +161 -0
edsl/{language_models/key_management/KeyLookupBuilder.py → key_management/key_lookup_builder.py} +118 -47
edsl/key_management/key_lookup_collection.py +82 -0
edsl/key_management/models.py +218 -0
edsl/language_models/__init__.py +7 -2
edsl/language_models/{ComputeCost.py → compute_cost.py} +18 -3
edsl/{exceptions/language_models.py → language_models/exceptions.py} +2 -1
edsl/language_models/language_model.py +1080 -0
edsl/language_models/model.py +10 -25
edsl/language_models/{ModelList.py → model_list.py} +9 -14
edsl/language_models/{RawResponseHandler.py → raw_response_handler.py} +1 -1
edsl/language_models/{RegisterLanguageModelsMeta.py → registry.py} +1 -1
edsl/language_models/repair.py +4 -4
edsl/language_models/utilities.py +4 -4
edsl/notebooks/__init__.py +3 -1
edsl/notebooks/{Notebook.py → notebook.py} +7 -8
edsl/prompts/__init__.py +1 -1
edsl/{exceptions/prompts.py → prompts/exceptions.py} +3 -1
edsl/prompts/{Prompt.py → prompt.py} +101 -95
edsl/questions/HTMLQuestion.py +1 -1
edsl/questions/__init__.py +154 -25
edsl/questions/answer_validator_mixin.py +1 -1
edsl/questions/compose_questions.py +4 -3
edsl/questions/derived/question_likert_five.py +166 -0
edsl/questions/derived/{QuestionLinearScale.py → question_linear_scale.py} +4 -4
edsl/questions/derived/{QuestionTopK.py → question_top_k.py} +4 -4
edsl/questions/derived/{QuestionYesNo.py → question_yes_no.py} +4 -5
edsl/questions/descriptors.py +24 -30
edsl/questions/loop_processor.py +65 -19
edsl/questions/question_base.py +881 -0
edsl/questions/question_base_gen_mixin.py +15 -16
edsl/questions/{QuestionBasePromptsMixin.py → question_base_prompts_mixin.py} +2 -2
edsl/questions/{QuestionBudget.py → question_budget.py} +3 -4
edsl/questions/{QuestionCheckBox.py → question_check_box.py} +16 -16
edsl/questions/{QuestionDict.py → question_dict.py} +39 -5
edsl/questions/{QuestionExtract.py → question_extract.py} +9 -9
edsl/questions/question_free_text.py +282 -0
edsl/questions/{QuestionFunctional.py → question_functional.py} +6 -5
edsl/questions/{QuestionList.py → question_list.py} +6 -7
edsl/questions/{QuestionMatrix.py → question_matrix.py} +6 -5
edsl/questions/{QuestionMultipleChoice.py → question_multiple_choice.py} +126 -21
edsl/questions/{QuestionNumerical.py → question_numerical.py} +5 -5
edsl/questions/{QuestionRank.py → question_rank.py} +6 -6
edsl/questions/question_registry.py +10 -16
edsl/questions/register_questions_meta.py +8 -4
edsl/questions/response_validator_abc.py +17 -16
edsl/results/__init__.py +4 -1
edsl/{exceptions/results.py → results/exceptions.py} +1 -1
edsl/results/report.py +197 -0
edsl/results/{Result.py → result.py} +131 -45
edsl/results/{Results.py → results.py} +420 -216
edsl/results/results_selector.py +344 -25
edsl/scenarios/__init__.py +30 -3
edsl/scenarios/{ConstructDownloadLink.py → construct_download_link.py} +7 -0
edsl/scenarios/directory_scanner.py +156 -13
edsl/scenarios/document_chunker.py +186 -0
edsl/scenarios/exceptions.py +101 -0
edsl/scenarios/file_methods.py +2 -3
edsl/scenarios/file_store.py +755 -0
edsl/scenarios/handlers/__init__.py +14 -14
edsl/scenarios/handlers/{csv.py → csv_file_store.py} +1 -2
edsl/scenarios/handlers/{docx.py → docx_file_store.py} +8 -7
edsl/scenarios/handlers/{html.py → html_file_store.py} +1 -2
edsl/scenarios/handlers/{jpeg.py → jpeg_file_store.py} +1 -1
edsl/scenarios/handlers/{json.py → json_file_store.py} +1 -1
edsl/scenarios/handlers/latex_file_store.py +5 -0
edsl/scenarios/handlers/{md.py → md_file_store.py} +1 -1
edsl/scenarios/handlers/{pdf.py → pdf_file_store.py} +2 -2
edsl/scenarios/handlers/{png.py → png_file_store.py} +1 -1
edsl/scenarios/handlers/{pptx.py → pptx_file_store.py} +8 -7
edsl/scenarios/handlers/{py.py → py_file_store.py} +1 -3
edsl/scenarios/handlers/{sql.py → sql_file_store.py} +2 -1
edsl/scenarios/handlers/{sqlite.py → sqlite_file_store.py} +2 -3
edsl/scenarios/handlers/{txt.py → txt_file_store.py} +1 -1
edsl/scenarios/scenario.py +928 -0
edsl/scenarios/scenario_join.py +18 -5
edsl/scenarios/{ScenarioList.py → scenario_list.py} +424 -106
edsl/scenarios/{ScenarioListPdfMixin.py → scenario_list_pdf_tools.py} +16 -15
edsl/scenarios/scenario_selector.py +5 -1
edsl/study/ObjectEntry.py +2 -2
edsl/study/SnapShot.py +5 -5
edsl/study/Study.py +20 -21
edsl/study/__init__.py +6 -4
edsl/surveys/__init__.py +7 -4
edsl/surveys/dag/__init__.py +2 -0
edsl/surveys/{ConstructDAG.py → dag/construct_dag.py} +3 -3
edsl/surveys/{DAG.py → dag/dag.py} +13 -10
edsl/surveys/descriptors.py +1 -1
edsl/surveys/{EditSurvey.py → edit_survey.py} +9 -9
edsl/{exceptions/surveys.py → surveys/exceptions.py} +1 -2
edsl/surveys/memory/__init__.py +3 -0
edsl/surveys/{MemoryPlan.py → memory/memory_plan.py} +10 -9
edsl/surveys/rules/__init__.py +3 -0
edsl/surveys/{Rule.py → rules/rule.py} +103 -43
edsl/surveys/{RuleCollection.py → rules/rule_collection.py} +21 -30
edsl/surveys/{RuleManager.py → rules/rule_manager.py} +19 -13
edsl/surveys/survey.py +1743 -0
edsl/surveys/{SurveyExportMixin.py → survey_export.py} +22 -27
edsl/surveys/{SurveyFlowVisualization.py → survey_flow_visualization.py} +11 -2
edsl/surveys/{Simulator.py → survey_simulator.py} +10 -3
edsl/tasks/__init__.py +32 -0
edsl/{jobs/tasks/QuestionTaskCreator.py → tasks/question_task_creator.py} +115 -57
edsl/tasks/task_creators.py +135 -0
edsl/{jobs/tasks/TaskHistory.py → tasks/task_history.py} +86 -47
edsl/{jobs/tasks → tasks}/task_status_enum.py +91 -7
edsl/tasks/task_status_log.py +85 -0
edsl/tokens/__init__.py +2 -0
edsl/tokens/interview_token_usage.py +53 -0
edsl/utilities/PrettyList.py +1 -1
edsl/utilities/SystemInfo.py +25 -22
edsl/utilities/__init__.py +29 -21
edsl/utilities/gcp_bucket/__init__.py +2 -0
edsl/utilities/gcp_bucket/cloud_storage.py +99 -96
edsl/utilities/interface.py +44 -536
edsl/{results/MarkdownToPDF.py → utilities/markdown_to_pdf.py} +13 -5
edsl/utilities/repair_functions.py +1 -1
{edsl-0.1.46.dist-info → edsl-0.1.48.dist-info}/METADATA +3 -2
edsl-0.1.48.dist-info/RECORD +347 -0
edsl/Base.py +0 -426
edsl/BaseDiff.py +0 -260
edsl/agents/InvigilatorBase.py +0 -260
edsl/agents/PromptConstructor.py +0 -318
edsl/auto/AutoStudy.py +0 -130
edsl/auto/StageBase.py +0 -243
edsl/auto/StageGenerateSurvey.py +0 -178
edsl/auto/StageLabelQuestions.py +0 -125
edsl/auto/StagePersona.py +0 -61
edsl/auto/StagePersonaDimensionValueRanges.py +0 -88
edsl/auto/StagePersonaDimensionValues.py +0 -74
edsl/auto/StagePersonaDimensions.py +0 -69
edsl/auto/StageQuestions.py +0 -74
edsl/auto/SurveyCreatorPipeline.py +0 -21
edsl/auto/utilities.py +0 -218
edsl/base/Base.py +0 -279
edsl/coop/PriceFetcher.py +0 -54
edsl/data/Cache.py +0 -580
edsl/data/CacheEntry.py +0 -230
edsl/data/SQLiteDict.py +0 -292
edsl/data/__init__.py +0 -5
edsl/data/orm.py +0 -10
edsl/exceptions/cache.py +0 -5
edsl/exceptions/coop.py +0 -14
edsl/exceptions/data.py +0 -14
edsl/exceptions/scenarios.py +0 -29
edsl/jobs/Answers.py +0 -43
edsl/jobs/JobsPrompts.py +0 -354
edsl/jobs/buckets/BucketCollection.py +0 -134
edsl/jobs/buckets/ModelBuckets.py +0 -65
edsl/jobs/buckets/TokenBucket.py +0 -283
edsl/jobs/buckets/TokenBucketClient.py +0 -191
edsl/jobs/interviews/Interview.py +0 -395
edsl/jobs/interviews/InterviewExceptionCollection.py +0 -99
edsl/jobs/interviews/InterviewStatisticsCollection.py +0 -25
edsl/jobs/runners/JobsRunnerAsyncio.py +0 -163
edsl/jobs/runners/JobsRunnerStatusData.py +0 -0
edsl/jobs/tasks/TaskCreators.py +0 -64
edsl/jobs/tasks/TaskStatusLog.py +0 -23
edsl/jobs/tokens/InterviewTokenUsage.py +0 -27
edsl/language_models/LanguageModel.py +0 -635
edsl/language_models/ServiceDataSources.py +0 -0
edsl/language_models/key_management/KeyLookup.py +0 -63
edsl/language_models/key_management/KeyLookupCollection.py +0 -38
edsl/language_models/key_management/models.py +0 -137
edsl/questions/QuestionBase.py +0 -539
edsl/questions/QuestionFreeText.py +0 -130
edsl/questions/derived/QuestionLikertFive.py +0 -76
edsl/results/DatasetExportMixin.py +0 -911
edsl/results/ResultsExportMixin.py +0 -45
edsl/results/TextEditor.py +0 -50
edsl/results/results_fetch_mixin.py +0 -33
edsl/results/results_tools_mixin.py +0 -98
edsl/scenarios/DocumentChunker.py +0 -104
edsl/scenarios/FileStore.py +0 -564
edsl/scenarios/Scenario.py +0 -548
edsl/scenarios/ScenarioHtmlMixin.py +0 -65
edsl/scenarios/ScenarioListExportMixin.py +0 -45
edsl/scenarios/handlers/latex.py +0 -5
edsl/shared.py +0 -1
edsl/surveys/Survey.py +0 -1306
edsl/surveys/SurveyQualtricsImport.py +0 -284
edsl/surveys/SurveyToApp.py +0 -141
edsl/surveys/instructions/__init__.py +0 -0
edsl/tools/__init__.py +0 -1
edsl/tools/clusters.py +0 -192
edsl/tools/embeddings.py +0 -27
edsl/tools/embeddings_plotting.py +0 -118
edsl/tools/plotting.py +0 -112
edsl/tools/summarize.py +0 -18
edsl/utilities/data/Registry.py +0 -6
edsl/utilities/data/__init__.py +0 -1
edsl/utilities/data/scooter_results.json +0 -1
edsl-0.1.46.dist-info/RECORD +0 -366
/edsl/coop/{CoopFunctionsMixin.py → coop_functions.py} +0 -0
/edsl/{results → dataset/display}/CSSParameterizer.py +0 -0
/edsl/{language_models/key_management → dataset/display}/__init__.py +0 -0
/edsl/{results → dataset/display}/table_data_class.py +0 -0
/edsl/{results → dataset/display}/table_display.css +0 -0
/edsl/{results/ResultsGGMixin.py → dataset/r/ggplot.py} +0 -0
/edsl/{results → dataset}/tree_explore.py +0 -0
/edsl/{surveys/instructions/ChangeInstruction.py → instructions/change_instruction.py} +0 -0
/edsl/{jobs/interviews → interviews}/interview_status_enum.py +0 -0
/edsl/jobs/{runners/JobsRunnerStatus.py → jobs_runner_status.py} +0 -0
/edsl/language_models/{PriceManager.py → price_manager.py} +0 -0
/edsl/language_models/{fake_openai_call.py → unused/fake_openai_call.py} +0 -0
/edsl/language_models/{fake_openai_service.py → unused/fake_openai_service.py} +0 -0
/edsl/notebooks/{NotebookToLaTeX.py → notebook_to_latex.py} +0 -0
/edsl/{exceptions/questions.py → questions/exceptions.py} +0 -0
/edsl/questions/{SimpleAskMixin.py → simple_ask_mixin.py} +0 -0
/edsl/surveys/{Memory.py → memory/memory.py} +0 -0
/edsl/surveys/{MemoryManagement.py → memory/memory_management.py} +0 -0
/edsl/surveys/{SurveyCSS.py → survey_css.py} +0 -0
/edsl/{jobs/tokens/TokenUsage.py → tokens/token_usage.py} +0 -0
/edsl/{results/MarkdownToDocx.py → utilities/markdown_to_docx.py} +0 -0
/edsl/{TemplateLoader.py → utilities/template_loader.py} +0 -0
{edsl-0.1.46.dist-info → edsl-0.1.48.dist-info}/LICENSE +0 -0
{edsl-0.1.46.dist-info → edsl-0.1.48.dist-info}/WHEEL +0 -0

edsl/scenarios/{ScenarioList.py → scenario_list.py} RENAMED Viewed

@@ -1,4 +1,21 @@
-"""A list of Scenarios to be used in a survey."""
+"""
+ScenarioList provides a collection of Scenario objects with advanced operations.
+The ScenarioList module extends the functionality of a simple list of Scenario objects,
+providing powerful operations for data manipulation, filtering, transformation, and analysis.
+It serves as a bridge between individual Scenarios and higher-level EDSL components like
+Surveys and Jobs.
+Key features include:
+- Collection operations (filtering, sorting, sampling, and iteration)
+- Data manipulation (transformation, joining, grouping, pivoting)
+- Format conversion (to/from pandas, CSV, Excel, etc.)
+- Advanced selection and retrieval mechanisms
+- Integration with other EDSL components
+ScenarioList is a core component in the EDSL framework for creating, managing, and
+manipulating collections of Scenarios for experiments, surveys, and data processing tasks.
+"""
 from __future__ import annotations
 from typing import (
@@ -10,12 +27,7 @@ from typing import (
     Literal,
     TYPE_CHECKING,
 )
-try:
-    from typing import TypeAlias
-except ImportError:
-    from typing_extensions import TypeAlias
+import warnings
 import csv
 import random
 from io import StringIO
@@ -23,37 +35,34 @@ import inspect
 from collections import UserList, defaultdict
 from collections.abc import Iterable
-if TYPE_CHECKING:
-    from urllib.parse import ParseResult
-    from edsl.results.Dataset import Dataset
-    from edsl.jobs.Jobs import Jobs
-    from edsl.surveys.Survey import Survey
-    from edsl.questions.QuestionBase import QuestionBase
 from simpleeval import EvalWithCompoundTypes, NameNotDefined  # type: ignore
 from tabulate import tabulate_formats
-from edsl.Base import Base
-from edsl.utilities.remove_edsl_version import remove_edsl_version
+try:
+    from typing import TypeAlias
+except ImportError:
+    from typing_extensions import TypeAlias
-from edsl.scenarios.Scenario import Scenario
-from edsl.scenarios.ScenarioListPdfMixin import ScenarioListPdfMixin
-from edsl.scenarios.ScenarioListExportMixin import ScenarioListExportMixin
-from edsl.utilities.naming_utilities import sanitize_string
-from edsl.utilities.is_valid_variable_name import is_valid_variable_name
-from edsl.exceptions.scenarios import ScenarioError
+if TYPE_CHECKING:
+    from urllib.parse import ParseResult
+    from ..dataset import Dataset
+    from ..jobs import Jobs
+    from ..surveys import Survey
+    from ..questions import QuestionBase
-from edsl.scenarios.directory_scanner import DirectoryScanner
+from ..base import Base
+from ..utilities import remove_edsl_version, sanitize_string, is_valid_variable_name, dict_hash
+from ..dataset import ScenarioListOperationsMixin
-class ScenarioListMixin(ScenarioListPdfMixin, ScenarioListExportMixin):
-    pass
+from .exceptions import ScenarioError
+from .scenario import Scenario
+from .directory_scanner import DirectoryScanner
+from .scenario_list_pdf_tools import PdfTools
 if TYPE_CHECKING:
-    from edsl.results.Dataset import Dataset
+    from ..dataset import Dataset
 TableFormat: TypeAlias = Literal[
     "plain",
@@ -72,9 +81,42 @@ TableFormat: TypeAlias = Literal[
     "tsv",
 ]
-class ScenarioList(Base, UserList, ScenarioListMixin):
-    """Class for creating a list of scenarios to be used in a survey."""
+class ScenarioList(Base, UserList, ScenarioListOperationsMixin):
+    """
+    A collection of Scenario objects with advanced operations for manipulation and analysis.
+    ScenarioList extends Python's UserList to provide specialized functionality for
+    working with collections of Scenario objects. It inherits from Base to integrate
+    with EDSL's object model and from ScenarioListOperationsMixin to provide
+    powerful data manipulation capabilities.
+    The class provides methods for filtering, sorting, joining, transforming, and
+    analyzing collections of Scenarios. It's designed to work seamlessly with other
+    EDSL components like Surveys, Jobs, and Questions.
+    Attributes:
+        data (list): The underlying list of Scenario objects.
+        codebook (dict): Optional metadata describing the fields in the scenarios.
+    Examples:
+        Create a ScenarioList from Scenario objects:
+        >>> from edsl.scenarios import Scenario, ScenarioList
+        >>> s1 = Scenario({"product": "apple", "price": 1.99})
+        >>> s2 = Scenario({"product": "banana", "price": 0.99})
+        >>> sl = ScenarioList([s1, s2])
+        Filter scenarios based on a condition:
+        >>> cheap_fruits = sl.filter("price < 1.50")
+        >>> len(cheap_fruits)
+        1
+        >>> cheap_fruits[0]["product"]
+        'banana'
+        Add a new column based on existing data:
+        >>> sl_with_tax = sl.mutate("tax = price * 0.08")
+        >>> sl_with_tax[0]["tax"]
+        0.1592
+    """
     __documentation__ = (
         "https://docs.expectedparrot.com/en/latest/scenarios.html#scenariolist"
@@ -83,7 +125,24 @@ class ScenarioList(Base, UserList, ScenarioListMixin):
     def __init__(
         self, data: Optional[list] = None, codebook: Optional[dict[str, str]] = None
     ):
-        """Initialize the ScenarioList class."""
+        """
+        Initialize a new ScenarioList with optional data and codebook.
+        Args:
+            data: A list of Scenario objects. If None, an empty list is used.
+            codebook: A dictionary mapping field names to descriptions or metadata.
+                     Used for documentation and to provide context for fields.
+        Examples:
+            >>> sl = ScenarioList()  # Empty list
+            >>> s1 = Scenario({"product": "apple"})
+            >>> s2 = Scenario({"product": "banana"})
+            >>> sl = ScenarioList([s1, s2])  # With data
+            >>> # With a codebook
+            >>> codebook = {"product": "Fruit name", "price": "Price in USD"}
+            >>> sl = ScenarioList([s1, s2], codebook=codebook)
+        """
         if data is not None:
             super().__init__(data)
         else:
@@ -91,21 +150,85 @@ class ScenarioList(Base, UserList, ScenarioListMixin):
         self.codebook = codebook or {}
     def unique(self) -> ScenarioList:
-        """Return a list of unique scenarios.
-        >>> s = ScenarioList([Scenario({'a': 1}), Scenario({'a': 1}), Scenario({'a': 2})])
-        >>> s.unique()
-        ScenarioList([Scenario({'a': 1}), Scenario({'a': 2})])
+        """
+        Return a new ScenarioList containing only unique Scenario objects.
+        This method removes duplicate Scenario objects based on their hash values,
+        which are determined by their content. Two Scenarios with identical key-value
+        pairs will have the same hash and be considered duplicates.
+        Returns:
+            A new ScenarioList containing only unique Scenario objects.
+        Examples:
+            >>> from edsl.scenarios import Scenario, ScenarioList
+            >>> s1 = Scenario({"a": 1})
+            >>> s2 = Scenario({"a": 1})  # Same content as s1
+            >>> s3 = Scenario({"a": 2})
+            >>> sl = ScenarioList([s1, s2, s3])
+            >>> unique_sl = sl.unique()
+            >>> len(unique_sl)
+            2
+            >>> unique_sl
+            ScenarioList([Scenario({'a': 1}), Scenario({'a': 2})])
+        Notes:
+            - The order of scenarios in the result is not guaranteed due to the use of sets
+            - Uniqueness is determined by the Scenario's __hash__ method
+            - The original ScenarioList is not modified
         """
         return ScenarioList(list(set(self)))
     @property
     def has_jinja_braces(self) -> bool:
-        """Check if the ScenarioList has Jinja braces."""
+        """
+        Check if any Scenario in the list contains values with Jinja template braces.
+        This property checks all Scenarios in the list to determine if any contain
+        string values with Jinja template syntax ({{ and }}). This is important for
+        rendering templates and avoiding conflicts with other templating systems.
+        Returns:
+            True if any Scenario contains values with Jinja braces, False otherwise.
+        Examples:
+            >>> from edsl.scenarios import Scenario, ScenarioList
+            >>> s1 = Scenario({"text": "Plain text"})
+            >>> s2 = Scenario({"text": "Template with {{variable}}"})
+            >>> sl1 = ScenarioList([s1])
+            >>> sl1.has_jinja_braces
+            False
+            >>> sl2 = ScenarioList([s1, s2])
+            >>> sl2.has_jinja_braces
+            True
+        """
         return any([scenario.has_jinja_braces for scenario in self])
     def _convert_jinja_braces(self) -> ScenarioList:
-        """Convert Jinja braces to Python braces."""
+        """
+        Convert Jinja braces to alternative symbols in all Scenarios in the list.
+        This method creates a new ScenarioList where all Jinja template braces
+        ({{ and }}) in string values are converted to alternative symbols (<< and >>).
+        This is useful when you need to prevent template processing or avoid conflicts
+        with other templating systems.
+        Returns:
+            A new ScenarioList with converted braces in all Scenarios.
+        Examples:
+            >>> from edsl.scenarios import Scenario, ScenarioList
+            >>> s = Scenario({"text": "Template with {{variable}}"})
+            >>> sl = ScenarioList([s])
+            >>> converted = sl._convert_jinja_braces()
+            >>> converted[0]["text"]
+            'Template with <<variable>>'
+        Notes:
+            - The original ScenarioList is not modified
+            - This is primarily intended for internal use
+            - The default replacement symbols are << and >>
+        """
         return ScenarioList([scenario._convert_jinja_braces() for scenario in self])
     def give_valid_names(self, existing_codebook: dict = None) -> ScenarioList:
@@ -202,7 +325,7 @@ class ScenarioList(Base, UserList, ScenarioListMixin):
             url={https://arxiv.org/abs/2407.11418},
             }
         """
-        from edsl import QuestionYesNo
+        from ..questions import QuestionYesNo
         new_scenario_list = self.duplicate()
         q = QuestionYesNo(
@@ -341,8 +464,6 @@ class ScenarioList(Base, UserList, ScenarioListMixin):
         >>> hash(s)
         1262252885757976162
         """
-        from edsl.utilities.utilities import dict_hash
         return dict_hash(self.to_dict(sort=True, add_edsl_version=False))
     def __eq__(self, other: Any) -> bool:
@@ -360,7 +481,7 @@ class ScenarioList(Base, UserList, ScenarioListMixin):
         ScenarioList([Scenario({'a': 1, 'b': 3}), Scenario({'a': 1, 'b': 4}), Scenario({'a': 2, 'b': 3}), Scenario({'a': 2, 'b': 4})])
         """
         from itertools import product
-        from edsl import Scenario
+        from .scenario import Scenario
         if isinstance(other, Scenario):
             other = ScenarioList([other])
         elif not isinstance(other, ScenarioList):
@@ -436,12 +557,14 @@ class ScenarioList(Base, UserList, ScenarioListMixin):
                 new_scenarios.append(new_scenario)
         return ScenarioList(new_scenarios)
-    def _concatenate(self, fields: List[str], output_type: str = "string", separator: str = ";") -> ScenarioList:
+    def _concatenate(self, fields: List[str], output_type: str = "string", separator: str = ";", new_field_name: Optional[str] = None) -> ScenarioList:
         """Private method to handle concatenation logic for different output types.
         :param fields: The fields to concatenate.
         :param output_type: The type of output ("string", "list", or "set").
         :param separator: The separator to use for string concatenation.
+        :param new_field_name: Optional custom name for the concatenated field.
+                             If None, defaults to "concat_field1_field2_..."
         Returns:
             ScenarioList: A new ScenarioList with concatenated fields.
@@ -461,17 +584,17 @@ class ScenarioList(Base, UserList, ScenarioListMixin):
                     values.append(new_scenario[field])
                     del new_scenario[field]
-            new_field_name = f"concat_{'_'.join(fields)}"
+            field_name = new_field_name if new_field_name is not None else f"concat_{'_'.join(fields)}"
             if output_type == "string":
                 # Convert all values to strings and join with separator
-                new_scenario[new_field_name] = separator.join(str(v) for v in values)
+                new_scenario[field_name] = separator.join(str(v) for v in values)
             elif output_type == "list":
                 # Keep as a list
-                new_scenario[new_field_name] = values
+                new_scenario[field_name] = values
             elif output_type == "set":
                 # Convert to a set (removes duplicates)
-                new_scenario[new_field_name] = set(values)
+                new_scenario[field_name] = set(values)
             else:
                 raise ValueError(f"Invalid output_type: {output_type}. Must be 'string', 'list', or 'set'.")
@@ -479,11 +602,12 @@ class ScenarioList(Base, UserList, ScenarioListMixin):
         return ScenarioList(new_scenarios)
-    def concatenate(self, fields: List[str], separator: str = ";") -> ScenarioList:
+    def concatenate(self, fields: List[str], separator: str = ";", new_field_name: Optional[str] = None) -> ScenarioList:
         """Concatenate specified fields into a single string field.
         :param fields: The fields to concatenate.
         :param separator: The separator to use.
+        :param new_field_name: Optional custom name for the concatenated field.
         Returns:
             ScenarioList: A new ScenarioList with concatenated fields.
@@ -492,13 +616,16 @@ class ScenarioList(Base, UserList, ScenarioListMixin):
             >>> s = ScenarioList([Scenario({'a': 1, 'b': 2, 'c': 3}), Scenario({'a': 4, 'b': 5, 'c': 6})])
             >>> s.concatenate(['a', 'b', 'c'])
             ScenarioList([Scenario({'concat_a_b_c': '1;2;3'}), Scenario({'concat_a_b_c': '4;5;6'})])
+            >>> s.concatenate(['a', 'b', 'c'], new_field_name='combined')
+            ScenarioList([Scenario({'combined': '1;2;3'}), Scenario({'combined': '4;5;6'})])
         """
-        return self._concatenate(fields, output_type="string", separator=separator)
+        return self._concatenate(fields, output_type="string", separator=separator, new_field_name=new_field_name)
-    def concatenate_to_list(self, fields: List[str]) -> ScenarioList:
+    def concatenate_to_list(self, fields: List[str], new_field_name: Optional[str] = None) -> ScenarioList:
         """Concatenate specified fields into a single list field.
         :param fields: The fields to concatenate.
+        :param new_field_name: Optional custom name for the concatenated field.
         Returns:
             ScenarioList: A new ScenarioList with fields concatenated into a list.
@@ -507,13 +634,16 @@ class ScenarioList(Base, UserList, ScenarioListMixin):
             >>> s = ScenarioList([Scenario({'a': 1, 'b': 2, 'c': 3}), Scenario({'a': 4, 'b': 5, 'c': 6})])
             >>> s.concatenate_to_list(['a', 'b', 'c'])
             ScenarioList([Scenario({'concat_a_b_c': [1, 2, 3]}), Scenario({'concat_a_b_c': [4, 5, 6]})])
+            >>> s.concatenate_to_list(['a', 'b', 'c'], new_field_name='values')
+            ScenarioList([Scenario({'values': [1, 2, 3]}), Scenario({'values': [4, 5, 6]})])
         """
-        return self._concatenate(fields, output_type="list")
+        return self._concatenate(fields, output_type="list", new_field_name=new_field_name)
-    def concatenate_to_set(self, fields: List[str]) -> ScenarioList:
+    def concatenate_to_set(self, fields: List[str], new_field_name: Optional[str] = None) -> ScenarioList:
         """Concatenate specified fields into a single set field.
         :param fields: The fields to concatenate.
+        :param new_field_name: Optional custom name for the concatenated field.
         Returns:
             ScenarioList: A new ScenarioList with fields concatenated into a set.
@@ -522,11 +652,10 @@ class ScenarioList(Base, UserList, ScenarioListMixin):
             >>> s = ScenarioList([Scenario({'a': 1, 'b': 2, 'c': 3}), Scenario({'a': 4, 'b': 5, 'c': 6})])
             >>> s.concatenate_to_set(['a', 'b', 'c'])
             ScenarioList([Scenario({'concat_a_b_c': {1, 2, 3}}), Scenario({'concat_a_b_c': {4, 5, 6}})])
-            >>> s = ScenarioList([Scenario({'a': 1, 'b': 1, 'c': 3})])
-            >>> s.concatenate_to_set(['a', 'b', 'c'])
-            ScenarioList([Scenario({'concat_a_b_c': {1, 3}})])
+            >>> s.concatenate_to_set(['a', 'b', 'c'], new_field_name='unique_values')
+            ScenarioList([Scenario({'unique_values': {1, 2, 3}}), Scenario({'unique_values': {4, 5, 6}})])
         """
-        return self._concatenate(fields, output_type="set")
+        return self._concatenate(fields, output_type="set", new_field_name=new_field_name)
     def unpack_dict(
         self, field: str, prefix: Optional[str] = None, drop_field: bool = False
@@ -601,7 +730,6 @@ class ScenarioList(Base, UserList, ScenarioListMixin):
             )
         raw_var_name, expression = new_var_string.split("=", 1)
         var_name = raw_var_name.strip()
-        from edsl.utilities.utilities import is_valid_variable_name
         if not is_valid_variable_name(var_name):
             raise ScenarioError(f"{var_name} is not a valid variable name.")
@@ -729,7 +857,7 @@ class ScenarioList(Base, UserList, ScenarioListMixin):
         >>> s.select('a')
         ScenarioList([Scenario({'a': 1}), Scenario({'a': 1})])
         """
-        from edsl.scenarios.scenario_selector import ScenarioSelector
+        from .scenario_selector import ScenarioSelector
         return ScenarioSelector(self).select(*fields)
@@ -850,7 +978,7 @@ class ScenarioList(Base, UserList, ScenarioListMixin):
         >>> s.to_dataset()
         Dataset([{'a': [1, 2, 3]}, {'b': [4, 5, 6]}])
         """
-        from edsl.results.Dataset import Dataset
+        from ..dataset import Dataset
         keys = list(self[0].keys())
         for scenario in self:
@@ -959,6 +1087,8 @@ class ScenarioList(Base, UserList, ScenarioListMixin):
             new_list.append(new_obj)
         return new_list
     def replace_names(self, new_names: list) -> ScenarioList:
         """Replace the field names in the scenarios with a new list of names.
@@ -1156,6 +1286,7 @@ class ScenarioList(Base, UserList, ScenarioListMixin):
         return scenario_list
+    @classmethod
     def from_wikipedia(cls, url: str, table_index: int = 0):
         """
         Extracts a table from a Wikipedia page.
@@ -1230,13 +1361,19 @@ class ScenarioList(Base, UserList, ScenarioListMixin):
     @classmethod
     def from_excel(
-        cls, filename: str, sheet_name: Optional[str] = None
+        cls, filename: str, sheet_name: Optional[str] = None, skip_rows: Optional[List[int]] = None, use_codebook: bool = False
     ) -> ScenarioList:
         """Create a ScenarioList from an Excel file.
         If the Excel file contains multiple sheets and no sheet_name is provided,
         the method will print the available sheets and require the user to specify one.
+        Args:
+            filename (str): Path to the Excel file
+            sheet_name (Optional[str]): Name of the sheet to load. If None and multiple sheets exist,
+                                      will raise an error listing available sheets.
+            skip_rows (Optional[List[int]]): List of row indices to skip (0-based). If None, all rows are included.
         Example:
         >>> import tempfile
@@ -1244,30 +1381,33 @@ class ScenarioList(Base, UserList, ScenarioListMixin):
         >>> import pandas as pd
         >>> with tempfile.NamedTemporaryFile(delete=False, suffix='.xlsx') as f:
         ...     df1 = pd.DataFrame({
-        ...         'name': ['Alice', 'Bob'],
-        ...         'age': [30, 25],
-        ...         'location': ['New York', 'Los Angeles']
+        ...         'name': ['Alice', 'Bob', 'Charlie'],
+        ...         'age': [30, 25, 35],
+        ...         'location': ['New York', 'Los Angeles', 'Chicago']
         ...     })
         ...     df2 = pd.DataFrame({
-        ...         'name': ['Charlie', 'David'],
-        ...         'age': [35, 40],
-        ...         'location': ['Chicago', 'Boston']
+        ...         'name': ['David', 'Eve'],
+        ...         'age': [40, 45],
+        ...         'location': ['Boston', 'Seattle']
         ...     })
         ...     with pd.ExcelWriter(f.name) as writer:
         ...         df1.to_excel(writer, sheet_name='Sheet1', index=False)
         ...         df2.to_excel(writer, sheet_name='Sheet2', index=False)
         ...     temp_filename = f.name
+        >>> # Load all rows
         >>> scenario_list = ScenarioList.from_excel(temp_filename, sheet_name='Sheet1')
         >>> len(scenario_list)
+        3
+        >>> # Skip the second row (index 1)
+        >>> scenario_list = ScenarioList.from_excel(temp_filename, sheet_name='Sheet1', skip_rows=[1])
+        >>> len(scenario_list)
         2
         >>> scenario_list[0]['name']
         'Alice'
-        >>> scenario_list = ScenarioList.from_excel(temp_filename)  # Should raise an error and list sheets
-        Traceback (most recent call last):
-        ...
-        ValueError: Please provide a sheet name to load data from.
+        >>> scenario_list[1]['name']
+        'Charlie'
         """
-        from edsl.scenarios.Scenario import Scenario
+        from .scenario import Scenario
         import pandas as pd
         # Get all sheets
@@ -1287,11 +1427,28 @@ class ScenarioList(Base, UserList, ScenarioListMixin):
         # Load the specified or determined sheet
         df = pd.read_excel(filename, sheet_name=sheet_name)
+        # Skip specified rows if any
+        if skip_rows:
+            df = df.drop(skip_rows)
+            # Reset index to ensure continuous indexing
+            df = df.reset_index(drop=True)
+        if use_codebook:
+            codebook = {f"col_{i}": col for i, col in enumerate(df.columns)}
+            koobedoc = {col:f"col_{i}" for i, col in enumerate(df.columns)}
         observations = []
         for _, row in df.iterrows():
-            observations.append(Scenario(row.to_dict()))
+            if use_codebook:
+                observations.append(Scenario({koobedoc.get(k):v for k,v in row.to_dict().items()}))
+            else:
+                observations.append(Scenario(row.to_dict()))
-        return cls(observations)
+        if use_codebook:
+            return cls(observations, codebook=codebook)
+        else:
+            return cls(observations)
     @classmethod
     def from_google_sheet(cls, url: str, sheet_name: str = None, column_names: Optional[List[str]]= None) -> ScenarioList:
@@ -1359,7 +1516,7 @@ class ScenarioList(Base, UserList, ScenarioListMixin):
     ) -> ScenarioList:
         """Create a ScenarioList from a delimited file (CSV/TSV) or URL."""
         import requests
-        from edsl.scenarios.Scenario import Scenario
+        from .scenario import Scenario
         from urllib.parse import urlparse
         from urllib.parse import ParseResult
@@ -1415,7 +1572,7 @@ class ScenarioList(Base, UserList, ScenarioListMixin):
         >>> s3 == ScenarioList([Scenario({'age': 30, 'location': 'New York', 'name': 'Alice'}), Scenario({'age': 25, 'location': None, 'name': 'Bob'})])
         True
         """
-        from edsl.scenarios.scenario_join import ScenarioJoin
+        from .scenario_join import ScenarioJoin
         sj = ScenarioJoin(self, other)
         return sj.left_join(by)
@@ -1439,7 +1596,7 @@ class ScenarioList(Base, UserList, ScenarioListMixin):
         d = {"scenarios": [s.to_dict(add_edsl_version=add_edsl_version) for s in data]}
         if add_edsl_version:
-            from edsl import __version__
+            from .. import __version__
             d["edsl_version"] = __version__
             d["edsl_class_name"] = self.__class__.__name__
@@ -1451,15 +1608,13 @@ class ScenarioList(Base, UserList, ScenarioListMixin):
         :param survey: The Survey object to use for the Jobs object.
         Example:
-        >>> from edsl import Survey
-        >>> from edsl.jobs.Jobs import Jobs
-        >>> from edsl import ScenarioList
+        >>> from edsl import Survey, Jobs, ScenarioList
         >>> isinstance(ScenarioList.example().to(Survey.example()), Jobs)
         True
         """
-        from edsl.surveys.Survey import Survey
-        from edsl.questions.QuestionBase import QuestionBase
-        from edsl.jobs.Jobs import Jobs
+        from ..surveys import Survey
+        from ..questions import QuestionBase
+        from ..jobs import Jobs
         if isinstance(survey, QuestionBase):
             return Survey([survey]).by(self)
@@ -1476,7 +1631,7 @@ class ScenarioList(Base, UserList, ScenarioListMixin):
         ScenarioList([Scenario({'name': 'Alice'}), Scenario({'name': 'Bob'})])
         """
-        from edsl.scenarios.Scenario import Scenario
+        from .scenario import Scenario
         return cls([Scenario(s) for s in scenario_dicts_list])
@@ -1484,7 +1639,7 @@ class ScenarioList(Base, UserList, ScenarioListMixin):
     @remove_edsl_version
     def from_dict(cls, data) -> ScenarioList:
         """Create a `ScenarioList` from a dictionary."""
-        from edsl.scenarios.Scenario import Scenario
+        from .scenario import Scenario
         return cls([Scenario.from_dict(s) for s in data["scenarios"]])
@@ -1511,8 +1666,8 @@ class ScenarioList(Base, UserList, ScenarioListMixin):
     def code(self) -> str:
         """Create the Python code representation of a survey."""
         header_lines = [
-            "from edsl.scenarios.Scenario import Scenario",
-            "from edsl.scenarios.ScenarioList import ScenarioList",
+            "from edsl.scenarios import Scenario",
+            "from edsl.scenarios import ScenarioList",
         ]
         lines = ["\n".join(header_lines)]
         names = []
@@ -1531,17 +1686,6 @@ class ScenarioList(Base, UserList, ScenarioListMixin):
         """
         return cls([Scenario.example(randomize), Scenario.example(randomize)])
-    # def rich_print(self) -> None:
-    #     """Display an object as a table."""
-    #     from rich.table import Table
-    #     table = Table(title="ScenarioList")
-    #     table.add_column("Index", style="bold")
-    #     table.add_column("Scenario")
-    #     for i, s in enumerate(self):
-    #         table.add_row(str(i), s.rich_print())
-    #     return table
     def __getitem__(self, key: Union[int, slice]) -> Any:
         """Return the item at the given index.
@@ -1570,9 +1714,7 @@ class ScenarioList(Base, UserList, ScenarioListMixin):
         >>> s.to_agent_list()
         AgentList([Agent(traits = {'age': 22, 'hair': 'brown', 'height': 5.5}), Agent(traits = {'age': 22, 'hair': 'brown', 'height': 5.5})])
         """
-        from edsl.agents.AgentList import AgentList
-        from edsl.agents.Agent import Agent
-        import warnings
+        from ..agents import AgentList, Agent
         agents = []
         for scenario in self:
@@ -1629,12 +1771,14 @@ class ScenarioList(Base, UserList, ScenarioListMixin):
             new_scenarios.extend(replacement_scenarios)
         return ScenarioList(new_scenarios)
-    def collapse(self, field: str) -> ScenarioList:
+    def collapse(self, field: str, separator: Optional[str] = None, add_count: bool = False) -> ScenarioList:
         """Collapse a ScenarioList by grouping on all fields except the specified one,
         collecting the values of the specified field into a list.
         Args:
             field: The field to collapse (whose values will be collected into lists)
+            separator: Optional string to join the values with instead of keeping as a list
+            add_count: If True, adds a field showing the number of collapsed rows
         Returns:
             ScenarioList: A new ScenarioList with the specified field collapsed into lists
@@ -1642,12 +1786,11 @@ class ScenarioList(Base, UserList, ScenarioListMixin):
         Example:
         >>> s = ScenarioList([
         ...     Scenario({'category': 'fruit', 'color': 'red', 'item': 'apple'}),
-        ...     Scenario({'category': 'fruit', 'color': 'yellow', 'item': 'banana'}),
         ...     Scenario({'category': 'fruit', 'color': 'red', 'item': 'cherry'}),
         ...     Scenario({'category': 'vegetable', 'color': 'green', 'item': 'spinach'})
         ... ])
-        >>> s.collapse('item')
-        ScenarioList([Scenario({'category': 'fruit', 'color': 'red', 'item': ['apple', 'cherry']}), Scenario({'category': 'fruit', 'color': 'yellow', 'item': ['banana']}), Scenario({'category': 'vegetable', 'color': 'green', 'item': ['spinach']})])
+        >>> s.collapse('item', add_count=True)
+        ScenarioList([Scenario({'category': 'fruit', 'color': 'red', 'item': ['apple', 'cherry'], 'num_collapsed_rows': 2}), Scenario({'category': 'vegetable', 'color': 'green', 'item': ['spinach'], 'num_collapsed_rows': 1})])
         """
         if not self:
             return ScenarioList([])
@@ -1667,11 +1810,186 @@ class ScenarioList(Base, UserList, ScenarioListMixin):
         result = []
         for key, values in grouped.items():
             new_scenario = dict(zip(id_vars, key))
-            new_scenario[field] = values
+            if separator:
+                new_scenario[field] = separator.join(values)
+            else:
+                new_scenario[field] = values
+            if add_count:
+                new_scenario['num_collapsed_rows'] = len(values)
+            result.append(Scenario(new_scenario))
+        return ScenarioList(result)
+    def create_comparisons(
+        self,
+        bidirectional: bool = False,
+        num_options: int = 2,
+        option_prefix: str = "option_",
+        use_alphabet: bool = False
+    ) -> ScenarioList:
+        """Create a new ScenarioList with comparisons between scenarios.
+        Each scenario in the result contains multiple original scenarios as dictionaries,
+        allowing for side-by-side comparison.
+        Args:
+            bidirectional (bool): If True, include both (A,B) and (B,A) comparisons.
+                If False, only include (A,B) where A comes before B in the original list.
+            num_options (int): Number of scenarios to include in each comparison.
+                Default is 2 for pairwise comparisons.
+            option_prefix (str): Prefix for the keys in the resulting scenarios.
+                Default is "option_", resulting in keys like "option_1", "option_2", etc.
+                Ignored if use_alphabet is True.
+            use_alphabet (bool): If True, use letters as keys (A, B, C, etc.) instead of
+                the option_prefix with numbers.
+        Returns:
+            ScenarioList: A new ScenarioList where each scenario contains multiple original
+                scenarios as dictionaries.
+        Example:
+            >>> s = ScenarioList([
+            ...     Scenario({'id': 1, 'text': 'Option A'}),
+            ...     Scenario({'id': 2, 'text': 'Option B'}),
+            ...     Scenario({'id': 3, 'text': 'Option C'})
+            ... ])
+            >>> s.create_comparisons(use_alphabet=True)
+            ScenarioList([Scenario({'A': {'id': 1, 'text': 'Option A'}, 'B': {'id': 2, 'text': 'Option B'}}), Scenario({'A': {'id': 1, 'text': 'Option A'}, 'B': {'id': 3, 'text': 'Option C'}}), Scenario({'A': {'id': 2, 'text': 'Option B'}, 'B': {'id': 3, 'text': 'Option C'}})])
+            >>> s.create_comparisons(num_options=3, use_alphabet=True)
+            ScenarioList([Scenario({'A': {'id': 1, 'text': 'Option A'}, 'B': {'id': 2, 'text': 'Option B'}, 'C': {'id': 3, 'text': 'Option C'}})])
+        """
+        from itertools import combinations, permutations
+        import string
+        if num_options < 2:
+            raise ValueError("num_options must be at least 2")
+        if num_options > len(self):
+            raise ValueError(f"num_options ({num_options}) cannot exceed the number of scenarios ({len(self)})")
+        if use_alphabet and num_options > 26:
+            raise ValueError("When using alphabet labels, num_options cannot exceed 26 (the number of letters in the English alphabet)")
+        # Convert each scenario to a dictionary
+        scenario_dicts = [scenario.to_dict(add_edsl_version=False) for scenario in self]
+        # Generate combinations or permutations based on bidirectional flag
+        if bidirectional:
+            # For bidirectional, use permutations to get all ordered arrangements
+            if num_options == 2:
+                # For pairwise, we can use permutations with r=2
+                scenario_groups = permutations(scenario_dicts, 2)
+            else:
+                # For more than 2 options with bidirectional=True,
+                # we need all permutations of the specified size
+                scenario_groups = permutations(scenario_dicts, num_options)
+        else:
+            # For unidirectional, use combinations to get unordered groups
+            scenario_groups = combinations(scenario_dicts, num_options)
+        # Create new scenarios with the combinations
+        result = []
+        for group in scenario_groups:
+            new_scenario = {}
+            for i, scenario_dict in enumerate(group):
+                if use_alphabet:
+                    # Use uppercase letters (A, B, C, etc.)
+                    key = string.ascii_uppercase[i]
+                else:
+                    # Use the option prefix with numbers (option_1, option_2, etc.)
+                    key = f"{option_prefix}{i+1}"
+                new_scenario[key] = scenario_dict
             result.append(Scenario(new_scenario))
         return ScenarioList(result)
+    @classmethod
+    def from_parquet(cls, filepath: str) -> ScenarioList:
+        """Create a ScenarioList from a Parquet file.
+        Args:
+            filepath (str): Path to the Parquet file
+        Returns:
+            ScenarioList: A ScenarioList containing the data from the Parquet file
+        Example:
+        >>> import pandas as pd
+        >>> import tempfile
+        >>> df = pd.DataFrame({'name': ['Alice', 'Bob'], 'age': [30, 25]})
+        >>> # The following would create and read a parquet file if dependencies are installed:
+        >>> # with tempfile.NamedTemporaryFile(suffix='.parquet', delete=False) as f:
+        >>> #     df.to_parquet(f.name)
+        >>> #     scenario_list = ScenarioList.from_parquet(f.name)
+        >>> # Instead, we'll demonstrate the equivalent result:
+        >>> scenario_list = ScenarioList.from_pandas(df)
+        >>> len(scenario_list)
+        2
+        >>> scenario_list[0]['name']
+        'Alice'
+        """
+        import pandas as pd
+        try:
+            # Try to read the Parquet file with pandas
+            df = pd.read_parquet(filepath)
+        except ImportError as e:
+            # Handle missing dependencies with a helpful error message
+            if "pyarrow" in str(e) or "fastparquet" in str(e):
+                raise ImportError(
+                    "Missing dependencies for Parquet support. Please install either pyarrow or fastparquet:\n"
+                    "  pip install pyarrow\n"
+                    "  or\n"
+                    "  pip install fastparquet"
+                ) from e
+            else:
+                raise
+        # Convert the DataFrame to a ScenarioList
+        return cls.from_pandas(df)
+    def replace_values(self, replacements:dict) -> "ScenarioList":
+        """
+        Create new scenarios with values replaced according to the provided replacement dictionary.
+        Args:
+            replacements (dict): Dictionary of values to replace {old_value: new_value}
+        Returns:
+            ScenarioList: A new ScenarioList with replaced values
+        Examples:
+            >>> scenarios = ScenarioList([
+            ...     Scenario({'a': 'nan', 'b': 1}),
+            ...     Scenario({'a': 2, 'b': 'nan'})
+            ... ])
+            >>> replaced = scenarios.replace_values({'nan': None})
+            >>> print(replaced)
+            ScenarioList([Scenario({'a': None, 'b': 1}), Scenario({'a': 2, 'b': None})])
+            >>> # Original scenarios remain unchanged
+            >>> print(scenarios)
+            ScenarioList([Scenario({'a': 'nan', 'b': 1}), Scenario({'a': 2, 'b': 'nan'})])
+        """
+        new_scenarios = []
+        for scenario in self:
+            new_scenario = {}
+            for key, value in scenario.items():
+                if str(value) in replacements:
+                    new_scenario[key] = replacements[str(value)]
+                else:
+                    new_scenario[key] = value
+            new_scenarios.append(Scenario(new_scenario))
+        return ScenarioList(new_scenarios)
+    @classmethod
+    def from_pdf(cls, filename_or_url, collapse_pages=False):
+        return PdfTools.from_pdf(filename_or_url, collapse_pages)
+    @classmethod
+    def from_pdf_to_image(cls, pdf_path, image_format="jpeg"):
+        return PdfTools.from_pdf_to_image(pdf_path, image_format)
 if __name__ == "__main__":
     import doctest

edsl 0.1.46__py3-none-any.whl → 0.1.48__py3-none-any.whl

edsl 0.1.46py3-none-any.whl → 0.1.48py3-none-any.whl