PyPI - edsl - Versions diffs - 0.1.38.dev4__py3-none-any.whl → 0.1.39__py3-none-any.whl - Mend

edsl 0.1.38.dev4py3-none-any.whl → 0.1.39py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (212) hide show

edsl/Base.py +197 -116
edsl/__init__.py +15 -7
edsl/__version__.py +1 -1
edsl/agents/Agent.py +351 -147
edsl/agents/AgentList.py +211 -73
edsl/agents/Invigilator.py +101 -50
edsl/agents/InvigilatorBase.py +62 -70
edsl/agents/PromptConstructor.py +143 -225
edsl/agents/QuestionInstructionPromptBuilder.py +128 -0
edsl/agents/QuestionTemplateReplacementsBuilder.py +137 -0
edsl/agents/__init__.py +0 -1
edsl/agents/prompt_helpers.py +3 -3
edsl/agents/question_option_processor.py +172 -0
edsl/auto/AutoStudy.py +18 -5
edsl/auto/StageBase.py +53 -40
edsl/auto/StageQuestions.py +2 -1
edsl/auto/utilities.py +0 -6
edsl/config.py +22 -2
edsl/conversation/car_buying.py +2 -1
edsl/coop/CoopFunctionsMixin.py +15 -0
edsl/coop/ExpectedParrotKeyHandler.py +125 -0
edsl/coop/PriceFetcher.py +1 -1
edsl/coop/coop.py +125 -47
edsl/coop/utils.py +14 -14
edsl/data/Cache.py +45 -27
edsl/data/CacheEntry.py +12 -15
edsl/data/CacheHandler.py +31 -12
edsl/data/RemoteCacheSync.py +154 -46
edsl/data/__init__.py +4 -3
edsl/data_transfer_models.py +2 -1
edsl/enums.py +27 -0
edsl/exceptions/__init__.py +50 -50
edsl/exceptions/agents.py +12 -0
edsl/exceptions/inference_services.py +5 -0
edsl/exceptions/questions.py +24 -6
edsl/exceptions/scenarios.py +7 -0
edsl/inference_services/AnthropicService.py +38 -19
edsl/inference_services/AvailableModelCacheHandler.py +184 -0
edsl/inference_services/AvailableModelFetcher.py +215 -0
edsl/inference_services/AwsBedrock.py +0 -2
edsl/inference_services/AzureAI.py +0 -2
edsl/inference_services/GoogleService.py +7 -12
edsl/inference_services/InferenceServiceABC.py +18 -85
edsl/inference_services/InferenceServicesCollection.py +120 -79
edsl/inference_services/MistralAIService.py +0 -3
edsl/inference_services/OpenAIService.py +47 -35
edsl/inference_services/PerplexityService.py +0 -3
edsl/inference_services/ServiceAvailability.py +135 -0
edsl/inference_services/TestService.py +11 -10
edsl/inference_services/TogetherAIService.py +5 -3
edsl/inference_services/data_structures.py +134 -0
edsl/jobs/AnswerQuestionFunctionConstructor.py +223 -0
edsl/jobs/Answers.py +1 -14
edsl/jobs/FetchInvigilator.py +47 -0
edsl/jobs/InterviewTaskManager.py +98 -0
edsl/jobs/InterviewsConstructor.py +50 -0
edsl/jobs/Jobs.py +356 -431
edsl/jobs/JobsChecks.py +35 -10
edsl/jobs/JobsComponentConstructor.py +189 -0
edsl/jobs/JobsPrompts.py +6 -4
edsl/jobs/JobsRemoteInferenceHandler.py +205 -133
edsl/jobs/JobsRemoteInferenceLogger.py +239 -0
edsl/jobs/RequestTokenEstimator.py +30 -0
edsl/jobs/async_interview_runner.py +138 -0
edsl/jobs/buckets/BucketCollection.py +44 -3
edsl/jobs/buckets/TokenBucket.py +53 -21
edsl/jobs/buckets/TokenBucketAPI.py +211 -0
edsl/jobs/buckets/TokenBucketClient.py +191 -0
edsl/jobs/check_survey_scenario_compatibility.py +85 -0
edsl/jobs/data_structures.py +120 -0
edsl/jobs/decorators.py +35 -0
edsl/jobs/interviews/Interview.py +143 -408
edsl/jobs/jobs_status_enums.py +9 -0
edsl/jobs/loggers/HTMLTableJobLogger.py +304 -0
edsl/jobs/results_exceptions_handler.py +98 -0
edsl/jobs/runners/JobsRunnerAsyncio.py +88 -403
edsl/jobs/runners/JobsRunnerStatus.py +133 -165
edsl/jobs/tasks/QuestionTaskCreator.py +21 -19
edsl/jobs/tasks/TaskHistory.py +38 -18
edsl/jobs/tasks/task_status_enum.py +0 -2
edsl/language_models/ComputeCost.py +63 -0
edsl/language_models/LanguageModel.py +194 -236
edsl/language_models/ModelList.py +28 -19
edsl/language_models/PriceManager.py +127 -0
edsl/language_models/RawResponseHandler.py +106 -0
edsl/language_models/ServiceDataSources.py +0 -0
edsl/language_models/__init__.py +1 -2
edsl/language_models/key_management/KeyLookup.py +63 -0
edsl/language_models/key_management/KeyLookupBuilder.py +273 -0
edsl/language_models/key_management/KeyLookupCollection.py +38 -0
edsl/language_models/key_management/__init__.py +0 -0
edsl/language_models/key_management/models.py +131 -0
edsl/language_models/model.py +256 -0
edsl/language_models/repair.py +2 -2
edsl/language_models/utilities.py +5 -4
edsl/notebooks/Notebook.py +19 -14
edsl/notebooks/NotebookToLaTeX.py +142 -0
edsl/prompts/Prompt.py +29 -39
edsl/questions/ExceptionExplainer.py +77 -0
edsl/questions/HTMLQuestion.py +103 -0
edsl/questions/QuestionBase.py +68 -214
edsl/questions/QuestionBasePromptsMixin.py +7 -3
edsl/questions/QuestionBudget.py +1 -1
edsl/questions/QuestionCheckBox.py +3 -3
edsl/questions/QuestionExtract.py +5 -7
edsl/questions/QuestionFreeText.py +2 -3
edsl/questions/QuestionList.py +10 -18
edsl/questions/QuestionMatrix.py +265 -0
edsl/questions/QuestionMultipleChoice.py +67 -23
edsl/questions/QuestionNumerical.py +2 -4
edsl/questions/QuestionRank.py +7 -17
edsl/questions/SimpleAskMixin.py +4 -3
edsl/questions/__init__.py +2 -1
edsl/questions/{AnswerValidatorMixin.py → answer_validator_mixin.py} +47 -2
edsl/questions/data_structures.py +20 -0
edsl/questions/derived/QuestionLinearScale.py +6 -3
edsl/questions/derived/QuestionTopK.py +1 -1
edsl/questions/descriptors.py +17 -3
edsl/questions/loop_processor.py +149 -0
edsl/questions/{QuestionBaseGenMixin.py → question_base_gen_mixin.py} +57 -50
edsl/questions/question_registry.py +1 -1
edsl/questions/{ResponseValidatorABC.py → response_validator_abc.py} +40 -26
edsl/questions/response_validator_factory.py +34 -0
edsl/questions/templates/matrix/__init__.py +1 -0
edsl/questions/templates/matrix/answering_instructions.jinja +5 -0
edsl/questions/templates/matrix/question_presentation.jinja +20 -0
edsl/results/CSSParameterizer.py +1 -1
edsl/results/Dataset.py +170 -7
edsl/results/DatasetExportMixin.py +168 -305
edsl/results/DatasetTree.py +28 -8
edsl/results/MarkdownToDocx.py +122 -0
edsl/results/MarkdownToPDF.py +111 -0
edsl/results/Result.py +298 -206
edsl/results/Results.py +149 -131
edsl/results/ResultsExportMixin.py +2 -0
edsl/results/TableDisplay.py +98 -171
edsl/results/TextEditor.py +50 -0
edsl/results/__init__.py +1 -1
edsl/results/file_exports.py +252 -0
edsl/results/{Selector.py → results_selector.py} +23 -13
edsl/results/smart_objects.py +96 -0
edsl/results/table_data_class.py +12 -0
edsl/results/table_renderers.py +118 -0
edsl/scenarios/ConstructDownloadLink.py +109 -0
edsl/scenarios/DocumentChunker.py +102 -0
edsl/scenarios/DocxScenario.py +16 -0
edsl/scenarios/FileStore.py +150 -239
edsl/scenarios/PdfExtractor.py +40 -0
edsl/scenarios/Scenario.py +90 -193
edsl/scenarios/ScenarioHtmlMixin.py +4 -3
edsl/scenarios/ScenarioList.py +415 -244
edsl/scenarios/ScenarioListExportMixin.py +0 -7
edsl/scenarios/ScenarioListPdfMixin.py +15 -37
edsl/scenarios/__init__.py +1 -2
edsl/scenarios/directory_scanner.py +96 -0
edsl/scenarios/file_methods.py +85 -0
edsl/scenarios/handlers/__init__.py +13 -0
edsl/scenarios/handlers/csv.py +49 -0
edsl/scenarios/handlers/docx.py +76 -0
edsl/scenarios/handlers/html.py +37 -0
edsl/scenarios/handlers/json.py +111 -0
edsl/scenarios/handlers/latex.py +5 -0
edsl/scenarios/handlers/md.py +51 -0
edsl/scenarios/handlers/pdf.py +68 -0
edsl/scenarios/handlers/png.py +39 -0
edsl/scenarios/handlers/pptx.py +105 -0
edsl/scenarios/handlers/py.py +294 -0
edsl/scenarios/handlers/sql.py +313 -0
edsl/scenarios/handlers/sqlite.py +149 -0
edsl/scenarios/handlers/txt.py +33 -0
edsl/scenarios/{ScenarioJoin.py → scenario_join.py} +10 -6
edsl/scenarios/scenario_selector.py +156 -0
edsl/study/ObjectEntry.py +1 -1
edsl/study/SnapShot.py +1 -1
edsl/study/Study.py +5 -12
edsl/surveys/ConstructDAG.py +92 -0
edsl/surveys/EditSurvey.py +221 -0
edsl/surveys/InstructionHandler.py +100 -0
edsl/surveys/MemoryManagement.py +72 -0
edsl/surveys/Rule.py +5 -4
edsl/surveys/RuleCollection.py +25 -27
edsl/surveys/RuleManager.py +172 -0
edsl/surveys/Simulator.py +75 -0
edsl/surveys/Survey.py +270 -791
edsl/surveys/SurveyCSS.py +20 -8
edsl/surveys/{SurveyFlowVisualizationMixin.py → SurveyFlowVisualization.py} +11 -9
edsl/surveys/SurveyToApp.py +141 -0
edsl/surveys/__init__.py +4 -2
edsl/surveys/descriptors.py +6 -2
edsl/surveys/instructions/ChangeInstruction.py +1 -2
edsl/surveys/instructions/Instruction.py +4 -13
edsl/surveys/instructions/InstructionCollection.py +11 -6
edsl/templates/error_reporting/interview_details.html +1 -1
edsl/templates/error_reporting/report.html +1 -1
edsl/tools/plotting.py +1 -1
edsl/utilities/PrettyList.py +56 -0
edsl/utilities/is_notebook.py +18 -0
edsl/utilities/is_valid_variable_name.py +11 -0
edsl/utilities/remove_edsl_version.py +24 -0
edsl/utilities/utilities.py +35 -23
{edsl-0.1.38.dev4.dist-info → edsl-0.1.39.dist-info}/METADATA +12 -10
edsl-0.1.39.dist-info/RECORD +358 -0
{edsl-0.1.38.dev4.dist-info → edsl-0.1.39.dist-info}/WHEEL +1 -1
edsl/language_models/KeyLookup.py +0 -30
edsl/language_models/registry.py +0 -190
edsl/language_models/unused/ReplicateBase.py +0 -83
edsl/results/ResultsDBMixin.py +0 -238
edsl-0.1.38.dev4.dist-info/RECORD +0 -277
/edsl/questions/{RegisterQuestionsMeta.py → register_questions_meta.py} +0 -0
/edsl/results/{ResultsFetchMixin.py → results_fetch_mixin.py} +0 -0
/edsl/results/{ResultsToolsMixin.py → results_tools_mixin.py} +0 -0
{edsl-0.1.38.dev4.dist-info → edsl-0.1.39.dist-info}/LICENSE +0 -0

edsl/inference_services/InferenceServiceABC.py CHANGED Viewed

@@ -1,5 +1,4 @@
 from abc import abstractmethod, ABC
-import os
 import re
 from datetime import datetime, timedelta
 from edsl.config import CONFIG
@@ -8,31 +7,32 @@ from edsl.config import CONFIG
 class InferenceServiceABC(ABC):
     """
     Abstract class for inference services.
-    Anthropic: https://docs.anthropic.com/en/api/rate-limits
     """
     _coop_config_vars = None
-    default_levels = {
-        "google": {"tpm": 2_000_000, "rpm": 15},
-        "openai": {"tpm": 2_000_000, "rpm": 10_000},
-        "anthropic": {"tpm": 2_000_000, "rpm": 500},
-    }
     def __init_subclass__(cls):
         """
         Check that the subclass has the required attributes.
         - `key_sequence` attribute determines...
         - `model_exclude_list` attribute determines...
         """
-        if not hasattr(cls, "key_sequence"):
-            raise NotImplementedError(
-                f"Class {cls.__name__} must have a 'key_sequence' attribute."
-            )
-        if not hasattr(cls, "model_exclude_list"):
-            raise NotImplementedError(
-                f"Class {cls.__name__} must have a 'model_exclude_list' attribute."
-            )
+        must_have_attributes = [
+            "key_sequence",
+            "model_exclude_list",
+            "usage_sequence",
+            "input_token_name",
+            "output_token_name",
+        ]
+        for attr in must_have_attributes:
+            if not hasattr(cls, attr):
+                raise NotImplementedError(
+                    f"Class {cls.__name__} must have a '{attr}' attribute."
+                )
+    @property
+    def service_name(self):
+        return self._inference_service_
     @classmethod
     def _should_refresh_coop_config_vars(cls):
@@ -44,44 +44,6 @@ class InferenceServiceABC(ABC):
             return True
         return (datetime.now() - cls._last_config_fetch) > timedelta(hours=24)
-    @classmethod
-    def _get_limt(cls, limit_type: str) -> int:
-        key = f"EDSL_SERVICE_{limit_type.upper()}_{cls._inference_service_.upper()}"
-        if key in os.environ:
-            return int(os.getenv(key))
-        if cls._coop_config_vars is None or cls._should_refresh_coop_config_vars():
-            try:
-                from edsl import Coop
-                c = Coop()
-                cls._coop_config_vars = c.fetch_rate_limit_config_vars()
-                cls._last_config_fetch = datetime.now()
-                if key in cls._coop_config_vars:
-                    return cls._coop_config_vars[key]
-            except Exception:
-                cls._coop_config_vars = None
-        else:
-            if key in cls._coop_config_vars:
-                return cls._coop_config_vars[key]
-        if cls._inference_service_ in cls.default_levels:
-            return int(cls.default_levels[cls._inference_service_][limit_type])
-        return int(CONFIG.get(f"EDSL_SERVICE_{limit_type.upper()}_BASELINE"))
-    def get_tpm(cls) -> int:
-        """
-        Returns the TPM for the service. If the service is not defined in the environment variables, it will return the baseline TPM.
-        """
-        return cls._get_limt(limit_type="tpm")
-    def get_rpm(cls):
-        """
-        Returns the RPM for the service. If the service is not defined in the environment variables, it will return the baseline RPM.
-        """
-        return cls._get_limt(limit_type="rpm")
     @abstractmethod
     def available() -> list[str]:
         """
@@ -113,35 +75,6 @@ class InferenceServiceABC(ABC):
 if __name__ == "__main__":
-    pass
-    # deep_infra_service = DeepInfraService("deep_infra", "DEEP_INFRA_API_KEY")
-    # deep_infra_service.available()
-    # m = deep_infra_service.create_model("microsoft/WizardLM-2-7B")
-    # response = m().hello()
-    # print(response)
-    # anthropic_service = AnthropicService("anthropic", "ANTHROPIC_API_KEY")
-    # anthropic_service.available()
-    # m = anthropic_service.create_model("claude-3-opus-20240229")
-    # response = m().hello()
-    # print(response)
-    # factory = OpenAIService("openai", "OPENAI_API")
-    # factory.available()
-    # m = factory.create_model("gpt-3.5-turbo")
-    # response = m().hello()
-    # from edsl import QuestionFreeText
-    # results = QuestionFreeText.example().by(m()).run()
-    # collection = InferenceServicesCollection([
-    #     OpenAIService,
-    #     AnthropicService,
-    #     DeepInfraService
-    # ])
+    import doctest
-    # available = collection.available()
-    # factory = collection.create_model_factory(*available[0])
-    # m = factory()
-    # from edsl import QuestionFreeText
-    # results = QuestionFreeText.example().by(m).run()
-    # print(results)
+    doctest.testmod()

edsl/inference_services/InferenceServicesCollection.py CHANGED Viewed

@@ -1,97 +1,138 @@
+from functools import lru_cache
+from collections import defaultdict
+from typing import Optional, Protocol, Dict, List, Tuple, TYPE_CHECKING, Literal
 from edsl.inference_services.InferenceServiceABC import InferenceServiceABC
-import warnings
+from edsl.inference_services.AvailableModelFetcher import AvailableModelFetcher
+from edsl.exceptions.inference_services import InferenceServiceError
+if TYPE_CHECKING:
+    from edsl.language_models.LanguageModel import LanguageModel
+    from edsl.inference_services.InferenceServiceABC import InferenceServiceABC
+class ModelCreator(Protocol):
+    def create_model(self, model_name: str) -> "LanguageModel":
+        ...
+from edsl.enums import InferenceServiceLiteral
+class ModelResolver:
+    def __init__(
+        self,
+        services: List[InferenceServiceLiteral],
+        models_to_services: Dict[InferenceServiceLiteral, InferenceServiceABC],
+        availability_fetcher: "AvailableModelFetcher",
+    ):
+        """
+        Class for determining which service to use for a given model.
+        """
+        self.services = services
+        self._models_to_services = models_to_services
+        self.availability_fetcher = availability_fetcher
+        self._service_names_to_classes = {
+            service._inference_service_: service for service in services
+        }
+    def resolve_model(
+        self, model_name: str, service_name: Optional[InferenceServiceLiteral] = None
+    ) -> InferenceServiceABC:
+        """Returns an InferenceServiceABC object for the given model name.
+        :param model_name: The name of the model to resolve. E.g., 'gpt-4o'
+        :param service_name: The name of the service to use. E.g., 'openai'
+        :return: An InferenceServiceABC object
+        """
+        if model_name == "test":
+            from edsl.inference_services.TestService import TestService
+            return TestService()
+        if service_name is not None:
+            service: InferenceServiceABC = self._service_names_to_classes.get(
+                service_name
+            )
+            if not service:
+                raise InferenceServiceError(f"Service {service_name} not found")
+            return service
+        if model_name in self._models_to_services:  # maybe we've seen it before!
+            return self._models_to_services[model_name]
+        for service in self.services:
+            (
+                available_models,
+                service_name,
+            ) = self.availability_fetcher.get_available_models_by_service(service)
+            if model_name in available_models:
+                self._models_to_services[model_name] = service
+                return service
+        raise InferenceServiceError(
+            f"""Model {model_name} not found in any services.
+                                    If you know the service that has this model, use the service_name parameter directly.
+                                    E.g., Model("gpt-4o", service_name="openai")
+                                    """
+        )
 class InferenceServicesCollection:
-    added_models = {}
+    added_models = defaultdict(list)  # Moved back to class level
-    def __init__(self, services: list[InferenceServiceABC] = None):
+    def __init__(self, services: Optional[List[InferenceServiceABC]] = None):
         self.services = services or []
+        self._models_to_services: Dict[str, InferenceServiceABC] = {}
+        self.availability_fetcher = AvailableModelFetcher(
+            self.services, self.added_models
+        )
+        self.resolver = ModelResolver(
+            self.services, self._models_to_services, self.availability_fetcher
+        )
     @classmethod
-    def add_model(cls, service_name, model_name):
+    def add_model(cls, service_name: str, model_name: str) -> None:
         if service_name not in cls.added_models:
-            cls.added_models[service_name] = []
-        cls.added_models[service_name].append(model_name)
-    @staticmethod
-    def _get_service_available(service, warn: bool = False) -> list[str]:
-        try:
-            service_models = service.available()
-        except Exception:
-            if warn:
-                warnings.warn(
-                    f"""Error getting models for {service._inference_service_}.
-                    Check that you have properly stored your Expected Parrot API key and activated remote inference, or stored your own API keys for the language models that you want to use.
-                    See https://docs.expectedparrot.com/en/latest/api_keys.html for instructions on storing API keys.
-                    Relying on Coop.""",
-                    UserWarning,
-                )
-            # Use the list of models on Coop as a fallback
-            try:
-                from edsl import Coop
-                c = Coop()
-                models_from_coop = c.fetch_models()
-                service_models = models_from_coop.get(service._inference_service_, [])
-                # cache results
-                service._models_list_cache = service_models
-            # Finally, use the available models cache from the Python file
-            except Exception:
-                if warn:
-                    warnings.warn(
-                        f"""Error getting models for {service._inference_service_}.
-                        Relying on EDSL cache.""",
-                        UserWarning,
-                    )
-                from edsl.inference_services.models_available_cache import (
-                    models_available,
-                )
-                service_models = models_available.get(service._inference_service_, [])
-                # cache results
-                service._models_list_cache = service_models
-        return service_models
-    def available(self):
-        total_models = []
-        for service in self.services:
-            service_models = self._get_service_available(service)
-            for model in service_models:
-                total_models.append([model, service._inference_service_, -1])
+            cls.added_models[service_name].append(model_name)
-            for model in self.added_models.get(service._inference_service_, []):
-                total_models.append([model, service._inference_service_, -1])
+    def service_names_to_classes(self) -> Dict[str, InferenceServiceABC]:
+        return {service._inference_service_: service for service in self.services}
-        sorted_models = sorted(total_models)
-        for i, model in enumerate(sorted_models):
-            model[2] = i
-            model = tuple(model)
-        return sorted_models
+    def available(
+        self,
+        service: Optional[str] = None,
+    ) -> List[Tuple[str, str, int]]:
+        return self.availability_fetcher.available(service)
-    def register(self, service):
+    def reset_cache(self) -> None:
+        self.availability_fetcher.reset_cache()
+    @property
+    def num_cache_entries(self) -> int:
+        return self.availability_fetcher.num_cache_entries
+    def register(self, service: InferenceServiceABC) -> None:
         self.services.append(service)
-    def create_model_factory(self, model_name: str, service_name=None, index=None):
-        from edsl.inference_services.TestService import TestService
+    def create_model_factory(
+        self, model_name: str, service_name: Optional[InferenceServiceLiteral] = None
+    ) -> "LanguageModel":
-        if model_name == "test":
-            return TestService.create_model(model_name)
+        if service_name is None:  # we try to find the right service
+            service = self.resolver.resolve_model(model_name, service_name)
+        else:  # if they passed a service, we'll use that
+            service = self.service_names_to_classes().get(service_name)
-        if service_name:
-            for service in self.services:
-                if service_name == service._inference_service_:
-                    return service.create_model(model_name)
+        if not service:  # but if we can't find it, we'll raise an error
+            raise InferenceServiceError(f"Service {service_name} not found")
-        for service in self.services:
-            if model_name in self._get_service_available(service):
-                if service_name is None or service_name == service._inference_service_:
-                    return service.create_model(model_name)
+        return service.create_model(model_name)
+if __name__ == "__main__":
+    import doctest
-        raise Exception(f"Model {model_name} not found in any of the services")
+    doctest.testmod()

edsl/inference_services/MistralAIService.py CHANGED Viewed

@@ -85,9 +85,6 @@ class MistralAIService(InferenceServiceABC):
                 "top_p": 0.9,
             }
-            _tpm = cls.get_tpm(cls)
-            _rpm = cls.get_rpm(cls)
             def sync_client(self):
                 return cls.sync_client()

edsl/inference_services/OpenAIService.py CHANGED Viewed

@@ -1,16 +1,19 @@
 from __future__ import annotations
-from typing import Any, List, Optional
+from typing import Any, List, Optional, Dict, NewType
 import os
 import openai
 from edsl.inference_services.InferenceServiceABC import InferenceServiceABC
-from edsl.language_models import LanguageModel
+from edsl.language_models.LanguageModel import LanguageModel
 from edsl.inference_services.rate_limits_cache import rate_limits
 from edsl.utilities.utilities import fix_partial_correct_response
 from edsl.config import CONFIG
+APIToken = NewType("APIToken", str)
 class OpenAIService(InferenceServiceABC):
     """OpenAI service class."""
@@ -22,35 +25,43 @@ class OpenAIService(InferenceServiceABC):
     _sync_client_ = openai.OpenAI
     _async_client_ = openai.AsyncOpenAI
-    _sync_client_instance = None
-    _async_client_instance = None
+    _sync_client_instances: Dict[APIToken, openai.OpenAI] = {}
+    _async_client_instances: Dict[APIToken, openai.AsyncOpenAI] = {}
     key_sequence = ["choices", 0, "message", "content"]
     usage_sequence = ["usage"]
     input_token_name = "prompt_tokens"
     output_token_name = "completion_tokens"
+    available_models_url = "https://platform.openai.com/docs/models/gp"
     def __init_subclass__(cls, **kwargs):
         super().__init_subclass__(**kwargs)
-        # so subclasses have to create their own instances of the clients
-        cls._sync_client_instance = None
-        cls._async_client_instance = None
+        # so subclasses that use the OpenAI api key have to create their own instances of the clients
+        cls._sync_client_instances = {}
+        cls._async_client_instances = {}
     @classmethod
-    def sync_client(cls):
-        if cls._sync_client_instance is None:
-            cls._sync_client_instance = cls._sync_client_(
-                api_key=os.getenv(cls._env_key_name_), base_url=cls._base_url_
+    def sync_client(cls, api_key):
+        if api_key not in cls._sync_client_instances:
+            client = cls._sync_client_(
+                api_key=api_key,
+                base_url=cls._base_url_,
             )
-        return cls._sync_client_instance
+            cls._sync_client_instances[api_key] = client
+        client = cls._sync_client_instances[api_key]
+        return client
     @classmethod
-    def async_client(cls):
-        if cls._async_client_instance is None:
-            cls._async_client_instance = cls._async_client_(
-                api_key=os.getenv(cls._env_key_name_), base_url=cls._base_url_
+    def async_client(cls, api_key):
+        if api_key not in cls._async_client_instances:
+            client = cls._async_client_(
+                api_key=api_key,
+                base_url=cls._base_url_,
             )
-        return cls._async_client_instance
+            cls._async_client_instances[api_key] = client
+        client = cls._async_client_instances[api_key]
+        return client
     model_exclude_list = [
         "whisper-1",
@@ -72,20 +83,24 @@ class OpenAIService(InferenceServiceABC):
     _models_list_cache: List[str] = []
     @classmethod
-    def get_model_list(cls):
-        raw_list = cls.sync_client().models.list()
+    def get_model_list(cls, api_key=None):
+        if api_key is None:
+            api_key = os.getenv(cls._env_key_name_)
+        raw_list = cls.sync_client(api_key).models.list()
         if hasattr(raw_list, "data"):
             return raw_list.data
         else:
             return raw_list
     @classmethod
-    def available(cls) -> List[str]:
+    def available(cls, api_token=None) -> List[str]:
+        if api_token is None:
+            api_token = os.getenv(cls._env_key_name_)
         if not cls._models_list_cache:
             try:
                 cls._models_list_cache = [
                     m.id
-                    for m in cls.get_model_list()
+                    for m in cls.get_model_list(api_key=api_token)
                     if m.id not in cls.model_exclude_list
                 ]
             except Exception as e:
@@ -107,9 +122,6 @@ class OpenAIService(InferenceServiceABC):
             input_token_name = cls.input_token_name
             output_token_name = cls.output_token_name
-            _rpm = cls.get_rpm(cls)
-            _tpm = cls.get_tpm(cls)
             _inference_service_ = cls._inference_service_
             _model_ = model_name
             _parameters_ = {
@@ -123,10 +135,10 @@ class OpenAIService(InferenceServiceABC):
             }
             def sync_client(self):
-                return cls.sync_client()
+                return cls.sync_client(api_key=self.api_token)
             def async_client(self):
-                return cls.async_client()
+                return cls.async_client(api_key=self.api_token)
             @classmethod
             def available(cls) -> list[str]:
@@ -175,16 +187,16 @@ class OpenAIService(InferenceServiceABC):
             ) -> dict[str, Any]:
                 """Calls the OpenAI API and returns the API response."""
                 if files_list:
-                    encoded_image = files_list[0].base64_string
                     content = [{"type": "text", "text": user_prompt}]
-                    content.append(
-                        {
-                            "type": "image_url",
-                            "image_url": {
-                                "url": f"data:image/jpeg;base64,{encoded_image}"
-                            },
-                        }
-                    )
+                    for file_entry in files_list:
+                        content.append(
+                            {
+                                "type": "image_url",
+                                "image_url": {
+                                    "url": f"data:{file_entry.mime_type};base64,{file_entry.base64_string}"
+                                },
+                            }
+                        )
                 else:
                     content = user_prompt
                 client = self.async_client()

edsl/inference_services/PerplexityService.py CHANGED Viewed

@@ -51,9 +51,6 @@ class PerplexityService(OpenAIService):
             input_token_name = cls.input_token_name
             output_token_name = cls.output_token_name
-            _rpm = cls.get_rpm(cls)
-            _tpm = cls.get_tpm(cls)
             _inference_service_ = cls._inference_service_
             _model_ = model_name

edsl/inference_services/ServiceAvailability.py ADDED Viewed

@@ -0,0 +1,135 @@
+from enum import Enum
+from typing import List, Optional, TYPE_CHECKING
+from functools import partial
+import warnings
+from edsl.inference_services.data_structures import AvailableModels, ModelNamesList
+if TYPE_CHECKING:
+    from edsl.inference_services.InferenceServiceABC import InferenceServiceABC
+class ModelSource(Enum):
+    LOCAL = "local"
+    COOP = "coop"
+    CACHE = "cache"
+class ServiceAvailability:
+    """This class is responsible for fetching the available models from different sources."""
+    _coop_model_list = None
+    def __init__(self, source_order: Optional[List[ModelSource]] = None):
+        """
+        Initialize with custom source order.
+        Default order is LOCAL -> COOP -> CACHE
+        """
+        self.source_order = source_order or [
+            ModelSource.LOCAL,
+            ModelSource.COOP,
+            ModelSource.CACHE,
+        ]
+        # Map sources to their fetch functions
+        self._source_fetchers = {
+            ModelSource.LOCAL: self._fetch_from_local_service,
+            ModelSource.COOP: self._fetch_from_coop,
+            ModelSource.CACHE: self._fetch_from_cache,
+        }
+    @classmethod
+    def models_from_coop(cls) -> AvailableModels:
+        if not cls._coop_model_list:
+            from edsl.coop.coop import Coop
+            c = Coop()
+            coop_model_list = c.fetch_models()
+            cls._coop_model_list = coop_model_list
+        return cls._coop_model_list
+    def get_service_available(
+        self, service: "InferenceServiceABC", warn: bool = False
+    ) -> ModelNamesList:
+        """
+        Try to fetch available models from sources in specified order.
+        Returns first successful result.
+        """
+        last_error = None
+        for source in self.source_order:
+            try:
+                fetch_func = partial(self._source_fetchers[source], service)
+                result = fetch_func()
+                # Cache successful result
+                service._models_list_cache = result
+                return result
+            except Exception as e:
+                last_error = e
+                if warn:
+                    self._warn_source_failed(service, source)
+                continue
+        # If we get here, all sources failed
+        raise RuntimeError(
+            f"All sources failed to fetch models. Last error: {last_error}"
+        )
+    @staticmethod
+    def _fetch_from_local_service(service: "InferenceServiceABC") -> ModelNamesList:
+        """Attempt to fetch models directly from the service."""
+        return service.available()
+    @classmethod
+    def _fetch_from_coop(cls, service: "InferenceServiceABC") -> ModelNamesList:
+        """Fetch models from Coop."""
+        models_from_coop = cls.models_from_coop()
+        return models_from_coop.get(service._inference_service_, [])
+    @staticmethod
+    def _fetch_from_cache(service: "InferenceServiceABC") -> ModelNamesList:
+        """Fetch models from local cache."""
+        from edsl.inference_services.models_available_cache import models_available
+        return models_available.get(service._inference_service_, [])
+    def _warn_source_failed(self, service: "InferenceServiceABC", source: ModelSource):
+        """Display appropriate warning message based on failed source."""
+        messages = {
+            ModelSource.LOCAL: f"""Error getting models for {service._inference_service_}.
+                Check that you have properly stored your Expected Parrot API key and activated remote inference,
+                or stored your own API keys for the language models that you want to use.
+                See https://docs.expectedparrot.com/en/latest/api_keys.html for instructions on storing API keys.
+                Trying next source.""",
+            ModelSource.COOP: f"Error getting models from Coop for {service._inference_service_}. Trying next source.",
+            ModelSource.CACHE: f"Error getting models from cache for {service._inference_service_}.",
+        }
+        warnings.warn(messages[source], UserWarning)
+if __name__ == "__main__":
+    # sa = ServiceAvailability()
+    # models_from_coop = sa.models_from_coop()
+    # print(models_from_coop)
+    from edsl.inference_services.OpenAIService import OpenAIService
+    openai_models = ServiceAvailability._fetch_from_local_service(OpenAIService())
+    print(openai_models)
+# Example usage:
+"""
+# Default order (LOCAL -> COOP -> CACHE)
+availability = ServiceAvailability()
+# Custom order (COOP -> LOCAL -> CACHE)
+availability_coop_first = ServiceAvailability([
+    ModelSource.COOP,
+    ModelSource.LOCAL,
+    ModelSource.CACHE
+])
+# Get available models using custom order
+models = availability_coop_first.get_service_available(service, warn=True)
+"""

edsl 0.1.38.dev4__py3-none-any.whl → 0.1.39__py3-none-any.whl

edsl 0.1.38.dev4py3-none-any.whl → 0.1.39py3-none-any.whl