PyPI - edsl - Versions diffs - 0.1.31.dev2__py3-none-any.whl → 0.1.31.dev4__py3-none-any.whl - Mend

edsl 0.1.31.dev2py3-none-any.whl → 0.1.31.dev4py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (21) hide show

edsl/__version__.py +1 -1
edsl/agents/Invigilator.py +9 -3
edsl/config.py +4 -0
edsl/coop/coop.py +4 -0
edsl/enums.py +2 -1
edsl/inference_services/DeepInfraService.py +4 -90
edsl/inference_services/GroqService.py +19 -0
edsl/inference_services/OpenAIService.py +64 -22
edsl/inference_services/registry.py +2 -1
edsl/jobs/Jobs.py +3 -2
edsl/jobs/interviews/InterviewTaskBuildingMixin.py +3 -2
edsl/jobs/runners/JobsRunnerAsyncio.py +89 -79
edsl/jobs/runners/JobsRunnerStatusData.py +0 -237
edsl/jobs/runners/JobsRunnerStatusMixin.py +264 -38
edsl/jobs/tasks/TaskCreators.py +8 -2
edsl/language_models/LanguageModel.py +7 -1
edsl/language_models/registry.py +4 -0
{edsl-0.1.31.dev2.dist-info → edsl-0.1.31.dev4.dist-info}/METADATA +2 -1
{edsl-0.1.31.dev2.dist-info → edsl-0.1.31.dev4.dist-info}/RECORD +21 -20
{edsl-0.1.31.dev2.dist-info → edsl-0.1.31.dev4.dist-info}/LICENSE +0 -0
{edsl-0.1.31.dev2.dist-info → edsl-0.1.31.dev4.dist-info}/WHEEL +0 -0

edsl/__version__.py CHANGED Viewed

	@@ -1 +1 @@
1	- __version__ = "0.1.31.~~dev2~~"
1	+ __version__ = "0.1.31.dev4"

edsl/agents/Invigilator.py CHANGED Viewed

@@ -18,7 +18,12 @@ class InvigilatorAI(PromptConstructorMixin, InvigilatorBase):
     """An invigilator that uses an AI model to answer questions."""
     async def async_answer_question(self) -> AgentResponseDict:
-        """Answer a question using the AI model."""
+        """Answer a question using the AI model.
+        >>> i = InvigilatorAI.example()
+        >>> i.answer_question()
+        {'message': '{"answer": "SPAM!"}'}
+        """
         params = self.get_prompts() | {"iteration": self.iteration}
         raw_response = await self.async_get_response(**params)
         data = {
@@ -29,6 +34,7 @@ class InvigilatorAI(PromptConstructorMixin, InvigilatorBase):
             "raw_model_response": raw_response["raw_model_response"],
         }
         response = self._format_raw_response(**data)
+        #breakpoint()
         return AgentResponseDict(**response)
     async def async_get_response(
@@ -38,7 +44,8 @@ class InvigilatorAI(PromptConstructorMixin, InvigilatorBase):
         iteration: int = 0,
         encoded_image=None,
     ) -> dict:
-        """Call the LLM and gets a response. Used in the `answer_question` method."""
+        """Call the LLM and gets a response. Used in the `answer_question` method.
+        """
         try:
             params = {
                 "user_prompt": user_prompt.text,
@@ -97,7 +104,6 @@ class InvigilatorAI(PromptConstructorMixin, InvigilatorBase):
         answer = question._translate_answer_code_to_answer(
             response["answer"], combined_dict
         )
-        # breakpoint()
         data = {
             "answer": answer,
             "comment": response.get(

edsl/config.py CHANGED Viewed

@@ -65,6 +65,10 @@ CONFIG_MAP = {
     #     "default": None,
     #     "info": "This env var holds your Anthropic API key (https://www.anthropic.com/).",
     # },
+    # "GROQ_API_KEY": {
+    #     "default": None,
+    #     "info": "This env var holds your GROQ API key (https://console.groq.com/login).",
+    # },
 }

edsl/coop/coop.py CHANGED Viewed

@@ -465,6 +465,7 @@ class Coop:
         description: Optional[str] = None,
         status: RemoteJobStatus = "queued",
         visibility: Optional[VisibilityType] = "unlisted",
+        iterations: Optional[int] = 1,
     ) -> dict:
         """
         Send a remote inference job to the server.
@@ -473,6 +474,7 @@ class Coop:
         :param optional description: A description for this entry in the remote cache.
         :param status: The status of the job. Should be 'queued', unless you are debugging.
         :param visibility: The visibility of the cache entry.
+        :param iterations: The number of times to run each interview.
         >>> job = Jobs.example()
         >>> coop.remote_inference_create(job=job, description="My job")
@@ -488,6 +490,7 @@ class Coop:
                 ),
                 "description": description,
                 "status": status,
+                "iterations": iterations,
                 "visibility": visibility,
                 "version": self._edsl_version,
             },
@@ -498,6 +501,7 @@ class Coop:
             "uuid": response_json.get("jobs_uuid"),
             "description": response_json.get("description"),
             "status": response_json.get("status"),
+            "iterations": response_json.get("iterations"),
             "visibility": response_json.get("visibility"),
             "version": self._edsl_version,
         }

edsl/enums.py CHANGED Viewed

@@ -59,7 +59,7 @@ class InferenceServiceType(EnumWithChecks):
     GOOGLE = "google"
     TEST = "test"
     ANTHROPIC = "anthropic"
+    GROQ = "groq"
 service_to_api_keyname = {
     InferenceServiceType.BEDROCK.value: "TBD",
@@ -69,6 +69,7 @@ service_to_api_keyname = {
     InferenceServiceType.GOOGLE.value: "GOOGLE_API_KEY",
     InferenceServiceType.TEST.value: "TBD",
     InferenceServiceType.ANTHROPIC.value: "ANTHROPIC_API_KEY",
+    InferenceServiceType.GROQ.value: "GROQ_API_KEY",
 }

edsl/inference_services/DeepInfraService.py CHANGED Viewed

@@ -2,102 +2,16 @@ import aiohttp
 import json
 import requests
 from typing import Any, List
-from edsl.inference_services.InferenceServiceABC import InferenceServiceABC
+#from edsl.inference_services.InferenceServiceABC import InferenceServiceABC
 from edsl.language_models import LanguageModel
+from edsl.inference_services.OpenAIService import OpenAIService
-class DeepInfraService(InferenceServiceABC):
+class DeepInfraService(OpenAIService):
     """DeepInfra service class."""
     _inference_service_ = "deep_infra"
     _env_key_name_ = "DEEP_INFRA_API_KEY"
+    _base_url_ = "https://api.deepinfra.com/v1/openai"
     _models_list_cache: List[str] = []
-    @classmethod
-    def available(cls):
-        text_models = cls.full_details_available()
-        return [m["model_name"] for m in text_models]
-    @classmethod
-    def full_details_available(cls, verbose=False):
-        if not cls._models_list_cache:
-            url = "https://api.deepinfra.com/models/list"
-            response = requests.get(url)
-            if response.status_code == 200:
-                text_generation_models = [
-                    r for r in response.json() if r["type"] == "text-generation"
-                ]
-                cls._models_list_cache = text_generation_models
-                from rich import print_json
-                import json
-                if verbose:
-                    print_json(json.dumps(text_generation_models))
-                return text_generation_models
-            else:
-                return f"Failed to fetch data: Status code {response.status_code}"
-        else:
-            return cls._models_list_cache
-    @classmethod
-    def create_model(cls, model_name: str, model_class_name=None) -> LanguageModel:
-        base_url = "https://api.deepinfra.com/v1/inference/"
-        if model_class_name is None:
-            model_class_name = cls.to_class_name(model_name)
-        url = f"{base_url}{model_name}"
-        class LLM(LanguageModel):
-            _inference_service_ = cls._inference_service_
-            _model_ = model_name
-            _parameters_ = {
-                "temperature": 0.7,
-                "top_p": 0.2,
-                "top_k": 0.1,
-                "max_new_tokens": 512,
-                "stopSequences": [],
-            }
-            async def async_execute_model_call(
-                self, user_prompt: str, system_prompt: str = ""
-            ) -> dict[str, Any]:
-                self.url = url
-                headers = {
-                    "Content-Type": "application/json",
-                    "Authorization": f"bearer {self.api_token}",
-                }
-                # don't mess w/ the newlines
-                data = {
-                    "input": f"""
-                    [INST]<<SYS>>
-                    {system_prompt}
-                    <<SYS>>{user_prompt}[/INST]
-                    """,
-                    "stream": False,
-                    "temperature": self.temperature,
-                    "top_p": self.top_p,
-                    "top_k": self.top_k,
-                    "max_new_tokens": self.max_new_tokens,
-                }
-                async with aiohttp.ClientSession() as session:
-                    async with session.post(
-                        self.url, headers=headers, data=json.dumps(data)
-                    ) as response:
-                        raw_response_text = await response.text()
-                        return json.loads(raw_response_text)
-            def parse_response(self, raw_response: dict[str, Any]) -> str:
-                if "results" not in raw_response:
-                    raise Exception(
-                        f"Deep Infra response does not contain 'results' key: {raw_response}"
-                    )
-                if "generated_text" not in raw_response["results"][0]:
-                    raise Exception(
-                        f"Deep Infra response does not contain 'generate_text' key: {raw_response['results'][0]}"
-                    )
-                return raw_response["results"][0]["generated_text"]
-        LLM.__name__ = model_class_name
-        return LLM

edsl/inference_services/GroqService.py ADDED Viewed

@@ -0,0 +1,19 @@
+from typing import Any, List
+from edsl.inference_services.OpenAIService import OpenAIService
+import groq
+class GroqService(OpenAIService):
+    """DeepInfra service class."""
+    _inference_service_ = "groq"
+    _env_key_name_ = "GROQ_API_KEY"
+    _sync_client_ =  groq.Groq
+    _async_client_ = groq.AsyncGroq
+    #_base_url_ = "https://api.deepinfra.com/v1/openai"
+    _base_url_ = None
+    _models_list_cache: List[str] = []

edsl/inference_services/OpenAIService.py CHANGED Viewed

@@ -1,6 +1,8 @@
 from typing import Any, List
 import re
-from openai import AsyncOpenAI
+import os
+#from openai import AsyncOpenAI
+import openai
 from edsl.inference_services.InferenceServiceABC import InferenceServiceABC
 from edsl.language_models import LanguageModel
@@ -12,6 +14,22 @@ class OpenAIService(InferenceServiceABC):
     _inference_service_ = "openai"
     _env_key_name_ = "OPENAI_API_KEY"
+    _base_url_ = None
+    _sync_client_ = openai.OpenAI
+    _async_client_ = openai.AsyncOpenAI
+    @classmethod
+    def sync_client(cls):
+        return cls._sync_client_(
+            api_key = os.getenv(cls._env_key_name_),
+            base_url = cls._base_url_)
+    @classmethod
+    def async_client(cls):
+        return cls._async_client_(
+            api_key = os.getenv(cls._env_key_name_),
+            base_url = cls._base_url_)
     # TODO: Make this a coop call
     model_exclude_list = [
@@ -31,16 +49,24 @@ class OpenAIService(InferenceServiceABC):
     ]
     _models_list_cache: List[str] = []
+    @classmethod
+    def get_model_list(cls):
+        raw_list = cls.sync_client().models.list()
+        if hasattr(raw_list, "data"):
+            return raw_list.data
+        else:
+            return raw_list
     @classmethod
     def available(cls) -> List[str]:
-        from openai import OpenAI
+        #from openai import OpenAI
         if not cls._models_list_cache:
             try:
-                client = OpenAI()
+                #client = OpenAI(api_key = os.getenv(cls._env_key_name_), base_url = cls._base_url_)
                 cls._models_list_cache = [
                     m.id
-                    for m in client.models.list()
+                    for m in cls.get_model_list()
                     if m.id not in cls.model_exclude_list
                 ]
             except Exception as e:
@@ -78,15 +104,24 @@ class OpenAIService(InferenceServiceABC):
                 "top_logprobs": 3,
             }
+            def sync_client(self):
+                return cls.sync_client()
+            def async_client(self):
+                return cls.async_client()
             @classmethod
             def available(cls) -> list[str]:
-                client = openai.OpenAI()
-                return client.models.list()
+                #import openai
+                #client = openai.OpenAI(api_key = os.getenv(cls._env_key_name_), base_url = cls._base_url_)
+                #return client.models.list()
+                return cls.sync_client().models.list()
             def get_headers(self) -> dict[str, Any]:
-                from openai import OpenAI
+                #from openai import OpenAI
-                client = OpenAI()
+                #client = OpenAI(api_key = os.getenv(cls._env_key_name_), base_url = cls._base_url_)
+                client = self.sync_client()
                 response = client.chat.completions.with_raw_response.create(
                     messages=[
                         {
@@ -124,8 +159,8 @@ class OpenAIService(InferenceServiceABC):
                 encoded_image=None,
             ) -> dict[str, Any]:
                 """Calls the OpenAI API and returns the API response."""
-                content = [{"type": "text", "text": user_prompt}]
                 if encoded_image:
+                    content = [{"type": "text", "text": user_prompt}]
                     content.append(
                         {
                             "type": "image_url",
@@ -134,21 +169,28 @@ class OpenAIService(InferenceServiceABC):
                             },
                         }
                     )
-                self.client = AsyncOpenAI()
-                response = await self.client.chat.completions.create(
-                    model=self.model,
-                    messages=[
+                else:
+                    content = user_prompt
+                # self.client = AsyncOpenAI(
+                #     api_key = os.getenv(cls._env_key_name_),
+                #     base_url = cls._base_url_
+                #     )
+                client = self.async_client()
+                params = {
+                    "model": self.model,
+                    "messages": [
                         {"role": "system", "content": system_prompt},
                         {"role": "user", "content": content},
                     ],
-                    temperature=self.temperature,
-                    max_tokens=self.max_tokens,
-                    top_p=self.top_p,
-                    frequency_penalty=self.frequency_penalty,
-                    presence_penalty=self.presence_penalty,
-                    logprobs=self.logprobs,
-                    top_logprobs=self.top_logprobs if self.logprobs else None,
-                )
+                    "temperature": self.temperature,
+                    "max_tokens": self.max_tokens,
+                    "top_p": self.top_p,
+                    "frequency_penalty": self.frequency_penalty,
+                    "presence_penalty": self.presence_penalty,
+                    "logprobs": self.logprobs,
+                    "top_logprobs": self.top_logprobs if self.logprobs else None,
+                }
+                response = await client.chat.completions.create(**params)
                 return response.model_dump()
             @staticmethod

edsl/inference_services/registry.py CHANGED Viewed

@@ -6,7 +6,8 @@ from edsl.inference_services.OpenAIService import OpenAIService
 from edsl.inference_services.AnthropicService import AnthropicService
 from edsl.inference_services.DeepInfraService import DeepInfraService
 from edsl.inference_services.GoogleService import GoogleService
+from edsl.inference_services.GroqService import GroqService
 default = InferenceServicesCollection(
-    [OpenAIService, AnthropicService, DeepInfraService, GoogleService]
+    [OpenAIService, AnthropicService, DeepInfraService, GoogleService, GroqService]
 )

edsl/jobs/Jobs.py CHANGED Viewed

@@ -475,6 +475,7 @@ class Jobs(Base):
                 self,
                 description=remote_inference_description,
                 status="queued",
+                iterations=n,
             )
             time_queued = datetime.now().strftime("%m/%d/%Y %I:%M:%S %p")
             job_uuid = remote_job_creation_data.get("uuid")
@@ -629,9 +630,9 @@ class Jobs(Base):
         results = JobsRunnerAsyncio(self).run(*args, **kwargs)
         return results
-    async def run_async(self, cache=None, **kwargs):
+    async def run_async(self, cache=None, n=1, **kwargs):
         """Run the job asynchronously."""
-        results = await JobsRunnerAsyncio(self).run_async(cache=cache, **kwargs)
+        results = await JobsRunnerAsyncio(self).run_async(cache=cache, n=n, **kwargs)
         return results
     def all_question_parameters(self):

edsl/jobs/interviews/InterviewTaskBuildingMixin.py CHANGED Viewed

@@ -204,12 +204,13 @@ class InterviewTaskBuildingMixin:
         return skip
     async def _attempt_to_answer_question(
-        self, invigilator: InvigilatorBase, task: asyncio.Task
-    ) -> AgentResponseDict:
+        self, invigilator: 'InvigilatorBase', task: asyncio.Task
+    ) -> 'AgentResponseDict':
         """Attempt to answer the question, and handle exceptions.
         :param invigilator: the invigilator that will answer the question.
         :param task: the task that is being run.
         """
         try:
             return await asyncio.wait_for(

edsl/jobs/runners/JobsRunnerAsyncio.py CHANGED Viewed

@@ -13,6 +13,35 @@ from edsl.jobs.tasks.TaskHistory import TaskHistory
 from edsl.jobs.buckets.BucketCollection import BucketCollection
 from edsl.utilities.decorators import jupyter_nb_handler
+import time
+import functools
+def cache_with_timeout(timeout):
+    def decorator(func):
+        cached_result = {}
+        last_computation_time = [0]  # Using list to store mutable value
+        @functools.wraps(func)
+        def wrapper(*args, **kwargs):
+            current_time = time.time()
+            if (current_time - last_computation_time[0]) >= timeout:
+                cached_result['value'] = func(*args, **kwargs)
+                last_computation_time[0] = current_time
+            return cached_result['value']
+        return wrapper
+    return decorator
+#from queue import Queue
+from collections import UserList
+class StatusTracker(UserList):
+    def __init__(self, total_tasks: int):
+        self.total_tasks = total_tasks
+        super().__init__()
+    def current_status(self):
+        return print(f"Completed: {len(self.data)} of {self.total_tasks}", end = "\r")
 class JobsRunnerAsyncio(JobsRunnerStatusMixin):
     """A class for running a collection of interviews asynchronously.
@@ -43,7 +72,9 @@ class JobsRunnerAsyncio(JobsRunnerStatusMixin):
         :param n: how many times to run each interview
         :param debug:
-        :param stop_on_exception:
+        :param stop_on_exception: Whether to stop the interview if an exception is raised
+        :param sidecar_model: a language model to use in addition to the interview's model
+        :param total_interviews: A list of interviews to run can be provided instead.
         """
         tasks = []
         if total_interviews:
@@ -87,15 +118,18 @@ class JobsRunnerAsyncio(JobsRunnerStatusMixin):
                     )  # set the cache for the first interview
                     self.total_interviews.append(interview)
-    async def run_async(self, cache=None) -> Results:
+    async def run_async(self, cache=None, n=1) -> Results:
         from edsl.results.Results import Results
+        #breakpoint()
+        #tracker = StatusTracker(total_tasks=len(self.interviews))
         if cache is None:
             self.cache = Cache()
         else:
             self.cache = cache
         data = []
-        async for result in self.run_async_generator(cache=self.cache):
+        async for result in self.run_async_generator(cache=self.cache, n=n):
             data.append(result)
         return Results(survey=self.jobs.survey, data=data)
@@ -201,91 +235,67 @@ class JobsRunnerAsyncio(JobsRunnerStatusMixin):
         self.sidecar_model = sidecar_model
         from edsl.results.Results import Results
+        from rich.live import Live
+        from rich.console import Console
-        if not progress_bar:
-            # print("Running without progress bar")
-            with cache as c:
+        @cache_with_timeout(1)
+        def generate_table():
+            return self.status_table(self.results, self.elapsed_time)
-                async def process_results():
-                    """Processes results from interviews."""
-                    async for result in self.run_async_generator(
-                        n=n,
-                        debug=debug,
-                        stop_on_exception=stop_on_exception,
-                        cache=c,
-                        sidecar_model=sidecar_model,
-                    ):
-                        self.results.append(result)
-                    self.completed = True
-                await asyncio.gather(process_results())
-            results = Results(survey=self.jobs.survey, data=self.results)
-        else:
-            # print("Running with progress bar")
-            from rich.live import Live
-            from rich.console import Console
-            def generate_table():
-                return self.status_table(self.results, self.elapsed_time)
-            @contextmanager
-            def no_op_cm():
-                """A no-op context manager with a dummy update method."""
-                yield DummyLive()
-            class DummyLive:
-                def update(self, *args, **kwargs):
-                    """A dummy update method that does nothing."""
-                    pass
-            progress_bar_context = (
-                Live(generate_table(), console=console, refresh_per_second=5)
-                if progress_bar
-                else no_op_cm()
-            )
+        async def process_results(cache, progress_bar_context = None):
+            """Processes results from interviews."""
+            async for result in self.run_async_generator(
+                n=n,
+                debug=debug,
+                stop_on_exception=stop_on_exception,
+                cache=cache,
+                sidecar_model=sidecar_model,
+            ):
+                self.results.append(result)
+                if progress_bar_context:
+                    progress_bar_context.update(generate_table())
+                self.completed = True
+        async def update_progress_bar(progress_bar_context):
+            """Updates the progress bar at fixed intervals."""
+            if progress_bar_context is None:
+                return
+            while True:
+                progress_bar_context.update(generate_table())
+                await asyncio.sleep(0.1)  # Update interval
+                if self.completed:
+                    break
+        @contextmanager
+        def conditional_context(condition, context_manager):
+            if condition:
+                with context_manager as cm:
+                    yield cm
+            else:
+                yield
+        with conditional_context(progress_bar, Live(generate_table(), console=console, refresh_per_second=1)) as progress_bar_context:
             with cache as c:
-                with progress_bar_context as live:
-                    async def update_progress_bar():
-                        """Updates the progress bar at fixed intervals."""
-                        while True:
-                            live.update(generate_table())
-                            await asyncio.sleep(0.00001)  # Update interval
-                            if self.completed:
-                                break
-                    async def process_results():
-                        """Processes results from interviews."""
-                        async for result in self.run_async_generator(
-                            n=n,
-                            debug=debug,
-                            stop_on_exception=stop_on_exception,
-                            cache=c,
-                            sidecar_model=sidecar_model,
-                        ):
-                            self.results.append(result)
-                            live.update(generate_table())
-                        self.completed = True
-                    progress_task = asyncio.create_task(update_progress_bar())
-                    try:
-                        await asyncio.gather(process_results(), progress_task)
-                    except asyncio.CancelledError:
+                progress_task = asyncio.create_task(update_progress_bar(progress_bar_context))
+                try:
+                    await asyncio.gather(progress_task, process_results(cache = c, progress_bar_context = progress_bar_context))
+                except asyncio.CancelledError:
                         pass
-                    finally:
-                        progress_task.cancel()  # Cancel the progress_task when process_results is done
-                        await progress_task
+                finally:
+                    progress_task.cancel()  # Cancel the progress_task when process_results is done
+                    await progress_task
-                        await asyncio.sleep(1)  # short delay to show the final status
+                    await asyncio.sleep(1)  # short delay to show the final status
-                        # one more update
-                        live.update(generate_table())
+                    if progress_bar_context:
+                        progress_bar_context.update(generate_table())
-            results = Results(survey=self.jobs.survey, data=self.results)
+        results = Results(survey=self.jobs.survey, data=self.results)
         task_history = TaskHistory(self.total_interviews, include_traceback=False)
         results.task_history = task_history

edsl 0.1.31.dev2__py3-none-any.whl → 0.1.31.dev4__py3-none-any.whl

edsl 0.1.31.dev2py3-none-any.whl → 0.1.31.dev4py3-none-any.whl