PyPI - inspect-ai - Versions diffs - 0.3.72__py3-none-any.whl → 0.3.73__py3-none-any.whl - Mend

inspect-ai 0.3.72py3-none-any.whl → 0.3.73py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (103) hide show

inspect_ai/_cli/eval.py +14 -3
inspect_ai/_cli/sandbox.py +3 -3
inspect_ai/_cli/score.py +6 -4
inspect_ai/_cli/trace.py +53 -6
inspect_ai/_display/core/config.py +1 -1
inspect_ai/_display/core/display.py +2 -1
inspect_ai/_display/core/footer.py +6 -6
inspect_ai/_display/plain/display.py +11 -6
inspect_ai/_display/rich/display.py +23 -13
inspect_ai/_display/textual/app.py +10 -9
inspect_ai/_display/textual/display.py +2 -2
inspect_ai/_display/textual/widgets/footer.py +4 -0
inspect_ai/_display/textual/widgets/samples.py +14 -5
inspect_ai/_eval/context.py +1 -2
inspect_ai/_eval/eval.py +54 -41
inspect_ai/_eval/loader.py +9 -2
inspect_ai/_eval/run.py +148 -81
inspect_ai/_eval/score.py +13 -8
inspect_ai/_eval/task/images.py +31 -21
inspect_ai/_eval/task/run.py +62 -59
inspect_ai/_eval/task/rundir.py +16 -9
inspect_ai/_eval/task/sandbox.py +7 -8
inspect_ai/_eval/task/util.py +7 -0
inspect_ai/_util/_async.py +118 -10
inspect_ai/_util/constants.py +0 -2
inspect_ai/_util/file.py +15 -29
inspect_ai/_util/future.py +37 -0
inspect_ai/_util/http.py +3 -99
inspect_ai/_util/httpx.py +60 -0
inspect_ai/_util/interrupt.py +2 -2
inspect_ai/_util/json.py +5 -52
inspect_ai/_util/logger.py +30 -86
inspect_ai/_util/retry.py +10 -61
inspect_ai/_util/trace.py +2 -2
inspect_ai/_view/server.py +86 -3
inspect_ai/_view/www/dist/assets/index.js +25837 -13269
inspect_ai/_view/www/log-schema.json +253 -186
inspect_ai/_view/www/package.json +2 -2
inspect_ai/_view/www/src/plan/PlanDetailView.tsx +8 -3
inspect_ai/_view/www/src/samples/transcript/StepEventView.tsx +2 -3
inspect_ai/_view/www/src/types/log.d.ts +122 -94
inspect_ai/approval/_human/manager.py +6 -10
inspect_ai/approval/_human/panel.py +2 -2
inspect_ai/dataset/_sources/util.py +7 -6
inspect_ai/log/__init__.py +4 -0
inspect_ai/log/_file.py +35 -61
inspect_ai/log/_log.py +18 -1
inspect_ai/log/_recorders/eval.py +14 -23
inspect_ai/log/_recorders/json.py +3 -18
inspect_ai/log/_samples.py +27 -2
inspect_ai/log/_transcript.py +8 -8
inspect_ai/model/__init__.py +2 -1
inspect_ai/model/_call_tools.py +60 -40
inspect_ai/model/_chat_message.py +3 -2
inspect_ai/model/_generate_config.py +25 -0
inspect_ai/model/_model.py +74 -36
inspect_ai/model/_openai.py +9 -1
inspect_ai/model/_providers/anthropic.py +24 -26
inspect_ai/model/_providers/azureai.py +11 -9
inspect_ai/model/_providers/bedrock.py +33 -24
inspect_ai/model/_providers/cloudflare.py +8 -9
inspect_ai/model/_providers/goodfire.py +7 -3
inspect_ai/model/_providers/google.py +47 -13
inspect_ai/model/_providers/groq.py +15 -15
inspect_ai/model/_providers/hf.py +24 -17
inspect_ai/model/_providers/mistral.py +36 -20
inspect_ai/model/_providers/openai.py +30 -25
inspect_ai/model/_providers/openai_o1.py +1 -1
inspect_ai/model/_providers/providers.py +1 -1
inspect_ai/model/_providers/together.py +3 -4
inspect_ai/model/_providers/util/__init__.py +2 -2
inspect_ai/model/_providers/util/chatapi.py +6 -19
inspect_ai/model/_providers/util/hooks.py +165 -0
inspect_ai/model/_providers/vertex.py +20 -3
inspect_ai/model/_providers/vllm.py +16 -19
inspect_ai/scorer/_multi.py +5 -2
inspect_ai/solver/_bridge/patch.py +31 -1
inspect_ai/solver/_fork.py +5 -3
inspect_ai/solver/_human_agent/agent.py +3 -2
inspect_ai/tool/__init__.py +8 -2
inspect_ai/tool/_tool_info.py +4 -90
inspect_ai/tool/_tool_params.py +4 -34
inspect_ai/tool/_tools/_web_search.py +30 -24
inspect_ai/util/__init__.py +4 -0
inspect_ai/util/_concurrency.py +5 -6
inspect_ai/util/_display.py +6 -0
inspect_ai/util/_json.py +170 -0
inspect_ai/util/_sandbox/docker/cleanup.py +13 -9
inspect_ai/util/_sandbox/docker/docker.py +5 -0
inspect_ai/util/_sandbox/environment.py +56 -9
inspect_ai/util/_sandbox/service.py +12 -5
inspect_ai/util/_subprocess.py +94 -113
inspect_ai/util/_subtask.py +2 -4
{inspect_ai-0.3.72.dist-info → inspect_ai-0.3.73.dist-info}/METADATA +6 -2
{inspect_ai-0.3.72.dist-info → inspect_ai-0.3.73.dist-info}/RECORD +99 -99
{inspect_ai-0.3.72.dist-info → inspect_ai-0.3.73.dist-info}/WHEEL +1 -1
inspect_ai/_util/timeouts.py +0 -160
inspect_ai/_view/www/node_modules/flatted/python/flatted.py +0 -149
inspect_ai/_view/www/node_modules/flatted/python/test.py +0 -63
inspect_ai/model/_providers/util/tracker.py +0 -92
{inspect_ai-0.3.72.dist-info → inspect_ai-0.3.73.dist-info}/LICENSE +0 -0
{inspect_ai-0.3.72.dist-info → inspect_ai-0.3.73.dist-info}/entry_points.txt +0 -0
{inspect_ai-0.3.72.dist-info → inspect_ai-0.3.73.dist-info}/top_level.txt +0 -0

inspect_ai/tool/_tool_params.py CHANGED Viewed

@@ -1,44 +1,14 @@
 from typing import (
-    Any,
     Literal,
-    Optional,
+    TypeAlias,
 )
 from pydantic import BaseModel, Field
-JSONType = Literal["string", "integer", "number", "boolean", "array", "object", "null"]
-"""Validate types within JSON schema."""
+from inspect_ai.util._json import JSONSchema
-class ToolParam(BaseModel):
-    """Description of tool parameter in JSON Schema format."""
-    type: JSONType | None = Field(default=None)
-    """JSON type of tool parameter."""
-    description: str | None = Field(default=None)
-    """Parameter description."""
-    default: Any = Field(default=None)
-    """Default value for parameter."""
-    enum: list[Any] | None = Field(default=None)
-    """Valid values for enum parameters."""
-    items: Optional["ToolParam"] = Field(default=None)
-    """Valid type for array parameters."""
-    properties: dict[str, "ToolParam"] | None = Field(default=None)
-    """Valid fields for object parametrs."""
-    additionalProperties: Optional["ToolParam"] | bool | None = Field(default=None)
-    """Are additional properties allowed?"""
-    anyOf: list["ToolParam"] | None = Field(default=None)
-    """Valid types for union parameters."""
-    required: list[str] | None = Field(default=None)
-    """Required fields for object parameters."""
+ToolParam: TypeAlias = JSONSchema
+"""Description of tool parameter in JSON Schema format."""
 class ToolParams(BaseModel):

inspect_ai/tool/_tools/_web_search.py CHANGED Viewed

@@ -1,7 +1,7 @@
-import asyncio
 import os
 from typing import Literal, Protocol, runtime_checkable
+import anyio
 import httpx
 from bs4 import BeautifulSoup, NavigableString
 from tenacity import (
@@ -13,7 +13,7 @@ from tenacity import (
 )
 from inspect_ai._util.error import PrerequisiteError
-from inspect_ai._util.retry import httpx_should_retry, log_retry_attempt
+from inspect_ai._util.httpx import httpx_should_retry, log_httpx_retry_attempt
 from inspect_ai.util._concurrency import concurrency
 from .._tool import Tool, ToolResult, tool
@@ -25,6 +25,17 @@ Page Content: {text}
 """
+class SearchLink:
+    def __init__(self, url: str, snippet: str) -> None:
+        self.url = url
+        self.snippet = snippet
+@runtime_checkable
+class SearchProvider(Protocol):
+    async def __call__(self, query: str, start_idx: int) -> list[SearchLink]: ...
 @tool
 def web_search(
     provider: Literal["google"] = "google",
@@ -84,16 +95,22 @@ def web_search(
             async with concurrency(f"{provider}_web_search", max_connections):
                 links = await search_provider(query, start_idx=search_calls * 10)
-            # Extract and summarize each page individually
-            pages = await asyncio.gather(
-                *[page_if_relevant(link.url, query, model, client) for link in links],
-                return_exceptions=True,
-            )
-            for page, link in zip(pages, links):
-                if page and not isinstance(page, BaseException):
-                    page_contents.append(page)
-                    urls.append(link.url)
-                    snippets.append(link.snippet)
+            async with anyio.create_task_group() as tg:
+                async def process_link(link: SearchLink) -> None:
+                    try:
+                        page = await page_if_relevant(link.url, query, model, client)
+                        if page:
+                            page_contents.append(page)
+                            urls.append(link.url)
+                            snippets.append(link.snippet)
+                    # exceptions fetching pages are very common!
+                    except Exception:
+                        pass
+                for lk in links:
+                    tg.start_soon(process_link, lk)
             search_calls += 1
         all_page_contents = "\n\n".join(page_contents)
@@ -168,17 +185,6 @@ async def page_if_relevant(
         return None
-class SearchLink:
-    def __init__(self, url: str, snippet: str) -> None:
-        self.url = url
-        self.snippet = snippet
-@runtime_checkable
-class SearchProvider(Protocol):
-    async def __call__(self, query: str, start_idx: int) -> list[SearchLink]: ...
 def google_search_provider(client: httpx.AsyncClient) -> SearchProvider:
     google_api_key = os.environ.get("GOOGLE_CSE_API_KEY", None)
     google_cse_id = os.environ.get("GOOGLE_CSE_ID", None)
@@ -204,7 +210,7 @@ def google_search_provider(client: httpx.AsyncClient) -> SearchProvider:
             wait=wait_exponential_jitter(),
             stop=stop_after_attempt(5) | stop_after_delay(60),
             retry=retry_if_exception(httpx_should_retry),
-            before_sleep=log_retry_attempt(search_url),
+            before_sleep=log_httpx_retry_attempt(search_url),
         )
         async def execute_search() -> httpx.Response:
             return await client.get(search_url)

inspect_ai/util/__init__.py CHANGED Viewed

@@ -3,6 +3,7 @@ from inspect_ai._util.trace import trace_action, trace_message
 from ._concurrency import concurrency
 from ._console import input_screen
 from ._display import DisplayType, display_counter, display_type
+from ._json import JSONSchema, JSONType, json_schema
 from ._panel import InputPanel, input_panel
 from ._resource import resource
 from ._sandbox import (
@@ -36,6 +37,9 @@ __all__ = [
     "InputPanel",
     "input_panel",
     "input_screen",
+    "JSONType",
+    "JSONSchema",
+    "json_schema",
     "OutputLimitExceededError",
     "resource",
     "subprocess",

inspect_ai/util/_concurrency.py CHANGED Viewed

@@ -1,9 +1,10 @@
-import asyncio
 import contextlib
 import time
 from dataclasses import dataclass
 from typing import AsyncIterator
+import anyio
 from inspect_ai._util.working import report_sample_waiting_time
@@ -45,9 +46,7 @@ async def concurrency(
     # do we have an existing semaphore? if not create one and store it
     semaphore = _concurrency_semaphores.get(key, None)
     if semaphore is None:
-        semaphore = ConcurencySempahore(
-            name, concurrency, asyncio.Semaphore(concurrency)
-        )
+        semaphore = ConcurencySempahore(name, concurrency, anyio.Semaphore(concurrency))
         _concurrency_semaphores[key] = semaphore
     # wait and yield to protected code
@@ -60,7 +59,7 @@ async def concurrency(
 def concurrency_status() -> dict[str, tuple[int, int]]:
     status: dict[str, tuple[int, int]] = {}
     for c in _concurrency_semaphores.values():
-        status[c.name] = (c.concurrency - c.semaphore._value, c.concurrency)
+        status[c.name] = (c.concurrency - c.semaphore.value, c.concurrency)
     return status
@@ -72,7 +71,7 @@ def init_concurrency() -> None:
 class ConcurencySempahore:
     name: str
     concurrency: int
-    semaphore: asyncio.Semaphore
+    semaphore: anyio.Semaphore
 _concurrency_semaphores: dict[str, ConcurencySempahore] = {}

inspect_ai/util/_display.py CHANGED Viewed

@@ -2,6 +2,7 @@ import os
 from logging import getLogger
 from typing import Literal
+from inspect_ai._util._async import configured_async_backend
 from inspect_ai._util.constants import DEFAULT_DISPLAY
 from inspect_ai._util.thread import is_main_thread
@@ -20,6 +21,11 @@ def init_display_type(display: str | None = None) -> DisplayType:
         display or os.environ.get("INSPECT_DISPLAY", DEFAULT_DISPLAY).lower().strip()
     )
+    # if trio is configured as the backend then throttle down to "rich"
+    # (as textual uses asyncio directly so is not compatible with trio)
+    if configured_async_backend() == "trio" and display == "full":
+        display = "rich"
     # if we are on a background thread then throttle down to "plain"
     # ("full" requires textual which cannot run in a background thread
     # b/c it calls the Python signal function; "rich" assumes exclusive

inspect_ai/util/_json.py ADDED Viewed

@@ -0,0 +1,170 @@
+import types
+import typing
+from dataclasses import is_dataclass
+from typing import (
+    Any,
+    Dict,
+    List,
+    Literal,
+    Optional,
+    Tuple,
+    Type,
+    Union,
+    get_args,
+    get_origin,
+    get_type_hints,
+    is_typeddict,
+)
+from pydantic import BaseModel, Field
+JSONType = Literal["string", "integer", "number", "boolean", "array", "object", "null"]
+"""Valid types within JSON schema."""
+class JSONSchema(BaseModel):
+    """JSON Schema for type."""
+    type: JSONType | None = Field(default=None)
+    """JSON type of tool parameter."""
+    description: str | None = Field(default=None)
+    """Parameter description."""
+    default: Any = Field(default=None)
+    """Default value for parameter."""
+    enum: list[Any] | None = Field(default=None)
+    """Valid values for enum parameters."""
+    items: Optional["JSONSchema"] = Field(default=None)
+    """Valid type for array parameters."""
+    properties: dict[str, "JSONSchema"] | None = Field(default=None)
+    """Valid fields for object parametrs."""
+    additionalProperties: Optional["JSONSchema"] | bool | None = Field(default=None)
+    """Are additional properties allowed?"""
+    anyOf: list["JSONSchema"] | None = Field(default=None)
+    """Valid types for union parameters."""
+    required: list[str] | None = Field(default=None)
+    """Required fields for object parameters."""
+def json_schema(t: Type[Any]) -> JSONSchema:
+    """Provide a JSON Schema for the specified type.
+    Schemas can be automatically inferred for a wide variety of
+    Python class types including Pydantic BaseModel, dataclasses,
+    and typed dicts.
+    Args:
+        t: Python type
+    Returns:
+        JSON Schema for type.
+    """
+    origin = get_origin(t)
+    args = get_args(t)
+    if origin is None:
+        if t is int:
+            return JSONSchema(type="integer")
+        elif t is float:
+            return JSONSchema(type="number")
+        elif t is str:
+            return JSONSchema(type="string")
+        elif t is bool:
+            return JSONSchema(type="boolean")
+        elif t is list:
+            return JSONSchema(type="array", items=JSONSchema())
+        elif t is dict:
+            return JSONSchema(type="object", additionalProperties=JSONSchema())
+        elif (
+            is_dataclass(t)
+            or is_typeddict(t)
+            or (isinstance(t, type) and issubclass(t, BaseModel))
+        ):
+            return cls_json_schema(t)
+        elif t is type(None):
+            return JSONSchema(type="null")
+        else:
+            return JSONSchema()
+    elif origin is list or origin is List or origin is tuple or origin is Tuple:
+        return JSONSchema(
+            type="array", items=json_schema(args[0]) if args else JSONSchema()
+        )
+    elif origin is dict or origin is Dict:
+        return JSONSchema(
+            type="object",
+            additionalProperties=json_schema(args[1])
+            if len(args) > 1
+            else JSONSchema(),
+        )
+    elif origin is Union or origin is types.UnionType:
+        return JSONSchema(anyOf=[json_schema(arg) for arg in args])
+    elif origin is Optional:
+        return JSONSchema(
+            anyOf=[json_schema(arg) for arg in args] + [JSONSchema(type="null")]
+        )
+    elif origin is typing.Literal:
+        return JSONSchema(enum=list(args))
+    return JSONSchema()  # Default case if we can't determine the type
+def cls_json_schema(cls: Type[Any]) -> JSONSchema:
+    properties: Dict[str, JSONSchema] = {}
+    required: List[str] = []
+    if is_dataclass(cls):
+        fields = cls.__dataclass_fields__  # type: ignore
+        for name, field in fields.items():
+            properties[name] = json_schema(field.type)  # type: ignore
+            if field.default == field.default_factory:
+                required.append(name)
+    elif isinstance(cls, type) and issubclass(cls, BaseModel):
+        schema = cls.model_json_schema()
+        for name, prop in schema.get("properties", {}).items():
+            properties[name] = JSONSchema(**prop)
+        required = schema.get("required", [])
+    elif is_typeddict(cls):
+        annotations = get_type_hints(cls)
+        for name, type_hint in annotations.items():
+            properties[name] = json_schema(type_hint)
+            if name in cls.__required_keys__:
+                required.append(name)
+    return JSONSchema(
+        type="object",
+        properties=properties,
+        required=required if required else None,
+        additionalProperties=False,
+    )
+def python_type_to_json_type(python_type: str | None) -> JSONType:
+    match python_type:
+        case "str":
+            return "string"
+        case "int":
+            return "integer"
+        case "float":
+            return "number"
+        case "bool":
+            return "boolean"
+        case "list":
+            return "array"
+        case "dict":
+            return "object"
+        case "None":
+            return "null"
+        # treat 'unknown' as string as anything can be converted to string
+        case None:
+            return "string"
+        case _:
+            raise ValueError(
+                f"Unsupported type: {python_type} for Python to JSON conversion."
+            )

inspect_ai/util/_sandbox/docker/cleanup.py CHANGED Viewed

@@ -1,12 +1,14 @@
-import asyncio
 from contextvars import ContextVar
 from pathlib import Path
 from typing import Awaitable, Callable, Set
+import anyio
 from rich import box, print
 from rich.panel import Panel
 from rich.table import Table
+from inspect_ai._util._async import coro_print_exceptions
 from .compose import compose_down, compose_ls, compose_ps
 from .config import is_auto_compose_file, safe_cleanup_auto_compose
 from .util import ComposeProject
@@ -94,13 +96,15 @@ async def cleanup_projects(
     )
     # cleanup all of the projects in parallel
-    tasks = [cleanup_fn(project, False) for project in projects]
-    results = await asyncio.gather(*tasks, return_exceptions=True)
-    # report errors
-    for result in results:
-        if result is not None:
-            print(f"Error cleaning up Docker environment: {result}")
+    async with anyio.create_task_group() as tg:
+        for project in projects:
+            tg.start_soon(
+                coro_print_exceptions,
+                "cleaning up Docker environment",
+                cleanup_fn,
+                project,
+                False,
+            )
 async def cli_cleanup(project_name: str | None) -> None:
@@ -141,7 +145,7 @@ def auto_compose_files() -> Set[str]:
 _running_projects: ContextVar[list[ComposeProject]] = ContextVar(
-    "docker_running_projects"
+    "docker_running_projects", default=[]
 )
 _auto_compose_files: ContextVar[Set[str]] = ContextVar("docker_auto_compose_files")

inspect_ai/util/_sandbox/docker/docker.py CHANGED Viewed

@@ -293,6 +293,9 @@ class DockerSandboxEnvironment(SandboxEnvironment):
     @override
     async def write_file(self, file: str, contents: str | bytes) -> None:
+        # defualt timeout for write_file operations
+        TIMEOUT = 180
         # resolve relative file paths
         file = self.container_file(file)
@@ -309,6 +312,7 @@ class DockerSandboxEnvironment(SandboxEnvironment):
             result = await self.exec(
                 ["sh", "-e", "-c", 'tee -- "$1"', "write_file_script", file],
                 input=contents,
+                timeout=TIMEOUT,
             )
         else:
             base64_contents = base64.b64encode(contents).decode("US-ASCII")
@@ -322,6 +326,7 @@ class DockerSandboxEnvironment(SandboxEnvironment):
                     file,
                 ],
                 input=base64_contents,
+                timeout=TIMEOUT,
             )
         if result.returncode != 0:
             if "permission denied" in result.stderr.casefold():

inspect_ai/util/_sandbox/environment.py CHANGED Viewed

@@ -3,18 +3,19 @@ from __future__ import annotations
 import abc
 from dataclasses import dataclass, field
 from typing import (
+    Annotated,
     Any,
     Awaitable,
     Callable,
     Literal,
-    NamedTuple,
     Type,
     TypeVar,
     Union,
+    cast,
     overload,
 )
-from pydantic import BaseModel, Field
+from pydantic import BaseModel, Field, model_validator
 from .._subprocess import ExecResult
@@ -38,6 +39,7 @@ SampleCleanup = Callable[
     ],
     Awaitable[None],
 ]
+ConfigDeserialize = Callable[[dict[str, Any]], BaseModel]
 class HostMapping(BaseModel):
@@ -211,11 +213,6 @@ class SandboxEnvironment(abc.ABC):
                 f"Expected instance of {sandbox_cls.__name__}, got {type(self).__name__}"
             )
-    @classmethod
-    def config_files(cls) -> list[str]:
-        """Standard config files for this provider (used for automatic discovery)"""
-        return []
     @classmethod
     def default_concurrency(cls) -> int | None:
         """Default max_sandboxes for this provider (`None` means no maximum)"""
@@ -296,6 +293,30 @@ class SandboxEnvironment(abc.ABC):
         """
         pass
+    @classmethod
+    def config_files(cls) -> list[str]:
+        """Standard config files for this provider (used for automatic discovery)"""
+        return []
+    @classmethod
+    def config_deserialize(cls, config: dict[str, Any]) -> BaseModel:
+        """Deserialize a sandbox-specific configuration model from a dict.
+        Override this method if you support a custom configuration model.
+        A basic implementation would be: `return MySandboxEnvironmentConfig(**config)`
+        Args:
+          config: Configuration dictionary produced by serializing the configuration
+            model.
+        Returns:
+          The sandbox-specific configuration model.
+        """
+        raise NotImplementedError(
+            "The SandboxEnvironment provider has not implemented config_deserialize."
+        )
 @dataclass
 class SandboxEnvironments:
@@ -311,15 +332,30 @@ class SandboxEnvironments:
     """
-class SandboxEnvironmentSpec(NamedTuple):
+class SandboxEnvironmentSpec(BaseModel, frozen=True):
     """Specification of a SandboxEnvironment."""
     type: str
     """Sandbox type (e.g. 'local', 'docker')"""
-    config: SandboxEnvironmentConfigType | None = None
+    # Any is used to prevent Pydantic from trying to initialise a BaseModel.
+    config: Annotated[Any, "BaseModel, str or None"] = None
     """Sandbox configuration (filename or config object)."""
+    def __init__(self, type: str, config: BaseModel | str | None = None):
+        super().__init__(type=type, config=config)
+    @model_validator(mode="before")
+    @classmethod
+    def load_config_model(cls, data: dict[str, Any]) -> dict[str, Any]:
+        type = data["type"]
+        config = data.get("config")
+        # Pydantic won't know what concrete type to instantiate for config, so
+        # ask the relevant sandbox environment to deserialize it.
+        if isinstance(config, dict) and len(config) > 0:
+            data["config"] = deserialize_sandbox_specific_config(type, config)
+        return data
 SandboxEnvironmentConfigType = BaseModel | str
@@ -343,3 +379,14 @@ def resolve_sandbox_environment(
         return SandboxEnvironmentSpec(sandbox[0], sandbox[1])
     else:
         return None
+def deserialize_sandbox_specific_config(type: str, config: dict[str, Any]) -> BaseModel:
+    # Avoid circular import
+    from inspect_ai.util._sandbox.registry import registry_find_sandboxenv
+    sandboxenv_type = registry_find_sandboxenv(type)
+    config_deserialize = cast(
+        ConfigDeserialize, getattr(sandboxenv_type, "config_deserialize")
+    )
+    return config_deserialize(config)

inspect_ai/util/_sandbox/service.py CHANGED Viewed

@@ -1,4 +1,3 @@
-import asyncio
 import json
 from logging import getLogger
 from pathlib import PurePosixPath
@@ -9,8 +8,10 @@ from typing import (
     cast,
 )
+import anyio
 from pydantic import JsonValue
+from inspect_ai._util._async import coro_log_exceptions
 from inspect_ai.util._subprocess import ExecResult
 from .environment import SandboxEnvironment
@@ -59,7 +60,7 @@ async def sandbox_service(
     # wait for and process methods
     while not until():
-        await asyncio.sleep(POLLING_INTERVAL)
+        await anyio.sleep(POLLING_INTERVAL)
         await service.handle_requests()
@@ -141,9 +142,15 @@ class SandboxService:
         if result.success:
             request_files = result.stdout.strip().splitlines()
             if request_files:
-                await asyncio.gather(
-                    *[self._handle_request(file) for file in request_files]
-                )
+                async with anyio.create_task_group() as tg:
+                    for file in request_files:
+                        tg.start_soon(
+                            coro_log_exceptions,
+                            logger,
+                            "handling sandbox service request",
+                            self._handle_request,
+                            file,
+                        )
     async def _handle_request(self, request_file: str) -> None:
         # read request

inspect-ai 0.3.72__py3-none-any.whl → 0.3.73__py3-none-any.whl

inspect-ai 0.3.72py3-none-any.whl → 0.3.73py3-none-any.whl