PyPI - inspect-ai - Versions diffs - 0.3.69__py3-none-any.whl → 0.3.70__py3-none-any.whl - Mend

inspect-ai 0.3.69py3-none-any.whl → 0.3.70py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (74) hide show

inspect_ai/_cli/eval.py +13 -1
inspect_ai/_display/textual/app.py +3 -2
inspect_ai/_display/textual/widgets/samples.py +4 -10
inspect_ai/_display/textual/widgets/transcript.py +25 -12
inspect_ai/_eval/eval.py +14 -2
inspect_ai/_eval/evalset.py +6 -1
inspect_ai/_eval/run.py +6 -0
inspect_ai/_eval/task/run.py +44 -15
inspect_ai/_eval/task/task.py +26 -3
inspect_ai/_util/interrupt.py +6 -0
inspect_ai/_util/logger.py +19 -0
inspect_ai/_util/rich.py +7 -8
inspect_ai/_util/text.py +13 -0
inspect_ai/_util/transcript.py +10 -2
inspect_ai/_util/working.py +46 -0
inspect_ai/_view/www/dist/assets/index.css +56 -12
inspect_ai/_view/www/dist/assets/index.js +904 -750
inspect_ai/_view/www/log-schema.json +337 -2
inspect_ai/_view/www/node_modules/flatted/python/flatted.py +149 -0
inspect_ai/_view/www/node_modules/flatted/python/test.py +63 -0
inspect_ai/_view/www/src/appearance/icons.ts +3 -1
inspect_ai/_view/www/src/metadata/RenderedContent.tsx +0 -1
inspect_ai/_view/www/src/samples/SampleDisplay.module.css +9 -1
inspect_ai/_view/www/src/samples/SampleDisplay.tsx +28 -1
inspect_ai/_view/www/src/samples/SampleSummaryView.module.css +4 -0
inspect_ai/_view/www/src/samples/SampleSummaryView.tsx +23 -2
inspect_ai/_view/www/src/samples/transcript/SampleLimitEventView.tsx +4 -0
inspect_ai/_view/www/src/samples/transcript/SandboxEventView.module.css +32 -0
inspect_ai/_view/www/src/samples/transcript/SandboxEventView.tsx +152 -0
inspect_ai/_view/www/src/samples/transcript/StepEventView.tsx +9 -2
inspect_ai/_view/www/src/samples/transcript/TranscriptView.tsx +19 -1
inspect_ai/_view/www/src/samples/transcript/event/EventPanel.tsx +6 -3
inspect_ai/_view/www/src/samples/transcript/types.ts +3 -1
inspect_ai/_view/www/src/types/log.d.ts +188 -108
inspect_ai/_view/www/src/utils/format.ts +7 -4
inspect_ai/_view/www/src/workspace/WorkSpaceView.tsx +9 -6
inspect_ai/log/__init__.py +2 -0
inspect_ai/log/_condense.py +1 -0
inspect_ai/log/_log.py +72 -12
inspect_ai/log/_samples.py +5 -1
inspect_ai/log/_transcript.py +31 -1
inspect_ai/model/_call_tools.py +1 -1
inspect_ai/model/_conversation.py +1 -1
inspect_ai/model/_model.py +32 -16
inspect_ai/model/_model_call.py +10 -3
inspect_ai/model/_providers/anthropic.py +13 -2
inspect_ai/model/_providers/bedrock.py +7 -0
inspect_ai/model/_providers/cloudflare.py +20 -7
inspect_ai/model/_providers/google.py +2 -0
inspect_ai/model/_providers/groq.py +57 -23
inspect_ai/model/_providers/hf.py +6 -0
inspect_ai/model/_providers/mistral.py +78 -51
inspect_ai/model/_providers/openai.py +9 -0
inspect_ai/model/_providers/providers.py +1 -1
inspect_ai/model/_providers/util/tracker.py +92 -0
inspect_ai/model/_providers/vllm.py +13 -5
inspect_ai/solver/_basic_agent.py +1 -3
inspect_ai/solver/_bridge/patch.py +0 -2
inspect_ai/solver/_limit.py +4 -4
inspect_ai/solver/_plan.py +0 -3
inspect_ai/solver/_task_state.py +7 -0
inspect_ai/tool/_tools/_web_search.py +3 -3
inspect_ai/util/_concurrency.py +14 -8
inspect_ai/util/_sandbox/context.py +15 -0
inspect_ai/util/_sandbox/docker/docker.py +7 -5
inspect_ai/util/_sandbox/environment.py +32 -1
inspect_ai/util/_sandbox/events.py +149 -0
inspect_ai/util/_sandbox/local.py +3 -3
{inspect_ai-0.3.69.dist-info → inspect_ai-0.3.70.dist-info}/METADATA +3 -3
{inspect_ai-0.3.69.dist-info → inspect_ai-0.3.70.dist-info}/RECORD +74 -67
{inspect_ai-0.3.69.dist-info → inspect_ai-0.3.70.dist-info}/LICENSE +0 -0
{inspect_ai-0.3.69.dist-info → inspect_ai-0.3.70.dist-info}/WHEEL +0 -0
{inspect_ai-0.3.69.dist-info → inspect_ai-0.3.70.dist-info}/entry_points.txt +0 -0
{inspect_ai-0.3.69.dist-info → inspect_ai-0.3.70.dist-info}/top_level.txt +0 -0

inspect_ai/_util/rich.py CHANGED Viewed

@@ -2,23 +2,22 @@ from rich.console import RenderableType
 from rich.style import Style
 from rich.text import Text
+from inspect_ai._util.text import truncate_lines
 def lines_display(
     text: str, max_lines: int = 100, style: str | Style = ""
 ) -> list[RenderableType]:
-    lines = text.splitlines()
-    if len(lines) > max_lines:
-        content: list[RenderableType] = [
-            Text("\n".join(lines[0:max_lines]), style=style)
-        ]
+    lines, truncated = truncate_lines(text, max_lines)
+    content: list[RenderableType] = [Text(lines, style=style)]
+    if truncated is not None:
         content.append(Text())
         content.append(
             Text.from_markup(
-                f"[italic]Output truncated ({len(lines) - max_lines} additional lines)...[/italic]",
+                f"[italic]Output truncated ({truncated} additional lines)...[/italic]",
                 style=style,
             )
         )
-    else:
-        content = [Text(text, style=style)]
     return content

inspect_ai/_util/text.py CHANGED Viewed

@@ -134,6 +134,19 @@ def truncate(text: str, length: int, overflow: str = "...", pad: bool = True) ->
     return truncated
+def truncate_lines(
+    text: str, max_lines: int = 100, max_characters: int | None = 100 * 100
+) -> tuple[str, int | None]:
+    if max_characters is not None:
+        text = truncate(text, max_characters)
+    lines = text.splitlines()
+    if len(lines) > max_lines:
+        output = "\n".join(lines[0:max_lines])
+        return output, len(lines) - max_lines
+    else:
+        return text, None
 def generate_large_text(target_tokens: int) -> str:
     """Generate a large amount of text with approximately the target number of tokens"""
     generated_text = []

inspect_ai/_util/transcript.py CHANGED Viewed

@@ -122,8 +122,16 @@ def transcript_reasoning(reasoning: str) -> list[RenderableType]:
     return content
-def transcript_separator(title: str, color: str) -> RenderableType:
-    return Rule(title=title, style=f"{color} bold", align="center", end="\n\n")
+def transcript_separator(
+    title: str, color: str, characters: str = "─"
+) -> RenderableType:
+    return Rule(
+        title=title,
+        characters=characters,
+        style=f"{color} bold",
+        align="center",
+        end="\n\n",
+    )
 def transcript_function(function: str, arguments: dict[str, Any]) -> RenderableType:

inspect_ai/_util/working.py ADDED Viewed

@@ -0,0 +1,46 @@
+import time
+from contextvars import ContextVar
+def init_sample_working_limit(start_time: float, working_limit: float | None) -> None:
+    _sample_working_limit.set(working_limit)
+    _sample_start_time.set(start_time)
+    _sample_waiting_time.set(0)
+def sample_waiting_time() -> float:
+    return _sample_waiting_time.get()
+def report_sample_waiting_time(waiting_time: float) -> None:
+    _sample_waiting_time.set(_sample_waiting_time.get() + waiting_time)
+    check_sample_working_limit()
+def check_sample_working_limit() -> None:
+    # no check if we don't have a limit
+    working_limit = _sample_working_limit.get()
+    if working_limit is None:
+        return
+    # are we over the limit?
+    running_time = time.monotonic() - _sample_start_time.get()
+    working_time = running_time - sample_waiting_time()
+    if working_time > working_limit:
+        from inspect_ai.solver._limit import SampleLimitExceededError
+        raise SampleLimitExceededError(
+            type="working",
+            value=int(working_time),
+            limit=int(working_limit),
+            message=f"Exceeded working time limit ({working_limit:,} seconds)",
+        )
+_sample_working_limit: ContextVar[float | None] = ContextVar(
+    "sample_working_limit", default=None
+)
+_sample_start_time: ContextVar[float] = ContextVar("sample_start_time", default=0)
+_sample_waiting_time: ContextVar[float] = ContextVar("sample_waiting_time", default=0)

inspect_ai/_view/www/dist/assets/index.css CHANGED Viewed

@@ -16317,35 +16317,43 @@ ul.jsondiffpatch-textdiff {
   width: 100%;
   margin-top: 1em;
 }
-._tabPanel_14odp_1 {
+._tabPanel_1isha_1 {
   padding-bottom: 1em;
 }
-._fullWidth_14odp_5 {
+._fullWidth_1isha_5 {
   width: 100%;
 }
-._metadataPanel_14odp_9 {
+._metadataPanel_1isha_9 {
   display: flex;
   flex-wrap: wrap;
-  align-items: flex-start;
+  align-items: stretch;
   gap: 1em;
   padding-left: 0;
   margin-top: 0.5em;
 }
-._padded_14odp_18 {
+._padded_1isha_18 {
   padding-left: 0.8em;
   margin-top: 0.4em;
 }
-._ansi_14odp_23 {
+._ansi_1isha_23 {
   margin: 1em 0;
 }
-._noTop_14odp_27 {
+._noTop_1isha_27 {
   margin-top: 0;
 }
+._timePanel_1isha_31 {
+  display: grid;
+  grid-template-columns: max-content max-content;
+  grid-template-rows: auto;
+  column-gap: 0.5em;
+  min-width: 200px;
+}
 ._flatBody_gk2ju_1 {
   color: var(--bs-danger);
   display: grid;
@@ -16365,15 +16373,15 @@ ul.jsondiffpatch-textdiff {
   line-height: var(--inspect-font-size-base);
   height: var(--inspect-font-size-base);
 }
-._target_yamz4_1 {
+._target_9qy4e_1 {
   padding-left: 0;
 }
-._answer_yamz4_5 {
+._answer_9qy4e_5 {
   padding-left: 0;
 }
-._grid_yamz4_9 {
+._grid_9qy4e_9 {
   display: grid;
   grid-column-gap: 0.5em;
   border-bottom: solid var(--bs-border-color) 1px;
@@ -16381,14 +16389,18 @@ ul.jsondiffpatch-textdiff {
   padding: 0em 1em 1em 1em;
 }
-._centerLabel_yamz4_17 {
+._centerLabel_9qy4e_17 {
   display: flex;
   justify-content: center;
 }
-._wrap_yamz4_22 {
+._wrap_9qy4e_22 {
   word-wrap: anywhere;
 }
+._titled_9qy4e_26:hover {
+  cursor: pointer;
+}
 ._title_19l1b_1 {
   margin-left: 0.5em;
   display: grid;
@@ -19070,6 +19082,38 @@ span.ap-marker-container:hover span.ap-marker {
   padding: 0;
   margin-bottom: 0;
 }
+._contents_iwnfd_1 {
+  margin-top: 0.5em;
+}
+._contents_iwnfd_1 > :last-child {
+  margin-bottom: 0;
+}
+._twoColumn_iwnfd_9 {
+  display: grid;
+  grid-template-columns: auto 1fr;
+  column-gap: 1.5em;
+}
+._exec_iwnfd_15 {
+  margin-top: 0.5em;
+}
+._result_iwnfd_19 {
+  margin-top: 0.5em;
+}
+._fileLabel_iwnfd_23 {
+  margin-top: 0;
+  margin-bottom: 0;
+}
+._wrapPre_iwnfd_28 {
+  white-space: pre-wrap;
+  word-wrap: break-word;
+  overflow-wrap: break-word;
+}
 ._darkenedBg_c8m1t_1 {
   background-color: var(--bs-light-bg-subtle);
 }

inspect-ai 0.3.69__py3-none-any.whl → 0.3.70__py3-none-any.whl

inspect-ai 0.3.69py3-none-any.whl → 0.3.70py3-none-any.whl