PyPI - inspect-ai - Versions diffs - 0.3.99__py3-none-any.whl → 0.3.101__py3-none-any.whl - Mend

inspect-ai 0.3.99py3-none-any.whl → 0.3.101py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (138) hide show

inspect_ai/_cli/eval.py +2 -1
inspect_ai/_display/core/config.py +11 -5
inspect_ai/_display/core/panel.py +66 -2
inspect_ai/_display/core/textual.py +5 -2
inspect_ai/_display/plain/display.py +1 -0
inspect_ai/_display/rich/display.py +2 -2
inspect_ai/_display/textual/widgets/transcript.py +37 -9
inspect_ai/_eval/eval.py +13 -1
inspect_ai/_eval/evalset.py +3 -2
inspect_ai/_eval/run.py +2 -0
inspect_ai/_eval/score.py +2 -4
inspect_ai/_eval/task/log.py +3 -1
inspect_ai/_eval/task/run.py +59 -81
inspect_ai/_util/content.py +11 -6
inspect_ai/_util/interrupt.py +2 -2
inspect_ai/_util/text.py +7 -0
inspect_ai/_util/working.py +8 -37
inspect_ai/_view/__init__.py +0 -0
inspect_ai/_view/schema.py +2 -1
inspect_ai/_view/www/CLAUDE.md +15 -0
inspect_ai/_view/www/dist/assets/index.css +307 -171
inspect_ai/_view/www/dist/assets/index.js +24733 -21641
inspect_ai/_view/www/log-schema.json +77 -3
inspect_ai/_view/www/package.json +9 -5
inspect_ai/_view/www/src/@types/log.d.ts +9 -0
inspect_ai/_view/www/src/app/App.tsx +1 -15
inspect_ai/_view/www/src/app/appearance/icons.ts +4 -1
inspect_ai/_view/www/src/app/content/MetaDataGrid.tsx +24 -6
inspect_ai/_view/www/src/app/content/MetadataGrid.module.css +0 -5
inspect_ai/_view/www/src/app/content/RenderedContent.tsx +220 -205
inspect_ai/_view/www/src/app/log-view/LogViewContainer.tsx +2 -1
inspect_ai/_view/www/src/app/log-view/tabs/SamplesTab.tsx +5 -0
inspect_ai/_view/www/src/app/log-view/tabs/grouping.ts +4 -4
inspect_ai/_view/www/src/app/routing/navigationHooks.ts +22 -25
inspect_ai/_view/www/src/app/routing/url.ts +84 -4
inspect_ai/_view/www/src/app/samples/InlineSampleDisplay.module.css +0 -5
inspect_ai/_view/www/src/app/samples/SampleDialog.module.css +1 -1
inspect_ai/_view/www/src/app/samples/SampleDisplay.module.css +7 -0
inspect_ai/_view/www/src/app/samples/SampleDisplay.tsx +24 -17
inspect_ai/_view/www/src/app/samples/SampleSummaryView.module.css +1 -2
inspect_ai/_view/www/src/app/samples/chat/ChatMessage.tsx +8 -6
inspect_ai/_view/www/src/app/samples/chat/ChatMessageRow.tsx +0 -4
inspect_ai/_view/www/src/app/samples/chat/ChatViewVirtualList.tsx +3 -2
inspect_ai/_view/www/src/app/samples/chat/MessageContent.tsx +2 -0
inspect_ai/_view/www/src/app/samples/chat/MessageContents.tsx +2 -0
inspect_ai/_view/www/src/app/samples/chat/messages.ts +1 -0
inspect_ai/_view/www/src/app/samples/chat/tools/ToolCallView.tsx +1 -0
inspect_ai/_view/www/src/app/samples/list/SampleList.tsx +17 -5
inspect_ai/_view/www/src/app/samples/list/SampleRow.tsx +1 -1
inspect_ai/_view/www/src/app/samples/transcript/ErrorEventView.tsx +1 -2
inspect_ai/_view/www/src/app/samples/transcript/InfoEventView.tsx +1 -1
inspect_ai/_view/www/src/app/samples/transcript/InputEventView.tsx +1 -2
inspect_ai/_view/www/src/app/samples/transcript/ModelEventView.module.css +1 -1
inspect_ai/_view/www/src/app/samples/transcript/ModelEventView.tsx +1 -1
inspect_ai/_view/www/src/app/samples/transcript/SampleInitEventView.tsx +1 -1
inspect_ai/_view/www/src/app/samples/transcript/SampleLimitEventView.tsx +3 -2
inspect_ai/_view/www/src/app/samples/transcript/SandboxEventView.tsx +4 -5
inspect_ai/_view/www/src/app/samples/transcript/ScoreEventView.tsx +1 -1
inspect_ai/_view/www/src/app/samples/transcript/SpanEventView.tsx +1 -2
inspect_ai/_view/www/src/app/samples/transcript/StepEventView.tsx +1 -3
inspect_ai/_view/www/src/app/samples/transcript/SubtaskEventView.tsx +1 -2
inspect_ai/_view/www/src/app/samples/transcript/ToolEventView.tsx +3 -4
inspect_ai/_view/www/src/app/samples/transcript/TranscriptPanel.module.css +42 -0
inspect_ai/_view/www/src/app/samples/transcript/TranscriptPanel.tsx +77 -0
inspect_ai/_view/www/src/app/samples/transcript/TranscriptVirtualList.tsx +27 -71
inspect_ai/_view/www/src/app/samples/transcript/TranscriptVirtualListComponent.module.css +13 -3
inspect_ai/_view/www/src/app/samples/transcript/TranscriptVirtualListComponent.tsx +27 -2
inspect_ai/_view/www/src/app/samples/transcript/event/EventPanel.module.css +1 -0
inspect_ai/_view/www/src/app/samples/transcript/event/EventPanel.tsx +21 -22
inspect_ai/_view/www/src/app/samples/transcript/outline/OutlineRow.module.css +45 -0
inspect_ai/_view/www/src/app/samples/transcript/outline/OutlineRow.tsx +223 -0
inspect_ai/_view/www/src/app/samples/transcript/outline/TranscriptOutline.module.css +10 -0
inspect_ai/_view/www/src/app/samples/transcript/outline/TranscriptOutline.tsx +258 -0
inspect_ai/_view/www/src/app/samples/transcript/outline/tree-visitors.ts +187 -0
inspect_ai/_view/www/src/app/samples/transcript/state/StateEventRenderers.tsx +8 -1
inspect_ai/_view/www/src/app/samples/transcript/state/StateEventView.tsx +3 -4
inspect_ai/_view/www/src/app/samples/transcript/transform/hooks.ts +78 -0
inspect_ai/_view/www/src/app/samples/transcript/transform/treeify.ts +340 -135
inspect_ai/_view/www/src/app/samples/transcript/transform/utils.ts +3 -0
inspect_ai/_view/www/src/app/samples/transcript/types.ts +2 -0
inspect_ai/_view/www/src/app/types.ts +5 -1
inspect_ai/_view/www/src/client/api/api-browser.ts +2 -2
inspect_ai/_view/www/src/components/LiveVirtualList.tsx +6 -1
inspect_ai/_view/www/src/components/MarkdownDiv.tsx +1 -1
inspect_ai/_view/www/src/components/PopOver.tsx +422 -0
inspect_ai/_view/www/src/components/PulsingDots.module.css +9 -9
inspect_ai/_view/www/src/components/PulsingDots.tsx +4 -1
inspect_ai/_view/www/src/components/StickyScroll.tsx +183 -0
inspect_ai/_view/www/src/components/TabSet.tsx +4 -0
inspect_ai/_view/www/src/state/hooks.ts +52 -2
inspect_ai/_view/www/src/state/logSlice.ts +4 -3
inspect_ai/_view/www/src/state/samplePolling.ts +8 -0
inspect_ai/_view/www/src/state/sampleSlice.ts +53 -9
inspect_ai/_view/www/src/state/scrolling.ts +152 -0
inspect_ai/_view/www/src/utils/attachments.ts +7 -0
inspect_ai/_view/www/src/utils/python.ts +18 -0
inspect_ai/_view/www/yarn.lock +290 -33
inspect_ai/agent/_react.py +12 -7
inspect_ai/agent/_run.py +2 -3
inspect_ai/analysis/beta/__init__.py +2 -0
inspect_ai/analysis/beta/_dataframe/samples/table.py +19 -18
inspect_ai/dataset/_sources/csv.py +2 -6
inspect_ai/dataset/_sources/hf.py +2 -6
inspect_ai/dataset/_sources/json.py +2 -6
inspect_ai/dataset/_util.py +23 -0
inspect_ai/log/_log.py +1 -1
inspect_ai/log/_recorders/eval.py +4 -3
inspect_ai/log/_recorders/file.py +2 -9
inspect_ai/log/_recorders/json.py +1 -0
inspect_ai/log/_recorders/recorder.py +1 -0
inspect_ai/log/_transcript.py +1 -1
inspect_ai/model/_call_tools.py +6 -2
inspect_ai/model/_openai.py +1 -1
inspect_ai/model/_openai_responses.py +85 -41
inspect_ai/model/_openai_web_search.py +38 -0
inspect_ai/model/_providers/azureai.py +72 -3
inspect_ai/model/_providers/openai.py +4 -1
inspect_ai/model/_providers/openai_responses.py +5 -1
inspect_ai/scorer/_metric.py +1 -2
inspect_ai/scorer/_reducer/reducer.py +1 -1
inspect_ai/solver/_task_state.py +2 -2
inspect_ai/tool/_tool.py +6 -2
inspect_ai/tool/_tool_def.py +27 -4
inspect_ai/tool/_tool_info.py +2 -0
inspect_ai/tool/_tools/_web_search/_google.py +43 -15
inspect_ai/tool/_tools/_web_search/_tavily.py +46 -13
inspect_ai/tool/_tools/_web_search/_web_search.py +214 -45
inspect_ai/util/__init__.py +4 -0
inspect_ai/util/_json.py +3 -0
inspect_ai/util/_limit.py +230 -20
inspect_ai/util/_sandbox/docker/compose.py +20 -11
inspect_ai/util/_span.py +1 -1
{inspect_ai-0.3.99.dist-info → inspect_ai-0.3.101.dist-info}/METADATA +3 -3
{inspect_ai-0.3.99.dist-info → inspect_ai-0.3.101.dist-info}/RECORD +138 -124
{inspect_ai-0.3.99.dist-info → inspect_ai-0.3.101.dist-info}/WHEEL +1 -1
{inspect_ai-0.3.99.dist-info → inspect_ai-0.3.101.dist-info}/entry_points.txt +0 -0
{inspect_ai-0.3.99.dist-info → inspect_ai-0.3.101.dist-info}/licenses/LICENSE +0 -0
{inspect_ai-0.3.99.dist-info → inspect_ai-0.3.101.dist-info}/top_level.txt +0 -0

inspect_ai/_util/content.py CHANGED Viewed

@@ -1,9 +1,14 @@
 from typing import Literal, Union
-from pydantic import BaseModel, Field
+from pydantic import BaseModel, Field, JsonValue
-class ContentText(BaseModel):
+class ContentBase(BaseModel):
+    internal: JsonValue | None = Field(default=None)
+    """Model provider specific payload - typically used to aid transformation back to model types."""
+class ContentText(ContentBase):
     """Text content."""
     type: Literal["text"] = Field(default="text")
@@ -16,7 +21,7 @@ class ContentText(BaseModel):
     """Was this a refusal message?"""
-class ContentReasoning(BaseModel):
+class ContentReasoning(ContentBase):
     """Reasoning content.
     See the specification for [thinking blocks](https://docs.anthropic.com/en/docs/build-with-claude/extended-thinking#understanding-thinking-blocks) for Claude models.
@@ -35,7 +40,7 @@ class ContentReasoning(BaseModel):
     """Indicates that the explicit content of this reasoning block has been redacted."""
-class ContentImage(BaseModel):
+class ContentImage(ContentBase):
     """Image content."""
     type: Literal["image"] = Field(default="image")
@@ -51,7 +56,7 @@ class ContentImage(BaseModel):
     """
-class ContentAudio(BaseModel):
+class ContentAudio(ContentBase):
     """Audio content."""
     type: Literal["audio"] = Field(default="audio")
@@ -64,7 +69,7 @@ class ContentAudio(BaseModel):
     """Format of audio data ('mp3' or 'wav')"""
-class ContentVideo(BaseModel):
+class ContentVideo(ContentBase):
     """Video content."""
     type: Literal["video"] = Field(default="video")

inspect_ai/_util/interrupt.py CHANGED Viewed

@@ -1,6 +1,6 @@
 import anyio
-from .working import check_sample_working_limit
+from inspect_ai.util._limit import check_working_limit
 def check_sample_interrupt() -> None:
@@ -12,4 +12,4 @@ def check_sample_interrupt() -> None:
         raise anyio.get_cancelled_exc_class()
     # check for working_limit
-    check_sample_working_limit()
+    check_working_limit()

inspect_ai/_util/text.py CHANGED Viewed

@@ -1,12 +1,19 @@
 import random
 import re
 import string
+import textwrap
 from logging import getLogger
 from typing import List, NamedTuple
 logger = getLogger(__name__)
+def truncate_text(text: str, max_length: int) -> str:
+    if len(text) <= max_length:
+        return text
+    return textwrap.shorten(text, width=max_length, placeholder="...")
 def strip_punctuation(s: str) -> str:
     return s.strip(string.whitespace + string.punctuation)

inspect_ai/_util/working.py CHANGED Viewed

@@ -1,19 +1,14 @@
 import time
 from contextvars import ContextVar
-from inspect_ai.util._limit import LimitExceededError
+from inspect_ai.util._limit import check_working_limit, record_waiting_time
-def init_sample_working_limit(start_time: float, working_limit: float | None) -> None:
-    _sample_working_limit.set(working_limit)
+def init_sample_working_time(start_time: float) -> None:
     _sample_start_time.set(start_time)
     _sample_waiting_time.set(0)
-def end_sample_working_limit() -> None:
-    _sample_working_limit.set(None)
 def sample_waiting_time() -> float:
     return _sample_waiting_time.get()
@@ -23,37 +18,13 @@ def sample_working_time() -> float:
 def report_sample_waiting_time(waiting_time: float) -> None:
+    # record and check for scoped limits
+    record_waiting_time(waiting_time)
+    check_working_limit()
+    # record sample-level limits
     _sample_waiting_time.set(_sample_waiting_time.get() + waiting_time)
-    check_sample_working_limit()
-def check_sample_working_limit() -> None:
-    from inspect_ai.log._transcript import SampleLimitEvent, transcript
-    # no check if we don't have a limit
-    working_limit = _sample_working_limit.get()
-    if working_limit is None:
-        return
-    # are we over the limit?
-    running_time = time.monotonic() - _sample_start_time.get()
-    working_time = running_time - sample_waiting_time()
-    if working_time > working_limit:
-        message = f"Exceeded working time limit ({working_limit:,} seconds)"
-        transcript()._event(
-            SampleLimitEvent(type="working", limit=int(working_limit), message=message)
-        )
-        raise LimitExceededError(
-            type="working",
-            value=int(working_time),
-            limit=int(working_limit),
-            message=message,
-        )
-_sample_working_limit: ContextVar[float | None] = ContextVar(
-    "sample_working_limit", default=None
-)
 _sample_start_time: ContextVar[float] = ContextVar("sample_start_time", default=0)

inspect_ai/_view/__init__.py ADDED Viewed

File without changes

inspect_ai/_view/schema.py CHANGED Viewed

@@ -45,9 +45,10 @@ def sync_view_schema() -> None:
                 "false",
             ],
             cwd=WWW_DIR,
+            check=True,
         )
-        subprocess.run(["yarn", "prettier:write"], cwd=types_path.parent)
+        subprocess.run(["yarn", "prettier:write"], cwd=types_path.parent, check=True)
         shutil.copyfile(types_path, vs_code_types_path)

inspect_ai/_view/www/CLAUDE.md ADDED Viewed

@@ -0,0 +1,15 @@
+# CLAUDE.md
+This file provides guidance to Claude Code (claude.ai/code) when working with code in this repository.
+## Build/Lint/Test Commands
+- Run type checker, linter, and tests: `yarn check-all`
+- Run type checker: `yarn tsc`
+- Run linter: `yarn lint`
+- Run tests: `yarn test`
+## Other Information
+- The code in this project is typescript, learn more about the configuration by inspecting package.json.
+- Respect existing code patterns when modifying files. Run linting before committing changes.

inspect-ai 0.3.99__py3-none-any.whl → 0.3.101__py3-none-any.whl

inspect-ai 0.3.99py3-none-any.whl → 0.3.101py3-none-any.whl