npm - @workbench-ai/workbench-contract - Versions diffs - 0.0.67 → 0.0.69 - Mend

@workbench-ai/workbench-contract 0.0.67 → 0.0.69

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (4) hide show

package/dist/index.d.ts CHANGED Viewed

@@ -1,682 +1,394 @@
 export type Json = null | boolean | number | string | Json[] | {
     [key: string]: Json;
 };
-export declare function isReservedWorkbenchAdapterAuthEnvName(name: string): boolean;
-export declare function assertWorkbenchAdapterAuthEnvNameAllowed(name: string): void;
-export interface RemoteWorkbenchProject {
-    id: string;
-    ownerUserId: string;
-    ownerUsername: string;
-    visibility: "private" | "public";
-    createdAt: string;
-    updatedAt: string;
-    activeEnvironmentVersionId: string;
-    currentSpecVersionId: string;
-    activeCandidateId?: string | null;
-    sourceFingerprint?: string;
-    starCount: number;
+export interface SurfaceSnapshotFile {
+    path: string;
+    kind?: "text" | "binary";
+    encoding?: "utf8" | "base64";
+    content: string;
+    executable?: boolean;
 }
-export interface RemoteWorkbenchProjectSummary {
-    id: string;
-    ownerUsername: string;
-    name: string;
-    description: string;
-    visibility: "private" | "public";
-    updatedAt: string;
-    currentSpecVersionId: string;
-    activeEnvironmentVersionId: string;
-    activeCandidateId?: string | null;
-    candidateCount: number;
-    evaluationCount: number;
-    runCount: number;
-    starCount: number;
-    viewerHasStarred?: boolean;
+export declare function normalizeWorkbenchSourcePath(filePath: string): string;
+export declare function normalizeWorkbenchSourceRequestPath(filePath: string): string;
+export declare function normalizeWorkbenchSkillName(value: string): string;
+export declare function isWorkbenchLocalMetadataPath(filePath: string): boolean;
+export type WorkbenchInspectionFileOwnerKind = "version" | "trace" | "artifact";
+export interface WorkbenchInspectionFileContent {
+    path: string;
+    kind?: SurfaceSnapshotFile["kind"];
+    encoding?: SurfaceSnapshotFile["encoding"];
+    executable?: boolean;
+    content?: string;
+    unavailableReason?: string;
 }
-export interface WorkbenchSpecValidation {
-    ok: boolean;
-    errors: string[];
-    warnings: string[];
+export declare function workbenchInspectionFileContentUnavailableReason(file: Pick<SurfaceSnapshotFile, "kind" | "encoding">): string | null;
+export declare function workbenchInspectionFileContent(file: SurfaceSnapshotFile): WorkbenchInspectionFileContent;
+export declare function workbenchInspectionFileManifest(file: SurfaceSnapshotFile): SurfaceSnapshotFile;
+export interface WorkbenchAgent {
+    name: string;
+    adapter: string;
+    model?: string;
+    config: Record<string, Json>;
 }
-export interface RemoteWorkbenchSpecVersion {
-    id: string;
-    projectId: string;
-    ordinal: number;
-    sourceYaml: string;
-    createdAt: string;
-    updatedAt: string;
-    validation: WorkbenchSpecValidation;
+export interface WorkbenchAgentSnapshot {
+    hash: string;
+    agent: WorkbenchAgent;
 }
-export interface RemoteWorkbenchEnvironment {
-    id: string;
+export type WorkbenchSkillSourceKind = "local" | "remote" | "none";
+export type WorkbenchSkillIncludeKind = Exclude<WorkbenchSkillSourceKind, "none">;
+export interface WorkbenchSkillInclude {
     name: string;
-    description: string;
-    currentVersionId: string;
-    builtIn: boolean;
+    kind: WorkbenchSkillIncludeKind;
+    path?: string;
+    from?: string;
+    ref?: string;
+    resolvedRef?: string;
+    hash?: string;
+    files?: SurfaceSnapshotFile[];
+}
+export interface WorkbenchSkillSource {
+    name: string;
+    kind: WorkbenchSkillSourceKind;
+    path?: string;
+    from?: string;
+    ref?: string;
+    resolvedRef?: string;
+    hash?: string;
+    includes?: WorkbenchSkillInclude[];
+}
+export interface WorkbenchSkillBundleSnapshot {
+    hash: string;
+    skillName: string;
+    entryName: string;
+    source: WorkbenchSkillSource;
+    files: SurfaceSnapshotFile[];
+    includedSkills: WorkbenchSkillInclude[];
     createdAt: string;
-    updatedAt: string;
 }
-export interface RemoteWorkbenchEnvironmentVersion {
+export interface WorkbenchVersion {
     id: string;
-    environmentId: string;
-    name: string;
-    spec: RemoteWorkbenchEnvironmentSpec;
-    imageRef: string;
-    sourceHash: string;
-    sourceType: "builtin" | "dockerfile";
-    build?: {
-        dockerfileRef?: BlobObjectRef;
-        logRef?: BlobObjectRef;
-        error?: string;
-        startedAt?: string;
-        finishedAt?: string;
-    };
-    status: "ready" | "building" | "failed";
+    hash: string;
+    message: string;
+    parentIds: string[];
     createdAt: string;
-    updatedAt: string;
-}
-export interface RemoteWorkbenchEnvironmentSpec {
-    base: string;
-    resources: {
-        cpu: number;
-        memoryGb: number;
-        diskGb: number;
-        timeoutMinutes: number;
-    };
-    network: "off" | "on";
-}
-export interface BlobObjectRef {
-    bucket: string;
-    key: string;
-    byteLength: number;
-    sha256: string;
-}
-export type RemoteWorkbenchSnapshotKind = "candidate" | "engineResolve" | "adapters" | "runtime";
-export type WorkspaceWriteEncoding = "utf8" | "base64";
-export interface SurfaceSnapshotFile {
-    path: string;
-    kind: "text" | "binary";
-    encoding: WorkspaceWriteEncoding;
-    content: string;
-    executable: boolean;
-    contentRedacted?: boolean;
-}
-export interface WorkbenchEngineCaseFiles {
-    public?: SurfaceSnapshotFile[];
-    private?: SurfaceSnapshotFile[];
-    source?: SurfaceSnapshotFile[];
-}
-export interface SurfaceSnapshot {
     files: SurfaceSnapshotFile[];
 }
-export interface RemoteWorkbenchFileInput {
-    path: string;
-    content: string;
-    encoding?: WorkspaceWriteEncoding;
-    executable?: boolean;
-}
-export interface EngineResolveBinding {
-    engine: string;
-    resolver: {
-        use: string;
-        withFingerprint: string;
-    };
-}
-export interface RemoteWorkbenchSnapshotBase {
+export interface WorkbenchEvalSnapshot {
+    hash: string;
     files: SurfaceSnapshotFile[];
+    caseCount: number;
+    createdAt: string;
     updatedAt: string;
+    scoreAdapter: string;
 }
-export interface RemoteWorkbenchEngineResolveSnapshot extends RemoteWorkbenchSnapshotBase {
-    kind: "engineResolve";
-    engineResolveBinding: EngineResolveBinding;
-}
-export interface RemoteWorkbenchStandardSnapshot extends RemoteWorkbenchSnapshotBase {
-    kind: Exclude<RemoteWorkbenchSnapshotKind, "engineResolve">;
-}
-export type RemoteWorkbenchSnapshot = RemoteWorkbenchEngineResolveSnapshot | RemoteWorkbenchStandardSnapshot;
-export type CandidateStatus = "running" | "evaluated" | "repair_exhausted" | "eval_error" | "agent_error";
-export interface MetricStats {
-    count: number;
-    mean: number;
-    variance: number;
-    stddev: number;
-    min: number;
-    max: number;
-}
-export type EvalCaseStatus = "completed" | "error";
-export type EvalCaseSource = Record<string, Json>;
-export interface CandidateCaseCriterionScore {
-    criterion_id: string;
-    label: string;
-    score: number;
-    pass: boolean;
-    errors?: string[];
-    rationale?: string;
-}
-export interface EvalCaseResult {
+export type WorkbenchRunKind = "eval" | "improve" | "compare";
+export type WorkbenchRunStatus = "running" | "succeeded" | "failed" | "canceled";
+export type WorkbenchJobStatus = "queued" | "running" | "succeeded" | "failed" | "canceled";
+export type WorkbenchArtifactKind = "file" | "directory" | "log" | "scorecard";
+export interface WorkbenchRun {
     id: string;
-    label?: string;
-    split?: string;
-    status?: EvalCaseStatus;
-    durationMs?: number;
-    metrics: Record<string, number>;
-    source?: EvalCaseSource;
-    feedback?: Json;
-    criteria?: CandidateCaseCriterionScore[];
-}
-export type ExecutionRole = "improver" | "runner" | "engine";
-export type ExecutionUsageCostSource = "provider" | "estimated" | "mixed";
-export interface ExecutionUsage {
-    provider?: string;
-    model?: string;
-    inputTokens?: number;
-    uncachedInputTokens?: number;
-    cachedInputTokens?: number;
-    cacheCreationInputTokens?: number;
-    cacheReadInputTokens?: number;
-    outputTokens?: number;
-    reasoningOutputTokens?: number;
-    totalTokens?: number;
+    kind: WorkbenchRunKind;
+    versionId: string;
+    skillName: string;
+    skillBundleHash: string;
+    evalHash: string;
+    agentName: string;
+    agentHash: string;
+    status: WorkbenchRunStatus;
+    score?: number;
     costUsd?: number;
-    costSource?: ExecutionUsageCostSource;
-    pricingSource?: string;
-}
-export interface UsageSummary {
-    total?: ExecutionUsage;
-    improver?: ExecutionUsage;
-    runner?: ExecutionUsage;
-    engine?: ExecutionUsage;
-}
-export interface EvaluationCandidateSummary {
-    id: string;
-    kind: "candidate";
-    label?: string;
-}
-export type EvaluationSampleStatus = "planned" | "running" | "completed" | "error";
-export type EvaluationStatus = EvaluationSampleStatus | "partial";
-export interface EvaluationSampleRecord {
-    id: string;
-    index: number;
-    candidate: EvaluationCandidateSummary;
-    status: EvaluationSampleStatus;
-    startedAt?: string;
+    latencyMs?: number;
+    jobIds?: string[];
+    traceIds: string[];
+    createdAt: string;
     finishedAt?: string;
-    durationMs?: number;
-    metrics?: Record<string, number>;
-    usage?: UsageSummary;
+    parentRunId?: string;
+    outputVersionId?: string;
     error?: string;
-    cases?: EvalCaseResult[];
-    feedback?: Json;
 }
-export interface EvaluationCaseStats {
+export interface WorkbenchJob {
     id: string;
-    label?: string;
-    split?: string;
-    status?: EvalCaseStatus;
-    sampleCount: number;
-    metrics: Record<string, MetricStats>;
-    durationMs?: MetricStats;
-}
-export interface EvaluationUsageStats {
-    total?: ExecutionUsageStats;
-    improver?: ExecutionUsageStats;
-    runner?: ExecutionUsageStats;
-    engine?: ExecutionUsageStats;
-}
-export interface ExecutionUsageStats {
-    inputTokens?: MetricStats;
-    uncachedInputTokens?: MetricStats;
-    cachedInputTokens?: MetricStats;
-    cacheCreationInputTokens?: MetricStats;
-    cacheReadInputTokens?: MetricStats;
-    outputTokens?: MetricStats;
-    reasoningOutputTokens?: MetricStats;
-    totalTokens?: MetricStats;
-    costUsd?: MetricStats;
-}
-export interface EvaluationRecord {
-    candidate: EvaluationCandidateSummary;
-    status: EvaluationStatus;
-    sampleCount: number;
-    completedSampleCount: number;
-    errorSampleCount: number;
+    runId: string;
+    kind: WorkbenchRunKind;
+    versionId: string;
+    skillName: string;
+    skillBundleHash: string;
+    evalHash: string;
+    agentName: string;
+    agentHash: string;
+    caseId: string;
+    sample: number;
+    status: WorkbenchJobStatus;
+    score?: number;
+    command?: string;
+    dockerImage?: string;
+    exitCode?: number;
+    artifactIds: string[];
+    traceIds: string[];
+    createdAt: string;
     startedAt?: string;
     finishedAt?: string;
-    metrics?: Record<string, MetricStats>;
-    durationMs?: MetricStats;
-    usage?: EvaluationUsageStats;
-    cases?: EvaluationCaseStats[];
-    samples: EvaluationSampleRecord[];
+    durationMs?: number;
     error?: string;
 }
-export interface EvaluationSummary {
+export interface WorkbenchArtifact {
     id: string;
     runId: string;
-    benchmarkFingerprint: string;
-    candidateFingerprint: string;
-    candidateId: string;
-    candidateName?: string;
-    candidateVersion: number;
-    candidateRunId?: string;
-    candidateRunName?: string;
+    jobId: string;
+    kind: WorkbenchArtifactKind;
+    path: string;
     createdAt: string;
-    updatedAt: string;
-    status: EvaluationStatus;
-    sampleCount: number;
-    completedSampleCount: number;
-    errorSampleCount: number;
-    metrics?: Record<string, MetricStats>;
-    selectionMetric?: string;
-    selectionLabel?: string;
-    selectionScore?: MetricStats;
-    durationMs?: MetricStats;
-    usage?: EvaluationUsageStats;
-    error?: string;
-}
-export interface EvaluationScorecard extends EvaluationSummary {
-    evaluation: EvaluationRecord;
+    files: SurfaceSnapshotFile[];
 }
-export interface WorkbenchEvaluationMetricDescriptor {
+export interface WorkbenchTrace {
     id: string;
-    label: string;
-    direction: "higher" | "lower";
-    kind: "number" | "duration_ms" | "currency_usd";
-    group: "metric" | "execution" | "usage" | "other";
-    primary: boolean;
-    semanticRole?: "performance" | "speed" | "cost";
-}
-export interface WorkbenchEvaluationComparisonRow {
-    evaluationId: string;
     runId: string;
-    candidateId: string;
-    candidateLabel: string;
-    configurationLabel: string;
-    status: EvaluationSummary["status"];
-    score: number | null;
-    metrics: Record<string, number>;
-    createdAt: string;
-    updatedAt: string;
-    error?: string;
-}
-export interface WorkbenchCandidateEvaluationRollup {
-    candidateId: string;
-    candidateLabel: string;
-    evaluationCount: number;
-    completeEvaluationCount: number;
-    scoredEvaluationCount: number;
-    bestEvaluationId: string | null;
-    bestScore: number | null;
-    meanScore: number | null;
-}
-export interface WorkbenchEvaluationComparison {
-    evaluations: EvaluationSummary[];
-    rows: WorkbenchEvaluationComparisonRow[];
-    candidates: WorkbenchCandidateEvaluationRollup[];
-    metrics: WorkbenchEvaluationMetricDescriptor[];
-}
-export interface CandidateSummary {
-    id: string;
-    name?: string;
-    version: number;
-    ordinal: number;
-    benchmarkFingerprint: string;
-    candidateFingerprint: string;
-    ownerUserId?: string;
-    ownerUsername?: string;
-    visibility?: "private" | "public";
+    jobId?: string;
+    versionId: string;
+    skillName: string;
+    skillBundleHash: string;
+    evalHash?: string;
+    agentName: string;
+    agentHash?: string;
     createdAt: string;
-    baseId?: string;
-    referenceIds: string[];
-    status: CandidateStatus;
-    fileChanges: string[];
-    usage?: UsageSummary;
-}
-export interface CandidateRecord extends CandidateSummary {
-    eval?: EvaluationRecord;
-    prompt?: string;
-    meta?: Json;
-}
-export interface CandidateLineageNode {
-    id: string;
-    active: boolean;
-    summary: CandidateSummary;
-}
-export interface CandidateLineageEdge {
-    id: string;
-    kind: "anchor";
-    sourceId: string;
-    targetId: string;
-}
-export interface CandidateLineageGraph {
-    activeId: string | null;
-    nodes: CandidateLineageNode[];
-    edges: CandidateLineageEdge[];
-}
-export declare function buildCandidateLineage(args: {
-    summaries: readonly CandidateSummary[];
-    activeId: string | null;
-}): CandidateLineageGraph;
-export declare function buildWorkbenchEvaluationComparison(evaluations: readonly EvaluationSummary[]): WorkbenchEvaluationComparison;
-export declare function buildWorkbenchEvaluationMetricDescriptors(evaluations: readonly EvaluationSummary[]): WorkbenchEvaluationMetricDescriptor[];
-export declare function readEvaluationScore(evaluation: EvaluationSummary): number | null;
-export declare function isCompleteEvaluationSummary(evaluation: Pick<EvaluationSummary, "status" | "sampleCount" | "completedSampleCount" | "errorSampleCount">): boolean;
-export declare function formatEvaluationConfigurationLabel(evaluation: Pick<EvaluationSummary, "candidateRunName" | "candidateRunId">): string;
-export type CandidatePreviewMode = "diff" | "raw" | "rendered";
-export type CandidatePreviewKind = "text" | "markdown" | "table" | "spreadsheet" | "image" | "pdf" | "unsupported";
-export type CandidatePreviewSourceEncoding = "utf8" | "base64";
-export type CandidateFileStatus = "added" | "modified" | "unchanged";
-export interface CandidateFileSummary {
-    path: string;
-    old_path: string | null;
-    status: CandidateFileStatus;
-    mime_type: string | null;
-    preview_kind: CandidatePreviewKind;
-    additions: number;
-    deletions: number;
-}
-export interface CandidateFilePreviewSource {
-    content: string;
-    encoding: CandidatePreviewSourceEncoding;
-}
-export interface CandidateFilePreview {
-    path: string;
-    view: CandidatePreviewMode;
-    mime_type: string | null;
-    preview_kind: CandidatePreviewKind;
-    diff: string | null;
-    source: CandidateFilePreviewSource | null;
-    rendered_html: string | null;
-}
-export interface CandidateCaseCriterionResult {
-    criterion_id: string;
-    pass: boolean;
-    score: number;
-    errors: string[];
-    rationale?: string;
-}
-export interface CandidateCaseExecutionRef {
-    runId: string;
-    kind: string;
-    role: WorkbenchExecutionEventRole;
-    status: RemoteWorkbenchJobStatus;
-    jobIds: string[];
-    executionIds: string[];
-    createdAt?: string;
-    startedAt?: string;
-    finishedAt?: string;
-    durationMs?: number;
-    caseId?: string;
-    sampleIndex?: number;
-    attemptIndex?: number;
-}
-export interface CandidateCaseReview {
-    candidateId: string;
-    caseId: string;
-    caseLabel: string;
-    sampleId?: string;
-    sampleIndex?: number;
-    status?: EvalCaseStatus | RemoteWorkbenchJobStatus;
-    metrics: Record<string, number>;
-    durationMs?: number;
-    source?: EvalCaseSource;
-    feedback?: Json;
-    executions: CandidateCaseExecutionRef[];
-    criteria_results: CandidateCaseCriterionResult[];
-}
-export type RunStatus = "queued" | "running" | "finished";
-export type RunOutcome = "ok" | "error" | "cancelled";
-export type RemoteRunWorkflow = "eval" | "improve";
-export interface RunSummary {
-    id: string;
-    workflow: RemoteRunWorkflow;
-    benchmarkFingerprint: string;
-    status: RunStatus;
-    candidateId?: string | null;
-    candidateRunId?: string;
-    candidateRunName?: string;
-    startedAt: string;
-    finishedAt?: string;
-    durationMs?: number;
-    improver: string;
-    engineRun: string;
-    strategy: string;
-    optimizeOn?: string;
-    selectBy?: string;
-    budget: number;
-    repairBudget: number;
-    attemptsRequested: number;
-    attemptsExecuted: number;
-    samples: number;
-    executionFingerprint?: string;
-    stoppedReason?: "budget_exhausted" | "completed" | "dry_run" | "cancelled";
-    outcome?: RunOutcome;
-    error?: string;
-    activeCandidateId?: string | null;
-    outputCandidateId?: string | null;
-}
-export interface WorkbenchRuntimeRun extends RunSummary {
-    jobCount?: number;
-    completedJobCount?: number;
-    failedJobCount?: number;
+    request: Json;
+    result: Json;
+    files: SurfaceSnapshotFile[];
 }
-export interface RuntimeEvent {
-    id: string;
-    at: string;
-    type: "run_started" | "job_queued" | "job_started" | "job_progress" | "sandbox_allocated" | "sandbox_stopped" | "candidate_created" | "candidate_evaluated" | "active_changed" | "run_finished";
+export interface WorkbenchLineageEdge {
+    parentId: string;
+    childId: string;
     runId?: string;
-    jobId?: string;
-    candidateId?: string;
-    baseId?: string;
-    activeId?: string;
-    status?: CandidateStatus | RemoteWorkbenchJobStatus;
-    metrics?: Record<string, number>;
-    detail?: Record<string, Json>;
-}
-export interface RuntimeSnapshot {
-    workspaceRoot: string;
-    activeId: string | null;
-    currentBenchmarkFingerprint: string | null;
-    summaries: CandidateSummary[];
-    evaluations: EvaluationSummary[];
-    runs: RunSummary[];
-}
-export interface WorkbenchRuntimeCandidateFiles {
-    candidateId: string;
-    files: SurfaceSnapshotFile[];
+    reason: "version" | "improve";
+    createdAt: string;
+    message?: string;
 }
-export interface WorkbenchRuntimeExecutionFiles {
-    jobId: string;
-    files: SurfaceSnapshotFile[];
+export type WorkbenchRemoteKind = "workbench-cloud" | "file";
+export interface WorkbenchRemote {
+    name: string;
+    url: string;
+    kind: WorkbenchRemoteKind;
 }
-export interface WorkbenchRuntimeBundle {
-    schema: "workbench.runtime.bundle.v1";
-    activeId: string | null;
-    candidates: CandidateRecord[];
-    candidateFiles: WorkbenchRuntimeCandidateFiles[];
-    evaluations: EvaluationScorecard[];
-    runs: WorkbenchRuntimeRun[];
-    jobs: RemoteWorkbenchJob[];
-    executionFiles: WorkbenchRuntimeExecutionFiles[];
-    events: RuntimeEvent[];
-}
-export interface WorkbenchRuntimeBundleStats {
-    candidates: number;
-    candidateFiles: number;
-    evaluations: number;
-    runs: number;
-    jobs: number;
-    executionFiles: number;
-    events: number;
-    activeId: string | null;
-}
-export interface WorkbenchRuntimeImportResult {
-    changed: boolean;
-    stats: WorkbenchRuntimeBundleStats;
-}
-export interface WorkbenchProjectSourceResources {
-    cpu?: number;
-    memoryGb?: number;
-    diskGb?: number;
-    timeoutMinutes?: number;
-}
-export interface WorkbenchProjectStateSource {
-    source: string;
-    files: SurfaceSnapshotFile[];
-    candidateFiles: SurfaceSnapshotFile[];
-    engineResolveFiles: SurfaceSnapshotFile[];
-    engineResolveBinding: EngineResolveBinding;
-    adapterFiles: SurfaceSnapshotFile[];
-    dockerfile: string;
-    runtimeDockerfile: string;
-    runtimeFiles: SurfaceSnapshotFile[];
-    network: "off" | "on";
-    resources: WorkbenchProjectSourceResources;
-    revisionId?: string;
-    fingerprint?: string;
+export interface WorkbenchRefs {
+    current?: string;
+    [name: string]: string | undefined;
 }
-export interface WorkbenchProjectStateBase {
-    sourceRevisionId?: string;
-    sourceFingerprint?: string;
-    runtimeFingerprint?: string;
+export interface WorkbenchProjectState {
+    schema: "workbench.skill.state.v1";
+    root: string;
+    refs: WorkbenchRefs;
+    remotes: Record<string, WorkbenchRemote>;
+    versions: WorkbenchVersion[];
+    skillSources: WorkbenchSkillSource[];
+    skillBundles: WorkbenchSkillBundleSnapshot[];
+    evals: WorkbenchEvalSnapshot[];
+    agents: WorkbenchAgent[];
+    runs: WorkbenchRun[];
+    jobs: WorkbenchJob[];
+    traces: WorkbenchTrace[];
+    executionEvents: WorkbenchExecutionEventBatch[];
+    artifacts: WorkbenchArtifact[];
+    lineage: WorkbenchLineageEdge[];
+}
+export interface WorkbenchStatus {
+    root: string;
+    initialized: boolean;
+    currentSkillHash?: string;
+    currentVersionId?: string;
+    defaultSkill?: string;
+    defaultAgent?: string;
+    versionCount: number;
+    skillCount: number;
+    agentCount: number;
+    runCount: number;
+    remoteCount: number;
+    pendingSyncCount?: number;
+    lastScore?: number;
 }
-export interface WorkbenchProjectStateRemote {
-    id: string;
+export interface WorkbenchRemoteSyncState {
+    schema: "workbench.remote-sync-state.v1";
     remote: string;
-    ownerUsername: string;
-    name: string;
-    visibility: "private" | "public";
-}
-export interface WorkbenchProjectState {
-    schema: "workbench.project.state.v1";
-    project: WorkbenchProjectStateRemote;
-    base: WorkbenchProjectStateBase;
-    source: WorkbenchProjectStateSource;
-    runtime: WorkbenchRuntimeBundle;
-}
-export interface WorkbenchProjectStateImportResult {
-    changed: boolean;
-    source: {
-        changed: boolean;
-        revisionId?: string;
-        fingerprint?: string;
+    url: string;
+    status: "synced" | "error";
+    lastSyncedAt?: string;
+    lastAttemptAt: string;
+    lastError?: {
+        code: string;
+        message: string;
+    } | null;
+    pushed?: number;
+    pulled?: number;
+}
+export interface WorkbenchStatusSnapshot {
+    schema: "workbench.status.v1";
+    ok: true;
+    project: {
+        root: string;
+        initialized: boolean;
+        currentVersionId?: string;
+        defaultSkill?: string;
+        defaultAgent?: string;
     };
-    runtime: WorkbenchRuntimeImportResult;
-    state: WorkbenchProjectState;
-}
-export type WorkbenchRemoteContractSchema = "workbench.remote.capabilities.v1" | "workbench.remote.run.request.v1" | "workbench.remote.job.claim_request.v1" | "workbench.remote.job.claim.v1" | "workbench.remote.job.renewal.v1" | "workbench.remote.job.renewal_result.v1" | "workbench.remote.job.progress.v1" | "workbench.remote.job.completion.v1" | "workbench.remote.job.retry.v1";
-export type WorkbenchRemoteProductionSandbox = "firecracker";
-export type WorkbenchRemoteLocalSandbox = "docker";
-export type WorkbenchRemoteNetworkPolicy = "open" | "none";
-export interface WorkbenchRemoteCapabilities {
-    schema: "workbench.remote.capabilities.v1";
-    contractVersion: 1;
-    projectState: {
-        schema: WorkbenchProjectState["schema"];
-        guardedSourceWrites: true;
-        immutableRuntimeFacts: true;
+    worktree: {
+        hasUnversionedChanges: boolean;
+        latestVersionId?: string;
     };
-    execution: {
-        fencedJobLeases: true;
-        idempotentCompletion: true;
-        progressIsBestEffort: true;
-        maxJobsPerRun: number;
+    runs: {
+        total: number;
+        lastRunId?: string;
+        lastStatus?: WorkbenchRunStatus;
+        lastScore?: number;
     };
-    sandbox: {
-        production: WorkbenchRemoteProductionSandbox;
-        local: WorkbenchRemoteLocalSandbox;
-        networkPolicies: WorkbenchRemoteNetworkPolicy[];
-    };
-    blobs: {
-        contentAddressed: boolean;
-        maxUploadBytes: number;
-    };
-}
-export interface WorkbenchRemoteRunRequest {
-    schema: "workbench.remote.run.request.v1";
-    workflow: "eval" | "improve";
-    budget?: number;
-    samples: number;
-    candidateId?: string;
-    sourceYaml?: string;
-    candidateFiles?: RemoteWorkbenchFileInput[];
-    adapterFiles?: RemoteWorkbenchFileInput[];
-    selectedSamples?: Array<{
-        caseId: string;
-        sampleIndex: number;
+    remotes: Array<{
+        name: string;
+        kind: WorkbenchRemoteKind;
+        url: string;
+        sync: {
+            status: "up_to_date" | "error" | "never";
+            lastSyncedAt?: string;
+            lastAttemptAt?: string;
+            lastError?: {
+                code: string;
+                message: string;
+            } | null;
+            nextCommand?: string;
+        };
+        publication: {
+            status: "published" | "unpublished";
+            visibility?: string;
+            versionId?: string;
+            installUrl?: string;
+            pinnedInstallUrl?: string;
+        };
     }>;
-    preserveActive?: boolean;
-    rerun?: boolean;
-}
-export interface AuthoredWorkbenchCandidateRunSpec extends WorkbenchAuthoredAdapterSpec {
-    name: string;
-}
-export interface WorkbenchCaseSelector {
-    all?: true;
-    split?: string;
-}
-export interface WorkbenchSelectionSpec {
-    metric: string;
-    cases?: WorkbenchCaseSelector;
-}
-export interface AuthoredWorkbenchCandidateImproveSpec extends WorkbenchAuthoredAdapterSpec {
-    edits: string[];
-    optimizeOn?: WorkbenchCaseSelector;
-    selectBy?: WorkbenchSelectionSpec;
+    auth?: {
+        workbenchCloud: {
+            status: "authenticated" | "not_authenticated";
+            baseUrl?: string;
+            username?: string;
+        };
+        adapters: Array<{
+            adapter: string;
+            slot?: string;
+            profile: string;
+            status: string;
+            method?: string;
+            updatedAt?: string;
+        }>;
+    };
+    next: string[];
+}
+export interface WorkbenchComparisonCell {
+    versionId: string;
+    skillName: string;
+    skillBundleHash: string;
+    evalHash: string;
+    agentName: string;
+    agentHash: string;
+    runId?: string;
+    status?: WorkbenchRunStatus;
+    score?: number;
+    costUsd?: number;
+    latencyMs?: number;
+    error?: string;
 }
-export interface AuthoredWorkbenchCandidateSpec {
-    name: string;
-    description?: string;
-    files: WorkbenchPathRef;
-    prepare?: WorkbenchCandidatePrepareSpec;
-    defaultRun?: string;
-    selectedRunId?: string;
-    runs: Record<string, AuthoredWorkbenchCandidateRunSpec>;
-    improve?: AuthoredWorkbenchCandidateImproveSpec;
-}
-export interface WorkbenchCandidatePrepareSpec {
-    command: string;
-}
-export interface WorkbenchPathRef {
+export interface WorkbenchComparison {
+    evalHash?: string;
+    versions: WorkbenchVersion[];
+    skills: WorkbenchSkillBundleSnapshot[];
+    agents: WorkbenchAgentSnapshot[];
+    cells: WorkbenchComparisonCell[];
+}
+export interface WorkbenchInspectionSnapshot {
+    root: string;
+    status: WorkbenchStatus;
+    versions: WorkbenchVersion[];
+    skillSources: WorkbenchSkillSource[];
+    skillBundles: WorkbenchSkillBundleSnapshot[];
+    evals: WorkbenchEvalSnapshot[];
+    agents: WorkbenchAgentSnapshot[];
+    comparison?: WorkbenchComparison;
+    runs: WorkbenchRun[];
+    jobs: WorkbenchJob[];
+    traces: WorkbenchTrace[];
+    executionEvents: WorkbenchExecutionEventBatch[];
+    artifacts: WorkbenchArtifact[];
+    lineage: WorkbenchLineageEdge[];
+    remotes: WorkbenchRemote[];
+    refs: WorkbenchRefs;
+    publication?: WorkbenchPublication;
+}
+export interface WorkbenchPublication {
+    versionId: string;
+    installUrl: string;
+    pinnedInstallUrl: string;
+}
+export interface WorkbenchObjectPack {
+    schema: "workbench.object-pack.v1";
+    createdAt: string;
+    refs: WorkbenchRefs;
+    versions: WorkbenchVersion[];
+    skillSources: WorkbenchSkillSource[];
+    skillBundles: WorkbenchSkillBundleSnapshot[];
+    evals: WorkbenchEvalSnapshot[];
+    agents: WorkbenchAgent[];
+    runs: WorkbenchRun[];
+    jobs: WorkbenchJob[];
+    traces: WorkbenchTrace[];
+    executionEvents: WorkbenchExecutionEventBatch[];
+    artifacts: WorkbenchArtifact[];
+    lineage: WorkbenchLineageEdge[];
+}
+export interface WorkbenchFilePreview {
     path: string;
+    source?: SurfaceSnapshotFile;
+    renderedText?: string;
+    diff?: string;
 }
-export interface WorkbenchAuthoredAdapterSpec {
-    use: string;
-    auth?: string | Record<string, string>;
-    with?: Record<string, Json>;
-}
-export interface AuthoredWorkbenchRuntimeSpec {
-    dockerfile: string;
-    resources?: {
-        cpu?: number;
-        memoryGb?: number;
-        diskGb?: number;
-        timeoutMinutes?: number;
-    };
-    network?: {
-        egress?: "none" | "open";
-    };
+export interface WorkbenchFileSurface {
+    files: SurfaceSnapshotFile[];
+    preview: WorkbenchFilePreview | null;
 }
-export type AuthoredWorkbenchImproveSpec = WorkbenchAuthoredAdapterSpec;
-export type AuthoredWorkbenchRunSpec = WorkbenchAuthoredAdapterSpec;
-export type AuthoredWorkbenchScoreSpec = WorkbenchAuthoredAdapterSpec;
-export interface AuthoredWorkbenchEngineConfig {
-    tasks?: WorkbenchAuthoredAdapterSpec;
-    environment: AuthoredWorkbenchRuntimeSpec;
-    score: AuthoredWorkbenchScoreSpec;
+export interface WorkbenchSpecValidation {
+    ok: boolean;
+    errors: string[];
+    warnings: string[];
 }
-export interface AuthoredWorkbenchEngineSpec {
-    use: string;
-    auth?: string | Record<string, string>;
-    with?: AuthoredWorkbenchEngineConfig | Record<string, Json>;
+export interface RemoteWorkbenchEnvironmentSpec {
+    base: string;
+    resources: {
+        cpu: number;
+        memoryGb: number;
+        diskGb: number;
+        timeoutMinutes: number;
+    };
+    network: "off" | "on";
 }
-export interface AuthoredWorkbenchBenchmarkSpec {
+export interface RemoteWorkbenchEnvironmentVersion {
+    id: string;
+    environmentId: string;
     name: string;
-    description: string;
-    engine: AuthoredWorkbenchEngineSpec;
+    spec: RemoteWorkbenchEnvironmentSpec;
+    imageRef: string;
+    sourceHash: string;
+    sourceType: "builtin" | "dockerfile";
+    build?: {
+        dockerfileRef?: BlobObjectRef;
+        logRef?: BlobObjectRef;
+        error?: string;
+        startedAt?: string;
+        finishedAt?: string;
+    };
+    status: "ready" | "building" | "failed";
+    createdAt: string;
+    updatedAt: string;
 }
-export interface AuthoredWorkbenchSourceSpec {
-    version: 4;
-    benchmark: AuthoredWorkbenchBenchmarkSpec;
-    candidate: AuthoredWorkbenchCandidateSpec;
+export interface EngineResolveBinding {
+    engine: string;
+    resolver: {
+        use: string;
+        withFingerprint: string;
+    };
 }
 export type WorkbenchExecutionPurpose = "improve" | "attempt";
 export type WorkbenchSandboxTemplateKind = "snapshot" | "oci";
@@ -704,11 +416,11 @@ export interface WorkbenchSandboxAllocation {
 }
 export interface WorkbenchExecutionCapability {
     executionId: string;
-    candidate: {
+    skill: {
         tenantId: string;
         projectId: string;
         runId: string;
-        candidateId?: string;
+        versionId?: string;
     };
     inputs: WorkbenchExecutionInputRef[];
     outputPrefix: string;
@@ -735,7 +447,7 @@ export interface WorkbenchExecutionInputRef {
     mountPath: string;
     writable: boolean;
 }
-export type WorkbenchExecutionOutputSchema = "workbench.candidate_patch.v1" | "workbench.result.v1" | string;
+export type WorkbenchExecutionOutputSchema = "workbench.skill_patch.v1" | "workbench.result.v1" | string;
 export interface WorkbenchExecutionOutputContract {
     name: string;
     schema: WorkbenchExecutionOutputSchema;
@@ -761,7 +473,7 @@ export interface WorkbenchExecutionSpec {
     id: string;
     projectId: string;
     runId: string;
-    candidateId?: string;
+    versionId?: string;
     purpose: WorkbenchExecutionPurpose;
     adapter: WorkbenchAdapterInvocation;
     sandbox: WorkbenchSandboxTemplate;
@@ -770,12 +482,87 @@ export interface WorkbenchExecutionSpec {
     policy: WorkbenchExecutionPolicy;
     metadata: Record<string, Json>;
 }
-export interface WorkbenchCandidatePatch {
+export interface BlobObjectRef {
+    bucket: string;
+    key: string;
+    byteLength: number;
+    sha256: string;
+}
+export interface WorkbenchSkillPatch {
     files: SurfaceSnapshotFile[];
     fileChanges: string[];
     summary?: string;
     feedback?: Json;
 }
+export interface WorkbenchCaseCriterionScore {
+    criterion_id: string;
+    label: string;
+    score: number;
+    pass: boolean;
+    errors?: string[];
+    rationale?: string;
+}
+export interface MetricStats {
+    count: number;
+    mean: number;
+    variance: number;
+    stddev: number;
+    min: number;
+    max: number;
+}
+export type EvalCaseStatus = "completed" | "error";
+export type EvalCaseSource = Record<string, Json>;
+export interface EvalCaseResult {
+    id: string;
+    label?: string;
+    split?: string;
+    status?: EvalCaseStatus;
+    durationMs?: number;
+    metrics: Record<string, number>;
+    source?: EvalCaseSource;
+    feedback?: Json;
+    criteria?: WorkbenchCaseCriterionScore[];
+}
+export type ExecutionRole = "improver" | "runner" | "engine";
+export type ExecutionUsageCostSource = "provider" | "estimated" | "mixed";
+export interface ExecutionUsage {
+    provider?: string;
+    model?: string;
+    inputTokens?: number;
+    uncachedInputTokens?: number;
+    cachedInputTokens?: number;
+    cacheCreationInputTokens?: number;
+    cacheReadInputTokens?: number;
+    outputTokens?: number;
+    reasoningOutputTokens?: number;
+    totalTokens?: number;
+    costUsd?: number;
+    costSource?: ExecutionUsageCostSource;
+    pricingSource?: string;
+}
+export interface UsageSummary {
+    total?: ExecutionUsage;
+    improver?: ExecutionUsage;
+    runner?: ExecutionUsage;
+    engine?: ExecutionUsage;
+}
+export interface EvaluationUsageStats {
+    total?: ExecutionUsageStats;
+    improver?: ExecutionUsageStats;
+    runner?: ExecutionUsageStats;
+    engine?: ExecutionUsageStats;
+}
+export interface ExecutionUsageStats {
+    inputTokens?: MetricStats;
+    uncachedInputTokens?: MetricStats;
+    cachedInputTokens?: MetricStats;
+    cacheCreationInputTokens?: MetricStats;
+    cacheReadInputTokens?: MetricStats;
+    reasoningOutputTokens?: MetricStats;
+    outputTokens?: MetricStats;
+    totalTokens?: MetricStats;
+    costUsd?: MetricStats;
+}
 export interface WorkbenchResult {
     score: number;
     metrics?: Record<string, number>;
@@ -888,6 +675,24 @@ export interface WorkbenchTraceSession {
     trace: WorkbenchExecutionTrace;
     metadata?: Record<string, Json>;
 }
+export type RemoteWorkbenchJobStatus = "queued" | "running" | "succeeded" | "failed" | "cancelled";
+export type RemoteWorkbenchJobKind = "execute";
+export interface RemoteWorkbenchJob {
+    id: string;
+    projectId: string;
+    runId: string;
+    versionId?: string;
+    kind: RemoteWorkbenchJobKind;
+    status: RemoteWorkbenchJobStatus;
+    attempt: number;
+    createdAt: string;
+    updatedAt: string;
+    startedAt?: string;
+    finishedAt?: string;
+    input: Json;
+    output?: Json;
+    error?: string;
+}
 export interface WorkbenchExecutionEvidence {
     id: string;
     kind: string;
@@ -896,7 +701,7 @@ export interface WorkbenchExecutionEvidence {
     status: RemoteWorkbenchJobStatus;
     jobIds: string[];
     executionIds: string[];
-    candidateId?: string;
+    versionId?: string;
     caseId?: string;
     sampleIndex?: number;
     attemptIndex?: number;
@@ -908,44 +713,6 @@ export interface WorkbenchExecutionTraceDetail {
     runId: string;
     executions: WorkbenchExecutionEvidence[];
 }
-export interface AuthoredWorkbenchCaseSummary {
-    id: string;
-    slug: string;
-    path: string;
-    name: string;
-    split?: string;
-    fileCount: number;
-}
-export interface AuthoredWorkbenchSourceFile {
-    path: string;
-    content: string;
-}
-export interface AuthoredWorkbenchSourceDocument {
-    path: string;
-    exists: boolean;
-    source_yaml: string;
-    source_files: AuthoredWorkbenchSourceFile[];
-    spec: AuthoredWorkbenchSourceSpec | null;
-    cases: AuthoredWorkbenchCaseSummary[];
-}
-export type RemoteWorkbenchJobStatus = "queued" | "running" | "succeeded" | "failed" | "cancelled";
-export type RemoteWorkbenchJobKind = "execute";
-export interface RemoteWorkbenchJob {
-    id: string;
-    projectId: string;
-    runId: string;
-    candidateId?: string;
-    kind: RemoteWorkbenchJobKind;
-    status: RemoteWorkbenchJobStatus;
-    attempt: number;
-    createdAt: string;
-    updatedAt: string;
-    startedAt?: string;
-    finishedAt?: string;
-    input: Json;
-    output?: Json;
-    error?: string;
-}
 export interface WorkbenchRemoteJobClaimRequest {
     schema: "workbench.remote.job.claim_request.v1";
     ownerUserId: string;
@@ -1015,32 +782,6 @@ export interface WorkbenchRemoteJobRetry {
     leaseToken: string;
     reason: string;
 }
-export interface RemoteWorkbenchRun extends WorkbenchRuntimeRun {
-    projectId: string;
-    environmentVersionId?: string;
-    specVersionId: string;
-    candidateId: string | null;
-    activeCandidateId?: string | null;
-    outputCandidateId?: string | null;
-    input: {
-        benchmarkFingerprint: string;
-        candidateFingerprint: string;
-        baseCandidateId: string | null;
-        payerUserId?: string;
-        candidateOwnerUserId?: string;
-        candidateOwnerUsername?: string;
-        preserveActiveCandidateId?: string | null;
-        selectedSamples?: Array<{
-            caseId: string;
-            sampleIndex: number;
-        }>;
-        sourceYaml?: string;
-        candidateSourceFiles?: SurfaceSnapshotFile[];
-        baseFiles: SurfaceSnapshotFile[];
-        engineResolveFiles: SurfaceSnapshotFile[];
-    };
-    jobCount: number;
-    completedJobCount: number;
-    failedJobCount: number;
-}
+export declare function isReservedWorkbenchAdapterAuthEnvName(name: string): boolean;
+export declare function assertWorkbenchAdapterAuthEnvNameAllowed(name: string): void;
 //# sourceMappingURL=index.d.ts.map