npm - @evalops/sdk-ts - Versions diffs - 0.1.100 → 0.1.102 - Mend

@evalops/sdk-ts 0.1.100 → 0.1.102

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (11) hide show

package/dist/agentruntime/v1/runtime_pb.d.ts +1931 -195
package/dist/agentruntime/v1/runtime_pb.js +421 -93
package/dist/evalcontrol/v1/evalcontrol_pb.d.ts +949 -0
package/dist/evalcontrol/v1/evalcontrol_pb.js +326 -0
package/dist/fermata/v1/fermata_pb.d.ts +822 -1
package/dist/fermata/v1/fermata_pb.js +397 -275
package/dist/fermata/v1/worker_pb.d.ts +73 -1
package/dist/fermata/v1/worker_pb.js +35 -2
package/dist/vfs/v1/filesystem_pb.d.ts +9 -1
package/dist/vfs/v1/filesystem_pb.js +5 -1
package/package.json +5 -1

package/dist/fermata/v1/fermata_pb.d.ts CHANGED Viewed

@@ -8,6 +8,260 @@ import type { JsonObject, Message } from "@bufbuild/protobuf";
  * Describes the file fermata/v1/fermata.proto.
  */
 export declare const file_fermata_v1_fermata: GenFile;
+/**
+ * @generated from message fermata.v1.LLMRubricAssertion
+ */
+export type LLMRubricAssertion = Message<"fermata.v1.LLMRubricAssertion"> & {
+    /**
+     * @generated from field: string judge_id = 1;
+     */
+    judgeId: string;
+    /**
+     * @generated from field: string verifier_judge_id = 2;
+     */
+    verifierJudgeId: string;
+    /**
+     * @generated from field: string rubric = 3;
+     */
+    rubric: string;
+    /**
+     * @generated from field: optional double min_score = 4;
+     */
+    minScore?: number | undefined;
+    /**
+     * @generated from field: int32 repeat = 5;
+     */
+    repeat: number;
+    /**
+     * @generated from field: int32 quorum = 6;
+     */
+    quorum: number;
+    /**
+     * @generated from field: bool record_judge_validation = 7;
+     */
+    recordJudgeValidation: boolean;
+    /**
+     * @generated from field: bool require_calibrated_judge = 8;
+     */
+    requireCalibratedJudge: boolean;
+    /**
+     * @generated from field: optional double min_judge_validation_accuracy = 9;
+     */
+    minJudgeValidationAccuracy?: number | undefined;
+    /**
+     * @generated from field: optional int32 min_judge_validation_count = 10;
+     */
+    minJudgeValidationCount?: number | undefined;
+    /**
+     * @generated from field: string rubric_version = 11;
+     */
+    rubricVersion: string;
+    /**
+     * @generated from field: string calibration_cohort = 12;
+     */
+    calibrationCohort: string;
+    /**
+     * @generated from field: bool advisory_only = 13;
+     */
+    advisoryOnly: boolean;
+};
+/**
+ * Describes the message fermata.v1.LLMRubricAssertion.
+ * Use `create(LLMRubricAssertionSchema)` to create a new message.
+ */
+export declare const LLMRubricAssertionSchema: GenMessage<LLMRubricAssertion>;
+/**
+ * @generated from message fermata.v1.LLMPairwiseRubricAssertion
+ */
+export type LLMPairwiseRubricAssertion = Message<"fermata.v1.LLMPairwiseRubricAssertion"> & {
+    /**
+     * @generated from field: string judge_id = 1;
+     */
+    judgeId: string;
+    /**
+     * @generated from field: string verifier_judge_id = 2;
+     */
+    verifierJudgeId: string;
+    /**
+     * @generated from field: string rubric = 3;
+     */
+    rubric: string;
+    /**
+     * @generated from field: string baseline_label = 4;
+     */
+    baselineLabel: string;
+    /**
+     * @generated from field: string candidate_label = 5;
+     */
+    candidateLabel: string;
+    /**
+     * @generated from field: optional double min_score = 6;
+     */
+    minScore?: number | undefined;
+    /**
+     * @generated from field: int32 repeat = 7;
+     */
+    repeat: number;
+    /**
+     * @generated from field: int32 quorum = 8;
+     */
+    quorum: number;
+    /**
+     * @generated from field: bool record_judge_validation = 9;
+     */
+    recordJudgeValidation: boolean;
+    /**
+     * @generated from field: bool require_calibrated_judge = 10;
+     */
+    requireCalibratedJudge: boolean;
+    /**
+     * @generated from field: optional double min_judge_validation_accuracy = 11;
+     */
+    minJudgeValidationAccuracy?: number | undefined;
+    /**
+     * @generated from field: optional int32 min_judge_validation_count = 12;
+     */
+    minJudgeValidationCount?: number | undefined;
+    /**
+     * @generated from field: string rubric_version = 13;
+     */
+    rubricVersion: string;
+    /**
+     * @generated from field: string calibration_cohort = 14;
+     */
+    calibrationCohort: string;
+    /**
+     * @generated from field: bool advisory_only = 15;
+     */
+    advisoryOnly: boolean;
+};
+/**
+ * Describes the message fermata.v1.LLMPairwiseRubricAssertion.
+ * Use `create(LLMPairwiseRubricAssertionSchema)` to create a new message.
+ */
+export declare const LLMPairwiseRubricAssertionSchema: GenMessage<LLMPairwiseRubricAssertion>;
+/**
+ * @generated from message fermata.v1.AgentTrajectoryStatusExpectation
+ */
+export type AgentTrajectoryStatusExpectation = Message<"fermata.v1.AgentTrajectoryStatusExpectation"> & {
+    /**
+     * @generated from field: string id = 1;
+     */
+    id: string;
+    /**
+     * @generated from field: string status = 2;
+     */
+    status: string;
+};
+/**
+ * Describes the message fermata.v1.AgentTrajectoryStatusExpectation.
+ * Use `create(AgentTrajectoryStatusExpectationSchema)` to create a new message.
+ */
+export declare const AgentTrajectoryStatusExpectationSchema: GenMessage<AgentTrajectoryStatusExpectation>;
+/**
+ * @generated from message fermata.v1.AgentTrajectoryStateExpectation
+ */
+export type AgentTrajectoryStateExpectation = Message<"fermata.v1.AgentTrajectoryStateExpectation"> & {
+    /**
+     * @generated from field: string path = 1;
+     */
+    path: string;
+    /**
+     * @generated from field: string value_json = 2;
+     */
+    valueJson: string;
+};
+/**
+ * Describes the message fermata.v1.AgentTrajectoryStateExpectation.
+ * Use `create(AgentTrajectoryStateExpectationSchema)` to create a new message.
+ */
+export declare const AgentTrajectoryStateExpectationSchema: GenMessage<AgentTrajectoryStateExpectation>;
+/**
+ * @generated from message fermata.v1.AgentTrajectoryAssertion
+ */
+export type AgentTrajectoryAssertion = Message<"fermata.v1.AgentTrajectoryAssertion"> & {
+    /**
+     * @generated from field: repeated string required_tools = 1;
+     */
+    requiredTools: string[];
+    /**
+     * @generated from field: repeated string forbidden_tools = 2;
+     */
+    forbiddenTools: string[];
+    /**
+     * @generated from field: repeated string required_events = 3;
+     */
+    requiredEvents: string[];
+    /**
+     * @generated from field: repeated string forbidden_events = 4;
+     */
+    forbiddenEvents: string[];
+    /**
+     * @generated from field: repeated fermata.v1.AgentTrajectoryStatusExpectation required_assertion_statuses = 5;
+     */
+    requiredAssertionStatuses: AgentTrajectoryStatusExpectation[];
+    /**
+     * @generated from field: repeated fermata.v1.AgentTrajectoryStateExpectation required_state_writes = 6;
+     */
+    requiredStateWrites: AgentTrajectoryStateExpectation[];
+    /**
+     * @generated from field: repeated fermata.v1.AgentTrajectoryStateExpectation forbidden_state_writes = 7;
+     */
+    forbiddenStateWrites: AgentTrajectoryStateExpectation[];
+    /**
+     * @generated from field: optional int32 max_events = 8;
+     */
+    maxEvents?: number | undefined;
+    /**
+     * @generated from field: optional int32 max_tool_calls = 9;
+     */
+    maxToolCalls?: number | undefined;
+    /**
+     * @generated from field: optional int32 max_replay_deltas = 10;
+     */
+    maxReplayDeltas?: number | undefined;
+    /**
+     * @generated from field: optional int32 max_score_failures = 11;
+     */
+    maxScoreFailures?: number | undefined;
+    /**
+     * @generated from field: optional int32 max_score_warnings = 12;
+     */
+    maxScoreWarnings?: number | undefined;
+    /**
+     * @generated from field: optional int64 max_latency_ms = 13;
+     */
+    maxLatencyMs?: bigint | undefined;
+    /**
+     * @generated from field: optional int64 max_cost_micros = 14;
+     */
+    maxCostMicros?: bigint | undefined;
+    /**
+     * @generated from field: optional int32 max_retries = 15;
+     */
+    maxRetries?: number | undefined;
+    /**
+     * @generated from field: bool require_idempotent_replay = 16;
+     */
+    requireIdempotentReplay: boolean;
+    /**
+     * @generated from field: bool forbid_duplicate_external_actions = 17;
+     */
+    forbidDuplicateExternalActions: boolean;
+    /**
+     * @generated from field: repeated string forbidden_external_actions = 18;
+     */
+    forbiddenExternalActions: string[];
+    /**
+     * @generated from field: repeated string required_trace_join_keys = 19;
+     */
+    requiredTraceJoinKeys: string[];
+};
+/**
+ * Describes the message fermata.v1.AgentTrajectoryAssertion.
+ * Use `create(AgentTrajectoryAssertionSchema)` to create a new message.
+ */
+export declare const AgentTrajectoryAssertionSchema: GenMessage<AgentTrajectoryAssertion>;
 /**
  * @generated from message fermata.v1.TestSuite
  */
@@ -116,6 +370,18 @@ export type Assertion = Message<"fermata.v1.Assertion"> & {
      * @generated from field: google.protobuf.Struct metadata = 6;
      */
     metadata?: JsonObject | undefined;
+    /**
+     * @generated from field: fermata.v1.LLMRubricAssertion llm_rubric = 7;
+     */
+    llmRubric?: LLMRubricAssertion | undefined;
+    /**
+     * @generated from field: fermata.v1.LLMPairwiseRubricAssertion llm_pairwise_rubric = 8;
+     */
+    llmPairwiseRubric?: LLMPairwiseRubricAssertion | undefined;
+    /**
+     * @generated from field: fermata.v1.AgentTrajectoryAssertion agent_trajectory = 9;
+     */
+    agentTrajectory?: AgentTrajectoryAssertion | undefined;
 };
 /**
  * Describes the message fermata.v1.Assertion.
@@ -1256,6 +1522,240 @@ export type ListTestSuitesResponse = Message<"fermata.v1.ListTestSuitesResponse"
  * Use `create(ListTestSuitesResponseSchema)` to create a new message.
  */
 export declare const ListTestSuitesResponseSchema: GenMessage<ListTestSuitesResponse>;
+/**
+ * @generated from message fermata.v1.EvaluationPackJudgeContract
+ */
+export type EvaluationPackJudgeContract = Message<"fermata.v1.EvaluationPackJudgeContract"> & {
+    /**
+     * @generated from field: string judge_id = 1;
+     */
+    judgeId: string;
+    /**
+     * @generated from field: string model = 2;
+     */
+    model: string;
+    /**
+     * @generated from field: string rubric_version = 3;
+     */
+    rubricVersion: string;
+    /**
+     * @generated from field: string calibration_cohort = 4;
+     */
+    calibrationCohort: string;
+    /**
+     * @generated from field: optional double max_disagreement_rate = 5;
+     */
+    maxDisagreementRate?: number | undefined;
+    /**
+     * @generated from field: optional double min_validation_accuracy = 6;
+     */
+    minValidationAccuracy?: number | undefined;
+    /**
+     * @generated from field: optional int32 min_validation_count = 7;
+     */
+    minValidationCount?: number | undefined;
+};
+/**
+ * Describes the message fermata.v1.EvaluationPackJudgeContract.
+ * Use `create(EvaluationPackJudgeContractSchema)` to create a new message.
+ */
+export declare const EvaluationPackJudgeContractSchema: GenMessage<EvaluationPackJudgeContract>;
+/**
+ * @generated from message fermata.v1.ProductionTracePromotionPolicy
+ */
+export type ProductionTracePromotionPolicy = Message<"fermata.v1.ProductionTracePromotionPolicy"> & {
+    /**
+     * @generated from field: bool require_quality_annotations = 1;
+     */
+    requireQualityAnnotations: boolean;
+    /**
+     * @generated from field: bool failed_annotations_only = 2;
+     */
+    failedAnnotationsOnly: boolean;
+    /**
+     * @generated from field: int32 max_cases = 3;
+     */
+    maxCases: number;
+    /**
+     * @generated from field: repeated string required_tags = 4;
+     */
+    requiredTags: string[];
+    /**
+     * @generated from field: repeated string excluded_tags = 5;
+     */
+    excludedTags: string[];
+};
+/**
+ * Describes the message fermata.v1.ProductionTracePromotionPolicy.
+ * Use `create(ProductionTracePromotionPolicySchema)` to create a new message.
+ */
+export declare const ProductionTracePromotionPolicySchema: GenMessage<ProductionTracePromotionPolicy>;
+/**
+ * @generated from message fermata.v1.EvaluationPack
+ */
+export type EvaluationPack = Message<"fermata.v1.EvaluationPack"> & {
+    /**
+     * @generated from field: string id = 1;
+     */
+    id: string;
+    /**
+     * @generated from field: string service = 2;
+     */
+    service: string;
+    /**
+     * @generated from field: string name = 3;
+     */
+    name: string;
+    /**
+     * @generated from field: string description = 4;
+     */
+    description: string;
+    /**
+     * @generated from field: string version = 5;
+     */
+    version: string;
+    /**
+     * @generated from field: repeated fermata.v1.EvaluationPackJudgeContract judge_contracts = 6;
+     */
+    judgeContracts: EvaluationPackJudgeContract[];
+    /**
+     * @generated from field: fermata.v1.ProductionTracePromotionPolicy trace_promotion_policy = 7;
+     */
+    tracePromotionPolicy?: ProductionTracePromotionPolicy | undefined;
+    /**
+     * @generated from field: fermata.v1.QualityGateConfig quality_gate = 8;
+     */
+    qualityGate?: QualityGateConfig | undefined;
+    /**
+     * @generated from field: repeated string source_suite_ids = 9;
+     */
+    sourceSuiteIds: string[];
+    /**
+     * @generated from field: repeated string trace_ids = 10;
+     */
+    traceIds: string[];
+    /**
+     * @generated from field: google.protobuf.Struct metadata = 11;
+     */
+    metadata?: JsonObject | undefined;
+    /**
+     * @generated from field: google.protobuf.Timestamp updated_at = 12;
+     */
+    updatedAt?: Timestamp | undefined;
+};
+/**
+ * Describes the message fermata.v1.EvaluationPack.
+ * Use `create(EvaluationPackSchema)` to create a new message.
+ */
+export declare const EvaluationPackSchema: GenMessage<EvaluationPack>;
+/**
+ * @generated from message fermata.v1.ListEvaluationPacksRequest
+ */
+export type ListEvaluationPacksRequest = Message<"fermata.v1.ListEvaluationPacksRequest"> & {
+    /**
+     * @generated from field: string organization_id = 1;
+     */
+    organizationId: string;
+    /**
+     * @generated from field: string workspace_id = 2;
+     */
+    workspaceId: string;
+    /**
+     * @generated from field: string service = 3;
+     */
+    service: string;
+};
+/**
+ * Describes the message fermata.v1.ListEvaluationPacksRequest.
+ * Use `create(ListEvaluationPacksRequestSchema)` to create a new message.
+ */
+export declare const ListEvaluationPacksRequestSchema: GenMessage<ListEvaluationPacksRequest>;
+/**
+ * @generated from message fermata.v1.ListEvaluationPacksResponse
+ */
+export type ListEvaluationPacksResponse = Message<"fermata.v1.ListEvaluationPacksResponse"> & {
+    /**
+     * @generated from field: repeated fermata.v1.EvaluationPack packs = 1;
+     */
+    packs: EvaluationPack[];
+    /**
+     * @generated from field: int32 total_count = 2;
+     */
+    totalCount: number;
+};
+/**
+ * Describes the message fermata.v1.ListEvaluationPacksResponse.
+ * Use `create(ListEvaluationPacksResponseSchema)` to create a new message.
+ */
+export declare const ListEvaluationPacksResponseSchema: GenMessage<ListEvaluationPacksResponse>;
+/**
+ * @generated from message fermata.v1.BuildEvaluationPackRequest
+ */
+export type BuildEvaluationPackRequest = Message<"fermata.v1.BuildEvaluationPackRequest"> & {
+    /**
+     * @generated from field: string organization_id = 1;
+     */
+    organizationId: string;
+    /**
+     * @generated from field: string workspace_id = 2;
+     */
+    workspaceId: string;
+    /**
+     * @generated from field: string pack_id = 3;
+     */
+    packId: string;
+    /**
+     * @generated from field: string suite_name = 4;
+     */
+    suiteName: string;
+    /**
+     * @generated from field: string created_by = 5;
+     */
+    createdBy: string;
+    /**
+     * @generated from field: repeated string source_suite_ids = 6;
+     */
+    sourceSuiteIds: string[];
+    /**
+     * @generated from field: repeated string trace_ids = 7;
+     */
+    traceIds: string[];
+    /**
+     * @generated from field: int32 limit = 8;
+     */
+    limit: number;
+};
+/**
+ * Describes the message fermata.v1.BuildEvaluationPackRequest.
+ * Use `create(BuildEvaluationPackRequestSchema)` to create a new message.
+ */
+export declare const BuildEvaluationPackRequestSchema: GenMessage<BuildEvaluationPackRequest>;
+/**
+ * @generated from message fermata.v1.BuildEvaluationPackResponse
+ */
+export type BuildEvaluationPackResponse = Message<"fermata.v1.BuildEvaluationPackResponse"> & {
+    /**
+     * @generated from field: fermata.v1.EvaluationPack pack = 1;
+     */
+    pack?: EvaluationPack | undefined;
+    /**
+     * @generated from field: fermata.v1.TestSuite suite = 2;
+     */
+    suite?: TestSuite | undefined;
+    /**
+     * @generated from field: fermata.v1.QualityGateConfig quality_gate = 3;
+     */
+    qualityGate?: QualityGateConfig | undefined;
+    /**
+     * @generated from field: fermata.v1.ProductionTracePromotionPolicy trace_promotion_policy = 4;
+     */
+    tracePromotionPolicy?: ProductionTracePromotionPolicy | undefined;
+};
+/**
+ * Describes the message fermata.v1.BuildEvaluationPackResponse.
+ * Use `create(BuildEvaluationPackResponseSchema)` to create a new message.
+ */
+export declare const BuildEvaluationPackResponseSchema: GenMessage<BuildEvaluationPackResponse>;
 /**
  * @generated from message fermata.v1.CreateScenarioRequest
  */
@@ -3938,6 +4438,38 @@ export type ListScenarioRunsRequest = Message<"fermata.v1.ListScenarioRunsReques
      * @generated from field: int32 offset = 5;
      */
     offset: number;
+    /**
+     * @generated from field: fermata.v1.ScenarioRunStatus status = 6;
+     */
+    status: ScenarioRunStatus;
+    /**
+     * @generated from field: string source = 7;
+     */
+    source: string;
+    /**
+     * @generated from field: string evaluation_id = 8;
+     */
+    evaluationId: string;
+    /**
+     * @generated from field: string suite_id = 9;
+     */
+    suiteId: string;
+    /**
+     * @generated from field: string test_case_id = 10;
+     */
+    testCaseId: string;
+    /**
+     * @generated from field: string candidate_id = 11;
+     */
+    candidateId: string;
+    /**
+     * @generated from field: string candidate_label = 12;
+     */
+    candidateLabel: string;
+    /**
+     * @generated from field: string model = 13;
+     */
+    model: string;
 };
 /**
  * Describes the message fermata.v1.ListScenarioRunsRequest.
@@ -4652,6 +5184,10 @@ export type EvaluationComparison = Message<"fermata.v1.EvaluationComparison"> &
      * @generated from field: google.protobuf.Timestamp updated_at = 19;
      */
     updatedAt?: Timestamp | undefined;
+    /**
+     * @generated from field: google.protobuf.Struct metadata = 20;
+     */
+    metadata?: JsonObject | undefined;
 };
 /**
  * Describes the message fermata.v1.EvaluationComparison.
@@ -6096,6 +6632,18 @@ export type ProductionTraceRecord = Message<"fermata.v1.ProductionTraceRecord">
      * @generated from field: optional double provider_cost = 17;
      */
     providerCost?: number | undefined;
+    /**
+     * @generated from field: repeated string must_contain = 18;
+     */
+    mustContain: string[];
+    /**
+     * @generated from field: repeated string must_not_contain = 19;
+     */
+    mustNotContain: string[];
+    /**
+     * @generated from field: optional double min_similarity = 20;
+     */
+    minSimilarity?: number | undefined;
 };
 /**
  * Describes the message fermata.v1.ProductionTraceRecord.
@@ -6214,6 +6762,18 @@ export type BuildProductionTraceRegressionSuiteRequest = Message<"fermata.v1.Bui
      * @generated from field: repeated fermata.v1.ProductionTraceRecord traces = 6;
      */
     traces: ProductionTraceRecord[];
+    /**
+     * @generated from field: repeated string trace_ids = 7;
+     */
+    traceIds: string[];
+    /**
+     * @generated from field: bool require_quality_annotations = 8;
+     */
+    requireQualityAnnotations: boolean;
+    /**
+     * @generated from field: bool failed_annotations_only = 9;
+     */
+    failedAnnotationsOnly: boolean;
 };
 /**
  * Describes the message fermata.v1.BuildProductionTraceRegressionSuiteRequest.
@@ -6504,6 +7064,26 @@ export type CompareProductionTraceReplayRequest = Message<"fermata.v1.ComparePro
      * @generated from field: optional int32 max_diff_lines = 5;
      */
     maxDiffLines?: number | undefined;
+    /**
+     * @generated from field: bool persist_comparison_artifact = 6;
+     */
+    persistComparisonArtifact: boolean;
+    /**
+     * @generated from field: string artifact_name = 7;
+     */
+    artifactName: string;
+    /**
+     * @generated from field: string baseline_run_id = 8;
+     */
+    baselineRunId: string;
+    /**
+     * @generated from field: repeated string comparison_run_ids = 9;
+     */
+    comparisonRunIds: string[];
+    /**
+     * @generated from field: string created_by = 10;
+     */
+    createdBy: string;
 };
 /**
  * Describes the message fermata.v1.CompareProductionTraceReplayRequest.
@@ -6526,6 +7106,14 @@ export type CompareProductionTraceReplayResponse = Message<"fermata.v1.ComparePr
      * @generated from field: repeated fermata.v1.ProductionTraceReplayRegression regressions = 3;
      */
     regressions: ProductionTraceReplayRegression[];
+    /**
+     * @generated from field: string comparison_artifact_id = 4;
+     */
+    comparisonArtifactId: string;
+    /**
+     * @generated from field: fermata.v1.EvaluationComparison comparison_artifact = 5;
+     */
+    comparisonArtifact?: EvaluationComparison | undefined;
 };
 /**
  * Describes the message fermata.v1.CompareProductionTraceReplayResponse.
@@ -7262,6 +7850,110 @@ export type JudgeCalibrationCandidate = Message<"fermata.v1.JudgeCalibrationCand
  * Use `create(JudgeCalibrationCandidateSchema)` to create a new message.
  */
 export declare const JudgeCalibrationCandidateSchema: GenMessage<JudgeCalibrationCandidate>;
+/**
+ * @generated from message fermata.v1.JudgeValidationSourceMetrics
+ */
+export type JudgeValidationSourceMetrics = Message<"fermata.v1.JudgeValidationSourceMetrics"> & {
+    /**
+     * @generated from field: string source = 1;
+     */
+    source: string;
+    /**
+     * @generated from field: fermata.v1.JudgeValidationAccuracyMetrics accuracy = 2;
+     */
+    accuracy?: JudgeValidationAccuracyMetrics | undefined;
+    /**
+     * @generated from field: fermata.v1.JudgeValidationBiasMetrics bias = 3;
+     */
+    bias?: JudgeValidationBiasMetrics | undefined;
+    /**
+     * @generated from field: google.protobuf.Timestamp latest_validation = 4;
+     */
+    latestValidation?: Timestamp | undefined;
+};
+/**
+ * Describes the message fermata.v1.JudgeValidationSourceMetrics.
+ * Use `create(JudgeValidationSourceMetricsSchema)` to create a new message.
+ */
+export declare const JudgeValidationSourceMetricsSchema: GenMessage<JudgeValidationSourceMetrics>;
+/**
+ * @generated from message fermata.v1.JudgeCalibrationReport
+ */
+export type JudgeCalibrationReport = Message<"fermata.v1.JudgeCalibrationReport"> & {
+    /**
+     * @generated from field: string organization_id = 1;
+     */
+    organizationId: string;
+    /**
+     * @generated from field: string judge_id = 2;
+     */
+    judgeId: string;
+    /**
+     * @generated from field: fermata.v1.JudgeCalibrationStatus status = 3;
+     */
+    status: JudgeCalibrationStatus;
+    /**
+     * @generated from field: bool passed = 4;
+     */
+    passed: boolean;
+    /**
+     * @generated from field: fermata.v1.JudgeValidationAccuracyMetrics accuracy = 5;
+     */
+    accuracy?: JudgeValidationAccuracyMetrics | undefined;
+    /**
+     * @generated from field: fermata.v1.JudgeValidationConfusionMatrix confusion_matrix = 6;
+     */
+    confusionMatrix?: JudgeValidationConfusionMatrix | undefined;
+    /**
+     * @generated from field: fermata.v1.JudgeValidationBiasMetrics bias = 7;
+     */
+    bias?: JudgeValidationBiasMetrics | undefined;
+    /**
+     * @generated from field: int32 min_validations = 8;
+     */
+    minValidations: number;
+    /**
+     * @generated from field: double min_accuracy = 9;
+     */
+    minAccuracy: number;
+    /**
+     * @generated from field: optional double max_absolute_score_drift = 10;
+     */
+    maxAbsoluteScoreDrift?: number | undefined;
+    /**
+     * @generated from field: int32 total_validated_records = 11;
+     */
+    totalValidatedRecords: number;
+    /**
+     * @generated from field: int32 scored_validation_count = 12;
+     */
+    scoredValidationCount: number;
+    /**
+     * @generated from field: int32 unscored_validation_count = 13;
+     */
+    unscoredValidationCount: number;
+    /**
+     * @generated from field: repeated string blocking_reasons = 14;
+     */
+    blockingReasons: string[];
+    /**
+     * @generated from field: repeated fermata.v1.JudgeValidationSourceMetrics source_metrics = 15;
+     */
+    sourceMetrics: JudgeValidationSourceMetrics[];
+    /**
+     * @generated from field: google.protobuf.Timestamp latest_validation = 16;
+     */
+    latestValidation?: Timestamp | undefined;
+    /**
+     * @generated from field: string recommended_action = 17;
+     */
+    recommendedAction: string;
+};
+/**
+ * Describes the message fermata.v1.JudgeCalibrationReport.
+ * Use `create(JudgeCalibrationReportSchema)` to create a new message.
+ */
+export declare const JudgeCalibrationReportSchema: GenMessage<JudgeCalibrationReport>;
 /**
  * @generated from message fermata.v1.GetJudgeValidationAccuracyRequest
  */
@@ -7358,6 +8050,54 @@ export type GetJudgeValidationBiasResponse = Message<"fermata.v1.GetJudgeValidat
  * Use `create(GetJudgeValidationBiasResponseSchema)` to create a new message.
  */
 export declare const GetJudgeValidationBiasResponseSchema: GenMessage<GetJudgeValidationBiasResponse>;
+/**
+ * @generated from message fermata.v1.GetJudgeCalibrationReportRequest
+ */
+export type GetJudgeCalibrationReportRequest = Message<"fermata.v1.GetJudgeCalibrationReportRequest"> & {
+    /**
+     * @generated from field: string organization_id = 1;
+     */
+    organizationId: string;
+    /**
+     * @generated from field: string judge_id = 2;
+     */
+    judgeId: string;
+    /**
+     * @generated from field: int32 min_validations = 3;
+     */
+    minValidations: number;
+    /**
+     * @generated from field: optional double min_accuracy = 4;
+     */
+    minAccuracy?: number | undefined;
+    /**
+     * @generated from field: optional double max_absolute_score_drift = 5;
+     */
+    maxAbsoluteScoreDrift?: number | undefined;
+    /**
+     * @generated from field: bool include_source_breakdown = 6;
+     */
+    includeSourceBreakdown: boolean;
+};
+/**
+ * Describes the message fermata.v1.GetJudgeCalibrationReportRequest.
+ * Use `create(GetJudgeCalibrationReportRequestSchema)` to create a new message.
+ */
+export declare const GetJudgeCalibrationReportRequestSchema: GenMessage<GetJudgeCalibrationReportRequest>;
+/**
+ * @generated from message fermata.v1.GetJudgeCalibrationReportResponse
+ */
+export type GetJudgeCalibrationReportResponse = Message<"fermata.v1.GetJudgeCalibrationReportResponse"> & {
+    /**
+     * @generated from field: fermata.v1.JudgeCalibrationReport report = 1;
+     */
+    report?: JudgeCalibrationReport | undefined;
+};
+/**
+ * Describes the message fermata.v1.GetJudgeCalibrationReportResponse.
+ * Use `create(GetJudgeCalibrationReportResponseSchema)` to create a new message.
+ */
+export declare const GetJudgeCalibrationReportResponseSchema: GenMessage<GetJudgeCalibrationReportResponse>;
 /**
  * @generated from message fermata.v1.RecalibrateJudgeValidationRequest
  */
@@ -7610,6 +8350,22 @@ export type QualityGateConfig = Message<"fermata.v1.QualityGateConfig"> & {
      * @generated from field: optional bool block_on_judges_needing_calibration = 13;
      */
     blockOnJudgesNeedingCalibration?: boolean | undefined;
+    /**
+     * @generated from field: repeated string required_judge_models = 14;
+     */
+    requiredJudgeModels: string[];
+    /**
+     * @generated from field: repeated string required_rubric_versions = 15;
+     */
+    requiredRubricVersions: string[];
+    /**
+     * @generated from field: repeated string required_calibration_cohorts = 16;
+     */
+    requiredCalibrationCohorts: string[];
+    /**
+     * @generated from field: optional double max_judge_disagreement_rate = 17;
+     */
+    maxJudgeDisagreementRate?: number | undefined;
 };
 /**
  * Describes the message fermata.v1.QualityGateConfig.
@@ -8615,7 +9371,19 @@ export declare enum AssertionKind {
     /**
      * @generated from enum value: ASSERTION_KIND_TOOL_CALL_F1 = 22;
      */
-    TOOL_CALL_F1 = 22
+    TOOL_CALL_F1 = 22,
+    /**
+     * @generated from enum value: ASSERTION_KIND_LLM_RUBRIC = 23;
+     */
+    LLM_RUBRIC = 23,
+    /**
+     * @generated from enum value: ASSERTION_KIND_LLM_PAIRWISE_RUBRIC = 24;
+     */
+    LLM_PAIRWISE_RUBRIC = 24,
+    /**
+     * @generated from enum value: ASSERTION_KIND_AGENT_TRAJECTORY = 25;
+     */
+    AGENT_TRAJECTORY = 25
 }
 /**
  * Describes the enum fermata.v1.AssertionKind.
@@ -8968,6 +9736,35 @@ export declare enum AgentApprovalDecision {
  * Describes the enum fermata.v1.AgentApprovalDecision.
  */
 export declare const AgentApprovalDecisionSchema: GenEnum<AgentApprovalDecision>;
+/**
+ * @generated from enum fermata.v1.JudgeCalibrationStatus
+ */
+export declare enum JudgeCalibrationStatus {
+    /**
+     * @generated from enum value: JUDGE_CALIBRATION_STATUS_UNSPECIFIED = 0;
+     */
+    UNSPECIFIED = 0,
+    /**
+     * @generated from enum value: JUDGE_CALIBRATION_STATUS_READY = 1;
+     */
+    READY = 1,
+    /**
+     * @generated from enum value: JUDGE_CALIBRATION_STATUS_NEEDS_LABELS = 2;
+     */
+    NEEDS_LABELS = 2,
+    /**
+     * @generated from enum value: JUDGE_CALIBRATION_STATUS_NEEDS_ACCURACY = 3;
+     */
+    NEEDS_ACCURACY = 3,
+    /**
+     * @generated from enum value: JUDGE_CALIBRATION_STATUS_NEEDS_BIAS_REVIEW = 4;
+     */
+    NEEDS_BIAS_REVIEW = 4
+}
+/**
+ * Describes the enum fermata.v1.JudgeCalibrationStatus.
+ */
+export declare const JudgeCalibrationStatusSchema: GenEnum<JudgeCalibrationStatus>;
 /**
  * FermataService is the Go control-plane surface for migrated Fermata routes.
  *
@@ -8998,6 +9795,22 @@ export declare const FermataService: GenService<{
         input: typeof ListTestSuitesRequestSchema;
         output: typeof ListTestSuitesResponseSchema;
     };
+    /**
+     * @generated from rpc fermata.v1.FermataService.ListEvaluationPacks
+     */
+    listEvaluationPacks: {
+        methodKind: "unary";
+        input: typeof ListEvaluationPacksRequestSchema;
+        output: typeof ListEvaluationPacksResponseSchema;
+    };
+    /**
+     * @generated from rpc fermata.v1.FermataService.BuildEvaluationPack
+     */
+    buildEvaluationPack: {
+        methodKind: "unary";
+        input: typeof BuildEvaluationPackRequestSchema;
+        output: typeof BuildEvaluationPackResponseSchema;
+    };
     /**
      * @generated from rpc fermata.v1.FermataService.CreateScenario
      */
@@ -9582,6 +10395,14 @@ export declare const FermataService: GenService<{
         input: typeof GetJudgeValidationBiasRequestSchema;
         output: typeof GetJudgeValidationBiasResponseSchema;
     };
+    /**
+     * @generated from rpc fermata.v1.FermataService.GetJudgeCalibrationReport
+     */
+    getJudgeCalibrationReport: {
+        methodKind: "unary";
+        input: typeof GetJudgeCalibrationReportRequestSchema;
+        output: typeof GetJudgeCalibrationReportResponseSchema;
+    };
     /**
      * @generated from rpc fermata.v1.FermataService.RecalibrateJudgeValidation
      */