npm - @tangle-network/agent-eval - Versions diffs - 0.20.12 → 0.21.0 - Mend

@tangle-network/agent-eval 0.20.12 → 0.21.0

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (48) hide show

package/CHANGELOG.md +76 -0
package/README.md +39 -1
package/dist/{chunk-75MCTH7P.js → chunk-3GN6U53I.js} +198 -3
package/dist/chunk-3GN6U53I.js.map +1 -0
package/dist/chunk-3IX6QTB7.js +1349 -0
package/dist/chunk-3IX6QTB7.js.map +1 -0
package/dist/{chunk-PKCVBYTQ.js → chunk-5IIQKMD5.js} +38 -2
package/dist/chunk-5IIQKMD5.js.map +1 -0
package/dist/{chunk-MCMV7DUL.js → chunk-ARZ6BEV6.js} +2 -2
package/dist/{chunk-HKYRWNHV.js → chunk-HRZELXCR.js} +2 -2
package/dist/{chunk-ODFINDLQ.js → chunk-KRR4VMH7.js} +11 -1
package/dist/chunk-KRR4VMH7.js.map +1 -0
package/dist/chunk-SNUHRBDL.js +154 -0
package/dist/chunk-SNUHRBDL.js.map +1 -0
package/dist/{chunk-KWUAAIHR.js → chunk-WOK2RTWG.js} +157 -1
package/dist/chunk-WOK2RTWG.js.map +1 -0
package/dist/{chunk-HNJLMAJ2.js → chunk-WOPGKVN4.js} +2 -2
package/dist/cli.js +3 -2
package/dist/cli.js.map +1 -1
package/dist/{control-C8NKbF3w.d.ts → control-cxwMOAsy.d.ts} +3 -2
package/dist/control.d.ts +4 -3
package/dist/control.js +2 -2
package/dist/emitter-B2XqDKFU.d.ts +121 -0
package/dist/{feedback-trajectory-BGQ_ANCN.d.ts → feedback-trajectory-CB0A32o3.d.ts} +2 -1
package/dist/index.d.ts +71 -83
package/dist/index.js +48 -60
package/dist/index.js.map +1 -1
package/dist/openapi.json +1 -1
package/dist/optimization.d.ts +3 -2
package/dist/optimization.js +2 -2
package/dist/reporting-Da2ihlcM.d.ts +672 -0
package/dist/reporting.d.ts +5 -426
package/dist/reporting.js +6 -2
package/dist/{emitter-BYO2nSDA.d.ts → store-u47QaJ9G.d.ts} +1 -91
package/dist/traces.d.ts +259 -3
package/dist/traces.js +24 -4
package/dist/wire/index.js +3 -2
package/docs/research-report-methodology.md +155 -0
package/package.json +10 -12
package/dist/chunk-75MCTH7P.js.map +0 -1
package/dist/chunk-IKFVX537.js +0 -717
package/dist/chunk-IKFVX537.js.map +0 -1
package/dist/chunk-KWUAAIHR.js.map +0 -1
package/dist/chunk-ODFINDLQ.js.map +0 -1
package/dist/chunk-PKCVBYTQ.js.map +0 -1
/package/dist/{chunk-MCMV7DUL.js.map → chunk-ARZ6BEV6.js.map} +0 -0
/package/dist/{chunk-HKYRWNHV.js.map → chunk-HRZELXCR.js.map} +0 -0
/package/dist/{chunk-HNJLMAJ2.js.map → chunk-WOPGKVN4.js.map} +0 -0

package/dist/openapi.json CHANGED Viewed

@@ -2,7 +2,7 @@
   "openapi": "3.1.0",
   "info": {
     "title": "@tangle-network/agent-eval — wire protocol",
-    "version": "0.20.12",
+    "version": "0.21.0",
     "description": "HTTP and stdio RPC interface to agent-eval. The TypeScript runtime is the source of truth; this spec is the contract that cross-language clients (Python, Rust, Go) generate from.\n\nWire-protocol version: 1.0.0. Bumps on breaking changes to request/response schemas.",
     "contact": {
       "name": "Tangle Network",

package/dist/optimization.d.ts CHANGED Viewed

@@ -1,9 +1,10 @@
 import { G as GateDecision } from './multi-shot-optimization-Bvtz294B.js';
 export { A as ActionableSideInfo, b as AsiSeverity, D as DEFAULT_MUTATION_PRIMITIVES, E as EvolvableVariant, e as GenerationReport, I as InMemoryTrialCache, h as MultiShotGateConfig, i as MultiShotGateResult, j as MultiShotMutateAdapter, k as MultiShotOptimizationConfig, l as MultiShotOptimizationResult, m as MultiShotRun, n as MultiShotRunInput, o as MultiShotRunner, p as MultiShotScore, q as MultiShotScorer, r as MultiShotSplit, s as MultiShotTrace, t as MultiShotTrialResult, u as MultiShotVariant, M as MutateAdapter, v as PromptEvolutionConfig, w as PromptEvolutionEvent, x as PromptEvolutionResult, R as ReflectionContext, y as ReflectionProposal, S as ScenarioAggregate, z as ScoreAdapter, T as TrialCache, a as TrialResult, B as TrialTrace, V as VariantAggregate, C as buildReflectionPrompt, J as defaultMultiShotObjectives, Q as parseReflectionResponse, U as runMultiShotOptimization, W as runPromptEvolution, Y as trialTraceFromMultiShotTrial } from './multi-shot-optimization-Bvtz294B.js';
 import { a as RunRecord } from './run-record-CX_jcAyr.js';
-export { n as FeedbackArtifactType, o as FeedbackAttempt, F as FeedbackLabel, p as FeedbackLabelKind, q as FeedbackLabelSource, r as FeedbackOptimizerRow, s as FeedbackOutcome, t as FeedbackReplayAdapter, u as FeedbackReplayResult, v as FeedbackSeverity, w as FeedbackSplitPolicy, x as FeedbackTask, b as FeedbackTrajectory, y as FeedbackTrajectoryFilter, a as FeedbackTrajectoryStore, z as FileSystemFeedbackTrajectoryStore, I as InMemoryFeedbackTrajectoryStore, P as PreferenceMemoryEntry, A as ProposedSideEffect, D as assignFeedbackSplit, E as controlRunToFeedbackTrajectory, G as createFeedbackTrajectory, H as feedbackTrajectoriesToDatasetScenarios, J as feedbackTrajectoriesToOptimizerRows, K as feedbackTrajectoryToDatasetScenario, L as feedbackTrajectoryToOptimizerRow, N as parseFeedbackTrajectoriesJsonl, O as renderPreferenceMemoryMarkdown, Q as replayFeedbackTrajectories, R as replayFeedbackTrajectory, U as serializeFeedbackTrajectoriesJsonl, Y as summarizePreferenceMemory, Z as withAssignedFeedbackSplit } from './feedback-trajectory-BGQ_ANCN.js';
+export { n as FeedbackArtifactType, o as FeedbackAttempt, F as FeedbackLabel, p as FeedbackLabelKind, q as FeedbackLabelSource, r as FeedbackOptimizerRow, s as FeedbackOutcome, t as FeedbackReplayAdapter, u as FeedbackReplayResult, v as FeedbackSeverity, w as FeedbackSplitPolicy, x as FeedbackTask, b as FeedbackTrajectory, y as FeedbackTrajectoryFilter, a as FeedbackTrajectoryStore, z as FileSystemFeedbackTrajectoryStore, I as InMemoryFeedbackTrajectoryStore, P as PreferenceMemoryEntry, A as ProposedSideEffect, D as assignFeedbackSplit, E as controlRunToFeedbackTrajectory, G as createFeedbackTrajectory, H as feedbackTrajectoriesToDatasetScenarios, J as feedbackTrajectoriesToOptimizerRows, K as feedbackTrajectoryToDatasetScenario, L as feedbackTrajectoryToOptimizerRow, N as parseFeedbackTrajectoriesJsonl, O as renderPreferenceMemoryMarkdown, Q as replayFeedbackTrajectories, R as replayFeedbackTrajectory, U as serializeFeedbackTrajectoriesJsonl, Y as summarizePreferenceMemory, Z as withAssignedFeedbackSplit } from './feedback-trajectory-CB0A32o3.js';
 import './dataset-B9qvlm_o.js';
-import './emitter-BYO2nSDA.js';
+import './emitter-B2XqDKFU.js';
+import './store-u47QaJ9G.js';
 /**
  * Researcher interface — stable hook for an external autonomous-research

package/dist/optimization.js CHANGED Viewed

@@ -25,9 +25,9 @@ import {
   summarizePreferenceMemory,
   trialTraceFromMultiShotTrial,
   withAssignedFeedbackSplit
-} from "./chunk-HKYRWNHV.js";
+} from "./chunk-HRZELXCR.js";
 import "./chunk-YUFXO3TU.js";
-import "./chunk-ODFINDLQ.js";
+import "./chunk-KRR4VMH7.js";
 import "./chunk-PZ5AY32C.js";
 export {
   CallbackResearcher,