npm - @agentv/core - Versions diffs - 0.5.1 → 0.6.1 - Mend

@agentv/core 0.5.1 → 0.6.1

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (12) hide show

package/dist/{chunk-NL7K4CAK.js → chunk-OW3SHBIJ.js} +7 -2
package/dist/chunk-OW3SHBIJ.js.map +1 -0
package/dist/evaluation/validation/index.cjs.map +1 -1
package/dist/evaluation/validation/index.js +1 -1
package/dist/index.cjs +439 -14
package/dist/index.cjs.map +1 -1
package/dist/index.d.cts +30 -2
package/dist/index.d.ts +30 -2
package/dist/index.js +434 -15
package/dist/index.js.map +1 -1
package/package.json +2 -2
package/dist/chunk-NL7K4CAK.js.map +0 -1

package/dist/index.d.cts CHANGED Viewed

@@ -1,4 +1,4 @@
-import { AxChatRequest } from '@ax-llm/ax';
+import { AxChatRequest, AxAI } from '@ax-llm/ax';
 /**
  * JSON primitive values appearing in AgentV payloads.
@@ -99,6 +99,7 @@ type EvaluatorConfig = CodeEvaluatorConfig | LlmJudgeEvaluatorConfig;
  */
 interface EvalCase {
     readonly id: string;
+    readonly dataset: string;
     readonly conversation_id?: string;
     readonly task: string;
     readonly user_segments: readonly JsonObject[];
@@ -117,6 +118,7 @@ interface EvalCase {
  */
 interface EvaluationResult {
     readonly eval_id: string;
+    readonly dataset: string;
     readonly conversation_id?: string;
     readonly score: number;
     readonly hits: readonly string[];
@@ -171,6 +173,11 @@ declare function buildPromptInputs(testCase: EvalCase): Promise<{
 }>;
 declare function fileExists(filePath: string): Promise<boolean>;
+/**
+ * Read a text file and normalize line endings to LF (\n).
+ * This ensures consistent behavior across Windows (CRLF) and Unix (LF) systems.
+ */
+declare function readTextFile(filePath: string): Promise<string>;
 /**
  * Find git repository root by walking up the directory tree.
  */
@@ -229,6 +236,11 @@ interface Provider {
      * the orchestrator may send multiple requests in a single provider session.
      */
     invokeBatch?(requests: readonly ProviderRequest[]): Promise<readonly ProviderResponse[]>;
+    /**
+     * Optional access to the underlying AxAI instance.
+     * This enables using advanced Ax features like structured output signatures.
+     */
+    getAxAI?(): AxAI;
 }
 type EnvLookup = Readonly<Record<string, string | undefined>>;
 interface TargetDefinition {
@@ -265,6 +277,8 @@ interface CodexResolvedConfig {
     readonly args?: readonly string[];
     readonly cwd?: string;
     readonly timeoutMs?: number;
+    readonly logDir?: string;
+    readonly logFormat?: "summary" | "json";
 }
 interface MockResolvedConfig {
     readonly response?: string;
@@ -370,6 +384,16 @@ interface EnsureSubagentsResult {
  */
 declare function ensureVSCodeSubagents(options: EnsureSubagentsOptions): Promise<EnsureSubagentsResult>;
+type CodexLogEntry = {
+    readonly filePath: string;
+    readonly evalCaseId?: string;
+    readonly targetName: string;
+    readonly attempt?: number;
+};
+type CodexLogListener = (entry: CodexLogEntry) => void;
+declare function consumeCodexLogEntries(): CodexLogEntry[];
+declare function subscribeToCodexLogEntries(listener: CodexLogListener): () => void;
 declare function createProvider(target: ResolvedTarget): Provider;
 declare function resolveAndCreateProvider(definition: TargetDefinition, env?: EnvLookup): Provider;
@@ -418,6 +442,10 @@ declare class LlmJudgeEvaluator implements Evaluator {
     private readonly customPrompt?;
     constructor(options: LlmJudgeEvaluatorOptions);
     evaluate(context: EvaluationContext): Promise<EvaluationScore>;
+    private evaluateWithAx;
+    private evaluateWithPrompt;
+    private buildJudgeForwardOptions;
+    private buildJudgeModelConfig;
 }
 interface CodeEvaluatorOptions {
     readonly script: string;
@@ -490,4 +518,4 @@ type AgentKernel = {
 };
 declare function createAgentKernel(): AgentKernel;
-export { type AgentKernel, type AnthropicResolvedConfig, type AssistantTestMessage, type AzureResolvedConfig, type CliResolvedConfig, CodeEvaluator, type CodeEvaluatorConfig, type CodeEvaluatorOptions, type EnsureSubagentsOptions, type EnsureSubagentsResult, type EnvLookup, type EvalCase, type EvaluationCache, type EvaluationContext, type EvaluationResult, type EvaluationScore, type Evaluator, type EvaluatorConfig, type EvaluatorKind, type EvaluatorResult, type GeminiResolvedConfig, type JsonObject, type JsonPrimitive, type JsonValue, LlmJudgeEvaluator, type LlmJudgeEvaluatorConfig, type LlmJudgeEvaluatorOptions, type MockResolvedConfig, type ProgressEvent, type Provider, type ProviderKind, type ProviderRequest, type ProviderResponse, type ResolvedTarget, type RunEvalCaseOptions, type RunEvaluationOptions, type SystemTestMessage, TEST_MESSAGE_ROLES, type TargetDefinition, type TestMessage, type TestMessageContent, type TestMessageRole, type ToolTestMessage, type UserTestMessage, type VSCodeResolvedConfig, buildDirectoryChain, buildPromptInputs, buildSearchRoots, createAgentKernel, createProvider, ensureVSCodeSubagents, extractCodeBlocks, fileExists, findGitRoot, getHitCount, isEvaluatorKind, isGuidelineFile, isJsonObject, isJsonValue, isTestMessage, isTestMessageRole, listTargetNames, loadEvalCases, readTargetDefinitions, resolveAndCreateProvider, resolveFileReference, resolveTargetDefinition, runEvalCase, runEvaluation };
+export { type AgentKernel, type AnthropicResolvedConfig, type AssistantTestMessage, type AzureResolvedConfig, type CliResolvedConfig, CodeEvaluator, type CodeEvaluatorConfig, type CodeEvaluatorOptions, type EnsureSubagentsOptions, type EnsureSubagentsResult, type EnvLookup, type EvalCase, type EvaluationCache, type EvaluationContext, type EvaluationResult, type EvaluationScore, type Evaluator, type EvaluatorConfig, type EvaluatorKind, type EvaluatorResult, type GeminiResolvedConfig, type JsonObject, type JsonPrimitive, type JsonValue, LlmJudgeEvaluator, type LlmJudgeEvaluatorConfig, type LlmJudgeEvaluatorOptions, type MockResolvedConfig, type ProgressEvent, type Provider, type ProviderKind, type ProviderRequest, type ProviderResponse, type ResolvedTarget, type RunEvalCaseOptions, type RunEvaluationOptions, type SystemTestMessage, TEST_MESSAGE_ROLES, type TargetDefinition, type TestMessage, type TestMessageContent, type TestMessageRole, type ToolTestMessage, type UserTestMessage, type VSCodeResolvedConfig, buildDirectoryChain, buildPromptInputs, buildSearchRoots, consumeCodexLogEntries, createAgentKernel, createProvider, ensureVSCodeSubagents, extractCodeBlocks, fileExists, findGitRoot, getHitCount, isEvaluatorKind, isGuidelineFile, isJsonObject, isJsonValue, isTestMessage, isTestMessageRole, listTargetNames, loadEvalCases, readTargetDefinitions, readTextFile, resolveAndCreateProvider, resolveFileReference, resolveTargetDefinition, runEvalCase, runEvaluation, subscribeToCodexLogEntries };

package/dist/index.d.ts CHANGED Viewed

@@ -1,4 +1,4 @@
-import { AxChatRequest } from '@ax-llm/ax';
+import { AxChatRequest, AxAI } from '@ax-llm/ax';
 /**
  * JSON primitive values appearing in AgentV payloads.
@@ -99,6 +99,7 @@ type EvaluatorConfig = CodeEvaluatorConfig | LlmJudgeEvaluatorConfig;
  */
 interface EvalCase {
     readonly id: string;
+    readonly dataset: string;
     readonly conversation_id?: string;
     readonly task: string;
     readonly user_segments: readonly JsonObject[];
@@ -117,6 +118,7 @@ interface EvalCase {
  */
 interface EvaluationResult {
     readonly eval_id: string;
+    readonly dataset: string;
     readonly conversation_id?: string;
     readonly score: number;
     readonly hits: readonly string[];
@@ -171,6 +173,11 @@ declare function buildPromptInputs(testCase: EvalCase): Promise<{
 }>;
 declare function fileExists(filePath: string): Promise<boolean>;
+/**
+ * Read a text file and normalize line endings to LF (\n).
+ * This ensures consistent behavior across Windows (CRLF) and Unix (LF) systems.
+ */
+declare function readTextFile(filePath: string): Promise<string>;
 /**
  * Find git repository root by walking up the directory tree.
  */
@@ -229,6 +236,11 @@ interface Provider {
      * the orchestrator may send multiple requests in a single provider session.
      */
     invokeBatch?(requests: readonly ProviderRequest[]): Promise<readonly ProviderResponse[]>;
+    /**
+     * Optional access to the underlying AxAI instance.
+     * This enables using advanced Ax features like structured output signatures.
+     */
+    getAxAI?(): AxAI;
 }
 type EnvLookup = Readonly<Record<string, string | undefined>>;
 interface TargetDefinition {
@@ -265,6 +277,8 @@ interface CodexResolvedConfig {
     readonly args?: readonly string[];
     readonly cwd?: string;
     readonly timeoutMs?: number;
+    readonly logDir?: string;
+    readonly logFormat?: "summary" | "json";
 }
 interface MockResolvedConfig {
     readonly response?: string;
@@ -370,6 +384,16 @@ interface EnsureSubagentsResult {
  */
 declare function ensureVSCodeSubagents(options: EnsureSubagentsOptions): Promise<EnsureSubagentsResult>;
+type CodexLogEntry = {
+    readonly filePath: string;
+    readonly evalCaseId?: string;
+    readonly targetName: string;
+    readonly attempt?: number;
+};
+type CodexLogListener = (entry: CodexLogEntry) => void;
+declare function consumeCodexLogEntries(): CodexLogEntry[];
+declare function subscribeToCodexLogEntries(listener: CodexLogListener): () => void;
 declare function createProvider(target: ResolvedTarget): Provider;
 declare function resolveAndCreateProvider(definition: TargetDefinition, env?: EnvLookup): Provider;
@@ -418,6 +442,10 @@ declare class LlmJudgeEvaluator implements Evaluator {
     private readonly customPrompt?;
     constructor(options: LlmJudgeEvaluatorOptions);
     evaluate(context: EvaluationContext): Promise<EvaluationScore>;
+    private evaluateWithAx;
+    private evaluateWithPrompt;
+    private buildJudgeForwardOptions;
+    private buildJudgeModelConfig;
 }
 interface CodeEvaluatorOptions {
     readonly script: string;
@@ -490,4 +518,4 @@ type AgentKernel = {
 };
 declare function createAgentKernel(): AgentKernel;
-export { type AgentKernel, type AnthropicResolvedConfig, type AssistantTestMessage, type AzureResolvedConfig, type CliResolvedConfig, CodeEvaluator, type CodeEvaluatorConfig, type CodeEvaluatorOptions, type EnsureSubagentsOptions, type EnsureSubagentsResult, type EnvLookup, type EvalCase, type EvaluationCache, type EvaluationContext, type EvaluationResult, type EvaluationScore, type Evaluator, type EvaluatorConfig, type EvaluatorKind, type EvaluatorResult, type GeminiResolvedConfig, type JsonObject, type JsonPrimitive, type JsonValue, LlmJudgeEvaluator, type LlmJudgeEvaluatorConfig, type LlmJudgeEvaluatorOptions, type MockResolvedConfig, type ProgressEvent, type Provider, type ProviderKind, type ProviderRequest, type ProviderResponse, type ResolvedTarget, type RunEvalCaseOptions, type RunEvaluationOptions, type SystemTestMessage, TEST_MESSAGE_ROLES, type TargetDefinition, type TestMessage, type TestMessageContent, type TestMessageRole, type ToolTestMessage, type UserTestMessage, type VSCodeResolvedConfig, buildDirectoryChain, buildPromptInputs, buildSearchRoots, createAgentKernel, createProvider, ensureVSCodeSubagents, extractCodeBlocks, fileExists, findGitRoot, getHitCount, isEvaluatorKind, isGuidelineFile, isJsonObject, isJsonValue, isTestMessage, isTestMessageRole, listTargetNames, loadEvalCases, readTargetDefinitions, resolveAndCreateProvider, resolveFileReference, resolveTargetDefinition, runEvalCase, runEvaluation };
+export { type AgentKernel, type AnthropicResolvedConfig, type AssistantTestMessage, type AzureResolvedConfig, type CliResolvedConfig, CodeEvaluator, type CodeEvaluatorConfig, type CodeEvaluatorOptions, type EnsureSubagentsOptions, type EnsureSubagentsResult, type EnvLookup, type EvalCase, type EvaluationCache, type EvaluationContext, type EvaluationResult, type EvaluationScore, type Evaluator, type EvaluatorConfig, type EvaluatorKind, type EvaluatorResult, type GeminiResolvedConfig, type JsonObject, type JsonPrimitive, type JsonValue, LlmJudgeEvaluator, type LlmJudgeEvaluatorConfig, type LlmJudgeEvaluatorOptions, type MockResolvedConfig, type ProgressEvent, type Provider, type ProviderKind, type ProviderRequest, type ProviderResponse, type ResolvedTarget, type RunEvalCaseOptions, type RunEvaluationOptions, type SystemTestMessage, TEST_MESSAGE_ROLES, type TargetDefinition, type TestMessage, type TestMessageContent, type TestMessageRole, type ToolTestMessage, type UserTestMessage, type VSCodeResolvedConfig, buildDirectoryChain, buildPromptInputs, buildSearchRoots, consumeCodexLogEntries, createAgentKernel, createProvider, ensureVSCodeSubagents, extractCodeBlocks, fileExists, findGitRoot, getHitCount, isEvaluatorKind, isGuidelineFile, isJsonObject, isJsonValue, isTestMessage, isTestMessageRole, listTargetNames, loadEvalCases, readTargetDefinitions, readTextFile, resolveAndCreateProvider, resolveFileReference, resolveTargetDefinition, runEvalCase, runEvaluation, subscribeToCodexLogEntries };