npm - @skillrecordings/cli - Versions diffs - 0.1.0 → 0.2.0 - Mend

@skillrecordings/cli 0.1.0 → 0.2.0

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (136) hide show

package/bin/skill.mjs +27 -0
package/dist/chunk-2NCCVTEE.js +22342 -0
package/dist/chunk-2NCCVTEE.js.map +1 -0
package/dist/chunk-3E3GYSZR.js +7071 -0
package/dist/chunk-3E3GYSZR.js.map +1 -0
package/dist/chunk-F4EM72IH.js +86 -0
package/dist/chunk-F4EM72IH.js.map +1 -0
package/dist/chunk-FGP7KUQW.js +432 -0
package/dist/chunk-FGP7KUQW.js.map +1 -0
package/dist/chunk-H3D6VCME.js +55 -0
package/dist/chunk-H3D6VCME.js.map +1 -0
package/dist/chunk-HK3PEWFD.js +208 -0
package/dist/chunk-HK3PEWFD.js.map +1 -0
package/dist/chunk-KEV3QKXP.js +4495 -0
package/dist/chunk-KEV3QKXP.js.map +1 -0
package/dist/chunk-MG37YDAK.js +882 -0
package/dist/chunk-MG37YDAK.js.map +1 -0
package/dist/chunk-MLNDSBZ4.js +482 -0
package/dist/chunk-MLNDSBZ4.js.map +1 -0
package/dist/chunk-N2WIV2JV.js +22 -0
package/dist/chunk-N2WIV2JV.js.map +1 -0
package/dist/chunk-PWWRCN5W.js +2067 -0
package/dist/chunk-PWWRCN5W.js.map +1 -0
package/dist/chunk-SKHBM3XP.js +7746 -0
package/dist/chunk-SKHBM3XP.js.map +1 -0
package/dist/chunk-WFANXVQG.js +64 -0
package/dist/chunk-WFANXVQG.js.map +1 -0
package/dist/chunk-WYKL32C3.js +275 -0
package/dist/chunk-WYKL32C3.js.map +1 -0
package/dist/chunk-ZNF7XD2S.js +134 -0
package/dist/chunk-ZNF7XD2S.js.map +1 -0
package/dist/config-AUAIYDSI.js +20 -0
package/dist/config-AUAIYDSI.js.map +1 -0
package/dist/fileFromPath-XN7LXIBI.js +134 -0
package/dist/fileFromPath-XN7LXIBI.js.map +1 -0
package/dist/getMachineId-bsd-KW2E7VK3.js +42 -0
package/dist/getMachineId-bsd-KW2E7VK3.js.map +1 -0
package/dist/getMachineId-darwin-ROXJUJX5.js +42 -0
package/dist/getMachineId-darwin-ROXJUJX5.js.map +1 -0
package/dist/getMachineId-linux-KVZEHQSU.js +34 -0
package/dist/getMachineId-linux-KVZEHQSU.js.map +1 -0
package/dist/getMachineId-unsupported-PPRILPPA.js +25 -0
package/dist/getMachineId-unsupported-PPRILPPA.js.map +1 -0
package/dist/getMachineId-win-IIF36LEJ.js +44 -0
package/dist/getMachineId-win-IIF36LEJ.js.map +1 -0
package/dist/index.js +112703 -0
package/dist/index.js.map +1 -0
package/dist/lib-R6DEEJCP.js +7623 -0
package/dist/lib-R6DEEJCP.js.map +1 -0
package/dist/pipeline-IAVVAKTU.js +120 -0
package/dist/pipeline-IAVVAKTU.js.map +1 -0
package/dist/query-NTP5NVXN.js +25 -0
package/dist/query-NTP5NVXN.js.map +1 -0
package/dist/routing-BAEPFB7V.js +390 -0
package/dist/routing-BAEPFB7V.js.map +1 -0
package/dist/stripe-lookup-charge-EPRUMZDL.js +56 -0
package/dist/stripe-lookup-charge-EPRUMZDL.js.map +1 -0
package/dist/stripe-payment-history-SJPKA63N.js +67 -0
package/dist/stripe-payment-history-SJPKA63N.js.map +1 -0
package/dist/stripe-subscription-status-L4Z65GB3.js +58 -0
package/dist/stripe-subscription-status-L4Z65GB3.js.map +1 -0
package/dist/stripe-verify-refund-FZDKCIUQ.js +54 -0
package/dist/stripe-verify-refund-FZDKCIUQ.js.map +1 -0
package/dist/support-memory-WSG7SDKG.js +10 -0
package/dist/support-memory-WSG7SDKG.js.map +1 -0
package/package.json +10 -7
package/.env.encrypted +0 -0
package/CHANGELOG.md +0 -35
package/data/tt-archive-dataset.json +0 -1
package/data/validate-test-dataset.json +0 -97
package/docs/CLI-AUTH.md +0 -504
package/preload.ts +0 -18
package/src/__tests__/init.test.ts +0 -74
package/src/alignment-test.ts +0 -64
package/src/check-apps.ts +0 -16
package/src/commands/auth/decrypt.ts +0 -123
package/src/commands/auth/encrypt.ts +0 -81
package/src/commands/auth/index.ts +0 -50
package/src/commands/auth/keygen.ts +0 -41
package/src/commands/auth/status.ts +0 -164
package/src/commands/axiom/forensic.ts +0 -868
package/src/commands/axiom/index.ts +0 -697
package/src/commands/build-dataset.ts +0 -311
package/src/commands/db-status.ts +0 -47
package/src/commands/deploys.ts +0 -219
package/src/commands/eval-local/compare.ts +0 -171
package/src/commands/eval-local/health.ts +0 -212
package/src/commands/eval-local/index.ts +0 -76
package/src/commands/eval-local/real-tools.ts +0 -416
package/src/commands/eval-local/run.ts +0 -1168
package/src/commands/eval-local/score-production.ts +0 -256
package/src/commands/eval-local/seed.ts +0 -276
package/src/commands/eval-pipeline/index.ts +0 -53
package/src/commands/eval-pipeline/real-tools.ts +0 -492
package/src/commands/eval-pipeline/run.ts +0 -1316
package/src/commands/eval-pipeline/seed.ts +0 -395
package/src/commands/eval-prompt.ts +0 -496
package/src/commands/eval.test.ts +0 -253
package/src/commands/eval.ts +0 -108
package/src/commands/faq-classify.ts +0 -460
package/src/commands/faq-cluster.ts +0 -135
package/src/commands/faq-extract.ts +0 -249
package/src/commands/faq-mine.ts +0 -432
package/src/commands/faq-review.ts +0 -426
package/src/commands/front/index.ts +0 -351
package/src/commands/front/pull-conversations.ts +0 -275
package/src/commands/front/tags.ts +0 -825
package/src/commands/front-cache.ts +0 -1277
package/src/commands/front-stats.ts +0 -75
package/src/commands/health.test.ts +0 -82
package/src/commands/health.ts +0 -362
package/src/commands/init.test.ts +0 -89
package/src/commands/init.ts +0 -106
package/src/commands/inngest/client.ts +0 -294
package/src/commands/inngest/events.ts +0 -296
package/src/commands/inngest/investigate.ts +0 -382
package/src/commands/inngest/runs.ts +0 -149
package/src/commands/inngest/signal.ts +0 -143
package/src/commands/kb-sync.ts +0 -498
package/src/commands/memory/find.ts +0 -135
package/src/commands/memory/get.ts +0 -87
package/src/commands/memory/index.ts +0 -97
package/src/commands/memory/stats.ts +0 -163
package/src/commands/memory/store.ts +0 -49
package/src/commands/memory/vote.ts +0 -159
package/src/commands/pipeline.ts +0 -127
package/src/commands/responses.ts +0 -856
package/src/commands/tools.ts +0 -293
package/src/commands/wizard.ts +0 -319
package/src/index.ts +0 -172
package/src/lib/crypto.ts +0 -56
package/src/lib/env-loader.ts +0 -206
package/src/lib/onepassword.ts +0 -137
package/src/test-agent-local.ts +0 -115
package/tsconfig.json +0 -11
package/vitest.config.ts +0 -10

package/src/commands/eval.test.ts DELETED Viewed

@@ -1,253 +0,0 @@
-import * as fs from 'node:fs/promises'
-import { afterEach, beforeEach, describe, expect, it, vi } from 'vitest'
-import { runEval } from './eval'
-// Mock process.exit to prevent test termination
-const mockExit = vi.spyOn(process, 'exit').mockImplementation((code) => {
-  throw new Error(`process.exit(${code})`)
-})
-// Mock fs module
-vi.mock('node:fs/promises')
-// Mock core evals module
-vi.mock('@skillrecordings/core/evals/routing', () => ({
-  evalRouting: vi.fn(),
-}))
-describe('eval command', () => {
-  beforeEach(() => {
-    vi.clearAllMocks()
-    mockExit.mockClear()
-  })
-  afterEach(() => {
-    mockExit.mockClear()
-  })
-  it('should require dataset path', async () => {
-    const consoleErrorSpy = vi.spyOn(console, 'error')
-    await expect(runEval('routing', undefined)).rejects.toThrow(
-      'process.exit(1)'
-    )
-    expect(consoleErrorSpy).toHaveBeenCalledWith(
-      expect.stringContaining('Dataset path is required')
-    )
-  })
-  it('should fail if dataset file does not exist', async () => {
-    const consoleErrorSpy = vi.spyOn(console, 'error')
-    vi.mocked(fs.access).mockRejectedValue(new Error('File not found'))
-    await expect(
-      runEval('routing', '/path/to/nonexistent.json')
-    ).rejects.toThrow('process.exit(1)')
-    expect(consoleErrorSpy).toHaveBeenCalledWith(
-      expect.stringContaining('Dataset file not found')
-    )
-  })
-  it('should fail if dataset is invalid JSON', async () => {
-    const consoleErrorSpy = vi.spyOn(console, 'error')
-    vi.mocked(fs.access).mockResolvedValue(undefined)
-    vi.mocked(fs.readFile).mockResolvedValue('invalid json')
-    await expect(runEval('routing', '/path/to/invalid.json')).rejects.toThrow(
-      'process.exit(1)'
-    )
-    expect(consoleErrorSpy).toHaveBeenCalledWith(
-      expect.stringContaining('Invalid JSON')
-    )
-  })
-  it('should print pretty results table by default', async () => {
-    const consoleSpy = vi.spyOn(console, 'log')
-    const mockDataset = [
-      {
-        message: 'Test message',
-        expectedCategory: 'needs_response',
-        expectedRoute: 'classifier' as const,
-      },
-    ]
-    const mockReport = {
-      precision: 0.92,
-      recall: 0.95,
-      fpRate: 0.03,
-      fnRate: 0.02,
-      byCategory: {
-        needs_response: {
-          tp: 10,
-          fp: 1,
-          fn: 1,
-          tn: 5,
-          precision: 0.95,
-          recall: 0.93,
-          f1: 0.94,
-          count: 17,
-        },
-      },
-      cost: {
-        tokens: 5000,
-        estimatedUsd: 0.00125,
-      },
-      latency: {
-        p50: 120,
-        p95: 250,
-        p99: 350,
-      },
-      passed: true,
-    }
-    vi.mocked(fs.access).mockResolvedValue(undefined)
-    vi.mocked(fs.readFile).mockResolvedValue(JSON.stringify(mockDataset))
-    const { evalRouting } = await import('@skillrecordings/core/evals/routing')
-    vi.mocked(evalRouting).mockResolvedValue(mockReport)
-    await expect(runEval('routing', '/path/to/dataset.json')).rejects.toThrow(
-      'process.exit(0)'
-    )
-    const output = consoleSpy.mock.calls.flat().join('\n')
-    expect(output).toContain('Precision')
-    expect(output).toContain('92.0%')
-    expect(output).toContain('Recall')
-    expect(output).toContain('95.0%')
-    expect(output).toContain('Latency')
-    expect(output).toContain('120ms')
-  })
-  it('should output JSON when --json flag is used', async () => {
-    const consoleSpy = vi.spyOn(console, 'log')
-    const mockDataset = [
-      {
-        message: 'Test message',
-        expectedCategory: 'needs_response',
-        expectedRoute: 'classifier' as const,
-      },
-    ]
-    const mockReport = {
-      precision: 0.92,
-      recall: 0.95,
-      fpRate: 0.03,
-      fnRate: 0.02,
-      byCategory: {},
-      cost: {
-        tokens: 5000,
-        estimatedUsd: 0.00125,
-      },
-      latency: {
-        p50: 120,
-        p95: 250,
-        p99: 350,
-      },
-      passed: true,
-    }
-    vi.mocked(fs.access).mockResolvedValue(undefined)
-    vi.mocked(fs.readFile).mockResolvedValue(JSON.stringify(mockDataset))
-    const { evalRouting } = await import('@skillrecordings/core/evals/routing')
-    vi.mocked(evalRouting).mockResolvedValue(mockReport)
-    await expect(
-      runEval('routing', '/path/to/dataset.json', { json: true })
-    ).rejects.toThrow('process.exit(0)')
-    const output = consoleSpy.mock.calls.flat().join('\n')
-    const parsed = JSON.parse(output)
-    expect(parsed.precision).toBe(0.92)
-    expect(parsed.recall).toBe(0.95)
-    expect(parsed.passed).toBe(true)
-  })
-  it('should exit with code 1 when gates fail', async () => {
-    const mockDataset = [
-      {
-        message: 'Test message',
-        expectedCategory: 'needs_response',
-        expectedRoute: 'classifier' as const,
-      },
-    ]
-    const mockReport = {
-      precision: 0.85, // Below threshold
-      recall: 0.88, // Below threshold
-      fpRate: 0.05,
-      fnRate: 0.04,
-      byCategory: {},
-      cost: {
-        tokens: 5000,
-        estimatedUsd: 0.00125,
-      },
-      latency: {
-        p50: 120,
-        p95: 250,
-        p99: 350,
-      },
-      passed: false,
-    }
-    vi.mocked(fs.access).mockResolvedValue(undefined)
-    vi.mocked(fs.readFile).mockResolvedValue(JSON.stringify(mockDataset))
-    const { evalRouting } = await import('@skillrecordings/core/evals/routing')
-    vi.mocked(evalRouting).mockResolvedValue(mockReport)
-    await expect(
-      runEval('routing', '/path/to/dataset.json', {
-        gates: { minPrecision: 0.92, minRecall: 0.95 },
-      })
-    ).rejects.toThrow('process.exit(1)')
-  })
-  it('should accept custom gates', async () => {
-    const mockDataset = [
-      {
-        message: 'Test message',
-        expectedCategory: 'needs_response',
-        expectedRoute: 'classifier' as const,
-      },
-    ]
-    const mockReport = {
-      precision: 0.92,
-      recall: 0.95,
-      fpRate: 0.03,
-      fnRate: 0.02,
-      byCategory: {},
-      cost: {
-        tokens: 5000,
-        estimatedUsd: 0.00125,
-      },
-      latency: {
-        p50: 120,
-        p95: 250,
-        p99: 350,
-      },
-      passed: true,
-    }
-    vi.mocked(fs.access).mockResolvedValue(undefined)
-    vi.mocked(fs.readFile).mockResolvedValue(JSON.stringify(mockDataset))
-    const { evalRouting } = await import('@skillrecordings/core/evals/routing')
-    vi.mocked(evalRouting).mockResolvedValue(mockReport)
-    // Test with custom gates
-    await expect(
-      runEval('routing', '/path/to/dataset.json', {
-        gates: { minPrecision: 0.9, minRecall: 0.93, maxFpRate: 0.05 },
-      })
-    ).rejects.toThrow('process.exit(0)')
-    expect(evalRouting).toHaveBeenCalledWith(mockDataset, {
-      minPrecision: 0.9,
-      minRecall: 0.93,
-      maxFpRate: 0.05,
-    })
-  })
-})

package/src/commands/eval.ts DELETED Viewed

@@ -1,108 +0,0 @@
-import { access, readFile } from 'node:fs/promises'
-import type {
-  EvalDatapoint,
-  EvalGates,
-  EvalReport,
-} from '@skillrecordings/core/evals/routing'
-export interface EvalOptions {
-  json?: boolean
-  gates?: EvalGates
-}
-/**
- * Run evals against a dataset
- *
- * Usage: skill eval routing --dataset path/to/dataset.json [--gates strict|relaxed] [--json]
- *
- * @param evalType - Type of eval to run (currently only 'routing' supported)
- * @param datasetPath - Path to JSON dataset file
- * @param options - Command options
- */
-export async function runEval(
-  evalType: string,
-  datasetPath: string | undefined,
-  options: EvalOptions = {}
-): Promise<void> {
-  const { json = false, gates } = options
-  // Validate inputs
-  if (!datasetPath) {
-    console.error(
-      'Error: Dataset path is required. Usage: skill eval routing --dataset <path>'
-    )
-    process.exit(1)
-  }
-  // Check if file exists
-  try {
-    await access(datasetPath)
-  } catch {
-    console.error(`Error: Dataset file not found: ${datasetPath}`)
-    process.exit(1)
-  }
-  // Read and parse dataset
-  let dataset: EvalDatapoint[]
-  try {
-    const content = await readFile(datasetPath, 'utf-8')
-    dataset = JSON.parse(content)
-  } catch (error) {
-    console.error(
-      `Error: Invalid JSON in dataset file: ${error instanceof Error ? error.message : 'Unknown error'}`
-    )
-    process.exit(1)
-  }
-  // Import evalRouting (only when needed to avoid circular deps)
-  const { evalRouting } = await import('@skillrecordings/core/evals/routing')
-  // Run eval with optional gates
-  const report: EvalReport = await evalRouting(dataset, gates)
-  // Output results
-  if (json) {
-    console.log(JSON.stringify(report, null, 2))
-  } else {
-    printPrettyResults(report)
-  }
-  // Exit with appropriate code
-  process.exit(report.passed ? 0 : 1)
-}
-/**
- * Print pretty-formatted results table
- */
-function printPrettyResults(report: EvalReport): void {
-  console.log('\n📊 Evaluation Results\n')
-  console.log('Overall Metrics:')
-  console.log(`  Precision:           ${(report.precision * 100).toFixed(1)}%`)
-  console.log(`  Recall:              ${(report.recall * 100).toFixed(1)}%`)
-  console.log(`  False Positive Rate: ${(report.fpRate * 100).toFixed(1)}%`)
-  console.log(`  False Negative Rate: ${(report.fnRate * 100).toFixed(1)}%`)
-  console.log('\nPerformance:')
-  console.log(`  Latency (p50):       ${report.latency.p50.toFixed(0)}ms`)
-  console.log(`  Latency (p95):       ${report.latency.p95.toFixed(0)}ms`)
-  console.log(`  Latency (p99):       ${report.latency.p99.toFixed(0)}ms`)
-  console.log(`  Total Tokens:        ${report.cost.tokens.toLocaleString()}`)
-  console.log(`  Estimated Cost:      $${report.cost.estimatedUsd.toFixed(4)}`)
-  if (Object.keys(report.byCategory).length > 0) {
-    console.log('\nCategory Breakdown:')
-    for (const [category, metrics] of Object.entries(report.byCategory)) {
-      console.log(`\n  ${category}:`)
-      console.log(`    Precision: ${(metrics.precision * 100).toFixed(1)}%`)
-      console.log(`    Recall:    ${(metrics.recall * 100).toFixed(1)}%`)
-      console.log(`    F1:        ${(metrics.f1 * 100).toFixed(1)}%`)
-      console.log(`    Count:     ${metrics.count}`)
-    }
-  }
-  console.log(`\n${report.passed ? '✅ PASSED' : '❌ FAILED'}`)
-  if (!report.passed) {
-    console.log('\nOne or more metrics fell below threshold gates.')
-  }
-}