npm - agentdb - Versions diffs - 1.0.0 - Mend

agentdb 1.0.0

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (361) hide show

package/LICENSE +38 -0
package/LICENSE-APACHE +190 -0
package/LICENSE-MIT +21 -0
package/README.md +953 -0
package/bin/agentdb.js +485 -0
package/bin/plugin-cli-wrapper.mjs +21 -0
package/dist/cache/query-cache.d.ts +105 -0
package/dist/cache/query-cache.d.ts.map +1 -0
package/dist/cache/query-cache.js +224 -0
package/dist/cache/query-cache.js.map +1 -0
package/dist/cache/query-cache.mjs +219 -0
package/dist/cli/cache/query-cache.d.ts +104 -0
package/dist/cli/cache/query-cache.js +244 -0
package/dist/cli/cli/db-commands.d.ts +48 -0
package/dist/cli/cli/db-commands.js +613 -0
package/dist/cli/commands.d.ts +7 -0
package/dist/cli/commands.d.ts.map +1 -0
package/dist/cli/commands.js +113 -0
package/dist/cli/commands.js.map +1 -0
package/dist/cli/commands.mjs +104 -0
package/dist/cli/core/backend-interface.d.ts +70 -0
package/dist/cli/core/backend-interface.js +15 -0
package/dist/cli/core/native-backend.d.ts +140 -0
package/dist/cli/core/native-backend.js +432 -0
package/dist/cli/core/vector-db.d.ts +126 -0
package/dist/cli/core/vector-db.js +338 -0
package/dist/cli/core/wasm-backend.d.ts +95 -0
package/dist/cli/core/wasm-backend.js +418 -0
package/dist/cli/db-commands.d.ts +49 -0
package/dist/cli/db-commands.d.ts.map +1 -0
package/dist/cli/db-commands.js +533 -0
package/dist/cli/db-commands.js.map +1 -0
package/dist/cli/db-commands.mjs +522 -0
package/dist/cli/generator.d.ts +11 -0
package/dist/cli/generator.d.ts.map +1 -0
package/dist/cli/generator.js +567 -0
package/dist/cli/generator.js.map +1 -0
package/dist/cli/generator.mjs +527 -0
package/dist/cli/help.d.ts +18 -0
package/dist/cli/help.d.ts.map +1 -0
package/dist/cli/help.js +676 -0
package/dist/cli/help.js.map +1 -0
package/dist/cli/help.mjs +667 -0
package/dist/cli/index/hnsw.d.ts +164 -0
package/dist/cli/index/hnsw.js +558 -0
package/dist/cli/plugin-cli.d.ts +7 -0
package/dist/cli/plugin-cli.d.ts.map +1 -0
package/dist/cli/plugin-cli.js +295 -0
package/dist/cli/plugin-cli.js.map +1 -0
package/dist/cli/plugin-cli.mjs +289 -0
package/dist/cli/quantization/product-quantization.d.ts +108 -0
package/dist/cli/quantization/product-quantization.js +350 -0
package/dist/cli/query/query-builder.d.ts +322 -0
package/dist/cli/query/query-builder.js +600 -0
package/dist/cli/templates.d.ts +14 -0
package/dist/cli/templates.d.ts.map +1 -0
package/dist/cli/templates.js +182 -0
package/dist/cli/templates.js.map +1 -0
package/dist/cli/templates.mjs +176 -0
package/dist/cli/types/index.d.ts +116 -0
package/dist/cli/types/index.js +5 -0
package/dist/cli/types.d.ts +91 -0
package/dist/cli/types.d.ts.map +1 -0
package/dist/cli/types.js +6 -0
package/dist/cli/types.js.map +1 -0
package/dist/cli/types.mjs +4 -0
package/dist/cli/wizard/index.d.ts +6 -0
package/dist/cli/wizard/index.d.ts.map +1 -0
package/dist/cli/wizard/index.js +138 -0
package/dist/cli/wizard/index.js.map +1 -0
package/dist/cli/wizard/index.mjs +131 -0
package/dist/cli/wizard/prompts.d.ts +11 -0
package/dist/cli/wizard/prompts.d.ts.map +1 -0
package/dist/cli/wizard/prompts.js +482 -0
package/dist/cli/wizard/prompts.js.map +1 -0
package/dist/cli/wizard/prompts.mjs +470 -0
package/dist/cli/wizard/validator.d.ts +13 -0
package/dist/cli/wizard/validator.d.ts.map +1 -0
package/dist/cli/wizard/validator.js +234 -0
package/dist/cli/wizard/validator.js.map +1 -0
package/dist/cli/wizard/validator.mjs +224 -0
package/dist/core/backend-interface.d.ts +71 -0
package/dist/core/backend-interface.d.ts.map +1 -0
package/dist/core/backend-interface.js +16 -0
package/dist/core/backend-interface.js.map +1 -0
package/dist/core/backend-interface.mjs +12 -0
package/dist/core/native-backend.d.ts +141 -0
package/dist/core/native-backend.d.ts.map +1 -0
package/dist/core/native-backend.js +457 -0
package/dist/core/native-backend.js.map +1 -0
package/dist/core/native-backend.mjs +449 -0
package/dist/core/vector-db.d.ts +127 -0
package/dist/core/vector-db.d.ts.map +1 -0
package/dist/core/vector-db.js +266 -0
package/dist/core/vector-db.js.map +1 -0
package/dist/core/vector-db.mjs +261 -0
package/dist/core/wasm-backend.d.ts +96 -0
package/dist/core/wasm-backend.d.ts.map +1 -0
package/dist/core/wasm-backend.js +393 -0
package/dist/core/wasm-backend.js.map +1 -0
package/dist/core/wasm-backend.mjs +385 -0
package/dist/index/hnsw-optimized.d.ts +75 -0
package/dist/index/hnsw-optimized.d.ts.map +1 -0
package/dist/index/hnsw-optimized.js +412 -0
package/dist/index/hnsw-optimized.js.map +1 -0
package/dist/index/hnsw-optimized.mjs +407 -0
package/dist/index/hnsw.d.ts +165 -0
package/dist/index/hnsw.d.ts.map +1 -0
package/dist/index/hnsw.js +521 -0
package/dist/index/hnsw.js.map +1 -0
package/dist/index/hnsw.mjs +516 -0
package/dist/index.d.ts +57 -0
package/dist/index.d.ts.map +1 -0
package/dist/index.js +82 -0
package/dist/index.js.map +1 -0
package/dist/index.mjs +63 -0
package/dist/mcp-server.d.ts +27 -0
package/dist/mcp-server.d.ts.map +1 -0
package/dist/mcp-server.js +789 -0
package/dist/mcp-server.js.map +1 -0
package/dist/mcp-server.mjs +784 -0
package/dist/plugins/base-plugin.d.ts +114 -0
package/dist/plugins/base-plugin.d.ts.map +1 -0
package/dist/plugins/base-plugin.js +313 -0
package/dist/plugins/base-plugin.js.map +1 -0
package/dist/plugins/base-plugin.mjs +275 -0
package/dist/plugins/implementations/active-learning.d.ts +135 -0
package/dist/plugins/implementations/active-learning.d.ts.map +1 -0
package/dist/plugins/implementations/active-learning.js +372 -0
package/dist/plugins/implementations/active-learning.js.map +1 -0
package/dist/plugins/implementations/active-learning.mjs +367 -0
package/dist/plugins/implementations/actor-critic.d.ts +64 -0
package/dist/plugins/implementations/actor-critic.d.ts.map +1 -0
package/dist/plugins/implementations/actor-critic.js +363 -0
package/dist/plugins/implementations/actor-critic.js.map +1 -0
package/dist/plugins/implementations/actor-critic.mjs +358 -0
package/dist/plugins/implementations/adversarial-training.d.ts +133 -0
package/dist/plugins/implementations/adversarial-training.d.ts.map +1 -0
package/dist/plugins/implementations/adversarial-training.js +409 -0
package/dist/plugins/implementations/adversarial-training.js.map +1 -0
package/dist/plugins/implementations/adversarial-training.mjs +404 -0
package/dist/plugins/implementations/curriculum-learning.d.ts +132 -0
package/dist/plugins/implementations/curriculum-learning.d.ts.map +1 -0
package/dist/plugins/implementations/curriculum-learning.js +354 -0
package/dist/plugins/implementations/curriculum-learning.js.map +1 -0
package/dist/plugins/implementations/curriculum-learning.mjs +349 -0
package/dist/plugins/implementations/decision-transformer.d.ts +77 -0
package/dist/plugins/implementations/decision-transformer.d.ts.map +1 -0
package/dist/plugins/implementations/decision-transformer.js +422 -0
package/dist/plugins/implementations/decision-transformer.js.map +1 -0
package/dist/plugins/implementations/decision-transformer.mjs +417 -0
package/dist/plugins/implementations/federated-learning.d.ts +126 -0
package/dist/plugins/implementations/federated-learning.d.ts.map +1 -0
package/dist/plugins/implementations/federated-learning.js +436 -0
package/dist/plugins/implementations/federated-learning.js.map +1 -0
package/dist/plugins/implementations/federated-learning.mjs +431 -0
package/dist/plugins/implementations/index.d.ts +30 -0
package/dist/plugins/implementations/index.d.ts.map +1 -0
package/dist/plugins/implementations/index.js +45 -0
package/dist/plugins/implementations/index.js.map +1 -0
package/dist/plugins/implementations/index.mjs +31 -0
package/dist/plugins/implementations/multi-task-learning.d.ts +115 -0
package/dist/plugins/implementations/multi-task-learning.d.ts.map +1 -0
package/dist/plugins/implementations/multi-task-learning.js +369 -0
package/dist/plugins/implementations/multi-task-learning.js.map +1 -0
package/dist/plugins/implementations/multi-task-learning.mjs +364 -0
package/dist/plugins/implementations/neural-architecture-search.d.ts +148 -0
package/dist/plugins/implementations/neural-architecture-search.d.ts.map +1 -0
package/dist/plugins/implementations/neural-architecture-search.js +379 -0
package/dist/plugins/implementations/neural-architecture-search.js.map +1 -0
package/dist/plugins/implementations/neural-architecture-search.mjs +374 -0
package/dist/plugins/implementations/q-learning.d.ts +98 -0
package/dist/plugins/implementations/q-learning.d.ts.map +1 -0
package/dist/plugins/implementations/q-learning.js +435 -0
package/dist/plugins/implementations/q-learning.js.map +1 -0
package/dist/plugins/implementations/q-learning.mjs +430 -0
package/dist/plugins/implementations/sarsa.d.ts +103 -0
package/dist/plugins/implementations/sarsa.d.ts.map +1 -0
package/dist/plugins/implementations/sarsa.js +347 -0
package/dist/plugins/implementations/sarsa.js.map +1 -0
package/dist/plugins/implementations/sarsa.mjs +342 -0
package/dist/plugins/index.d.ts +107 -0
package/dist/plugins/index.d.ts.map +1 -0
package/dist/plugins/index.js +179 -0
package/dist/plugins/index.js.map +1 -0
package/dist/plugins/index.mjs +168 -0
package/dist/plugins/interface.d.ts +439 -0
package/dist/plugins/interface.d.ts.map +1 -0
package/dist/plugins/interface.js +12 -0
package/dist/plugins/interface.js.map +1 -0
package/dist/plugins/interface.mjs +10 -0
package/dist/plugins/learning-plugin.interface.d.ts +257 -0
package/dist/plugins/learning-plugin.interface.d.ts.map +1 -0
package/dist/plugins/learning-plugin.interface.js +7 -0
package/dist/plugins/learning-plugin.interface.js.map +1 -0
package/dist/plugins/learning-plugin.interface.mjs +5 -0
package/dist/plugins/plugin-exports.d.ts +71 -0
package/dist/plugins/plugin-exports.d.ts.map +1 -0
package/dist/plugins/plugin-exports.js +78 -0
package/dist/plugins/plugin-exports.js.map +1 -0
package/dist/plugins/plugin-exports.mjs +69 -0
package/dist/plugins/registry.d.ts +206 -0
package/dist/plugins/registry.d.ts.map +1 -0
package/dist/plugins/registry.js +365 -0
package/dist/plugins/registry.js.map +1 -0
package/dist/plugins/registry.mjs +356 -0
package/dist/plugins/validator.d.ts +63 -0
package/dist/plugins/validator.d.ts.map +1 -0
package/dist/plugins/validator.js +464 -0
package/dist/plugins/validator.js.map +1 -0
package/dist/plugins/validator.mjs +458 -0
package/dist/quantization/binary-quantization.d.ts +104 -0
package/dist/quantization/binary-quantization.d.ts.map +1 -0
package/dist/quantization/binary-quantization.js +246 -0
package/dist/quantization/binary-quantization.js.map +1 -0
package/dist/quantization/binary-quantization.mjs +240 -0
package/dist/quantization/optimized-pq.d.ts +138 -0
package/dist/quantization/optimized-pq.d.ts.map +1 -0
package/dist/quantization/optimized-pq.js +320 -0
package/dist/quantization/optimized-pq.js.map +1 -0
package/dist/quantization/optimized-pq.mjs +313 -0
package/dist/quantization/product-quantization.d.ts +109 -0
package/dist/quantization/product-quantization.d.ts.map +1 -0
package/dist/quantization/product-quantization.js +287 -0
package/dist/quantization/product-quantization.js.map +1 -0
package/dist/quantization/product-quantization.mjs +282 -0
package/dist/quantization/scalar-quantization.d.ts +100 -0
package/dist/quantization/scalar-quantization.d.ts.map +1 -0
package/dist/quantization/scalar-quantization.js +324 -0
package/dist/quantization/scalar-quantization.js.map +1 -0
package/dist/quantization/scalar-quantization.mjs +319 -0
package/dist/query/index.d.ts +6 -0
package/dist/query/index.d.ts.map +1 -0
package/dist/query/index.js +9 -0
package/dist/query/index.js.map +1 -0
package/dist/query/index.mjs +4 -0
package/dist/query/query-builder.d.ts +323 -0
package/dist/query/query-builder.d.ts.map +1 -0
package/dist/query/query-builder.js +524 -0
package/dist/query/query-builder.js.map +1 -0
package/dist/query/query-builder.mjs +519 -0
package/dist/reasoning/context-synthesizer.d.ts +57 -0
package/dist/reasoning/context-synthesizer.d.ts.map +1 -0
package/dist/reasoning/context-synthesizer.js +224 -0
package/dist/reasoning/context-synthesizer.js.map +1 -0
package/dist/reasoning/context-synthesizer.mjs +219 -0
package/dist/reasoning/experience-curator.d.ts +66 -0
package/dist/reasoning/experience-curator.d.ts.map +1 -0
package/dist/reasoning/experience-curator.js +288 -0
package/dist/reasoning/experience-curator.js.map +1 -0
package/dist/reasoning/experience-curator.mjs +283 -0
package/dist/reasoning/memory-optimizer.d.ts +69 -0
package/dist/reasoning/memory-optimizer.d.ts.map +1 -0
package/dist/reasoning/memory-optimizer.js +331 -0
package/dist/reasoning/memory-optimizer.js.map +1 -0
package/dist/reasoning/memory-optimizer.mjs +326 -0
package/dist/reasoning/pattern-matcher.d.ts +59 -0
package/dist/reasoning/pattern-matcher.d.ts.map +1 -0
package/dist/reasoning/pattern-matcher.js +229 -0
package/dist/reasoning/pattern-matcher.js.map +1 -0
package/dist/reasoning/pattern-matcher.mjs +224 -0
package/dist/reasoningbank/adapter/agentdb-adapter.d.ts +118 -0
package/dist/reasoningbank/adapter/agentdb-adapter.d.ts.map +1 -0
package/dist/reasoningbank/adapter/agentdb-adapter.js +477 -0
package/dist/reasoningbank/adapter/agentdb-adapter.js.map +1 -0
package/dist/reasoningbank/adapter/types.d.ts +113 -0
package/dist/reasoningbank/adapter/types.d.ts.map +1 -0
package/dist/reasoningbank/adapter/types.js +9 -0
package/dist/reasoningbank/adapter/types.js.map +1 -0
package/dist/reasoningbank/cli/commands.d.ts +16 -0
package/dist/reasoningbank/cli/commands.d.ts.map +1 -0
package/dist/reasoningbank/cli/commands.js +272 -0
package/dist/reasoningbank/cli/commands.js.map +1 -0
package/dist/reasoningbank/mcp/agentdb-tools.d.ts +319 -0
package/dist/reasoningbank/mcp/agentdb-tools.d.ts.map +1 -0
package/dist/reasoningbank/mcp/agentdb-tools.js +301 -0
package/dist/reasoningbank/mcp/agentdb-tools.js.map +1 -0
package/dist/reasoningbank/migration/migrate.d.ts +25 -0
package/dist/reasoningbank/migration/migrate.d.ts.map +1 -0
package/dist/reasoningbank/migration/migrate.js +178 -0
package/dist/reasoningbank/migration/migrate.js.map +1 -0
package/dist/reasoningbank/reasoning/context-synthesizer.d.ts +37 -0
package/dist/reasoningbank/reasoning/context-synthesizer.d.ts.map +1 -0
package/dist/reasoningbank/reasoning/context-synthesizer.js +114 -0
package/dist/reasoningbank/reasoning/context-synthesizer.js.map +1 -0
package/dist/reasoningbank/reasoning/experience-curator.d.ts +39 -0
package/dist/reasoningbank/reasoning/experience-curator.d.ts.map +1 -0
package/dist/reasoningbank/reasoning/experience-curator.js +98 -0
package/dist/reasoningbank/reasoning/experience-curator.js.map +1 -0
package/dist/reasoningbank/reasoning/memory-optimizer.d.ts +44 -0
package/dist/reasoningbank/reasoning/memory-optimizer.d.ts.map +1 -0
package/dist/reasoningbank/reasoning/memory-optimizer.js +184 -0
package/dist/reasoningbank/reasoning/memory-optimizer.js.map +1 -0
package/dist/reasoningbank/reasoning/pattern-matcher.d.ts +40 -0
package/dist/reasoningbank/reasoning/pattern-matcher.d.ts.map +1 -0
package/dist/reasoningbank/reasoning/pattern-matcher.js +87 -0
package/dist/reasoningbank/reasoning/pattern-matcher.js.map +1 -0
package/dist/reasoningbank/sync/quic-sync.d.ts +77 -0
package/dist/reasoningbank/sync/quic-sync.d.ts.map +1 -0
package/dist/reasoningbank/sync/quic-sync.js +165 -0
package/dist/reasoningbank/sync/quic-sync.js.map +1 -0
package/dist/sync/conflict.d.ts +78 -0
package/dist/sync/conflict.d.ts.map +1 -0
package/dist/sync/conflict.js +202 -0
package/dist/sync/conflict.js.map +1 -0
package/dist/sync/conflict.mjs +196 -0
package/dist/sync/coordinator.d.ts +111 -0
package/dist/sync/coordinator.d.ts.map +1 -0
package/dist/sync/coordinator.js +256 -0
package/dist/sync/coordinator.js.map +1 -0
package/dist/sync/coordinator.mjs +250 -0
package/dist/sync/delta.d.ts +81 -0
package/dist/sync/delta.d.ts.map +1 -0
package/dist/sync/delta.js +245 -0
package/dist/sync/delta.js.map +1 -0
package/dist/sync/delta.mjs +238 -0
package/dist/sync/index.d.ts +11 -0
package/dist/sync/index.d.ts.map +1 -0
package/dist/sync/index.js +22 -0
package/dist/sync/index.js.map +1 -0
package/dist/sync/index.mjs +9 -0
package/dist/sync/quic-sync.d.ts +81 -0
package/dist/sync/quic-sync.d.ts.map +1 -0
package/dist/sync/quic-sync.js +329 -0
package/dist/sync/quic-sync.js.map +1 -0
package/dist/sync/quic-sync.mjs +323 -0
package/dist/sync/types.d.ts +168 -0
package/dist/sync/types.d.ts.map +1 -0
package/dist/sync/types.js +8 -0
package/dist/sync/types.js.map +1 -0
package/dist/sync/types.mjs +6 -0
package/dist/types/index.d.ts +117 -0
package/dist/types/index.d.ts.map +1 -0
package/dist/types/index.js +6 -0
package/dist/types/index.js.map +1 -0
package/dist/types/index.mjs +4 -0
package/dist/wasm-loader.d.ts +32 -0
package/dist/wasm-loader.d.ts.map +1 -0
package/dist/wasm-loader.js +75 -0
package/dist/wasm-loader.js.map +1 -0
package/dist/wasm-loader.mjs +64 -0
package/examples/adaptive-learning.ts +284 -0
package/examples/browser/README.md +732 -0
package/examples/browser/adaptive-recommendations/index.html +427 -0
package/examples/browser/collaborative-filtering/index.html +310 -0
package/examples/browser/continual-learning/index.html +736 -0
package/examples/browser/experience-replay/index.html +616 -0
package/examples/browser/index.html +369 -0
package/examples/browser/meta-learning/index.html +789 -0
package/examples/browser/neuro-symbolic/index.html +692 -0
package/examples/browser/pattern-learning/index.html +620 -0
package/examples/browser/quantum-inspired/index.html +728 -0
package/examples/browser/rag/index.html +624 -0
package/examples/browser/swarm-intelligence/index.html +811 -0
package/examples/browser-basic.html +170 -0
package/examples/hnsw-example.ts +148 -0
package/examples/node-basic.js +70 -0
package/examples/quic-sync-example.ts +310 -0
package/examples/quick-start.js +68 -0
package/examples/wasm-example.ts +222 -0
package/package.json +118 -0

package/dist/plugins/implementations/q-learning.mjs ADDED Viewed

@@ -0,0 +1,430 @@
+/**
+ * Q-Learning Plugin
+ *
+ * Implements the Q-Learning algorithm with experience replay.
+ * Q-Learning is a model-free, off-policy RL algorithm that learns
+ * the optimal action-value function (Q-function).
+ *
+ * Key features:
+ * - Epsilon-greedy exploration
+ * - Experience replay buffer
+ * - Optional prioritized experience replay
+ * - Temporal difference learning
+ */
+import { BasePlugin } from '../base-plugin.mjs';
+/**
+ * Experience replay buffer
+ */
+class ReplayBuffer {
+    constructor(capacity) {
+        this.buffer = [];
+        this.position = 0;
+        this.capacity = capacity;
+    }
+    /**
+     * Add experience to buffer
+     */
+    add(experience) {
+        if (this.buffer.length < this.capacity) {
+            this.buffer.push(experience);
+        }
+        else {
+            this.buffer[this.position] = experience;
+        }
+        this.position = (this.position + 1) % this.capacity;
+    }
+    /**
+     * Sample random batch
+     */
+    sample(batchSize) {
+        const batch = [];
+        for (let i = 0; i < Math.min(batchSize, this.buffer.length); i++) {
+            const index = Math.floor(Math.random() * this.buffer.length);
+            batch.push(this.buffer[index]);
+        }
+        return batch;
+    }
+    /**
+     * Get buffer size
+     */
+    size() {
+        return this.buffer.length;
+    }
+    /**
+     * Check if buffer has enough samples
+     */
+    hasEnough(minSize) {
+        return this.buffer.length >= minSize;
+    }
+}
+/**
+ * Prioritized Experience Replay Buffer
+ */
+class PrioritizedReplayBuffer extends ReplayBuffer {
+    constructor(capacity, alpha = 0.6, beta = 0.4, betaIncrement = 0.001) {
+        super(capacity);
+        this.priorities = [];
+        this.alpha = alpha;
+        this.beta = beta;
+        this.betaIncrement = betaIncrement;
+    }
+    /**
+     * Add experience with priority
+     */
+    addWithPriority(experience, priority) {
+        this.add(experience);
+        if (this.priorities.length < this.size()) {
+            this.priorities.push(priority);
+        }
+        else {
+            const pos = this.position - 1;
+            this.priorities[pos >= 0 ? pos : this.priorities.length - 1] = priority;
+        }
+    }
+    /**
+     * Sample batch using prioritized sampling
+     */
+    samplePrioritized(batchSize) {
+        const n = this.size();
+        const batch = [];
+        const indices = [];
+        const weights = [];
+        // Compute sampling probabilities
+        const probs = this.priorities.map(p => Math.pow(p, this.alpha));
+        const totalProb = probs.reduce((sum, p) => sum + p, 0);
+        // Sample
+        for (let i = 0; i < Math.min(batchSize, n); i++) {
+            const rand = Math.random() * totalProb;
+            let cumProb = 0;
+            let index = 0;
+            for (let j = 0; j < probs.length; j++) {
+                cumProb += probs[j];
+                if (rand <= cumProb) {
+                    index = j;
+                    break;
+                }
+            }
+            batch.push(this.buffer[index]);
+            indices.push(index);
+            // Compute importance sampling weight
+            const prob = probs[index] / totalProb;
+            const weight = Math.pow(n * prob, -this.beta);
+            weights.push(weight);
+        }
+        // Normalize weights
+        const maxWeight = Math.max(...weights);
+        const normalizedWeights = weights.map(w => w / maxWeight);
+        // Anneal beta
+        this.beta = Math.min(1.0, this.beta + this.betaIncrement);
+        return { experiences: batch, indices, weights: normalizedWeights };
+    }
+    /**
+     * Update priority for specific experience
+     */
+    updatePriority(index, priority) {
+        if (index >= 0 && index < this.priorities.length) {
+            this.priorities[index] = priority;
+        }
+    }
+}
+/**
+ * Q-Learning Plugin Implementation
+ */
+export class QLearningPlugin extends BasePlugin {
+    constructor() {
+        super(...arguments);
+        this.name = 'q-learning';
+        this.version = '1.0.0';
+        this.qTable = new Map();
+        this.epsilon = 1.0;
+        this.epsilonMin = 0.01;
+        this.epsilonDecay = 0.995;
+        this.usePrioritized = false;
+        this.trainCounter = 0;
+    }
+    /**
+     * Initialize Q-Learning plugin
+     */
+    async onInitialize() {
+        // Initialize epsilon
+        this.epsilon = this.config.algorithm.epsilonStart || 1.0;
+        this.epsilonMin = this.config.algorithm.epsilonEnd || 0.01;
+        this.epsilonDecay = this.config.algorithm.epsilonDecay || 0.995;
+        // Initialize replay buffer
+        const replayConfig = this.config.experienceReplay;
+        if (replayConfig && replayConfig.type === 'prioritized') {
+            this.usePrioritized = true;
+            this.replayBuffer = new PrioritizedReplayBuffer(replayConfig.capacity, replayConfig.alpha, replayConfig.beta, replayConfig.betaIncrement);
+        }
+        else if (replayConfig && replayConfig.type === 'uniform') {
+            this.replayBuffer = new ReplayBuffer(replayConfig.capacity);
+        }
+        else {
+            // Default replay buffer
+            this.replayBuffer = new ReplayBuffer(10000);
+        }
+    }
+    /**
+     * Select action using epsilon-greedy policy
+     *
+     * @param state - Current state vector
+     * @param context - Optional context
+     * @returns Selected action
+     */
+    async selectAction(state, context) {
+        this.checkInitialized();
+        // Epsilon-greedy exploration
+        if (Math.random() < this.epsilon) {
+            return this.randomAction(state);
+        }
+        // Exploit: Select action with highest Q-value
+        return this.greedyAction(state);
+    }
+    /**
+     * Select random action (exploration)
+     */
+    async randomAction(state) {
+        // Find similar states to get action space
+        const similar = await this.retrieveSimilar(state, 10);
+        if (similar.length === 0) {
+            // No similar states, return random embedding
+            return {
+                id: 'random',
+                embedding: Array.from({ length: 768 }, () => Math.random() * 2 - 1),
+                source: 'policy',
+                confidence: 0,
+                metadata: { exploration: true },
+            };
+        }
+        // Random action from similar states
+        const randomIdx = Math.floor(Math.random() * similar.length);
+        const randomExp = similar[randomIdx];
+        if (!randomExp.metadata) {
+            // Fallback to random embedding
+            return {
+                id: 'random',
+                embedding: Array.from({ length: 768 }, () => Math.random() * 2 - 1),
+                source: 'policy',
+                confidence: 0,
+                metadata: { exploration: true },
+            };
+        }
+        return {
+            id: randomExp.id,
+            embedding: randomExp.metadata.action,
+            source: 'policy',
+            confidence: 0,
+            metadata: { exploration: true },
+        };
+    }
+    /**
+     * Select greedy action (exploitation)
+     */
+    async greedyAction(state) {
+        const stateKey = this.hashState(state);
+        // Get Q-values for this state
+        const qValues = this.qTable.get(stateKey);
+        if (!qValues || qValues.size === 0) {
+            // No Q-values yet, explore similar states
+            const similar = await this.retrieveSimilar(state, 1);
+            if (similar.length > 0 && similar[0].metadata) {
+                return {
+                    id: similar[0].id,
+                    embedding: similar[0].metadata.action,
+                    source: 'policy',
+                    confidence: similar[0].score,
+                    metadata: { exploration: false },
+                };
+            }
+            // Fallback to random
+            return this.randomAction(state);
+        }
+        // Find action with maximum Q-value
+        let maxQ = -Infinity;
+        let bestAction = '';
+        for (const [action, qValue] of qValues.entries()) {
+            if (qValue > maxQ) {
+                maxQ = qValue;
+                bestAction = action;
+            }
+        }
+        // Retrieve action embedding from storage
+        const actionData = await this.getActionEmbedding(bestAction);
+        return {
+            id: bestAction,
+            embedding: actionData,
+            source: 'policy',
+            confidence: this.normalizeQValue(maxQ),
+            metadata: { exploration: false, qValue: maxQ },
+        };
+    }
+    /**
+     * Store experience and update Q-table
+     */
+    async onStoreExperience(experience) {
+        // Add to replay buffer
+        if (this.usePrioritized) {
+            const tdError = this.computeTDError(experience);
+            this.replayBuffer.addWithPriority(experience, Math.abs(tdError) + 1e-6);
+        }
+        else {
+            this.replayBuffer.add(experience);
+        }
+        // Train periodically
+        this.trainCounter++;
+        const trainEvery = this.config.training.trainEvery || 100;
+        if (this.trainCounter >= trainEvery && this.replayBuffer.hasEnough(this.config.training.minExperiences)) {
+            await this.train({ epochs: 1, verbose: false });
+            this.trainCounter = 0;
+        }
+    }
+    /**
+     * Train Q-Learning on replay buffer
+     */
+    async train(options) {
+        this.checkInitialized();
+        const epochs = options?.epochs || 1;
+        const batchSize = options?.batchSize || this.config.training.batchSize;
+        const learningRate = options?.learningRate || this.config.algorithm.learningRate;
+        const gamma = this.config.algorithm.discountFactor;
+        let totalLoss = 0;
+        let avgQValue = 0;
+        for (let epoch = 0; epoch < epochs; epoch++) {
+            let epochLoss = 0;
+            let epochQSum = 0;
+            // Sample batch
+            let batch;
+            let weights = [];
+            if (this.usePrioritized) {
+                const sampled = this.replayBuffer.samplePrioritized(batchSize);
+                batch = sampled.experiences;
+                weights = sampled.weights;
+            }
+            else {
+                batch = this.replayBuffer.sample(batchSize);
+                weights = new Array(batch.length).fill(1.0);
+            }
+            // Update Q-values
+            for (let i = 0; i < batch.length; i++) {
+                const exp = batch[i];
+                const weight = weights[i];
+                const stateKey = this.hashState(exp.state);
+                const actionKey = this.hashAction(exp.action);
+                // Get current Q-value
+                const currentQ = this.getQValue(stateKey, actionKey);
+                // Compute target Q-value
+                const nextStateKey = this.hashState(exp.nextState);
+                const maxNextQ = exp.done ? 0 : this.getMaxQValue(nextStateKey);
+                const targetQ = exp.reward + gamma * maxNextQ;
+                // TD error
+                const tdError = targetQ - currentQ;
+                // Update Q-value
+                const newQ = currentQ + learningRate * weight * tdError;
+                this.setQValue(stateKey, actionKey, newQ);
+                // Track metrics
+                epochLoss += tdError * tdError * weight;
+                epochQSum += newQ;
+                // Update priority if using prioritized replay
+                if (this.usePrioritized) {
+                    const sampled = this.replayBuffer.samplePrioritized(batchSize);
+                    this.replayBuffer.updatePriority(sampled.indices[i], Math.abs(tdError) + 1e-6);
+                }
+            }
+            totalLoss = epochLoss / batch.length;
+            avgQValue = epochQSum / batch.length;
+        }
+        // Decay epsilon
+        this.epsilon = Math.max(this.epsilonMin, this.epsilon * this.epsilonDecay);
+        return {
+            loss: totalLoss,
+            avgQValue,
+            epsilon: this.epsilon,
+        };
+    }
+    /**
+     * Compute TD error for prioritized replay
+     */
+    computeTDError(experience) {
+        const stateKey = this.hashState(experience.state);
+        const actionKey = this.hashAction(experience.action);
+        const gamma = this.config.algorithm.discountFactor;
+        const currentQ = this.getQValue(stateKey, actionKey);
+        const nextStateKey = this.hashState(experience.nextState);
+        const maxNextQ = experience.done ? 0 : this.getMaxQValue(nextStateKey);
+        const targetQ = experience.reward + gamma * maxNextQ;
+        return targetQ - currentQ;
+    }
+    /**
+     * Get Q-value for state-action pair
+     */
+    getQValue(stateKey, actionKey) {
+        const qValues = this.qTable.get(stateKey);
+        return qValues?.get(actionKey) || 0;
+    }
+    /**
+     * Set Q-value for state-action pair
+     */
+    setQValue(stateKey, actionKey, value) {
+        if (!this.qTable.has(stateKey)) {
+            this.qTable.set(stateKey, new Map());
+        }
+        this.qTable.get(stateKey).set(actionKey, value);
+    }
+    /**
+     * Get maximum Q-value for a state
+     */
+    getMaxQValue(stateKey) {
+        const qValues = this.qTable.get(stateKey);
+        if (!qValues || qValues.size === 0) {
+            return 0;
+        }
+        return Math.max(...Array.from(qValues.values()));
+    }
+    /**
+     * Hash state vector to string key
+     */
+    hashState(state) {
+        // Simple hash - in production, use better hashing or clustering
+        return state.slice(0, 10).map((x) => x.toFixed(2)).join(',');
+    }
+    /**
+     * Hash action to string key
+     */
+    hashAction(action) {
+        if (typeof action === 'string') {
+            return action;
+        }
+        if (Array.isArray(action)) {
+            return action.slice(0, 10).map((x) => x.toFixed(2)).join(',');
+        }
+        return String(action);
+    }
+    /**
+     * Get action embedding from ID
+     */
+    async getActionEmbedding(actionId) {
+        // In production, retrieve from database
+        // For now, return random embedding
+        return Array.from({ length: 768 }, () => Math.random() * 2 - 1);
+    }
+    /**
+     * Normalize Q-value to 0-1 confidence
+     */
+    normalizeQValue(qValue) {
+        return 1 / (1 + Math.exp(-qValue)); // Sigmoid
+    }
+    /**
+     * Save Q-table
+     */
+    async onSave(path) {
+        console.log(`Saving Q-Learning model to ${path}`);
+        // In production, serialize Q-table to file
+    }
+    /**
+     * Load Q-table
+     */
+    async onLoad(path) {
+        console.log(`Loading Q-Learning model from ${path}`);
+        // In production, deserialize Q-table from file
+    }
+}

package/dist/plugins/implementations/sarsa.d.ts ADDED Viewed

@@ -0,0 +1,103 @@
+/**
+ * SARSA Plugin
+ *
+ * Implements the SARSA (State-Action-Reward-State-Action) algorithm
+ * with eligibility traces (SARSA(λ)).
+ *
+ * SARSA is an on-policy TD control algorithm that learns from the
+ * actual actions taken by the current policy, unlike Q-Learning which
+ * is off-policy.
+ *
+ * Key features:
+ * - On-policy learning
+ * - Eligibility traces for faster learning
+ * - Epsilon-greedy exploration
+ * - More conservative than Q-Learning
+ */
+import { BasePlugin } from '../base-plugin';
+import { Action, Context, Experience, TrainOptions, TrainingMetrics } from '../learning-plugin.interface';
+/**
+ * SARSA Plugin Implementation
+ */
+export declare class SARSAPlugin extends BasePlugin {
+    name: string;
+    version: string;
+    private qTable;
+    private epsilon;
+    private epsilonMin;
+    private epsilonDecay;
+    private eligibilityTraces;
+    private lambda;
+    private lastState;
+    private lastAction;
+    /**
+     * Initialize SARSA plugin
+     */
+    protected onInitialize(): Promise<void>;
+    /**
+     * Select action using epsilon-greedy policy
+     *
+     * @param state - Current state vector
+     * @param context - Optional context
+     * @returns Selected action
+     */
+    selectAction(state: number[], context?: Context): Promise<Action>;
+    /**
+     * Select random action (exploration)
+     */
+    private randomAction;
+    /**
+     * Select greedy action (exploitation)
+     */
+    private greedyAction;
+    /**
+     * Store experience and perform SARSA update
+     *
+     * SARSA uses the actual next action taken, not the max Q-value
+     */
+    protected onStoreExperience(experience: Experience): Promise<void>;
+    /**
+     * Perform SARSA(λ) update with eligibility traces
+     */
+    private sarsaUpdate;
+    /**
+     * Train SARSA on stored experiences
+     *
+     * For online learning, this is called after each experience.
+     * For offline learning, this processes batches of episodes.
+     */
+    train(options?: TrainOptions): Promise<TrainingMetrics>;
+    /**
+     * Get Q-value for state-action pair
+     */
+    private getQValue;
+    /**
+     * Set Q-value for state-action pair
+     */
+    private setQValue;
+    /**
+     * Hash state vector to string key
+     */
+    private hashState;
+    /**
+     * Hash action to string key
+     */
+    private hashAction;
+    /**
+     * Get action embedding from ID
+     */
+    private getActionEmbedding;
+    /**
+     * Normalize Q-value to 0-1 confidence
+     */
+    private normalizeQValue;
+    /**
+     * Save Q-table and eligibility traces
+     */
+    protected onSave(path: string): Promise<void>;
+    /**
+     * Load Q-table and eligibility traces
+     */
+    protected onLoad(path: string): Promise<void>;
+}
+//# sourceMappingURL=sarsa.d.ts.map

package/dist/plugins/implementations/sarsa.d.ts.map ADDED Viewed

@@ -0,0 +1 @@

+ {"version":3,"file":"sarsa.d.ts","sourceRoot":"","sources":["../../../src/plugins/implementations/sarsa.ts"],"names":[],"mappings":"AAAA;;;;;;;;;;;;;;;GAeG;AAEH,OAAO,EAAE,UAAU,EAAE,MAAM,gBAAgB,CAAC;AAC5C,OAAO,EACL,MAAM,EACN,OAAO,EACP,UAAU,EACV,YAAY,EACZ,eAAe,EAChB,MAAM,8BAA8B,CAAC;AA8EtC;;GAEG;AACH,qBAAa,WAAY,SAAQ,UAAU;IAClC,IAAI,SAAW;IACf,OAAO,SAAW;IAEzB,OAAO,CAAC,MAAM,CAA+C;IAC7D,OAAO,CAAC,OAAO,CAAe;IAC9B,OAAO,CAAC,UAAU,CAAgB;IAClC,OAAO,CAAC,YAAY,CAAiB;IACrC,OAAO,CAAC,iBAAiB,CAAoB;IAC7C,OAAO,CAAC,MAAM,CAAe;IAC7B,OAAO,CAAC,SAAS,CAAyB;IAC1C,OAAO,CAAC,UAAU,CAAa;IAE/B;;OAEG;cACa,YAAY,IAAI,OAAO,CAAC,IAAI,CAAC;IAc7C;;;;;;OAMG;IACG,YAAY,CAAC,KAAK,EAAE,MAAM,EAAE,EAAE,OAAO,CAAC,EAAE,OAAO,GAAG,OAAO,CAAC,MAAM,CAAC;IAYvE;;OAEG;YACW,YAAY;IAuC1B;;OAEG;YACW,YAAY;IA+C1B;;;;OAIG;cACa,iBAAiB,CAAC,UAAU,EAAE,UAAU,GAAG,OAAO,CAAC,IAAI,CAAC;IAyBxE;;OAEG;YACW,WAAW;IAuCzB;;;;;OAKG;IACG,KAAK,CAAC,OAAO,CAAC,EAAE,YAAY,GAAG,OAAO,CAAC,eAAe,CAAC;IA4B7D;;OAEG;IACH,OAAO,CAAC,SAAS;IAKjB;;OAEG;IACH,OAAO,CAAC,SAAS;IAOjB;;OAEG;IACH,OAAO,CAAC,SAAS;IAKjB;;OAEG;IACH,OAAO,CAAC,UAAU;IAYlB;;OAEG;YACW,kBAAkB;IAMhC;;OAEG;IACH,OAAO,CAAC,eAAe;IAIvB;;OAEG;cACa,MAAM,CAAC,IAAI,EAAE,MAAM,GAAG,OAAO,CAAC,IAAI,CAAC;IAKnD;;OAEG;cACa,MAAM,CAAC,IAAI,EAAE,MAAM,GAAG,OAAO,CAAC,IAAI,CAAC;CAIpD"}