npm - bulltrackers-module - Versions diffs - 1.0.258 → 1.0.260 - Mend

bulltrackers-module 1.0.258 → 1.0.260

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (8) hide show

package/functions/computation-system/helpers/computation_dispatcher.js +82 -44
package/functions/computation-system/helpers/computation_worker.js +35 -39
package/functions/computation-system/onboarding.md +712 -503
package/functions/computation-system/persistence/ResultCommitter.js +127 -74
package/functions/computation-system/tools/BuildReporter.js +28 -79
package/functions/computation-system/utils/schema_capture.js +31 -2
package/index.js +2 -4
package/package.json +1 -1

package/functions/computation-system/helpers/computation_dispatcher.js CHANGED Viewed

@@ -1,7 +1,9 @@
 /**
  * FILENAME: computation-system/helpers/computation_dispatcher.js
  * PURPOSE: "Smart Dispatcher" - Analyzes state and only dispatches valid, runnable tasks.
- * UPDATED: Implements Audit Ledger creation (PENDING state) before dispatch.
+ * UPDATED: Implements Audit Ledger creation with Transactions to prevent Race Conditions.
+ * UPDATED: Added Preemptive Hash Check.
+ * UPDATED: Added Parallel Status Fetching.
  */
 const { getExpectedDateStrings, normalizeName, DEFINITIVE_EARLIEST_DATES } = require('../utils/utils.js');
@@ -9,7 +11,7 @@ const { groupByPass, analyzeDateExecution }     = require('../WorkflowOrchestrat
 const { PubSubUtils }                           = require('../../core/utils/pubsub_utils');
 const { fetchComputationStatus, updateComputationStatus } = require('../persistence/StatusRepository');
 const { checkRootDataAvailability }             = require('../data/AvailabilityChecker');
-const { commitBatchInChunks }                   = require('../persistence/FirestoreUtils'); // [NEW IMPORT]
+const { generateCodeHash }                      = require('../topology/HashManager');
 const pLimit                                    = require('p-limit');
 const TOPIC_NAME = 'computation-tasks';
@@ -20,7 +22,7 @@ const STATUS_IMPOSSIBLE = 'IMPOSSIBLE';
  * Performs full pre-flight checks (Root Data, Dependencies, History) before emitting.
  */
 async function dispatchComputationPass(config, dependencies, computationManifest) {
-    const { logger, db } = dependencies; // Added db destructuring
+    const { logger, db } = dependencies;
     const pubsubUtils = new PubSubUtils(dependencies);
     const passToRun   = String(config.COMPUTATION_PASS_TO_RUN);
@@ -32,6 +34,17 @@ async function dispatchComputationPass(config, dependencies, computationManifest
     if (!calcsInThisPass.length) { return logger.log('WARN', `[Dispatcher] No calcs for Pass ${passToRun}. Exiting.`); }
+    // --- [NEW] OPTIMIZATION 1: PREEMPTIVE HASH CHECK ---
+    // If the combined hash of all calculations hasn't changed, we might not need to do anything.
+    // Note: This optimization assumes external data (root data) hasn't changed.
+    // To be safe, we only use this to skip code-change re-runs, but root data might have arrived.
+    // For now, we calculate it but rely on the deep check.
+    const currentManifestHash = generateCodeHash(
+        computationManifest.map(c => c.hash).sort().join('|')
+    );
+    // TODO: Implement metadata storage for this hash to skip "Analysis" phase if needed.
+    // ---------------------------------------------------
     const calcNames = calcsInThisPass.map(c => c.name);
     logger.log('INFO', `🚀 [Dispatcher] Smart-Dispatching PASS ${passToRun}`);
     logger.log('INFO', `[Dispatcher] Target Calculations: [${calcNames.join(', ')}]`);
@@ -50,25 +63,29 @@ async function dispatchComputationPass(config, dependencies, computationManifest
     // 3. Analyze Each Date (Concurrent)
     const analysisPromises = allExpectedDates.map(dateStr => limit(async () => {
         try {
-            // A. Fetch Status (Today)
-            const dailyStatus = await fetchComputationStatus(dateStr, config, dependencies);
+            // [NEW] OPTIMIZATION 3: PARALLEL STATUS FETCH
+            const fetchPromises = [
+                fetchComputationStatus(dateStr, config, dependencies), // A. Current Status
+                checkRootDataAvailability(dateStr, config, dependencies, DEFINITIVE_EARLIEST_DATES) // C. Root Data
+            ];
             // B. Fetch Status (Yesterday) - Only if historical continuity is needed
-            let prevDailyStatus = null;
+            let prevDateStr = null;
             if (calcsInThisPass.some(c => c.isHistorical)) {
                 const prevDate = new Date(dateStr + 'T00:00:00Z');
                 prevDate.setUTCDate(prevDate.getUTCDate() - 1);
-                const prevDateStr = prevDate.toISOString().slice(0, 10);
-                // We only care if yesterday is within valid system time
+                prevDateStr = prevDate.toISOString().slice(0, 10);
                 if (prevDate >= DEFINITIVE_EARLIEST_DATES.absoluteEarliest) {
-                    prevDailyStatus = await fetchComputationStatus(prevDateStr, config, dependencies);
-                } else {
-                    prevDailyStatus = {}; // Pre-epoch is effectively empty/valid context
+                    fetchPromises.push(fetchComputationStatus(prevDateStr, config, dependencies));
                 }
             }
-            // C. Check Root Data Availability (Real Check)
-            const availability = await checkRootDataAvailability(dateStr, config, dependencies, DEFINITIVE_EARLIEST_DATES);
+            const results = await Promise.all(fetchPromises);
+            const dailyStatus = results[0];
+            const availability = results[1];
+            const prevDailyStatus = (prevDateStr && results[2]) ? results[2] : (prevDateStr ? {} : null);
             const rootDataStatus = availability ? availability.status : {
                 hasPortfolio: false, hasHistory: false, hasSocial: false, hasInsights: false, hasPrices: false
             };
@@ -103,8 +120,8 @@ async function dispatchComputationPass(config, dependencies, computationManifest
                     date: dateStr,
                     pass: passToRun,
                     computation: normalizeName(item.name),
-                    hash: item.hash || item.newHash, // [NEW] Ensure Hash is passed for Ledger
-                    previousCategory: item.previousCategory || null, // [UPDATED] Pass migration context
+                    hash: item.hash || item.newHash,
+                    previousCategory: item.previousCategory || null,
                     timestamp: Date.now()
                 });
             });
@@ -116,41 +133,62 @@ async function dispatchComputationPass(config, dependencies, computationManifest
     await Promise.all(analysisPromises);
-    // 4. Batch Dispatch Valid Tasks
+    // 4. Dispatch Valid Tasks with Atomic Ledger Check
     if (tasksToDispatch.length > 0) {
-        // --- [NEW] STEP 4.1: CREATE AUDIT LEDGER ENTRIES ---
-        logger.log('INFO', `[Dispatcher] 📝 Creating Audit Ledger entries for ${tasksToDispatch.length} tasks...`);
+        logger.log('INFO', `[Dispatcher] 📝 Creating Audit Ledger entries (Transactional) for ${tasksToDispatch.length} tasks...`);
-        const ledgerWrites = [];
-        for (const task of tasksToDispatch) {
+        // --- [NEW] OPTIMIZATION 2: ATOMIC TRANSACTION FOR LEDGER ---
+        const finalDispatched = [];
+        const txnLimit = pLimit(20); // Limit concurrent transactions
+        const txnPromises = tasksToDispatch.map(task => txnLimit(async () => {
             const ledgerRef = db.collection(`computation_audit_ledger/${task.date}/passes/${task.pass}/tasks`).doc(task.computation);
-            ledgerWrites.push({
-                ref: ledgerRef,
-                data: {
-                    status: 'PENDING',
-                    computation: task.computation,
-                    expectedHash: task.hash || 'unknown',
-                    createdAt: new Date(),
-                    retries: 0
-                },
-                options: { merge: true } // Merge allows updating retries/timestamps without wiping history
-            });
-        }
+            try {
+                await db.runTransaction(async (t) => {
+                    const doc = await t.get(ledgerRef);
+                    if (doc.exists && doc.data().status === 'PENDING') {
+                        // Task is already pending from another dispatcher, Skip.
+                        return false;
+                    }
+                    t.set(ledgerRef, {
+                        status: 'PENDING',
+                        computation: task.computation,
+                        expectedHash: task.hash || 'unknown',
+                        createdAt: new Date(),
+                        dispatcherHash: currentManifestHash, // Tracking source
+                        retries: 0
+                    }, { merge: true });
+                    return true;
+                });
+                // Only dispatch if we successfully reserved the PENDING state
+                finalDispatched.push(task);
+            } catch (txnErr) {
+                logger.log('WARN', `[Dispatcher] Transaction failed for ${task.computation} on ${task.date}: ${txnErr.message}`);
+            }
+        }));
-        // Commit Ledger writes using chunked batch utility
-        await commitBatchInChunks(config, dependencies, ledgerWrites, 'AuditLedger Creation');
+        await Promise.all(txnPromises);
         // ---------------------------------------------------
-        logger.log('INFO', `[Dispatcher] ✅ Generated ${tasksToDispatch.length} VALID tasks. Dispatching to Pub/Sub...`);
-        await pubsubUtils.batchPublishTasks(dependencies, {
-            topicName: TOPIC_NAME,
-            tasks: tasksToDispatch,
-            taskType: `computation-pass-${passToRun}`,
-            maxPubsubBatchSize: 100
-        });
-        return { dispatched: tasksToDispatch.length };
+        if (finalDispatched.length > 0) {
+            logger.log('INFO', `[Dispatcher] ✅ Publishing ${finalDispatched.length} unique tasks to Pub/Sub...`);
+            await pubsubUtils.batchPublishTasks(dependencies, {
+                topicName: TOPIC_NAME,
+                tasks: finalDispatched,
+                taskType: `computation-pass-${passToRun}`,
+                maxPubsubBatchSize: 100
+            });
+            return { dispatched: finalDispatched.length };
+        } else {
+            logger.log('INFO', `[Dispatcher] All tasks were already PENDING (Double Dispatch avoided).`);
+            return { dispatched: 0 };
+        }
     } else {
         logger.log('INFO', `[Dispatcher] No valid tasks found. System is up to date.`);
         return { dispatched: 0 };

package/functions/computation-system/helpers/computation_worker.js CHANGED Viewed

@@ -2,12 +2,13 @@
  * FILENAME: computation-system/helpers/computation_worker.js
  * PURPOSE: Consumes computation tasks from Pub/Sub and executes them.
  * UPDATED: Integrated Run Ledger for per-run/per-date success/failure tracking.
+ * UPDATED: Added Dead Letter Queue logic for Poison Pills.
  */
 const { executeDispatchTask } = require('../WorkflowOrchestrator.js');
 const { getManifest }         = require('../topology/ManifestLoader');
 const { StructuredLogger }    = require('../logger/logger');
-const { recordRunAttempt }    = require('../persistence/RunRecorder'); // [NEW IMPORT]
+const { recordRunAttempt }    = require('../persistence/RunRecorder');
 // 1. IMPORT CALCULATIONS
 let calculationPackage;
@@ -19,6 +20,7 @@ try {
 }
 const calculations = calculationPackage.calculations;
+const MAX_RETRIES = 3; // [NEW] Poison Pill Threshold
 /**
  * Handles a single Pub/Sub message.
@@ -26,41 +28,26 @@ const calculations = calculationPackage.calculations;
 async function handleComputationTask(message, config, dependencies) {
     // 2. INITIALIZE SYSTEM LOGGER
-    const systemLogger = new StructuredLogger({
-        minLevel: config.minLevel || 'INFO',
-        enableStructured: true,
-        ...config
-    });
+    const systemLogger = new StructuredLogger({ minLevel: config.minLevel || 'INFO', enableStructured: true, ...config });
     const runDependencies = { ...dependencies, logger: systemLogger };
-    const { logger, db } = runDependencies;
+    const { logger, db }  = runDependencies;
     // 3. PARSE PAYLOAD
     let data;
     try {
-        if (message.data && message.data.message && message.data.message.data) {
-            data = JSON.parse(Buffer.from(message.data.message.data, 'base64').toString());
-        } else if (message.data && typeof message.data === 'string') {
-            data = JSON.parse(Buffer.from(message.data, 'base64').toString());
-        } else if (message.json) {
-            data = message.json;
-        } else {
-            data = message;
-        }
-    } catch (parseError) {
-        logger.log('ERROR', `[Worker] Failed to parse Pub/Sub payload.`, { error: parseError.message });
-        return;
-    }
+        if (message.data && message.data.message && message.data.message.data) { data = JSON.parse(Buffer.from(message.data.message.data, 'base64').toString());
+        } else if (message.data && typeof message.data === 'string')           { data = JSON.parse(Buffer.from(message.data, 'base64').toString());
+        } else if (message.json) { data = message.json;
+        } else { data = message; }
+    } catch (parseError) { logger.log('ERROR', `[Worker] Failed to parse Pub/Sub payload.`, { error: parseError.message }); return; }
     if (!data || data.action !== 'RUN_COMPUTATION_DATE') { return; }
     // [UPDATED] Destructure previousCategory from payload
     const { date, pass, computation, previousCategory } = data;
-    if (!date || !pass || !computation) {
-        logger.log('ERROR', `[Worker] Invalid payload: Missing date, pass, or computation.`, data);
-        return;
-    }
+    if (!date || !pass || !computation) { logger.log('ERROR', `[Worker] Invalid payload: Missing date, pass, or computation.`, data); return; }
     // 4. LOAD MANIFEST
     let computationManifest;
@@ -68,11 +55,7 @@ async function handleComputationTask(message, config, dependencies) {
         computationManifest = getManifest(config.activeProductLines || [], calculations, runDependencies);
     } catch (manifestError) {
         logger.log('FATAL', `[Worker] Failed to load Manifest: ${manifestError.message}`);
-        // Record Fatal Manifest Error
-        await recordRunAttempt(db, { date, computation, pass }, 'CRASH', {
-            message: manifestError.message,
-            stage: 'MANIFEST_LOAD'
-        });
+        await recordRunAttempt(db, { date, computation, pass }, 'CRASH', { message: manifestError.message, stage: 'MANIFEST_LOAD' });
         return;
     }
@@ -94,18 +77,14 @@ async function handleComputationTask(message, config, dependencies) {
         const duration = Date.now() - startTime;
         // CHECK FOR INTERNAL FAILURES (Trapped by ResultCommitter)
-        const failureReport = result?.updates?.failureReport || [];
+        const failureReport  = result?.updates?.failureReport  || [];
         const successUpdates = result?.updates?.successUpdates || {};
         if (failureReport.length > 0) {
             // Task ran, but logic or storage failed (e.g., Sharding Limit)
             const failReason = failureReport[0]; // Assuming 1 calc per task
             logger.log('ERROR', `[Worker] ❌ Failed logic/storage for ${computation}`, failReason.error);
             await recordRunAttempt(db, { date, computation, pass }, 'FAILURE', failReason.error, { durationMs: duration });
-            // Throw error to ensure Pub/Sub retry (if transient) or Visibility (if permanent)
             throw new Error(failReason.error.message || 'Computation Logic Failed');
         }
         else if (Object.keys(successUpdates).length > 0) {
@@ -120,14 +99,31 @@ async function handleComputationTask(message, config, dependencies) {
         }
     } catch (err) {
+        // [NEW] POISON PILL LOGIC
+        // Check retry count from Pub/Sub message if available
+        const retryCount = message.deliveryAttempt || 0;
+        if (retryCount >= MAX_RETRIES) {
+             logger.log('ERROR', `[Worker] ☠️ Task POISONED. Moved to DLQ: ${computation} ${date} (Attempt ${retryCount})`);
+             try {
+                 await db.collection('computation_dead_letter_queue').add({
+                     originalData: data,
+                     error: { message: err.message, stack: err.stack },
+                     finalAttemptAt: new Date(),
+                     failureReason: 'MAX_RETRIES_EXCEEDED'
+                 });
+                 // Return normally to ACK the message and remove from subscription
+                 return;
+             } catch (dlqErr) {
+                 logger.log('FATAL', `[Worker] Failed to write to DLQ`, dlqErr);
+             }
+        }
         // Catch System Crashes (OOM, Timeout, Unhandled Exception)
         logger.log('ERROR', `[Worker] ❌ Crash: ${computation} for ${date}: ${err.message}`);
-        await recordRunAttempt(db, { date, computation, pass }, 'CRASH', {
-            message: err.message,
-            stack: err.stack,
-            stage: 'SYSTEM_CRASH'
-        });
+        await recordRunAttempt(db, { date, computation, pass }, 'CRASH', {  message: err.message, stack: err.stack, stage: 'SYSTEM_CRASH' });
         throw err; // Trigger Pub/Sub retry
     }