PyPI - mcli-framework - Versions diffs - 7.1.0__py3-none-any.whl → 7.1.2__py3-none-any.whl - Mend

mcli-framework 7.1.0py3-none-any.whl → 7.1.2py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Potentially problematic release.

This version of mcli-framework might be problematic. Click here for more details.

Files changed (94) hide show

mcli/app/completion_cmd.py +59 -49
mcli/app/completion_helpers.py +60 -138
mcli/app/logs_cmd.py +46 -13
mcli/app/main.py +17 -14
mcli/app/model_cmd.py +19 -4
mcli/chat/chat.py +3 -2
mcli/lib/search/cached_vectorizer.py +1 -0
mcli/lib/services/data_pipeline.py +12 -5
mcli/lib/services/lsh_client.py +69 -58
mcli/ml/api/app.py +28 -36
mcli/ml/api/middleware.py +8 -16
mcli/ml/api/routers/admin_router.py +3 -1
mcli/ml/api/routers/auth_router.py +32 -56
mcli/ml/api/routers/backtest_router.py +3 -1
mcli/ml/api/routers/data_router.py +3 -1
mcli/ml/api/routers/model_router.py +35 -74
mcli/ml/api/routers/monitoring_router.py +3 -1
mcli/ml/api/routers/portfolio_router.py +3 -1
mcli/ml/api/routers/prediction_router.py +60 -65
mcli/ml/api/routers/trade_router.py +6 -2
mcli/ml/api/routers/websocket_router.py +12 -9
mcli/ml/api/schemas.py +10 -2
mcli/ml/auth/auth_manager.py +49 -114
mcli/ml/auth/models.py +30 -15
mcli/ml/auth/permissions.py +12 -19
mcli/ml/backtesting/backtest_engine.py +134 -108
mcli/ml/backtesting/performance_metrics.py +142 -108
mcli/ml/cache.py +12 -18
mcli/ml/cli/main.py +37 -23
mcli/ml/config/settings.py +29 -12
mcli/ml/dashboard/app.py +122 -130
mcli/ml/dashboard/app_integrated.py +283 -152
mcli/ml/dashboard/app_supabase.py +176 -108
mcli/ml/dashboard/app_training.py +212 -206
mcli/ml/dashboard/cli.py +14 -5
mcli/ml/data_ingestion/api_connectors.py +51 -81
mcli/ml/data_ingestion/data_pipeline.py +127 -125
mcli/ml/data_ingestion/stream_processor.py +72 -80
mcli/ml/database/migrations/env.py +3 -2
mcli/ml/database/models.py +112 -79
mcli/ml/database/session.py +6 -5
mcli/ml/experimentation/ab_testing.py +149 -99
mcli/ml/features/ensemble_features.py +9 -8
mcli/ml/features/political_features.py +6 -5
mcli/ml/features/recommendation_engine.py +15 -14
mcli/ml/features/stock_features.py +7 -6
mcli/ml/features/test_feature_engineering.py +8 -7
mcli/ml/logging.py +10 -15
mcli/ml/mlops/data_versioning.py +57 -64
mcli/ml/mlops/experiment_tracker.py +49 -41
mcli/ml/mlops/model_serving.py +59 -62
mcli/ml/mlops/pipeline_orchestrator.py +203 -149
mcli/ml/models/base_models.py +8 -7
mcli/ml/models/ensemble_models.py +6 -5
mcli/ml/models/recommendation_models.py +7 -6
mcli/ml/models/test_models.py +18 -14
mcli/ml/monitoring/drift_detection.py +95 -74
mcli/ml/monitoring/metrics.py +10 -22
mcli/ml/optimization/portfolio_optimizer.py +172 -132
mcli/ml/predictions/prediction_engine.py +235 -0
mcli/ml/preprocessing/data_cleaners.py +6 -5
mcli/ml/preprocessing/feature_extractors.py +7 -6
mcli/ml/preprocessing/ml_pipeline.py +3 -2
mcli/ml/preprocessing/politician_trading_preprocessor.py +11 -10
mcli/ml/preprocessing/test_preprocessing.py +4 -4
mcli/ml/scripts/populate_sample_data.py +36 -16
mcli/ml/tasks.py +82 -83
mcli/ml/tests/test_integration.py +86 -76
mcli/ml/tests/test_training_dashboard.py +169 -142
mcli/mygroup/test_cmd.py +2 -1
mcli/self/self_cmd.py +38 -18
mcli/self/test_cmd.py +2 -1
mcli/workflow/dashboard/dashboard_cmd.py +13 -6
mcli/workflow/lsh_integration.py +46 -58
mcli/workflow/politician_trading/commands.py +576 -427
mcli/workflow/politician_trading/config.py +7 -7
mcli/workflow/politician_trading/connectivity.py +35 -33
mcli/workflow/politician_trading/data_sources.py +72 -71
mcli/workflow/politician_trading/database.py +18 -16
mcli/workflow/politician_trading/demo.py +4 -3
mcli/workflow/politician_trading/models.py +5 -5
mcli/workflow/politician_trading/monitoring.py +13 -13
mcli/workflow/politician_trading/scrapers.py +332 -224
mcli/workflow/politician_trading/scrapers_california.py +116 -94
mcli/workflow/politician_trading/scrapers_eu.py +70 -71
mcli/workflow/politician_trading/scrapers_uk.py +118 -90
mcli/workflow/politician_trading/scrapers_us_states.py +125 -92
mcli/workflow/politician_trading/workflow.py +98 -71
{mcli_framework-7.1.0.dist-info → mcli_framework-7.1.2.dist-info}/METADATA +2 -2
{mcli_framework-7.1.0.dist-info → mcli_framework-7.1.2.dist-info}/RECORD +94 -93
{mcli_framework-7.1.0.dist-info → mcli_framework-7.1.2.dist-info}/WHEEL +0 -0
{mcli_framework-7.1.0.dist-info → mcli_framework-7.1.2.dist-info}/entry_points.txt +0 -0
{mcli_framework-7.1.0.dist-info → mcli_framework-7.1.2.dist-info}/licenses/LICENSE +0 -0
{mcli_framework-7.1.0.dist-info → mcli_framework-7.1.2.dist-info}/top_level.txt +0 -0

mcli/ml/mlops/pipeline_orchestrator.py CHANGED Viewed

@@ -1,28 +1,42 @@
 """End-to-end ML pipeline orchestrator"""
-import sys
 import os
+import sys
 sys.path.insert(0, os.path.join(os.path.dirname(__file__), "../.."))
-from typing import Dict, Any, Optional, List, Callable, Union
+import json
+import logging
+import pickle
 from dataclasses import dataclass, field
+from datetime import datetime
 from enum import Enum
 from pathlib import Path
-import pandas as pd
+from typing import Any, Callable, Dict, List, Optional, Union
 import numpy as np
+import pandas as pd
 import torch
-import logging
-from datetime import datetime
-import json
-import pickle
-from ml.preprocessing.data_processor import DataProcessor, ProcessingConfig
-from ml.features.stock_features import StockRecommendationFeatures
-from ml.features.political_features import PoliticalInfluenceFeatures
 from ml.features.ensemble_features import EnsembleFeatureBuilder
-from ml.features.recommendation_engine import StockRecommendationEngine, RecommendationConfig as FeatureRecommendationConfig
-from ml.models.ensemble_models import DeepEnsembleModel, EnsembleConfig, ModelConfig, EnsembleTrainer
-from ml.models.recommendation_models import StockRecommendationModel, RecommendationConfig, RecommendationTrainer
+from ml.features.political_features import PoliticalInfluenceFeatures
+from ml.features.recommendation_engine import RecommendationConfig as FeatureRecommendationConfig
+from ml.features.recommendation_engine import (
+    StockRecommendationEngine,
+)
+from ml.features.stock_features import StockRecommendationFeatures
+from ml.models.ensemble_models import (
+    DeepEnsembleModel,
+    EnsembleConfig,
+    EnsembleTrainer,
+    ModelConfig,
+)
+from ml.models.recommendation_models import (
+    RecommendationConfig,
+    RecommendationTrainer,
+    StockRecommendationModel,
+)
+from ml.preprocessing.data_processor import DataProcessor, ProcessingConfig
 from .experiment_tracker import ExperimentTracker, MLflowConfig
 logger = logging.getLogger(__name__)
@@ -30,6 +44,7 @@ logger = logging.getLogger(__name__)
 class PipelineStage(Enum):
     """Pipeline execution stages"""
     DATA_INGESTION = "data_ingestion"
     DATA_PREPROCESSING = "data_preprocessing"
     FEATURE_ENGINEERING = "feature_engineering"
@@ -41,6 +56,7 @@ class PipelineStage(Enum):
 @dataclass
 class PipelineStep:
     """Individual pipeline step configuration"""
     name: str
     stage: PipelineStage
     function: Callable
@@ -55,6 +71,7 @@ class PipelineStep:
 @dataclass
 class PipelineConfig:
     """Complete pipeline configuration"""
     name: str = "politician-trading-ml-pipeline"
     version: str = "1.0.0"
     data_dir: Path = Path("data")
@@ -102,57 +119,76 @@ class MLPipeline:
     def _setup_default_pipeline(self):
         """Setup default pipeline steps"""
         # Data ingestion
-        self.add_step(PipelineStep(
-            name="load_raw_data",
-            stage=PipelineStage.DATA_INGESTION,
-            function=self._load_raw_data,
-            outputs=["raw_trading_data", "raw_stock_data"]
-        ))
+        self.add_step(
+            PipelineStep(
+                name="load_raw_data",
+                stage=PipelineStage.DATA_INGESTION,
+                function=self._load_raw_data,
+                outputs=["raw_trading_data", "raw_stock_data"],
+            )
+        )
         # Data preprocessing
-        self.add_step(PipelineStep(
-            name="preprocess_data",
-            stage=PipelineStage.DATA_PREPROCESSING,
-            function=self._preprocess_data,
-            inputs={"trading_data": "raw_trading_data", "stock_data": "raw_stock_data"},
-            outputs=["processed_trading_data", "processed_stock_data"]
-        ))
+        self.add_step(
+            PipelineStep(
+                name="preprocess_data",
+                stage=PipelineStage.DATA_PREPROCESSING,
+                function=self._preprocess_data,
+                inputs={"trading_data": "raw_trading_data", "stock_data": "raw_stock_data"},
+                outputs=["processed_trading_data", "processed_stock_data"],
+            )
+        )
         # Feature engineering
-        self.add_step(PipelineStep(
-            name="extract_features",
-            stage=PipelineStage.FEATURE_ENGINEERING,
-            function=self._extract_features,
-            inputs={"trading_data": "processed_trading_data", "stock_data": "processed_stock_data"},
-            outputs=["feature_matrix", "feature_names", "labels"]
-        ))
+        self.add_step(
+            PipelineStep(
+                name="extract_features",
+                stage=PipelineStage.FEATURE_ENGINEERING,
+                function=self._extract_features,
+                inputs={
+                    "trading_data": "processed_trading_data",
+                    "stock_data": "processed_stock_data",
+                },
+                outputs=["feature_matrix", "feature_names", "labels"],
+            )
+        )
         # Model training
-        self.add_step(PipelineStep(
-            name="train_model",
-            stage=PipelineStage.MODEL_TRAINING,
-            function=self._train_model,
-            inputs={"X": "feature_matrix", "y": "labels"},
-            outputs=["trained_model", "training_metrics"]
-        ))
+        self.add_step(
+            PipelineStep(
+                name="train_model",
+                stage=PipelineStage.MODEL_TRAINING,
+                function=self._train_model,
+                inputs={"X": "feature_matrix", "y": "labels"},
+                outputs=["trained_model", "training_metrics"],
+            )
+        )
         # Model evaluation
-        self.add_step(PipelineStep(
-            name="evaluate_model",
-            stage=PipelineStage.MODEL_EVALUATION,
-            function=self._evaluate_model,
-            inputs={"model": "trained_model", "X_test": "test_features", "y_test": "test_labels"},
-            outputs=["evaluation_metrics", "predictions"]
-        ))
+        self.add_step(
+            PipelineStep(
+                name="evaluate_model",
+                stage=PipelineStage.MODEL_EVALUATION,
+                function=self._evaluate_model,
+                inputs={
+                    "model": "trained_model",
+                    "X_test": "test_features",
+                    "y_test": "test_labels",
+                },
+                outputs=["evaluation_metrics", "predictions"],
+            )
+        )
         # Model deployment
-        self.add_step(PipelineStep(
-            name="deploy_model",
-            stage=PipelineStage.MODEL_DEPLOYMENT,
-            function=self._deploy_model,
-            inputs={"model": "trained_model", "metrics": "evaluation_metrics"},
-            outputs=["deployment_info"]
-        ))
+        self.add_step(
+            PipelineStep(
+                name="deploy_model",
+                stage=PipelineStage.MODEL_DEPLOYMENT,
+                function=self._deploy_model,
+                inputs={"model": "trained_model", "metrics": "evaluation_metrics"},
+                outputs=["deployment_info"],
+            )
+        )
     def add_step(self, step: PipelineStep):
         """Add step to pipeline"""
@@ -179,15 +215,15 @@ class MLPipeline:
             # Generate mock data for testing
             stock_data = self._generate_mock_stock_data()
-        logger.info(f"Loaded {len(trading_data)} trading records and {len(stock_data)} stock prices")
+        logger.info(
+            f"Loaded {len(trading_data)} trading records and {len(stock_data)} stock prices"
+        )
-        return {
-            "raw_trading_data": trading_data,
-            "raw_stock_data": stock_data
-        }
+        return {"raw_trading_data": trading_data, "raw_stock_data": stock_data}
-    def _preprocess_data(self, trading_data: pd.DataFrame,
-                        stock_data: pd.DataFrame) -> Dict[str, pd.DataFrame]:
+    def _preprocess_data(
+        self, trading_data: pd.DataFrame, stock_data: pd.DataFrame
+    ) -> Dict[str, pd.DataFrame]:
         """Preprocess raw data"""
         logger.info("Preprocessing data...")
@@ -200,8 +236,8 @@ class MLPipeline:
         # Process stock data (ensure proper format)
         processed_stock = stock_data.copy()
-        if 'date' in processed_stock.columns and processed_stock['date'].dtype == 'object':
-            processed_stock['date'] = pd.to_datetime(processed_stock['date'])
+        if "date" in processed_stock.columns and processed_stock["date"].dtype == "object":
+            processed_stock["date"] = pd.to_datetime(processed_stock["date"])
         # Clean and validate
         processed_trading = self.data_processor.clean_data(processed_trading)
@@ -211,11 +247,12 @@ class MLPipeline:
         return {
             "processed_trading_data": processed_trading,
-            "processed_stock_data": processed_stock
+            "processed_stock_data": processed_stock,
         }
-    def _extract_features(self, trading_data: pd.DataFrame,
-                         stock_data: pd.DataFrame) -> Dict[str, Any]:
+    def _extract_features(
+        self, trading_data: pd.DataFrame, stock_data: pd.DataFrame
+    ) -> Dict[str, Any]:
         """Extract features from preprocessed data"""
         logger.info("Extracting features...")
@@ -255,7 +292,7 @@ class MLPipeline:
         return {
             "feature_matrix": feature_df.values,
             "feature_names": feature_names,
-            "labels": labels
+            "labels": labels,
         }
     def _train_model(self, X: np.ndarray, y: np.ndarray) -> Dict[str, Any]:
@@ -280,7 +317,7 @@ class MLPipeline:
                 learning_rate=0.001,
                 weight_decay=1e-4,
                 batch_size=32,
-                epochs=10
+                epochs=10,
             ),
             ModelConfig(
                 model_type="attention",
@@ -289,19 +326,16 @@ class MLPipeline:
                 learning_rate=0.001,
                 weight_decay=1e-4,
                 batch_size=32,
-                epochs=10
-            )
+                epochs=10,
+            ),
         ]
         ensemble_config = EnsembleConfig(
-            base_models=model_configs,
-            ensemble_method="weighted_average"
+            base_models=model_configs, ensemble_method="weighted_average"
         )
         recommendation_config = RecommendationConfig(
-            ensemble_config=ensemble_config,
-            risk_adjustment=True,
-            confidence_threshold=0.6
+            ensemble_config=ensemble_config, risk_adjustment=True, confidence_threshold=0.6
         )
         # Create and train model
@@ -317,9 +351,16 @@ class MLPipeline:
         # Train model
         trainer = RecommendationTrainer(self.model, recommendation_config)
         result = trainer.train(
-            X_train, y_train, returns_train, risk_labels_train,
-            X_val, y_val, returns_val, risk_labels_val,
-            epochs=10, batch_size=32
+            X_train,
+            y_train,
+            returns_train,
+            risk_labels_train,
+            X_val,
+            y_val,
+            returns_val,
+            risk_labels_val,
+            epochs=10,
+            batch_size=32,
         )
         # Extract metrics
@@ -331,18 +372,16 @@ class MLPipeline:
             "val_accuracy": result.val_metrics.accuracy,
             "val_precision": result.val_metrics.precision,
             "val_recall": result.val_metrics.recall,
-            "val_f1": result.val_metrics.f1_score
+            "val_f1": result.val_metrics.f1_score,
         }
         logger.info(f"Model trained - Val accuracy: {training_metrics['val_accuracy']:.3f}")
-        return {
-            "trained_model": self.model,
-            "training_metrics": training_metrics
-        }
+        return {"trained_model": self.model, "training_metrics": training_metrics}
-    def _evaluate_model(self, model: StockRecommendationModel,
-                       X_test: np.ndarray, y_test: np.ndarray) -> Dict[str, Any]:
+    def _evaluate_model(
+        self, model: StockRecommendationModel, X_test: np.ndarray, y_test: np.ndarray
+    ) -> Dict[str, Any]:
         """Evaluate trained model"""
         logger.info("Evaluating model...")
@@ -351,13 +390,21 @@ class MLPipeline:
         probabilities = model.predict_proba(X_test)
         # Calculate metrics
-        from sklearn.metrics import accuracy_score, precision_score, recall_score, f1_score, roc_auc_score
+        from sklearn.metrics import (
+            accuracy_score,
+            f1_score,
+            precision_score,
+            recall_score,
+            roc_auc_score,
+        )
         evaluation_metrics = {
             "test_accuracy": accuracy_score(y_test, predictions),
-            "test_precision": precision_score(y_test, predictions, average='weighted', zero_division=0),
-            "test_recall": recall_score(y_test, predictions, average='weighted', zero_division=0),
-            "test_f1": f1_score(y_test, predictions, average='weighted', zero_division=0)
+            "test_precision": precision_score(
+                y_test, predictions, average="weighted", zero_division=0
+            ),
+            "test_recall": recall_score(y_test, predictions, average="weighted", zero_division=0),
+            "test_f1": f1_score(y_test, predictions, average="weighted", zero_division=0),
         }
         # Calculate AUC if binary classification
@@ -369,35 +416,37 @@ class MLPipeline:
         logger.info(f"Model evaluation - Test accuracy: {evaluation_metrics['test_accuracy']:.3f}")
-        return {
-            "evaluation_metrics": evaluation_metrics,
-            "predictions": predictions
-        }
+        return {"evaluation_metrics": evaluation_metrics, "predictions": predictions}
-    def _deploy_model(self, model: StockRecommendationModel,
-                     metrics: Dict[str, float]) -> Dict[str, Any]:
+    def _deploy_model(
+        self, model: StockRecommendationModel, metrics: Dict[str, float]
+    ) -> Dict[str, Any]:
         """Deploy model (save to disk)"""
         logger.info("Deploying model...")
         # Save model
         model_path = self.config.model_dir / f"model_{datetime.now().strftime('%Y%m%d_%H%M%S')}.pt"
-        torch.save({
-            'model_state_dict': model.state_dict(),
-            'metrics': metrics,
-            'config': model.recommendation_config
-        }, model_path)
+        torch.save(
+            {
+                "model_state_dict": model.state_dict(),
+                "metrics": metrics,
+                "config": model.recommendation_config,
+            },
+            model_path,
+        )
         deployment_info = {
             "model_path": str(model_path),
             "deployed_at": datetime.now().isoformat(),
-            "metrics": metrics
+            "metrics": metrics,
         }
         logger.info(f"Model deployed to {model_path}")
         return {"deployment_info": deployment_info}
-    def run(self, start_step: Optional[str] = None,
-           end_step: Optional[str] = None) -> Dict[str, Any]:
+    def run(
+        self, start_step: Optional[str] = None, end_step: Optional[str] = None
+    ) -> Dict[str, Any]:
         """Execute pipeline"""
         logger.info(f"Starting pipeline: {self.config.name} v{self.config.version}")
@@ -407,12 +456,14 @@ class MLPipeline:
             self.experiment_tracker.start_run(run_name, self.config.tags)
             # Log pipeline config
-            self.experiment_tracker.log_params({
-                "pipeline_name": self.config.name,
-                "pipeline_version": self.config.version,
-                "enable_caching": self.config.enable_caching,
-                "parallel_execution": self.config.parallel_execution
-            })
+            self.experiment_tracker.log_params(
+                {
+                    "pipeline_name": self.config.name,
+                    "pipeline_version": self.config.version,
+                    "enable_caching": self.config.enable_caching,
+                    "parallel_execution": self.config.parallel_execution,
+                }
+            )
         # Execute steps
         start_idx = 0
@@ -421,7 +472,9 @@ class MLPipeline:
         if start_step:
             start_idx = next((i for i, s in enumerate(self.steps) if s.name == start_step), 0)
         if end_step:
-            end_idx = next((i+1 for i, s in enumerate(self.steps) if s.name == end_step), len(self.steps))
+            end_idx = next(
+                (i + 1 for i, s in enumerate(self.steps) if s.name == end_step), len(self.steps)
+            )
         for i, step in enumerate(self.steps[start_idx:end_idx], start=start_idx):
             if not step.enabled:
@@ -453,7 +506,9 @@ class MLPipeline:
                 # Log to MLflow
                 if self.experiment_tracker and "metrics" in str(result):
                     if isinstance(result, dict) and any("metric" in k for k in result.keys()):
-                        metrics_dict = result.get("training_metrics", result.get("evaluation_metrics", {}))
+                        metrics_dict = result.get(
+                            "training_metrics", result.get("evaluation_metrics", {})
+                        )
                         self.experiment_tracker.log_metrics(metrics_dict)
                 # Checkpoint if needed
@@ -473,9 +528,7 @@ class MLPipeline:
                     self.artifacts.get("feature_matrix", np.random.randn(5, 100))[:5]
                 )
                 self.experiment_tracker.log_model(
-                    self.model,
-                    "recommendation_model",
-                    input_example=example_input
+                    self.model, "recommendation_model", input_example=example_input
                 )
             except Exception as e:
                 logger.warning(f"Could not log model to MLflow: {e}")
@@ -486,11 +539,7 @@ class MLPipeline:
         logger.info("Pipeline execution completed successfully")
-        return {
-            "artifacts": self.artifacts,
-            "metrics": self.metrics,
-            "model": self.model
-        }
+        return {"artifacts": self.artifacts, "metrics": self.metrics, "model": self.model}
     def _save_checkpoint(self, step_number: int):
         """Save pipeline checkpoint"""
@@ -498,20 +547,23 @@ class MLPipeline:
         checkpoint = {
             "step_number": step_number,
-            "artifacts": {k: v for k, v in self.artifacts.items()
-                        if not isinstance(v, (torch.nn.Module, type))},
+            "artifacts": {
+                k: v
+                for k, v in self.artifacts.items()
+                if not isinstance(v, (torch.nn.Module, type))
+            },
             "metrics": self.metrics,
-            "timestamp": datetime.now()
+            "timestamp": datetime.now(),
         }
-        with open(checkpoint_path, 'wb') as f:
+        with open(checkpoint_path, "wb") as f:
             pickle.dump(checkpoint, f)
         logger.debug(f"Saved checkpoint at step {step_number}")
     def load_checkpoint(self, checkpoint_path: Path):
         """Load pipeline checkpoint"""
-        with open(checkpoint_path, 'rb') as f:
+        with open(checkpoint_path, "rb") as f:
             checkpoint = pickle.load(f)
         self.artifacts.update(checkpoint["artifacts"])
@@ -529,13 +581,16 @@ class MLPipeline:
         data = []
         for _ in range(n_records):
-            data.append({
-                "politician_name_cleaned": np.random.choice(politicians),
-                "transaction_date_cleaned": pd.Timestamp.now() - pd.Timedelta(days=np.random.randint(1, 365)),
-                "transaction_amount_cleaned": np.random.uniform(1000, 500000),
-                "transaction_type_cleaned": np.random.choice(["buy", "sell"]),
-                "ticker_cleaned": np.random.choice(tickers)
-            })
+            data.append(
+                {
+                    "politician_name_cleaned": np.random.choice(politicians),
+                    "transaction_date_cleaned": pd.Timestamp.now()
+                    - pd.Timedelta(days=np.random.randint(1, 365)),
+                    "transaction_amount_cleaned": np.random.uniform(1000, 500000),
+                    "transaction_type_cleaned": np.random.choice(["buy", "sell"]),
+                    "ticker_cleaned": np.random.choice(tickers),
+                }
+            )
         return pd.DataFrame(data)
@@ -550,15 +605,17 @@ class MLPipeline:
             base_price = np.random.uniform(100, 500)
             for date in dates:
                 price = base_price * (1 + np.random.normal(0, 0.02))
-                data.append({
-                    "symbol": ticker,
-                    "date": date,
-                    "close": price,
-                    "volume": np.random.randint(1000000, 10000000),
-                    "open": price * 0.99,
-                    "high": price * 1.01,
-                    "low": price * 0.98
-                })
+                data.append(
+                    {
+                        "symbol": ticker,
+                        "date": date,
+                        "close": price,
+                        "volume": np.random.randint(1000000, 10000000),
+                        "open": price * 0.99,
+                        "high": price * 1.01,
+                        "low": price * 0.98,
+                    }
+                )
         return pd.DataFrame(data)
@@ -583,8 +640,9 @@ class PipelineExecutor:
         return self.pipelines[name].run(**kwargs)
-    def run_experiment(self, n_runs: int = 5,
-                      param_grid: Optional[Dict[str, List]] = None) -> pd.DataFrame:
+    def run_experiment(
+        self, n_runs: int = 5, param_grid: Optional[Dict[str, List]] = None
+    ) -> pd.DataFrame:
         """Run multiple experiments with different parameters"""
         results = []
@@ -604,11 +662,7 @@ class PipelineExecutor:
             result = pipeline.run()
             # Collect metrics
-            run_metrics = {
-                "run_id": i,
-                "pipeline_name": pipeline_name,
-                **result.get("metrics", {})
-            }
+            run_metrics = {"run_id": i, "pipeline_name": pipeline_name, **result.get("metrics", {})}
             results.append(run_metrics)
-        return pd.DataFrame(results)
+        return pd.DataFrame(results)

mcli/ml/models/base_models.py CHANGED Viewed

@@ -1,13 +1,14 @@
 """Base classes for ML models"""
-import torch
-import torch.nn as nn
+import logging
+from abc import ABC, abstractmethod
+from dataclasses import dataclass
+from typing import Any, Dict, List, Optional, Tuple, Union
 import numpy as np
 import pandas as pd
-from typing import Dict, List, Optional, Tuple, Any, Union
-from dataclasses import dataclass
-from abc import ABC, abstractmethod
-import logging
+import torch
+import torch.nn as nn
 logger = logging.getLogger(__name__)
@@ -136,9 +137,9 @@ class BaseStockModel(nn.Module, ABC):
         """Calculate comprehensive model metrics"""
         from sklearn.metrics import (
             accuracy_score,
+            f1_score,
             precision_score,
             recall_score,
-            f1_score,
             roc_auc_score,
         )

mcli/ml/models/ensemble_models.py CHANGED Viewed

@@ -1,13 +1,14 @@
 """Ensemble models for stock prediction"""
+import logging
+from dataclasses import dataclass
+from typing import Any, Dict, List, Optional, Tuple, Union
+import numpy as np
+import pandas as pd
 import torch
 import torch.nn as nn
 import torch.nn.functional as F
-import numpy as np
-import pandas as pd
-from typing import Dict, List, Optional, Tuple, Any, Union
-from dataclasses import dataclass
-import logging
 from base_models import BaseStockModel, ModelMetrics, ValidationResult
 logger = logging.getLogger(__name__)

mcli/ml/models/recommendation_models.py CHANGED Viewed

@@ -1,14 +1,15 @@
 """Stock recommendation models"""
+import logging
+from dataclasses import dataclass
+from datetime import datetime
+from typing import Any, Dict, List, Optional, Tuple, Union
+import numpy as np
+import pandas as pd
 import torch
 import torch.nn as nn
 import torch.nn.functional as F
-import numpy as np
-import pandas as pd
-from typing import Dict, List, Optional, Tuple, Any, Union
-from dataclasses import dataclass
-import logging
-from datetime import datetime
 from base_models import BaseStockModel, ModelMetrics, ValidationResult
 from ensemble_models import DeepEnsembleModel, EnsembleConfig, ModelConfig

mcli-framework 7.1.0__py3-none-any.whl → 7.1.2__py3-none-any.whl

Potentially problematic release.

mcli-framework 7.1.0py3-none-any.whl → 7.1.2py3-none-any.whl