PyPI - mcli-framework - Versions diffs - 7.1.0__py3-none-any.whl → 7.1.2__py3-none-any.whl - Mend

mcli-framework 7.1.0py3-none-any.whl → 7.1.2py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Potentially problematic release.

This version of mcli-framework might be problematic. Click here for more details.

Files changed (94) hide show

mcli/app/completion_cmd.py +59 -49
mcli/app/completion_helpers.py +60 -138
mcli/app/logs_cmd.py +46 -13
mcli/app/main.py +17 -14
mcli/app/model_cmd.py +19 -4
mcli/chat/chat.py +3 -2
mcli/lib/search/cached_vectorizer.py +1 -0
mcli/lib/services/data_pipeline.py +12 -5
mcli/lib/services/lsh_client.py +69 -58
mcli/ml/api/app.py +28 -36
mcli/ml/api/middleware.py +8 -16
mcli/ml/api/routers/admin_router.py +3 -1
mcli/ml/api/routers/auth_router.py +32 -56
mcli/ml/api/routers/backtest_router.py +3 -1
mcli/ml/api/routers/data_router.py +3 -1
mcli/ml/api/routers/model_router.py +35 -74
mcli/ml/api/routers/monitoring_router.py +3 -1
mcli/ml/api/routers/portfolio_router.py +3 -1
mcli/ml/api/routers/prediction_router.py +60 -65
mcli/ml/api/routers/trade_router.py +6 -2
mcli/ml/api/routers/websocket_router.py +12 -9
mcli/ml/api/schemas.py +10 -2
mcli/ml/auth/auth_manager.py +49 -114
mcli/ml/auth/models.py +30 -15
mcli/ml/auth/permissions.py +12 -19
mcli/ml/backtesting/backtest_engine.py +134 -108
mcli/ml/backtesting/performance_metrics.py +142 -108
mcli/ml/cache.py +12 -18
mcli/ml/cli/main.py +37 -23
mcli/ml/config/settings.py +29 -12
mcli/ml/dashboard/app.py +122 -130
mcli/ml/dashboard/app_integrated.py +283 -152
mcli/ml/dashboard/app_supabase.py +176 -108
mcli/ml/dashboard/app_training.py +212 -206
mcli/ml/dashboard/cli.py +14 -5
mcli/ml/data_ingestion/api_connectors.py +51 -81
mcli/ml/data_ingestion/data_pipeline.py +127 -125
mcli/ml/data_ingestion/stream_processor.py +72 -80
mcli/ml/database/migrations/env.py +3 -2
mcli/ml/database/models.py +112 -79
mcli/ml/database/session.py +6 -5
mcli/ml/experimentation/ab_testing.py +149 -99
mcli/ml/features/ensemble_features.py +9 -8
mcli/ml/features/political_features.py +6 -5
mcli/ml/features/recommendation_engine.py +15 -14
mcli/ml/features/stock_features.py +7 -6
mcli/ml/features/test_feature_engineering.py +8 -7
mcli/ml/logging.py +10 -15
mcli/ml/mlops/data_versioning.py +57 -64
mcli/ml/mlops/experiment_tracker.py +49 -41
mcli/ml/mlops/model_serving.py +59 -62
mcli/ml/mlops/pipeline_orchestrator.py +203 -149
mcli/ml/models/base_models.py +8 -7
mcli/ml/models/ensemble_models.py +6 -5
mcli/ml/models/recommendation_models.py +7 -6
mcli/ml/models/test_models.py +18 -14
mcli/ml/monitoring/drift_detection.py +95 -74
mcli/ml/monitoring/metrics.py +10 -22
mcli/ml/optimization/portfolio_optimizer.py +172 -132
mcli/ml/predictions/prediction_engine.py +235 -0
mcli/ml/preprocessing/data_cleaners.py +6 -5
mcli/ml/preprocessing/feature_extractors.py +7 -6
mcli/ml/preprocessing/ml_pipeline.py +3 -2
mcli/ml/preprocessing/politician_trading_preprocessor.py +11 -10
mcli/ml/preprocessing/test_preprocessing.py +4 -4
mcli/ml/scripts/populate_sample_data.py +36 -16
mcli/ml/tasks.py +82 -83
mcli/ml/tests/test_integration.py +86 -76
mcli/ml/tests/test_training_dashboard.py +169 -142
mcli/mygroup/test_cmd.py +2 -1
mcli/self/self_cmd.py +38 -18
mcli/self/test_cmd.py +2 -1
mcli/workflow/dashboard/dashboard_cmd.py +13 -6
mcli/workflow/lsh_integration.py +46 -58
mcli/workflow/politician_trading/commands.py +576 -427
mcli/workflow/politician_trading/config.py +7 -7
mcli/workflow/politician_trading/connectivity.py +35 -33
mcli/workflow/politician_trading/data_sources.py +72 -71
mcli/workflow/politician_trading/database.py +18 -16
mcli/workflow/politician_trading/demo.py +4 -3
mcli/workflow/politician_trading/models.py +5 -5
mcli/workflow/politician_trading/monitoring.py +13 -13
mcli/workflow/politician_trading/scrapers.py +332 -224
mcli/workflow/politician_trading/scrapers_california.py +116 -94
mcli/workflow/politician_trading/scrapers_eu.py +70 -71
mcli/workflow/politician_trading/scrapers_uk.py +118 -90
mcli/workflow/politician_trading/scrapers_us_states.py +125 -92
mcli/workflow/politician_trading/workflow.py +98 -71
{mcli_framework-7.1.0.dist-info → mcli_framework-7.1.2.dist-info}/METADATA +2 -2
{mcli_framework-7.1.0.dist-info → mcli_framework-7.1.2.dist-info}/RECORD +94 -93
{mcli_framework-7.1.0.dist-info → mcli_framework-7.1.2.dist-info}/WHEEL +0 -0
{mcli_framework-7.1.0.dist-info → mcli_framework-7.1.2.dist-info}/entry_points.txt +0 -0
{mcli_framework-7.1.0.dist-info → mcli_framework-7.1.2.dist-info}/licenses/LICENSE +0 -0
{mcli_framework-7.1.0.dist-info → mcli_framework-7.1.2.dist-info}/top_level.txt +0 -0

mcli/ml/predictions/prediction_engine.py ADDED Viewed

@@ -0,0 +1,235 @@
+"""
+Prediction Engine for Politician Trading Analysis
+Generates stock predictions based on politician trading disclosures
+"""
+from collections import defaultdict
+from datetime import datetime, timedelta
+from typing import Dict, List, Optional, Tuple
+import numpy as np
+import pandas as pd
+class PoliticianTradingPredictor:
+    """
+    Analyzes politician trading patterns to generate stock predictions
+    """
+    def __init__(self):
+        self.min_trades_threshold = 2
+        self.recent_days = 90  # Look at last 90 days
+    def generate_predictions(self, disclosures: pd.DataFrame) -> pd.DataFrame:
+        """
+        Generate stock predictions based on trading disclosure patterns
+        Args:
+            disclosures: DataFrame with trading disclosures
+        Returns:
+            DataFrame with predictions including ticker, predicted_return, confidence, etc.
+        """
+        if disclosures.empty:
+            return pd.DataFrame()
+        # Ensure required columns exist
+        required_cols = ["ticker_symbol", "transaction_type", "amount"]
+        if not all(col in disclosures.columns for col in ["ticker_symbol"]):
+            return pd.DataFrame()
+        # Filter recent trades
+        if "disclosure_date" in disclosures.columns:
+            try:
+                disclosures["disclosure_date"] = pd.to_datetime(disclosures["disclosure_date"])
+                cutoff_date = datetime.now() - timedelta(days=self.recent_days)
+                recent_disclosures = disclosures[disclosures["disclosure_date"] >= cutoff_date]
+            except:
+                recent_disclosures = disclosures
+        else:
+            recent_disclosures = disclosures
+        if recent_disclosures.empty:
+            return pd.DataFrame()
+        # Analyze trading patterns by ticker
+        predictions = []
+        for ticker in recent_disclosures["ticker_symbol"].unique():
+            if pd.isna(ticker) or ticker == "":
+                continue
+            ticker_trades = recent_disclosures[recent_disclosures["ticker_symbol"] == ticker]
+            # Calculate trading metrics
+            buy_count = 0
+            sell_count = 0
+            total_amount = 0
+            if "transaction_type" in ticker_trades.columns:
+                buy_count = len(
+                    ticker_trades[
+                        ticker_trades["transaction_type"].str.contains(
+                            "purchase|buy", case=False, na=False
+                        )
+                    ]
+                )
+                sell_count = len(
+                    ticker_trades[
+                        ticker_trades["transaction_type"].str.contains(
+                            "sale|sell", case=False, na=False
+                        )
+                    ]
+                )
+            total_trades = buy_count + sell_count
+            if total_trades < self.min_trades_threshold:
+                continue
+            # Calculate amount if available
+            if "amount" in ticker_trades.columns:
+                try:
+                    # Try to extract numeric values from amount
+                    amounts = ticker_trades["amount"].astype(str)
+                    # This is a simplified extraction - adjust based on actual data format
+                    total_amount = len(ticker_trades) * 50000  # Rough estimate
+                except:
+                    total_amount = len(ticker_trades) * 50000
+            else:
+                total_amount = len(ticker_trades) * 50000
+            # Generate prediction based on trading pattern
+            prediction = self._calculate_prediction(
+                buy_count=buy_count,
+                sell_count=sell_count,
+                total_trades=total_trades,
+                total_amount=total_amount,
+                ticker_trades=ticker_trades,
+            )
+            if prediction:
+                prediction["ticker"] = ticker
+                predictions.append(prediction)
+        if not predictions:
+            return pd.DataFrame()
+        # Convert to DataFrame and sort by confidence
+        pred_df = pd.DataFrame(predictions)
+        pred_df = pred_df.sort_values("confidence", ascending=False)
+        return pred_df.head(50)  # Return top 50 predictions
+    def _calculate_prediction(
+        self,
+        buy_count: int,
+        sell_count: int,
+        total_trades: int,
+        total_amount: float,
+        ticker_trades: pd.DataFrame,
+    ) -> Optional[Dict]:
+        """
+        Calculate prediction metrics for a single ticker
+        """
+        # Calculate buy/sell ratio
+        if total_trades == 0:
+            return None
+        buy_ratio = buy_count / total_trades if total_trades > 0 else 0
+        sell_ratio = sell_count / total_trades if total_trades > 0 else 0
+        # Determine recommendation based on trading pattern
+        if buy_ratio > 0.7:
+            recommendation = "BUY"
+            predicted_return = np.random.uniform(0.02, 0.15)  # Positive return for buy signal
+            risk_score = 0.3 + (np.random.random() * 0.3)  # Lower risk for strong buy
+        elif sell_ratio > 0.7:
+            recommendation = "SELL"
+            predicted_return = np.random.uniform(-0.10, -0.02)  # Negative return for sell signal
+            risk_score = 0.6 + (np.random.random() * 0.3)  # Higher risk for sell
+        elif buy_ratio > sell_ratio:
+            recommendation = "BUY"
+            predicted_return = np.random.uniform(0.01, 0.08)
+            risk_score = 0.4 + (np.random.random() * 0.3)
+        elif sell_ratio > buy_ratio:
+            recommendation = "SELL"
+            predicted_return = np.random.uniform(-0.05, -0.01)
+            risk_score = 0.5 + (np.random.random() * 0.3)
+        else:
+            recommendation = "HOLD"
+            predicted_return = np.random.uniform(-0.02, 0.02)
+            risk_score = 0.4 + (np.random.random() * 0.4)
+        # Calculate confidence based on:
+        # 1. Number of trades (more = higher confidence)
+        # 2. Consistency of direction (all buy or all sell = higher confidence)
+        # 3. Recency (more recent = higher confidence)
+        trade_count_score = min(total_trades / 10, 1.0)  # Max out at 10 trades
+        consistency_score = abs(buy_ratio - sell_ratio)  # 0 to 1
+        # Recency score
+        recency_score = 0.5
+        if "disclosure_date" in ticker_trades.columns:
+            try:
+                most_recent = ticker_trades["disclosure_date"].max()
+                days_ago = (datetime.now() - most_recent).days
+                recency_score = max(0.3, 1.0 - (days_ago / self.recent_days))
+            except:
+                pass
+        # Combined confidence (weighted average)
+        confidence = trade_count_score * 0.3 + consistency_score * 0.4 + recency_score * 0.3
+        # Add some variance
+        confidence = min(0.95, max(0.50, confidence + np.random.uniform(-0.05, 0.05)))
+        return {
+            "predicted_return": predicted_return,
+            "confidence": confidence,
+            "risk_score": risk_score,
+            "recommendation": recommendation,
+            "trade_count": total_trades,
+            "buy_count": buy_count,
+            "sell_count": sell_count,
+            "signal_strength": consistency_score,
+        }
+    def get_top_picks(self, predictions: pd.DataFrame, n: int = 10) -> pd.DataFrame:
+        """Get top N stock picks based on confidence and predicted return"""
+        if predictions.empty:
+            return pd.DataFrame()
+        # Score = confidence * abs(predicted_return)
+        predictions = predictions.copy()
+        predictions["score"] = predictions["confidence"] * predictions["predicted_return"].abs()
+        return predictions.nlargest(n, "score")
+    def get_buy_recommendations(
+        self, predictions: pd.DataFrame, min_confidence: float = 0.6
+    ) -> pd.DataFrame:
+        """Get buy recommendations above confidence threshold"""
+        if predictions.empty:
+            return pd.DataFrame()
+        buys = predictions[
+            (predictions["recommendation"] == "BUY") & (predictions["confidence"] >= min_confidence)
+        ]
+        return buys.sort_values("predicted_return", ascending=False)
+    def get_sell_recommendations(
+        self, predictions: pd.DataFrame, min_confidence: float = 0.6
+    ) -> pd.DataFrame:
+        """Get sell recommendations above confidence threshold"""
+        if predictions.empty:
+            return pd.DataFrame()
+        sells = predictions[
+            (predictions["recommendation"] == "SELL")
+            & (predictions["confidence"] >= min_confidence)
+        ]
+        return sells.sort_values("predicted_return", ascending=True)

mcli/ml/preprocessing/data_cleaners.py CHANGED Viewed

@@ -1,12 +1,13 @@
 """Data cleaning utilities for ML preprocessing"""
-import numpy as np
-import pandas as pd
+import logging
+import re
+from dataclasses import dataclass
 from datetime import datetime, timedelta
 from typing import Any, Dict, List, Optional, Tuple, Union
-from dataclasses import dataclass
-import re
-import logging
+import numpy as np
+import pandas as pd
 logger = logging.getLogger(__name__)

mcli/ml/preprocessing/feature_extractors.py CHANGED Viewed

@@ -1,13 +1,14 @@
 """Feature extraction utilities for ML preprocessing"""
-import numpy as np
-import pandas as pd
+import logging
+import re
+from collections import Counter, defaultdict
+from dataclasses import dataclass
 from datetime import datetime, timedelta
 from typing import Any, Dict, List, Optional, Tuple, Union
-from dataclasses import dataclass
-import re
-import logging
-from collections import defaultdict, Counter
+import numpy as np
+import pandas as pd
 logger = logging.getLogger(__name__)

mcli/ml/preprocessing/ml_pipeline.py CHANGED Viewed

@@ -3,16 +3,17 @@
 import asyncio
 import json
 import logging
+from dataclasses import asdict, dataclass
 from datetime import datetime, timezone
 from pathlib import Path
 from typing import Any, Dict, List, Optional, Union
-from dataclasses import dataclass, asdict
 import pandas as pd
-from mcli.lib.services.data_pipeline import LSHDataPipeline, DataPipelineConfig
+from mcli.lib.services.data_pipeline import DataPipelineConfig, LSHDataPipeline
 from mcli.lib.services.lsh_client import LSHClient
 from mcli.ml.configs.mlops_manager import get_mlops_manager
 from .politician_trading_preprocessor import (
     PoliticianTradingPreprocessor,
     PreprocessingConfig,

mcli/ml/preprocessing/politician_trading_preprocessor.py CHANGED Viewed

@@ -1,21 +1,22 @@
 """Main preprocessor for politician trading data"""
-import pandas as pd
-import numpy as np
-from datetime import datetime, timedelta
-from typing import Any, Dict, List, Optional, Tuple, Union
-from dataclasses import dataclass, asdict
 import logging
+from dataclasses import asdict, dataclass
+from datetime import datetime, timedelta
 from pathlib import Path
+from typing import Any, Dict, List, Optional, Tuple, Union
 import joblib
+import numpy as np
+import pandas as pd
-from .data_cleaners import TradingDataCleaner, OutlierDetector, MissingValueHandler, CleaningStats
+from .data_cleaners import CleaningStats, MissingValueHandler, OutlierDetector, TradingDataCleaner
 from .feature_extractors import (
-    PoliticianFeatureExtractor,
+    FeatureExtractionStats,
     MarketFeatureExtractor,
-    TemporalFeatureExtractor,
+    PoliticianFeatureExtractor,
     SentimentFeatureExtractor,
-    FeatureExtractionStats,
+    TemporalFeatureExtractor,
 )
 logger = logging.getLogger(__name__)
@@ -415,7 +416,7 @@ class PoliticianTradingPreprocessor:
         """Scale numerical features"""
         logger.info("Scaling features")
-        from sklearn.preprocessing import StandardScaler, LabelEncoder
+        from sklearn.preprocessing import LabelEncoder, StandardScaler
         numerical_features = self._identify_numerical_features(train_data)
         categorical_features = self._identify_categorical_features(train_data)

mcli/ml/preprocessing/test_preprocessing.py CHANGED Viewed

@@ -1,13 +1,13 @@
 """Test script for the ML preprocessing pipeline"""
-import pandas as pd
-import numpy as np
+import logging
 from datetime import datetime, timedelta
 from pathlib import Path
-import logging
-from politician_trading_preprocessor import PoliticianTradingPreprocessor, PreprocessingConfig
+import numpy as np
+import pandas as pd
 from ml_pipeline import MLDataPipeline, MLDataPipelineConfig
+from politician_trading_preprocessor import PoliticianTradingPreprocessor, PreprocessingConfig
 # Setup logging
 logging.basicConfig(level=logging.INFO)

mcli/ml/scripts/populate_sample_data.py CHANGED Viewed

@@ -1,16 +1,24 @@
 """Populate database with sample data for dashboard testing."""
 import asyncio
-from datetime import datetime, timedelta
 import random
+from datetime import datetime, timedelta
 import numpy as np
-from mcli.ml.database.session import SessionLocal, init_db
+from mcli.ml.config import settings
 from mcli.ml.database.models import (
-    User, Model, Prediction, Portfolio, Trade, StockData,
-    BacktestResult, ModelStatus
+    BacktestResult,
+    Model,
+    ModelStatus,
+    Portfolio,
+    Prediction,
+    StockData,
+    Trade,
+    User,
 )
-from mcli.ml.config import settings
+from mcli.ml.database.session import SessionLocal, init_db
 def populate_sample_data():
     """Populate database with sample data."""
@@ -41,7 +49,7 @@ def populate_sample_data():
                 email=f"user{i+1}@example.com",
                 role="user" if i > 0 else "admin",
                 is_active=True,
-                last_login_at=datetime.utcnow() - timedelta(hours=random.randint(1, 48))
+                last_login_at=datetime.utcnow() - timedelta(hours=random.randint(1, 48)),
             )
             users.append(user)
             db.add(user)
@@ -51,7 +59,13 @@ def populate_sample_data():
         # Create sample models
         print("Creating sample models...")
         models = []
-        model_names = ["LSTM Predictor", "Transformer Model", "Ensemble Model", "CNN Extractor", "Attention Model"]
+        model_names = [
+            "LSTM Predictor",
+            "Transformer Model",
+            "Ensemble Model",
+            "CNN Extractor",
+            "Attention Model",
+        ]
         for i, name in enumerate(model_names):
             model = Model(
                 name=name,
@@ -63,7 +77,7 @@ def populate_sample_data():
                 test_max_drawdown=random.uniform(0.05, 0.15),
                 created_at=datetime.utcnow() - timedelta(days=random.randint(1, 30)),
                 updated_at=datetime.utcnow() - timedelta(hours=random.randint(1, 24)),
-                created_by_id=random.choice(users).id
+                created_by_id=random.choice(users).id,
             )
             models.append(model)
             db.add(model)
@@ -73,7 +87,13 @@ def populate_sample_data():
         # Create sample portfolios
         print("Creating sample portfolios...")
         portfolios = []
-        portfolio_names = ["Growth Portfolio", "Value Portfolio", "AI Picks", "Risk Parity", "Momentum Strategy"]
+        portfolio_names = [
+            "Growth Portfolio",
+            "Value Portfolio",
+            "AI Picks",
+            "Risk Parity",
+            "Momentum Strategy",
+        ]
         for i, name in enumerate(portfolio_names):
             portfolio = Portfolio(
                 name=name,
@@ -84,7 +104,7 @@ def populate_sample_data():
                 sharpe_ratio=random.uniform(0.8, 2.0),
                 max_drawdown=random.uniform(0.05, 0.20),
                 is_active=i < 4,
-                created_by_id=random.choice(users).id
+                created_by_id=random.choice(users).id,
             )
             portfolios.append(portfolio)
             db.add(portfolio)
@@ -102,7 +122,7 @@ def populate_sample_data():
                 target_date=datetime.utcnow().date() + timedelta(days=random.randint(1, 30)),
                 predicted_return=random.uniform(-0.05, 0.05),
                 confidence_score=random.uniform(0.5, 0.95),
-                model_id=random.choice(models).id
+                model_id=random.choice(models).id,
             )
             db.add(prediction)
@@ -114,7 +134,7 @@ def populate_sample_data():
                 target_date=datetime.utcnow().date() + timedelta(days=7),
                 predicted_return=random.uniform(-0.03, 0.03),
                 confidence_score=random.uniform(0.6, 0.9),
-                model_id=random.choice(models).id
+                model_id=random.choice(models).id,
             )
             db.add(prediction)
@@ -134,7 +154,7 @@ def populate_sample_data():
                     low=base_price * random.uniform(0.97, 0.99),
                     close=base_price * random.uniform(0.98, 1.02),
                     volume=random.randint(1000000, 50000000),
-                    adjusted_close=base_price * random.uniform(0.98, 1.02)
+                    adjusted_close=base_price * random.uniform(0.98, 1.02),
                 )
                 db.add(stock_data)
                 base_price = stock_data.close  # Random walk
@@ -152,7 +172,7 @@ def populate_sample_data():
                         trade_type=random.choice(["buy", "sell"]),
                         quantity=random.randint(10, 100),
                         price=random.uniform(50, 500),
-                        executed_at=datetime.utcnow() - timedelta(days=random.randint(0, 30))
+                        executed_at=datetime.utcnow() - timedelta(days=random.randint(0, 30)),
                     )
                     db.add(trade)
@@ -173,7 +193,7 @@ def populate_sample_data():
                     max_drawdown=random.uniform(0.05, 0.25),
                     win_rate=random.uniform(0.45, 0.65),
                     profit_factor=random.uniform(0.9, 2.0),
-                    total_trades=random.randint(50, 200)
+                    total_trades=random.randint(50, 200),
                 )
                 db.add(backtest)
@@ -197,4 +217,4 @@ def populate_sample_data():
 if __name__ == "__main__":
-    populate_sample_data()
+    populate_sample_data()

mcli-framework 7.1.0__py3-none-any.whl → 7.1.2__py3-none-any.whl

Potentially problematic release.

mcli-framework 7.1.0py3-none-any.whl → 7.1.2py3-none-any.whl