PyPI - mcli-framework - Versions diffs - 7.1.0__py3-none-any.whl → 7.1.2__py3-none-any.whl - Mend

mcli-framework 7.1.0py3-none-any.whl → 7.1.2py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Potentially problematic release.

This version of mcli-framework might be problematic. Click here for more details.

Files changed (94) hide show

mcli/app/completion_cmd.py +59 -49
mcli/app/completion_helpers.py +60 -138
mcli/app/logs_cmd.py +46 -13
mcli/app/main.py +17 -14
mcli/app/model_cmd.py +19 -4
mcli/chat/chat.py +3 -2
mcli/lib/search/cached_vectorizer.py +1 -0
mcli/lib/services/data_pipeline.py +12 -5
mcli/lib/services/lsh_client.py +69 -58
mcli/ml/api/app.py +28 -36
mcli/ml/api/middleware.py +8 -16
mcli/ml/api/routers/admin_router.py +3 -1
mcli/ml/api/routers/auth_router.py +32 -56
mcli/ml/api/routers/backtest_router.py +3 -1
mcli/ml/api/routers/data_router.py +3 -1
mcli/ml/api/routers/model_router.py +35 -74
mcli/ml/api/routers/monitoring_router.py +3 -1
mcli/ml/api/routers/portfolio_router.py +3 -1
mcli/ml/api/routers/prediction_router.py +60 -65
mcli/ml/api/routers/trade_router.py +6 -2
mcli/ml/api/routers/websocket_router.py +12 -9
mcli/ml/api/schemas.py +10 -2
mcli/ml/auth/auth_manager.py +49 -114
mcli/ml/auth/models.py +30 -15
mcli/ml/auth/permissions.py +12 -19
mcli/ml/backtesting/backtest_engine.py +134 -108
mcli/ml/backtesting/performance_metrics.py +142 -108
mcli/ml/cache.py +12 -18
mcli/ml/cli/main.py +37 -23
mcli/ml/config/settings.py +29 -12
mcli/ml/dashboard/app.py +122 -130
mcli/ml/dashboard/app_integrated.py +283 -152
mcli/ml/dashboard/app_supabase.py +176 -108
mcli/ml/dashboard/app_training.py +212 -206
mcli/ml/dashboard/cli.py +14 -5
mcli/ml/data_ingestion/api_connectors.py +51 -81
mcli/ml/data_ingestion/data_pipeline.py +127 -125
mcli/ml/data_ingestion/stream_processor.py +72 -80
mcli/ml/database/migrations/env.py +3 -2
mcli/ml/database/models.py +112 -79
mcli/ml/database/session.py +6 -5
mcli/ml/experimentation/ab_testing.py +149 -99
mcli/ml/features/ensemble_features.py +9 -8
mcli/ml/features/political_features.py +6 -5
mcli/ml/features/recommendation_engine.py +15 -14
mcli/ml/features/stock_features.py +7 -6
mcli/ml/features/test_feature_engineering.py +8 -7
mcli/ml/logging.py +10 -15
mcli/ml/mlops/data_versioning.py +57 -64
mcli/ml/mlops/experiment_tracker.py +49 -41
mcli/ml/mlops/model_serving.py +59 -62
mcli/ml/mlops/pipeline_orchestrator.py +203 -149
mcli/ml/models/base_models.py +8 -7
mcli/ml/models/ensemble_models.py +6 -5
mcli/ml/models/recommendation_models.py +7 -6
mcli/ml/models/test_models.py +18 -14
mcli/ml/monitoring/drift_detection.py +95 -74
mcli/ml/monitoring/metrics.py +10 -22
mcli/ml/optimization/portfolio_optimizer.py +172 -132
mcli/ml/predictions/prediction_engine.py +235 -0
mcli/ml/preprocessing/data_cleaners.py +6 -5
mcli/ml/preprocessing/feature_extractors.py +7 -6
mcli/ml/preprocessing/ml_pipeline.py +3 -2
mcli/ml/preprocessing/politician_trading_preprocessor.py +11 -10
mcli/ml/preprocessing/test_preprocessing.py +4 -4
mcli/ml/scripts/populate_sample_data.py +36 -16
mcli/ml/tasks.py +82 -83
mcli/ml/tests/test_integration.py +86 -76
mcli/ml/tests/test_training_dashboard.py +169 -142
mcli/mygroup/test_cmd.py +2 -1
mcli/self/self_cmd.py +38 -18
mcli/self/test_cmd.py +2 -1
mcli/workflow/dashboard/dashboard_cmd.py +13 -6
mcli/workflow/lsh_integration.py +46 -58
mcli/workflow/politician_trading/commands.py +576 -427
mcli/workflow/politician_trading/config.py +7 -7
mcli/workflow/politician_trading/connectivity.py +35 -33
mcli/workflow/politician_trading/data_sources.py +72 -71
mcli/workflow/politician_trading/database.py +18 -16
mcli/workflow/politician_trading/demo.py +4 -3
mcli/workflow/politician_trading/models.py +5 -5
mcli/workflow/politician_trading/monitoring.py +13 -13
mcli/workflow/politician_trading/scrapers.py +332 -224
mcli/workflow/politician_trading/scrapers_california.py +116 -94
mcli/workflow/politician_trading/scrapers_eu.py +70 -71
mcli/workflow/politician_trading/scrapers_uk.py +118 -90
mcli/workflow/politician_trading/scrapers_us_states.py +125 -92
mcli/workflow/politician_trading/workflow.py +98 -71
{mcli_framework-7.1.0.dist-info → mcli_framework-7.1.2.dist-info}/METADATA +2 -2
{mcli_framework-7.1.0.dist-info → mcli_framework-7.1.2.dist-info}/RECORD +94 -93
{mcli_framework-7.1.0.dist-info → mcli_framework-7.1.2.dist-info}/WHEEL +0 -0
{mcli_framework-7.1.0.dist-info → mcli_framework-7.1.2.dist-info}/entry_points.txt +0 -0
{mcli_framework-7.1.0.dist-info → mcli_framework-7.1.2.dist-info}/licenses/LICENSE +0 -0
{mcli_framework-7.1.0.dist-info → mcli_framework-7.1.2.dist-info}/top_level.txt +0 -0

mcli/workflow/politician_trading/scrapers_uk.py CHANGED Viewed

@@ -8,169 +8,186 @@ to collect MP financial disclosure data.
 import asyncio
 import logging
 from datetime import datetime
-from typing import List, Dict, Any, Optional
+from typing import Any, Dict, List, Optional
 import aiohttp
+from .models import Politician, PoliticianRole, TradingDisclosure, TransactionType
 from .scrapers import BaseScraper
-from .models import TradingDisclosure, Politician, PoliticianRole, TransactionType
 logger = logging.getLogger(__name__)
 class UKParliamentScraper(BaseScraper):
     """Scraper for UK Parliament Register of Interests API"""
     def __init__(self, config):
         super().__init__(config)
         self.base_url = "https://interests-api.parliament.uk/api/v1"
         self.session: Optional[aiohttp.ClientSession] = None
     async def __aenter__(self):
         """Async context manager entry"""
         self.session = aiohttp.ClientSession(
             timeout=aiohttp.ClientTimeout(total=self.config.timeout),
-            headers={'User-Agent': self.config.user_agent}
+            headers={"User-Agent": self.config.user_agent},
         )
         return self
     async def __aexit__(self, exc_type, exc_val, exc_tb):
         """Async context manager exit"""
         if self.session:
             await self.session.close()
     async def fetch_members_interests(self) -> List[TradingDisclosure]:
         """Fetch all MP financial interests from the API"""
         logger.info("Starting UK Parliament financial interests collection")
         if not self.session:
             raise RuntimeError("Session not initialized. Use async context manager.")
         disclosures = []
         try:
             # First, get all interest categories to understand what types of interests exist
             categories = await self._fetch_categories()
             logger.info(f"Found {len(categories)} interest categories")
             # Get all interests for financial/investment categories
             financial_categories = self._filter_financial_categories(categories)
             for category in financial_categories:
                 category_disclosures = await self._fetch_interests_by_category(category)
                 disclosures.extend(category_disclosures)
                 # Rate limiting
                 await asyncio.sleep(self.config.request_delay)
             logger.info(f"Collected {len(disclosures)} UK Parliament financial interests")
             return disclosures
         except Exception as e:
             logger.error(f"Failed to fetch UK Parliament interests: {e}")
             raise
     async def _fetch_categories(self) -> List[Dict[str, Any]]:
         """Fetch all interest categories from the API"""
         url = f"{self.base_url}/Categories"
         params = {"Take": 100}  # Get up to 100 categories
         async with self.session.get(url, params=params) as response:
             response.raise_for_status()
             data = await response.json()
             return data.get("items", [])
-    def _filter_financial_categories(self, categories: List[Dict[str, Any]]) -> List[Dict[str, Any]]:
+    def _filter_financial_categories(
+        self, categories: List[Dict[str, Any]]
+    ) -> List[Dict[str, Any]]:
         """Filter categories to include only financial/investment related ones"""
         financial_keywords = [
-            "shareholding", "share", "investment", "financial", "company",
-            "directorship", "employment", "remuneration", "sponsorship",
-            "gift", "benefit", "land", "property"
+            "shareholding",
+            "share",
+            "investment",
+            "financial",
+            "company",
+            "directorship",
+            "employment",
+            "remuneration",
+            "sponsorship",
+            "gift",
+            "benefit",
+            "land",
+            "property",
         ]
         financial_categories = []
         for category in categories:
             category_name = category.get("name", "").lower()
             if any(keyword in category_name for keyword in financial_keywords):
                 financial_categories.append(category)
                 logger.debug(f"Including financial category: {category.get('name')}")
         return financial_categories
-    async def _fetch_interests_by_category(self, category: Dict[str, Any]) -> List[TradingDisclosure]:
+    async def _fetch_interests_by_category(
+        self, category: Dict[str, Any]
+    ) -> List[TradingDisclosure]:
         """Fetch interests for a specific category"""
         category_id = category.get("id")
         category_name = category.get("name")
         logger.debug(f"Fetching interests for category: {category_name} (ID: {category_id})")
         disclosures = []
         skip = 0
         take = 50
         while True:
             url = f"{self.base_url}/Interests"
-            params = {
-                "categoryId": category_id,
-                "Skip": skip,
-                "Take": take
-            }
+            params = {"categoryId": category_id, "Skip": skip, "Take": take}
             try:
                 async with self.session.get(url, params=params) as response:
                     response.raise_for_status()
                     data = await response.json()
                     interests = data.get("items", [])
                     if not interests:
                         break
                     for interest in interests:
                         disclosure = await self._parse_uk_interest(interest, category_name)
                         if disclosure:
                             disclosures.append(disclosure)
                     skip += take
                     # If we got fewer results than requested, we're done
                     if len(interests) < take:
                         break
             except Exception as e:
                 logger.error(f"Failed to fetch interests for category {category_name}: {e}")
                 break
         logger.debug(f"Found {len(disclosures)} interests in category: {category_name}")
         return disclosures
-    async def _parse_uk_interest(self, interest: Dict[str, Any], category_name: str) -> Optional[TradingDisclosure]:
+    async def _parse_uk_interest(
+        self, interest: Dict[str, Any], category_name: str
+    ) -> Optional[TradingDisclosure]:
         """Parse a UK Parliament interest into a TradingDisclosure"""
         try:
             # Extract member information from the new API structure
             member_data = interest.get("member")
             if not member_data:
                 return None
             member_id = member_data.get("id")
             politician_name = member_data.get("nameDisplayAs", "")
             # Get interest details
             interest_id = interest.get("id")
             description = interest.get("summary", "")
             registered_date = interest.get("registrationDate")
             # Parse dates
-            transaction_date = self._parse_date(registered_date) if registered_date else datetime.now()
+            transaction_date = (
+                self._parse_date(registered_date) if registered_date else datetime.now()
+            )
             disclosure_date = transaction_date  # UK system doesn't separate these
             # Determine transaction type from description
             transaction_type = self._infer_transaction_type(description, category_name)
             # Extract asset information from fields and description
-            asset_name, asset_ticker = self._extract_asset_info_from_fields(interest, description, category_name)
+            asset_name, asset_ticker = self._extract_asset_info_from_fields(
+                interest, description, category_name
+            )
             # Extract amount information (if available)
             amount_min, amount_max, amount_exact = self._extract_amount_info(description)
             disclosure = TradingDisclosure(
                 id=f"uk_parliament_{interest_id}",
                 politician_id="",  # Will be filled during politician matching
@@ -191,29 +208,29 @@ class UKParliamentScraper(BaseScraper):
                     "category_name": category_name,
                     "registered_date": registered_date,
                     "source": "uk_parliament_api",
-                    "politician_name": politician_name
-                }
+                    "politician_name": politician_name,
+                },
             )
             return disclosure
         except Exception as e:
             logger.error(f"Failed to parse UK interest: {e}")
             return None
     async def _fetch_mp_name(self, member_id: int) -> str:
         """Fetch MP name from the Parliament API using member ID"""
         if not self.session:
             return ""
         try:
             # Try the Members endpoint to get MP details
             member_url = f"{self.base_url}/Members/{member_id}"
             async with self.session.get(member_url) as response:
                 if response.status == 200:
                     data = await response.json()
                     # Extract name from the response
                     name = data.get("name", "")
                     if not name:
@@ -225,19 +242,21 @@ class UKParliamentScraper(BaseScraper):
                         last_name = data.get("nameFull", "") or data.get("nameFamily", "")
                         if first_name and last_name:
                             name = f"{first_name} {last_name}"
                     if name:
                         logger.debug(f"Found MP name for ID {member_id}: {name}")
                         return name.strip()
                 else:
-                    logger.debug(f"Could not fetch MP details for ID {member_id}: HTTP {response.status}")
+                    logger.debug(
+                        f"Could not fetch MP details for ID {member_id}: HTTP {response.status}"
+                    )
         except Exception as e:
             logger.debug(f"Failed to fetch MP name for ID {member_id}: {e}")
         return ""
     def _parse_date(self, date_str: str) -> datetime:
         """Parse UK Parliament API date format"""
         try:
@@ -245,12 +264,12 @@ class UKParliamentScraper(BaseScraper):
             return datetime.fromisoformat(date_str.replace("Z", "+00:00"))
         except Exception:
             return datetime.now()
     def _infer_transaction_type(self, description: str, category_name: str) -> TransactionType:
         """Infer transaction type from description and category"""
         description_lower = description.lower()
         category_lower = category_name.lower()
         # UK Parliament disclosures are mostly about holdings, not transactions
         # But we can infer some information
         if any(word in description_lower for word in ["sold", "disposed", "divested"]):
@@ -261,29 +280,33 @@ class UKParliamentScraper(BaseScraper):
             return TransactionType.PURCHASE  # Assume shareholding disclosure is a purchase
         else:
             return TransactionType.PURCHASE  # Default assumption
-    def _extract_asset_info_from_fields(self, interest: Dict[str, Any], description: str, category_name: str) -> tuple[str, Optional[str]]:
+    def _extract_asset_info_from_fields(
+        self, interest: Dict[str, Any], description: str, category_name: str
+    ) -> tuple[str, Optional[str]]:
         """Extract asset name and ticker from interest fields"""
         # Look for OrganisationName in fields
         fields = interest.get("fields", [])
         organization_name = None
         for field in fields:
             if field.get("name") == "OrganisationName":
                 organization_name = field.get("value")
                 break
         # Use organization name if available, otherwise fall back to description
         if organization_name:
             return organization_name, None
         else:
             return self._extract_asset_info(description, category_name)
-    def _extract_asset_info(self, description: str, category_name: str) -> tuple[str, Optional[str]]:
+    def _extract_asset_info(
+        self, description: str, category_name: str
+    ) -> tuple[str, Optional[str]]:
         """Extract asset name and ticker from description"""
         # UK descriptions often contain company names
         # This is a simplified extraction - could be enhanced with NLP
         if "shareholding" in category_name.lower():
             # Try to extract company name from shareholding descriptions
             # Format often like: "Shareholding in [Company Name] Ltd"
@@ -292,38 +315,41 @@ class UKParliamentScraper(BaseScraper):
                 if len(parts) > 1:
                     asset_name = parts[1].strip().rstrip(".")
                     return asset_name, None
         # Fallback: use description as asset name
         return description[:100], None  # Truncate to reasonable length
-    def _extract_amount_info(self, description: str) -> tuple[Optional[float], Optional[float], Optional[float]]:
+    def _extract_amount_info(
+        self, description: str
+    ) -> tuple[Optional[float], Optional[float], Optional[float]]:
         """Extract amount information from description"""
         # UK Parliament disclosures often don't include specific amounts
         # They use threshold categories (£70,000+, etc.)
         description_lower = description.lower()
         # Look for UK threshold amounts
         if "£70,000" in description_lower or "70000" in description_lower:
             return 70000.0, None, None
         elif "£" in description_lower:
             # Try to extract specific amounts
             import re
-            amount_pattern = r'£([\d,]+)'
+            amount_pattern = r"£([\d,]+)"
             matches = re.findall(amount_pattern, description)
             if matches:
                 try:
-                    amount = float(matches[0].replace(',', ''))
+                    amount = float(matches[0].replace(",", ""))
                     return amount, None, amount
                 except ValueError:
                     pass
         return None, None, None
     async def get_politicians(self) -> List[Politician]:
         """Fetch current MPs from the Members API"""
         logger.info("Fetching current UK MPs")
         # For now, return empty list - would need Members API integration
         # This would require calling https://members-api.parliament.uk/
         return []
@@ -338,13 +364,15 @@ async def run_uk_parliament_collection(config) -> List[TradingDisclosure]:
 # Example usage for testing
 if __name__ == "__main__":
     from .config import WorkflowConfig
     async def main():
         config = WorkflowConfig.default()
         disclosures = await run_uk_parliament_collection(config.scraping)
         print(f"Collected {len(disclosures)} UK Parliament financial interests")
         for disclosure in disclosures[:3]:  # Show first 3
-            print(f"- {disclosure.asset_name} by {disclosure.raw_data.get('politician_name', 'Unknown')}")
-    asyncio.run(main())
+            print(
+                f"- {disclosure.asset_name} by {disclosure.raw_data.get('politician_name', 'Unknown')}"
+            )
+    asyncio.run(main())

mcli-framework 7.1.0__py3-none-any.whl → 7.1.2__py3-none-any.whl

Potentially problematic release.

mcli-framework 7.1.0py3-none-any.whl → 7.1.2py3-none-any.whl