PyPI - churnkit - Versions diffs - 0.75.0a1__py3-none-any.whl - Mend

churnkit 0.75.0a1__py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (302) hide show

customer_retention/integrations/iteration/recommendation_tracker.py ADDED Viewed

@@ -0,0 +1,341 @@
+from dataclasses import dataclass, field
+from datetime import datetime
+from enum import Enum
+from pathlib import Path
+from typing import Any, Dict, List, Optional
+import yaml
+class RecommendationStatus(Enum):
+    PENDING = "pending"
+    APPLIED = "applied"
+    SKIPPED = "skipped"
+    FAILED = "failed"
+class RecommendationType(Enum):
+    CLEANING = "cleaning"
+    TRANSFORM = "transform"
+    FEATURE = "feature"
+    ENCODING = "encoding"
+@dataclass
+class TrackedRecommendation:
+    recommendation_id: str
+    recommendation_type: RecommendationType
+    source_column: str
+    action: str
+    description: str
+    status: RecommendationStatus = RecommendationStatus.PENDING
+    applied_in_iteration: Optional[str] = None
+    skip_reason: Optional[str] = None
+    failure_reason: Optional[str] = None
+    outcome_impact: Optional[float] = None
+    created_at: datetime = field(default_factory=datetime.now)
+    updated_at: Optional[datetime] = None
+    @staticmethod
+    def generate_id(rec_type: RecommendationType, column: str, action: str) -> str:
+        return f"{rec_type.value}_{column}_{action}"
+    def to_dict(self) -> Dict[str, Any]:
+        return {
+            "recommendation_id": self.recommendation_id,
+            "recommendation_type": self.recommendation_type.value,
+            "source_column": self.source_column,
+            "action": self.action,
+            "description": self.description,
+            "status": self.status.value,
+            "applied_in_iteration": self.applied_in_iteration,
+            "skip_reason": self.skip_reason,
+            "failure_reason": self.failure_reason,
+            "outcome_impact": self.outcome_impact,
+            "created_at": self.created_at.isoformat(),
+            "updated_at": self.updated_at.isoformat() if self.updated_at else None
+        }
+    @classmethod
+    def from_dict(cls, data: Dict[str, Any]) -> "TrackedRecommendation":
+        return cls(
+            recommendation_id=data["recommendation_id"],
+            recommendation_type=RecommendationType(data["recommendation_type"]),
+            source_column=data["source_column"],
+            action=data["action"],
+            description=data.get("description", ""),
+            status=RecommendationStatus(data.get("status", "pending")),
+            applied_in_iteration=data.get("applied_in_iteration"),
+            skip_reason=data.get("skip_reason"),
+            failure_reason=data.get("failure_reason"),
+            outcome_impact=data.get("outcome_impact"),
+            created_at=datetime.fromisoformat(data["created_at"]) if "created_at" in data else datetime.now(),
+            updated_at=datetime.fromisoformat(data["updated_at"]) if data.get("updated_at") else None
+        )
+class RecommendationTracker:
+    PATTERN_SECTIONS = ["trend", "seasonality", "cohort", "recency", "categorical"]
+    def __init__(self, storage_path: str):
+        self.storage_path = Path(storage_path)
+        self.recommendations: Dict[str, TrackedRecommendation] = {}
+    def add(self, recommendation: TrackedRecommendation) -> None:
+        self.recommendations[recommendation.recommendation_id] = recommendation
+    def _create_tracked_recommendation(
+        self, rec_type: RecommendationType, source_col: str, action: str, description: str
+    ) -> TrackedRecommendation:
+        rec_id = TrackedRecommendation.generate_id(rec_type, source_col, action)
+        tracked = TrackedRecommendation(
+            recommendation_id=rec_id,
+            recommendation_type=rec_type,
+            source_column=source_col,
+            action=action,
+            description=description
+        )
+        self.add(tracked)
+        return tracked
+    def add_from_cleaning(self, cleaning_rec) -> TrackedRecommendation:
+        action = f"{cleaning_rec.issue_type}_{cleaning_rec.strategy}"
+        return self._create_tracked_recommendation(
+            RecommendationType.CLEANING, cleaning_rec.column_name, action, cleaning_rec.description
+        )
+    def add_from_transform(self, transform_rec) -> TrackedRecommendation:
+        return self._create_tracked_recommendation(
+            RecommendationType.TRANSFORM, transform_rec.column_name,
+            transform_rec.transform_type, transform_rec.reason
+        )
+    def add_from_feature(self, feature_rec) -> TrackedRecommendation:
+        return self._create_tracked_recommendation(
+            RecommendationType.FEATURE, feature_rec.source_column,
+            feature_rec.feature_name, feature_rec.description
+        )
+    def _add_feature_list(
+        self, rec_dict: Dict[str, Any], default_action: str, source_fn=None
+    ) -> List[TrackedRecommendation]:
+        features = rec_dict.get("features", [])
+        action = rec_dict.get("action", default_action)
+        reason = rec_dict.get("reason", "")
+        description = f"{action}: {reason}"
+        tracked_list = []
+        for feature in features:
+            source = source_fn(feature) if source_fn else default_action.split("_")[0]
+            tracked_list.append(
+                self._create_tracked_recommendation(RecommendationType.FEATURE, source, feature, description)
+            )
+        return tracked_list
+    def add_from_recency(self, rec_dict: Dict[str, Any]) -> List[TrackedRecommendation]:
+        return self._add_feature_list(rec_dict, "recency_feature", source_fn=lambda _: "recency")
+    def add_from_categorical(self, rec_dict: Dict[str, Any]) -> List[TrackedRecommendation]:
+        return self._add_feature_list(
+            rec_dict, "categorical_feature",
+            source_fn=lambda f: f.replace("_is_high_risk", "") if "_is_high_risk" in f else f,
+        )
+    def _should_add_recommendation(
+        self, rec: TrackedRecommendation, seen_ids: set, tracked: List[TrackedRecommendation]
+    ) -> bool:
+        if rec.recommendation_id in seen_ids:
+            return False
+        seen_ids.add(rec.recommendation_id)
+        self.add(rec)
+        tracked.append(rec)
+        return True
+    def add_from_temporal_findings(self, findings: Any) -> List[TrackedRecommendation]:
+        tracked: List[TrackedRecommendation] = []
+        seen_ids: set = set()
+        pattern_meta = findings.metadata.get("temporal_patterns", {}) if findings.metadata else {}
+        def add_if_new(rec: TrackedRecommendation) -> bool:
+            return self._should_add_recommendation(rec, seen_ids, tracked)
+        self._process_pattern_sections(pattern_meta, add_if_new)
+        self._process_temporal_features(pattern_meta, add_if_new)
+        self._process_sparkline_recommendations(pattern_meta, add_if_new)
+        self._process_effect_size_recommendations(pattern_meta, add_if_new)
+        self._process_predictive_power_recommendations(pattern_meta, add_if_new)
+        return tracked
+    def _process_section_recommendations(self, pattern_meta: Dict, section: str, add_if_new, skip_actions: Optional[List[str]] = None) -> None:
+        for rec in pattern_meta.get(section, {}).get("recommendations", []):
+            if skip_actions and rec.get("action") in skip_actions:
+                continue
+            features = rec.get("features", [])
+            if not features:
+                continue
+            action = rec.get("action", f"add_{section}_feature")
+            reason = rec.get("reason", f"From {section} analysis")
+            priority = rec.get("priority", "medium")
+            for feature in features:
+                rec_id = TrackedRecommendation.generate_id(RecommendationType.FEATURE, section, feature)
+                add_if_new(TrackedRecommendation(
+                    recommendation_id=rec_id, recommendation_type=RecommendationType.FEATURE,
+                    source_column=section, action=feature, description=f"[{priority}] {action}: {reason}",
+                ))
+    def _process_pattern_sections(self, pattern_meta: Dict, add_if_new) -> None:
+        for section in self.PATTERN_SECTIONS:
+            self._process_section_recommendations(pattern_meta, section, add_if_new, ["skip_cohort_features"])
+    def _process_temporal_features(self, pattern_meta: Dict, add_if_new) -> None:
+        for section in ["velocity", "momentum", "lag"]:
+            for rec in pattern_meta.get(section, {}).get("recommendations", []):
+                features = rec.get("features", [])
+                if not features:
+                    continue
+                action = rec.get("action", f"add_{section}_feature")
+                description = rec.get("description", f"From {section} analysis")
+                source_col = rec.get("source_column", section)
+                int_priority = rec.get("priority", 2)
+                priority_str = self._get_priority_label(int_priority)
+                effect_size = rec.get("effect_size")
+                effect_info = f" (d={effect_size:.2f})" if effect_size else ""
+                for feature in features:
+                    rec_id = TrackedRecommendation.generate_id(RecommendationType.FEATURE, source_col, feature)
+                    add_if_new(TrackedRecommendation(
+                        recommendation_id=rec_id, recommendation_type=RecommendationType.FEATURE,
+                        source_column=source_col, action=feature,
+                        description=f"[{priority_str}] {action}: {description}{effect_info}",
+                    ))
+    def _process_sparkline_recommendations(self, pattern_meta: Dict, add_if_new) -> None:
+        for rec in pattern_meta.get("sparkline", {}).get("recommendations", []):
+            features = rec.get("features", []) or ([rec.get("feature")] if rec.get("feature") else [])
+            if not features:
+                continue
+            action = rec.get("action", "sparkline_feature")
+            reason = rec.get("reason", "From sparkline analysis")
+            priority = rec.get("priority", "medium")
+            for feature in features:
+                rec_id = TrackedRecommendation.generate_id(RecommendationType.FEATURE, "sparkline", feature)
+                add_if_new(TrackedRecommendation(
+                    recommendation_id=rec_id, recommendation_type=RecommendationType.FEATURE,
+                    source_column="sparkline", action=feature, description=f"[{priority}] {action}: {reason}",
+                ))
+    def _process_effect_size_recommendations(self, pattern_meta: Dict, add_if_new) -> None:
+        for rec in pattern_meta.get("effect_size", {}).get("recommendations", []):
+            feature = rec.get("feature", "")
+            if not feature or rec.get("action") == "consider_dropping":
+                continue
+            effect_d = rec.get("effect_size", 0)
+            priority = rec.get("priority", "medium")
+            reason = rec.get("reason", f"Effect size d={effect_d:.2f}")
+            rec_id = TrackedRecommendation.generate_id(RecommendationType.FEATURE, "effect_size", feature)
+            add_if_new(TrackedRecommendation(
+                recommendation_id=rec_id, recommendation_type=RecommendationType.FEATURE,
+                source_column="effect_size", action=feature, description=f"[{priority}] prioritize: {reason}",
+            ))
+    def _process_predictive_power_recommendations(self, pattern_meta: Dict, add_if_new) -> None:
+        for rec in pattern_meta.get("predictive_power", {}).get("recommendations", []):
+            feature = rec.get("feature", "")
+            if not feature:
+                continue
+            iv, ks = rec.get("iv", 0), rec.get("ks", 0)
+            priority = rec.get("priority", "medium")
+            rec_id = TrackedRecommendation.generate_id(RecommendationType.FEATURE, "predictive_power", feature)
+            add_if_new(TrackedRecommendation(
+                recommendation_id=rec_id, recommendation_type=RecommendationType.FEATURE,
+                source_column="predictive_power", action=feature,
+                description=f"[{priority}] include: IV={iv:.3f}, KS={ks:.3f}",
+            ))
+    @staticmethod
+    def _get_priority_label(int_priority: int) -> str:
+        return "high" if int_priority == 1 else "medium"
+    def get(self, recommendation_id: str) -> Optional[TrackedRecommendation]:
+        return self.recommendations.get(recommendation_id)
+    def _update_recommendation_status(self, recommendation_id: str, status: RecommendationStatus, **kwargs) -> None:
+        rec = self.get(recommendation_id)
+        if rec:
+            rec.status = status
+            rec.updated_at = datetime.now()
+            for attr, value in kwargs.items():
+                setattr(rec, attr, value)
+    def mark_applied(self, recommendation_id: str, iteration_id: str) -> None:
+        self._update_recommendation_status(
+            recommendation_id, RecommendationStatus.APPLIED, applied_in_iteration=iteration_id
+        )
+    def mark_skipped(self, recommendation_id: str, reason: str) -> None:
+        self._update_recommendation_status(
+            recommendation_id, RecommendationStatus.SKIPPED, skip_reason=reason
+        )
+    def mark_failed(self, recommendation_id: str, reason: str) -> None:
+        self._update_recommendation_status(
+            recommendation_id, RecommendationStatus.FAILED, failure_reason=reason
+        )
+    def set_outcome_impact(self, recommendation_id: str, impact: float) -> None:
+        rec = self.get(recommendation_id)
+        if rec:
+            rec.outcome_impact = impact
+            rec.updated_at = datetime.now()
+    def _get_by_status(self, status: RecommendationStatus) -> List[TrackedRecommendation]:
+        return [r for r in self.recommendations.values() if r.status == status]
+    def get_pending(self) -> List[TrackedRecommendation]:
+        return self._get_by_status(RecommendationStatus.PENDING)
+    def get_applied(self) -> List[TrackedRecommendation]:
+        return self._get_by_status(RecommendationStatus.APPLIED)
+    def get_skipped(self) -> List[TrackedRecommendation]:
+        return self._get_by_status(RecommendationStatus.SKIPPED)
+    def get_failed(self) -> List[TrackedRecommendation]:
+        return self._get_by_status(RecommendationStatus.FAILED)
+    def get_high_impact(self, threshold: float = 0.1) -> List[TrackedRecommendation]:
+        high_impact = [
+            r for r in self.recommendations.values()
+            if r.outcome_impact is not None and r.outcome_impact >= threshold
+        ]
+        high_impact.sort(key=lambda x: x.outcome_impact or 0, reverse=True)
+        return high_impact
+    def get_by_type(self, rec_type: RecommendationType) -> List[TrackedRecommendation]:
+        return [r for r in self.recommendations.values()
+                if r.recommendation_type == rec_type]
+    def get_summary(self) -> Dict[str, int]:
+        return {
+            "total": len(self.recommendations),
+            "pending": len(self.get_pending()),
+            "applied": len(self.get_applied()),
+            "skipped": len(self.get_skipped()),
+            "failed": len(self.get_failed()),
+        }
+    def save(self) -> None:
+        self.storage_path.parent.mkdir(parents=True, exist_ok=True)
+        data = {
+            "recommendations": [r.to_dict() for r in self.recommendations.values()]
+        }
+        with open(self.storage_path, "w") as f:
+            yaml.dump(data, f, default_flow_style=False, sort_keys=False)
+    def load(self) -> None:
+        if not self.storage_path.exists():
+            return
+        with open(self.storage_path, "r") as f:
+            data = yaml.safe_load(f)
+        if data and "recommendations" in data:
+            for rec_data in data["recommendations"]:
+                rec = TrackedRecommendation.from_dict(rec_data)
+                self.recommendations[rec.recommendation_id] = rec

customer_retention/integrations/iteration/signals.py ADDED Viewed

@@ -0,0 +1,212 @@
+from dataclasses import dataclass, field
+from datetime import datetime
+from enum import Enum
+from typing import TYPE_CHECKING, Any, Dict, List, Optional, Tuple
+from customer_retention.core.compat import DataFrame
+if TYPE_CHECKING:
+    from .context import IterationTrigger
+class IterationSignal(Enum):
+    DRIFT_CRITICAL = "drift_critical"
+    DRIFT_WARNING = "drift_warning"
+    PERFORMANCE_CRITICAL = "performance_critical"
+    PERFORMANCE_WARNING = "performance_warning"
+    DATA_QUALITY_ISSUE = "data_quality_issue"
+    SCHEDULED_RETRAIN = "scheduled_retrain"
+    MANUAL_TRIGGER = "manual_trigger"
+@dataclass
+class SignalEvent:
+    signal_type: IterationSignal
+    source: str
+    severity: str
+    details: Dict[str, Any]
+    recommended_action: str
+    timestamp: datetime = field(default_factory=datetime.now)
+    def to_dict(self) -> Dict[str, Any]:
+        return {
+            "signal_type": self.signal_type.value,
+            "source": self.source,
+            "severity": self.severity,
+            "details": self.details,
+            "recommended_action": self.recommended_action,
+            "timestamp": self.timestamp.isoformat()
+        }
+    @classmethod
+    def from_dict(cls, data: Dict[str, Any]) -> "SignalEvent":
+        return cls(
+            signal_type=IterationSignal(data["signal_type"]),
+            source=data["source"],
+            severity=data["severity"],
+            details=data["details"],
+            recommended_action=data["recommended_action"],
+            timestamp=datetime.fromisoformat(data["timestamp"]) if "timestamp" in data else datetime.now()
+        )
+class SignalAggregator:
+    def __init__(self, drift_detector=None, performance_monitor=None):
+        self.drift_detector = drift_detector
+        self.performance_monitor = performance_monitor
+        self._pending_signals: List[SignalEvent] = []
+    def check_drift_signals(self, current_data: DataFrame) -> List[SignalEvent]:
+        if self.drift_detector is None:
+            return []
+        signals = []
+        try:
+            drift_result = self.drift_detector.detect_drift(current_data, method="psi")
+            for feature_result in drift_result.feature_results:
+                if not feature_result.drift_detected:
+                    continue
+                from customer_retention.core.components.enums import Severity
+                if feature_result.severity == Severity.CRITICAL:
+                    signal_type = IterationSignal.DRIFT_CRITICAL
+                    severity = "critical"
+                    action = "retrain"
+                else:
+                    signal_type = IterationSignal.DRIFT_WARNING
+                    severity = "warning"
+                    action = "monitor"
+                signals.append(SignalEvent(
+                    signal_type=signal_type,
+                    source="drift_detector",
+                    severity=severity,
+                    details={
+                        "feature": feature_result.feature_name,
+                        "metric": feature_result.metric_name,
+                        "value": feature_result.metric_value
+                    },
+                    recommended_action=action
+                ))
+        except Exception:
+            pass
+        self._pending_signals.extend(signals)
+        return signals
+    def check_performance_signals(self, current_metrics: Dict[str, float]) -> List[SignalEvent]:
+        if self.performance_monitor is None:
+            return []
+        signals = []
+        result = self.performance_monitor.compare_metrics(current_metrics)
+        from customer_retention.stages.monitoring.performance_monitor import PerformanceStatus
+        if result.status == PerformanceStatus.CRITICAL:
+            signals.append(SignalEvent(
+                signal_type=IterationSignal.PERFORMANCE_CRITICAL,
+                source="performance_monitor",
+                severity="critical",
+                details={
+                    "current_metrics": current_metrics,
+                    "baseline_metrics": result.baseline_metrics,
+                    "comparison": result.comparison
+                },
+                recommended_action="retrain"
+            ))
+        elif result.status == PerformanceStatus.WARNING:
+            signals.append(SignalEvent(
+                signal_type=IterationSignal.PERFORMANCE_WARNING,
+                source="performance_monitor",
+                severity="warning",
+                details={
+                    "current_metrics": current_metrics,
+                    "baseline_metrics": result.baseline_metrics,
+                    "comparison": result.comparison
+                },
+                recommended_action="investigate"
+            ))
+        self._pending_signals.extend(signals)
+        return signals
+    def add_manual_signal(self, reason: str, details: Dict[str, Any]) -> SignalEvent:
+        event = SignalEvent(
+            signal_type=IterationSignal.MANUAL_TRIGGER,
+            source="user",
+            severity="info",
+            details={"reason": reason, **details},
+            recommended_action="retrain"
+        )
+        self._pending_signals.append(event)
+        return event
+    def add_scheduled_signal(self, schedule_name: str) -> SignalEvent:
+        event = SignalEvent(
+            signal_type=IterationSignal.SCHEDULED_RETRAIN,
+            source="scheduler",
+            severity="info",
+            details={"schedule": schedule_name},
+            recommended_action="retrain"
+        )
+        self._pending_signals.append(event)
+        return event
+    def check_all_signals(self, current_data: Optional[DataFrame] = None,
+                          current_metrics: Optional[Dict[str, float]] = None) -> List[SignalEvent]:
+        all_signals = []
+        if current_data is not None:
+            all_signals.extend(self.check_drift_signals(current_data))
+        if current_metrics is not None:
+            all_signals.extend(self.check_performance_signals(current_metrics))
+        return all_signals
+    def get_pending_signals(self) -> List[SignalEvent]:
+        return self._pending_signals.copy()
+    def clear_signals(self) -> None:
+        self._pending_signals.clear()
+    def should_trigger_iteration(self) -> Tuple[bool, Optional["IterationTrigger"]]:
+        from .context import IterationTrigger
+        if not self._pending_signals:
+            return False, None
+        for signal in self._pending_signals:
+            if signal.signal_type == IterationSignal.DRIFT_CRITICAL:
+                return True, IterationTrigger.DRIFT_DETECTED
+            if signal.signal_type == IterationSignal.PERFORMANCE_CRITICAL:
+                return True, IterationTrigger.PERFORMANCE_DROP
+        for signal in self._pending_signals:
+            if signal.signal_type == IterationSignal.MANUAL_TRIGGER:
+                return True, IterationTrigger.MANUAL
+            if signal.signal_type == IterationSignal.SCHEDULED_RETRAIN:
+                return True, IterationTrigger.SCHEDULED
+        critical_count = sum(1 for s in self._pending_signals if "critical" in s.severity.lower())
+        warning_count = sum(1 for s in self._pending_signals if "warning" in s.severity.lower())
+        if critical_count > 0:
+            return True, IterationTrigger.DRIFT_DETECTED
+        if warning_count >= 3:
+            return True, IterationTrigger.DRIFT_DETECTED
+        return False, None
+    def get_signal_summary(self) -> Dict[str, Any]:
+        return {
+            "total": len(self._pending_signals),
+            "critical": sum(1 for s in self._pending_signals if "critical" in s.severity.lower()),
+            "warning": sum(1 for s in self._pending_signals if "warning" in s.severity.lower()),
+            "info": sum(1 for s in self._pending_signals if "info" in s.severity.lower()),
+            "signals_by_type": {
+                signal_type.value: sum(1 for s in self._pending_signals if s.signal_type == signal_type)
+                for signal_type in IterationSignal
+            }
+        }

customer_retention/integrations/llm_context/__init__.py ADDED Viewed

@@ -0,0 +1,4 @@
+from .context_builder import LLMContextBuilder
+from .prompts import PromptTemplates
+__all__ = ["LLMContextBuilder", "PromptTemplates"]