PyPI - aigroup-econ-mcp - Versions diffs - 1.3.3__py3-none-any.whl → 2.0.1__py3-none-any.whl - Mend

aigroup-econ-mcp 1.3.3py3-none-any.whl → 2.0.1py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (198) hide show

tools/data_loader.py ADDED Viewed

@@ -0,0 +1,213 @@
+"""
+数据加载组件 - 支持多种文件格式
+支持txt、json、csv、excel文件的读取和解析
+"""
+import json
+from pathlib import Path
+from typing import Any, Dict, List, Union
+import pandas as pd
+class DataLoader:
+    """数据加载器，支持多种文件格式"""
+    @staticmethod
+    def load_from_file(file_path: str) -> Dict[str, Any]:
+        """
+        从文件加载数据
+        Args:
+            file_path: 文件路径
+        Returns:
+            包含y_data和x_data的字典
+        Raises:
+            FileNotFoundError: 文件不存在
+            ValueError: 不支持的文件格式或数据格式错误
+        """
+        path = Path(file_path)
+        if not path.exists():
+            raise FileNotFoundError(f"文件不存在: {file_path}")
+        suffix = path.suffix.lower()
+        if suffix == '.txt':
+            return DataLoader._load_txt(path)
+        elif suffix == '.json':
+            return DataLoader._load_json(path)
+        elif suffix == '.csv':
+            return DataLoader._load_csv(path)
+        elif suffix in ['.xlsx', '.xls']:
+            return DataLoader._load_excel(path)
+        else:
+            raise ValueError(f"不支持的文件格式: {suffix}")
+    @staticmethod
+    def _load_txt(path: Path) -> Dict[str, Any]:
+        """加载txt文件（空格或制表符分隔）"""
+        with open(path, 'r', encoding='utf-8') as f:
+            lines = f.readlines()
+        # 跳过空行和注释行
+        data_lines = [line.strip() for line in lines if line.strip() and not line.strip().startswith('#')]
+        if not data_lines:
+            raise ValueError("txt文件为空或没有有效数据")
+        # 解析数据
+        data = []
+        for line in data_lines:
+            # 支持空格和制表符分隔
+            row = [float(x) for x in line.split()]
+            data.append(row)
+        return DataLoader._parse_data_matrix(data)
+    @staticmethod
+    def _load_json(path: Path) -> Dict[str, Any]:
+        """加载json文件"""
+        with open(path, 'r', encoding='utf-8') as f:
+            data = json.load(f)
+        # 支持两种格式：
+        # 1. {"y_data": [...], "x_data": [[...], ...]}
+        # 2. {"data": [[y, x1, x2, ...], ...]}
+        if "y_data" in data and "x_data" in data:
+            return {
+                "y_data": data["y_data"],
+                "x_data": data["x_data"],
+                "feature_names": data.get("feature_names"),
+            }
+        elif "data" in data:
+            return DataLoader._parse_data_matrix(data["data"])
+        else:
+            raise ValueError("JSON格式错误：需要包含'y_data'和'x_data'或'data'字段")
+    @staticmethod
+    def _load_csv(path: Path) -> Dict[str, Any]:
+        """加载csv文件"""
+        df = pd.read_csv(path)
+        return DataLoader._parse_dataframe(df)
+    @staticmethod
+    def _load_excel(path: Path) -> Dict[str, Any]:
+        """加载excel文件"""
+        df = pd.read_excel(path)
+        return DataLoader._parse_dataframe(df)
+    @staticmethod
+    def _parse_dataframe(df: pd.DataFrame) -> Dict[str, Any]:
+        """解析DataFrame"""
+        if df.empty:
+            raise ValueError("数据框为空")
+        # 第一列为y，其余列为x
+        y_data = df.iloc[:, 0].tolist()
+        if df.shape[1] > 1:
+            x_data = df.iloc[:, 1:].values.tolist()
+            feature_names = df.columns[1:].tolist()
+        else:
+            raise ValueError("数据至少需要包含因变量和一个自变量")
+        return {
+            "y_data": y_data,
+            "x_data": x_data,
+            "feature_names": feature_names,
+        }
+    @staticmethod
+    def _parse_data_matrix(data: List[List[float]]) -> Dict[str, Any]:
+        """解析数据矩阵（第一列为y，其余列为x）"""
+        if not data:
+            raise ValueError("数据矩阵为空")
+        y_data = [row[0] for row in data]
+        if len(data[0]) > 1:
+            x_data = [row[1:] for row in data]
+            feature_names = [f"X{i+1}" for i in range(len(data[0]) - 1)]
+        else:
+            raise ValueError("数据至少需要包含因变量和一个自变量")
+        return {
+            "y_data": y_data,
+            "x_data": x_data,
+            "feature_names": feature_names,
+        }
+class MLEDataLoader:
+    """MLE专用数据加载器"""
+    @staticmethod
+    def load_from_file(file_path: str) -> Dict[str, Any]:
+        """
+        从文件加载MLE数据（单列数据）
+        Args:
+            file_path: 文件路径
+        Returns:
+            包含data的字典
+        """
+        path = Path(file_path)
+        if not path.exists():
+            raise FileNotFoundError(f"文件不存在: {file_path}")
+        suffix = path.suffix.lower()
+        if suffix == '.txt':
+            return MLEDataLoader._load_txt(path)
+        elif suffix == '.json':
+            return MLEDataLoader._load_json(path)
+        elif suffix == '.csv':
+            return MLEDataLoader._load_csv(path)
+        elif suffix in ['.xlsx', '.xls']:
+            return MLEDataLoader._load_excel(path)
+        else:
+            raise ValueError(f"不支持的文件格式: {suffix}")
+    @staticmethod
+    def _load_txt(path: Path) -> Dict[str, Any]:
+        """加载txt文件"""
+        with open(path, 'r', encoding='utf-8') as f:
+            lines = f.readlines()
+        data = []
+        for line in lines:
+            line = line.strip()
+            if line and not line.startswith('#'):
+                data.append(float(line.split()[0]))
+        return {"data": data}
+    @staticmethod
+    def _load_json(path: Path) -> Dict[str, Any]:
+        """加载json文件"""
+        with open(path, 'r', encoding='utf-8') as f:
+            loaded = json.load(f)
+        if isinstance(loaded, dict) and "data" in loaded:
+            return {"data": loaded["data"]}
+        elif isinstance(loaded, list):
+            return {"data": loaded}
+        else:
+            raise ValueError("JSON格式错误")
+    @staticmethod
+    def _load_csv(path: Path) -> Dict[str, Any]:
+        """加载csv文件"""
+        df = pd.read_csv(path)
+        return {"data": df.iloc[:, 0].tolist()}
+    @staticmethod
+    def _load_excel(path: Path) -> Dict[str, Any]:
+        """加载excel文件"""
+        df = pd.read_excel(path)
+        return {"data": df.iloc[:, 0].tolist()}

tools/decorators.py ADDED Viewed

@@ -0,0 +1,38 @@
+"""
+工具装饰器模块
+"""
+from functools import wraps
+from typing import Callable, Any
+def with_file_support_decorator(tool_name: str):
+    """
+    支持文件输入的装饰器
+    Args:
+        tool_name: 工具名称
+    """
+    def decorator(func: Callable) -> Callable:
+        @wraps(func)
+        def wrapper(*args, **kwargs):
+            # 简化实现 - 直接调用原函数
+            return func(*args, **kwargs)
+        return wrapper
+    return decorator
+def validate_input(data_type: str = "econometric"):
+    """
+    输入验证装饰器
+    Args:
+        data_type: 数据类型
+    """
+    def decorator(func: Callable) -> Callable:
+        @wraps(func)
+        def wrapper(*args, **kwargs):
+            # 简化实现 - 直接调用原函数
+            return func(*args, **kwargs)
+        return wrapper
+    return decorator

tools/distribution_analysis_adapter.py ADDED Viewed

@@ -0,0 +1,121 @@
+"""
+分布分析与分解方法适配器
+将核心算法适配为MCP工具
+"""
+from typing import List, Optional
+import json
+from econometrics.distribution_analysis import (
+    oaxaca_blinder_decomposition,
+    variance_decomposition,
+    time_series_decomposition,
+    OaxacaResult,
+    VarianceDecompositionResult,
+    TimeSeriesDecompositionResult
+)
+from .output_formatter import OutputFormatter
+def oaxaca_blinder_adapter(
+    y_a: List[float],
+    x_a: List[List[float]],
+    y_b: List[float],
+    x_b: List[List[float]],
+    feature_names: Optional[List[str]] = None,
+    weight_matrix: str = "pooled",
+    output_format: str = "json",
+    save_path: Optional[str] = None
+) -> str:
+    """Oaxaca-Blinder分解适配器"""
+    result: OaxacaResult = oaxaca_blinder_decomposition(
+        y_a=y_a,
+        x_a=x_a,
+        y_b=y_b,
+        x_b=x_b,
+        feature_names=feature_names,
+        weight_matrix=weight_matrix
+    )
+    if output_format == "json":
+        json_result = json.dumps(result.dict(), ensure_ascii=False, indent=2)
+        if save_path:
+            OutputFormatter.save_to_file(json_result, save_path)
+            return f"分析完成！结果已保存到: {save_path}\n\n{json_result}"
+        return json_result
+    else:
+        formatted = f"""# Oaxaca-Blinder分解结果
+{result.summary}
+"""
+        if save_path:
+            OutputFormatter.save_to_file(formatted, save_path)
+        return formatted
+def variance_decomposition_adapter(
+    values: List[float],
+    groups: List[str],
+    group_names: Optional[List[str]] = None,
+    output_format: str = "json",
+    save_path: Optional[str] = None
+) -> str:
+    """方差分解适配器"""
+    result: VarianceDecompositionResult = variance_decomposition(
+        values=values,
+        groups=groups,
+        group_names=group_names
+    )
+    if output_format == "json":
+        json_result = json.dumps(result.dict(), ensure_ascii=False, indent=2)
+        if save_path:
+            OutputFormatter.save_to_file(json_result, save_path)
+            return f"分析完成！结果已保存到: {save_path}\n\n{json_result}"
+        return json_result
+    else:
+        formatted = f"""# 方差分解(ANOVA)结果
+{result.summary}
+"""
+        if save_path:
+            OutputFormatter.save_to_file(formatted, save_path)
+        return formatted
+def time_series_decomposition_adapter(
+    data: List[float],
+    period: int = 12,
+    model: str = "additive",
+    method: str = "classical",
+    extrapolate_trend: str = "freq",
+    output_format: str = "json",
+    save_path: Optional[str] = None
+) -> str:
+    """时间序列分解适配器"""
+    result: TimeSeriesDecompositionResult = time_series_decomposition(
+        data=data,
+        period=period,
+        model=model,
+        method=method,
+        extrapolate_trend=extrapolate_trend
+    )
+    if output_format == "json":
+        json_result = json.dumps(result.dict(), ensure_ascii=False, indent=2)
+        if save_path:
+            OutputFormatter.save_to_file(json_result, save_path)
+            return f"分析完成！结果已保存到: {save_path}\n\n{json_result}"
+        return json_result
+    else:
+        formatted = f"""# 时间序列分解结果
+{result.summary}
+"""
+        if save_path:
+            OutputFormatter.save_to_file(formatted, save_path)
+        return formatted

tools/econometrics_adapter.py ADDED Viewed

@@ -0,0 +1,286 @@
+"""
+计量经济学核心算法适配器
+复用 econometrics/ 中的核心实现，避免代码重复
+"""
+from typing import List, Optional, Union
+import sys
+from pathlib import Path
+import json
+# 确保可以导入econometrics模块
+sys.path.insert(0, str(Path(__file__).parent.parent))
+# 导入核心算法实现
+from econometrics.basic_parametric_estimation.ols.ols_model import (
+    ols_regression as core_ols_regression,
+    OLSResult as CoreOLSResult
+)
+from econometrics.basic_parametric_estimation.mle.mle_model import (
+    mle_estimation as core_mle_estimation,
+    MLEResult as CoreMLEResult
+)
+from econometrics.basic_parametric_estimation.gmm.gmm_model import (
+    gmm_estimation as core_gmm_estimation,
+    GMMResult as CoreGMMResult
+)
+# 导入数据加载和格式化组件
+from .data_loader import DataLoader, MLEDataLoader
+from .output_formatter import OutputFormatter
+class DataValidator:
+    """数据验证器"""
+    @staticmethod
+    def validate_ols_gmm_data(y_data: List[float], x_data: List[List[float]], feature_names: Optional[List[str]] = None):
+        """验证OLS和GMM数据格式"""
+        if len(y_data) != len(x_data):
+            raise ValueError(f"因变量长度({len(y_data)})与自变量长度({len(x_data)})不一致")
+        # 检查所有x_data行的长度是否一致
+        if x_data:
+            first_row_len = len(x_data[0])
+            for i, row in enumerate(x_data):
+                if len(row) != first_row_len:
+                    raise ValueError(f"自变量第{i}行长度({len(row)})与第一行长度({first_row_len})不一致")
+        # 验证feature_names
+        if feature_names and len(feature_names) != len(x_data[0]) if x_data else 0:
+            raise ValueError(f"特征名称数量({len(feature_names)})与自变量列数({len(x_data[0]) if x_data else 0})不一致")
+    @staticmethod
+    def convert_to_2d_list(data: Union[List[float], List[List[float]]]) -> List[List[float]]:
+        """将数据转换为二维列表格式"""
+        if not data:
+            return []
+        # 如果是一维列表，转换为二维列表
+        if isinstance(data[0], (int, float)):
+            return [[x] for x in data]
+        # 已经是二维列表
+        return data
+class EconometricsAdapter:
+    """
+    计量经济学适配器
+    将core算法适配为MCP工具，支持文件输入和多种输出格式
+    """
+    @staticmethod
+    def ols_regression(
+        y_data: Optional[List[float]] = None,
+        x_data: Optional[List[List[float]]] = None,
+        file_path: Optional[str] = None,
+        feature_names: Optional[List[str]] = None,
+        constant: bool = True,
+        confidence_level: float = 0.95,
+        output_format: str = "json",
+        save_path: Optional[str] = None
+    ) -> str:
+        """
+        OLS回归适配器
+        优势：复用econometrics/核心算法，避免代码重复
+        """
+        # 1. 数据准备
+        if file_path:
+            data = DataLoader.load_from_file(file_path)
+            y_data = data["y_data"]
+            x_data = data["x_data"]
+            feature_names = data.get("feature_names") or feature_names
+        elif y_data is None or x_data is None:
+            raise ValueError("必须提供文件路径(file_path)或直接数据(y_data和x_data)")
+        # 数据验证和转换
+        x_data = DataValidator.convert_to_2d_list(x_data)
+        DataValidator.validate_ols_gmm_data(y_data, x_data, feature_names)
+        # 2. 调用核心算法（复用！）
+        result: CoreOLSResult = core_ols_regression(
+            y_data=y_data,
+            x_data=x_data,
+            feature_names=feature_names,
+            constant=constant,
+            confidence_level=confidence_level
+        )
+        # 3. 格式化输出
+        if output_format == "json":
+            json_result = json.dumps(result.dict(), ensure_ascii=False, indent=2)
+            if save_path:
+                OutputFormatter.save_to_file(json_result, save_path)
+                return f"分析完成！结果已保存到: {save_path}\n\n{json_result}"
+            return json_result
+        else:
+            # 尝试使用格式化器，失败则回退到JSON
+            try:
+                formatted = OutputFormatter.format_ols_result(result, output_format)
+                if save_path:
+                    OutputFormatter.save_to_file(formatted, save_path)
+                    return f"分析完成！\n\n{formatted}\n\n已保存到: {save_path}"
+                return formatted
+            except Exception as e:
+                # 回退到JSON格式
+                json_result = json.dumps(result.dict(), ensure_ascii=False, indent=2)
+                warning = f"警告: {output_format}格式化失败({str(e)})，返回JSON格式\n\n"
+                if save_path:
+                    OutputFormatter.save_to_file(json_result, save_path)
+                    return f"{warning}分析完成！结果已保存到: {save_path}\n\n{json_result}"
+                return warning + json_result
+    @staticmethod
+    def mle_estimation(
+        data: Optional[List[float]] = None,
+        file_path: Optional[str] = None,
+        distribution: str = "normal",
+        initial_params: Optional[List[float]] = None,
+        confidence_level: float = 0.95,
+        output_format: str = "json",
+        save_path: Optional[str] = None
+    ) -> str:
+        """
+        MLE估计适配器
+        优势：复用econometrics/核心算法
+        """
+        # 1. 数据准备
+        if file_path:
+            data_dict = MLEDataLoader.load_from_file(file_path)
+            data = data_dict["data"]
+        elif data is None:
+            raise ValueError("必须提供文件路径(file_path)或直接数据(data)")
+        # 2. 调用核心算法（复用！）
+        result: CoreMLEResult = core_mle_estimation(
+            data=data,
+            distribution=distribution,
+            initial_params=initial_params,
+            confidence_level=confidence_level
+        )
+        # 3. 格式化输出
+        if output_format == "json":
+            json_result = json.dumps(result.dict(), ensure_ascii=False, indent=2)
+            if save_path:
+                OutputFormatter.save_to_file(json_result, save_path)
+                return f"分析完成！结果已保存到: {save_path}\n\n{json_result}"
+            return json_result
+        else:
+            # 尝试使用格式化器，失败则回退到JSON
+            try:
+                formatted = OutputFormatter.format_mle_result(result, output_format)
+                if save_path:
+                    OutputFormatter.save_to_file(formatted, save_path)
+                    return f"分析完成！\n\n{formatted}\n\n已保存到: {save_path}"
+                return formatted
+            except Exception as e:
+                # 回退到JSON格式
+                json_result = json.dumps(result.dict(), ensure_ascii=False, indent=2)
+                warning = f"警告: {output_format}格式化失败({str(e)})，返回JSON格式\n\n"
+                if save_path:
+                    OutputFormatter.save_to_file(json_result, save_path)
+                    return f"{warning}分析完成！结果已保存到: {save_path}\n\n{json_result}"
+                return warning + json_result
+    @staticmethod
+    def gmm_estimation(
+        y_data: Optional[List[float]] = None,
+        x_data: Optional[List[List[float]]] = None,
+        file_path: Optional[str] = None,
+        instruments: Optional[List[List[float]]] = None,
+        feature_names: Optional[List[str]] = None,
+        constant: bool = True,
+        confidence_level: float = 0.95,
+        output_format: str = "json",
+        save_path: Optional[str] = None
+    ) -> str:
+        """
+        GMM估计适配器
+        优势：复用econometrics/核心算法
+        增强：添加数值稳定性检查
+        """
+        # 1. 数据准备
+        if file_path:
+            data = DataLoader.load_from_file(file_path)
+            y_data = data["y_data"]
+            x_data = data["x_data"]
+            feature_names = data.get("feature_names") or feature_names
+        elif y_data is None or x_data is None:
+            raise ValueError("必须提供文件路径(file_path)或直接数据(y_data和x_data)")
+        # 数据验证和转换
+        x_data = DataValidator.convert_to_2d_list(x_data)
+        DataValidator.validate_ols_gmm_data(y_data, x_data, feature_names)
+        # 转换工具变量格式
+        if instruments:
+            instruments = DataValidator.convert_to_2d_list(instruments)
+        # 2. 调用核心算法（复用！）
+        try:
+            result: CoreGMMResult = core_gmm_estimation(
+                y_data=y_data,
+                x_data=x_data,
+                instruments=instruments,
+                feature_names=feature_names,
+                constant=constant,
+                confidence_level=confidence_level
+            )
+        except Exception as e:
+            # 提供更详细的错误信息
+            error_msg = f"GMM估计失败: {str(e)}\n"
+            error_msg += "可能原因:\n"
+            error_msg += "1. 数据存在多重共线性\n"
+            error_msg += "2. 工具变量不足或无效\n"
+            error_msg += "3. 矩阵奇异（数值不稳定）\n"
+            error_msg += "建议:\n"
+            error_msg += "- 检查数据质量\n"
+            error_msg += "- 增加工具变量数量\n"
+            error_msg += "- 尝试标准化数据\n"
+            raise ValueError(error_msg) from e
+        # 3. 格式化输出
+        if output_format == "json":
+            json_result = json.dumps(result.dict(), ensure_ascii=False, indent=2)
+            if save_path:
+                OutputFormatter.save_to_file(json_result, save_path)
+                return f"分析完成！结果已保存到: {save_path}\n\n{json_result}"
+            return json_result
+        else:
+            # 尝试使用格式化器，失败则回退到JSON
+            try:
+                formatted = OutputFormatter.format_gmm_result(result, output_format)
+                if save_path:
+                    OutputFormatter.save_to_file(formatted, save_path)
+                    return f"分析完成！\n\n{formatted}\n\n已保存到: {save_path}"
+                return formatted
+            except Exception as e:
+                # 回退到JSON格式
+                json_result = json.dumps(result.dict(), ensure_ascii=False, indent=2)
+                warning = f"警告: {output_format}格式化失败({str(e)})，返回JSON格式\n\n"
+                if save_path:
+                    OutputFormatter.save_to_file(json_result, save_path)
+                    return f"{warning}分析完成！结果已保存到: {save_path}\n\n{json_result}"
+                return warning + json_result
+# 便捷别名
+ols_adapter = EconometricsAdapter.ols_regression
+mle_adapter = EconometricsAdapter.mle_estimation
+# 导入模型规范、诊断和稳健推断适配器
+from .model_specification_adapter import (
+    diagnostic_tests_adapter,
+    gls_adapter,
+    wls_adapter,
+    robust_errors_adapter,
+    model_selection_adapter,
+    regularization_adapter,
+    simultaneous_equations_adapter
+)
+gmm_adapter = EconometricsAdapter.gmm_estimation

aigroup-econ-mcp 1.3.3__py3-none-any.whl → 2.0.1__py3-none-any.whl

aigroup-econ-mcp 1.3.3py3-none-any.whl → 2.0.1py3-none-any.whl