PyPI - srbf - Versions diffs - 0.1.0__py3-none-any.whl - Mend

srbf 0.1.0__py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (37) hide show

srbf/__init__.py +10 -0
srbf/__main__.py +96 -0
srbf/baselines/__init__.py +7 -0
srbf/baselines/brute_force_model.py +329 -0
srbf/baselines/skeleton_pool_model.py +389 -0
srbf/benchmarks/__init__.py +5 -0
srbf/benchmarks/fastsrb.py +524 -0
srbf/compat/__init__.py +5 -0
srbf/compat/nesymres.py +74 -0
srbf/eval/__init__.py +15 -0
srbf/eval/candidate_store.py +308 -0
srbf/eval/core.py +109 -0
srbf/eval/data_sources.py +1015 -0
srbf/eval/engine.py +599 -0
srbf/eval/evaluation.py +159 -0
srbf/eval/formatting.py +59 -0
srbf/eval/metrics/__init__.py +24 -0
srbf/eval/metrics/bootstrap.py +31 -0
srbf/eval/metrics/numeric.py +97 -0
srbf/eval/metrics/symbolic.py +34 -0
srbf/eval/metrics/token_prediction.py +464 -0
srbf/eval/metrics/zss.py +42 -0
srbf/eval/model_adapters.py +1021 -0
srbf/eval/provenance.py +186 -0
srbf/eval/result_processing.py +351 -0
srbf/eval/result_store.py +134 -0
srbf/eval/run_config.py +779 -0
srbf/eval/sample_metadata.py +85 -0
srbf/eval/variable_renaming.py +128 -0
srbf/py.typed +0 -0
srbf-0.1.0.dist-info/METADATA +106 -0
srbf-0.1.0.dist-info/RECORD +37 -0
srbf-0.1.0.dist-info/WHEEL +5 -0
srbf-0.1.0.dist-info/entry_points.txt +2 -0
srbf-0.1.0.dist-info/licenses/LICENSE +21 -0
srbf-0.1.0.dist-info/licenses/THIRD_PARTY_LICENSES +84 -0
srbf-0.1.0.dist-info/top_level.txt +1 -0

srbf/__init__.py ADDED Viewed

@@ -0,0 +1,10 @@
+"""srbf: the symbolic-regression evaluation framework, carved from flash-ansr.
+Engine + model adapters + benchmarks + metrics for evaluating symbolic-regression models.
+Depends one-way on flash-ansr (srbf imports flash-ansr; flash-ansr never imports srbf).
+"""
+from srbf.eval.evaluation import Evaluation
+from srbf.eval.run_config import EvaluationRunPlan, build_evaluation_run
+__all__ = ["Evaluation", "EvaluationRunPlan", "build_evaluation_run"]
+__version__ = "0.1.0"

srbf/__main__.py ADDED Viewed

@@ -0,0 +1,96 @@
+"""srbf command-line interface: the ``run`` subcommand carved from flash-ansr.
+flash-ansr keeps the rest of its CLI (train / benchmark / import-data / install / ...); only
+``run`` is evaluation-bound and lives here. The eval imports are ``srbf.eval.*``; the
+flash-ansr ``utils`` imports are the cross-repo contract (srbf depends one-way on flash-ansr).
+"""
+import argparse
+def main(argv: list[str] | None = None) -> None:
+    parser = argparse.ArgumentParser(description="srbf: symbolic-regression evaluation framework")
+    subparsers = parser.add_subparsers(dest="command_name", required=True)
+    run_parser = subparsers.add_parser("run", help="Run an evaluation from a unified config")
+    run_parser.add_argument('-c', '--config', type=str, required=True, help='Path to the evaluation run config file')
+    run_parser.add_argument('-n', '--limit', type=int, default=None, help='Override the sample limit specified in the config')
+    run_parser.add_argument('-o', '--output-file', type=str, default=None, help='Override the output file path from the config')
+    run_parser.add_argument('--save-every', type=int, default=None, help='Override periodic save frequency')
+    run_parser.add_argument('--no-resume', action='store_true', help='Ignore previous results even if the output file exists')
+    run_parser.add_argument('--experiment', type=str, default=None, help='Name of the experiment defined in the config to execute')
+    run_parser.add_argument('-v', '--verbose', action='store_true', help='Print a progress bar')
+    args = parser.parse_args(argv)
+    match args.command_name:
+        case 'run':
+            from srbf.eval.run_config import build_evaluation_run, EvaluationRunPlan
+            from flash_ansr.utils.config_io import load_config
+            from flash_ansr.utils.paths import substitute_root_path
+            config_path = substitute_root_path(args.config)
+            if args.verbose:
+                print(f"Running evaluation plan from {config_path}")
+            raw_config = load_config(config_path)
+            experiment_map = raw_config.get("experiments") if isinstance(raw_config, dict) else None
+            from srbf.eval.provenance import collect_provenance, format_provenance
+            base_prov = collect_provenance(config_path, None)
+            print(format_provenance(base_prov), flush=True)
+            def _execute_plan(plan: EvaluationRunPlan, experiment_name: str | None = None) -> None:
+                label = f"[{experiment_name}] " if experiment_name else ""
+                if plan.completed or plan.engine is None:
+                    if args.verbose:
+                        target = plan.total_limit or 'configured'
+                        print(f"{label}Evaluation already completed ({plan.existing_results}/{target}). Nothing to do.")
+                    return
+                plan.engine.run(
+                    limit=plan.remaining,
+                    save_every=plan.save_every,
+                    output_path=plan.output_path,
+                    verbose=args.verbose,
+                    progress=args.verbose,
+                    meta={**base_prov, "experiment": experiment_name},
+                )
+                if args.verbose:
+                    total = plan.engine.result_store.size
+                    destination = plan.output_path or 'memory'
+                    print(f"{label}Evaluation finished with {total} samples (saved to {destination}).")
+            if experiment_map and args.experiment is None:
+                experiment_names = list(experiment_map.keys())
+                if args.verbose:
+                    count = len(experiment_names)
+                    print(f"No --experiment provided; running all {count} experiments defined in config.")
+                for experiment_name in experiment_names:
+                    if args.verbose:
+                        print(f"--> {experiment_name}")
+                    plan = build_evaluation_run(
+                        config=config_path,
+                        limit_override=args.limit,
+                        output_override=args.output_file,
+                        save_every_override=args.save_every,
+                        resume=None if not args.no_resume else False,
+                        experiment=experiment_name,
+                    )
+                    _execute_plan(plan, experiment_name)
+            else:
+                plan = build_evaluation_run(
+                    config=config_path,
+                    limit_override=args.limit,
+                    output_override=args.output_file,
+                    save_every_override=args.save_every,
+                    resume=None if not args.no_resume else False,
+                    experiment=args.experiment,
+                )
+                _execute_plan(plan, args.experiment)
+        case _:
+            parser.print_help()
+if __name__ == "__main__":
+    main()

srbf/baselines/__init__.py ADDED Viewed

@@ -0,0 +1,7 @@
+from .skeleton_pool_model import SkeletonPoolModel
+from .brute_force_model import BruteForceModel
+__all__ = [
+    "SkeletonPoolModel",
+    "BruteForceModel",
+]

srbf/baselines/brute_force_model.py ADDED Viewed

@@ -0,0 +1,329 @@
+import copy
+import os
+from collections import defaultdict
+from typing import Any, Generator, Literal, Sequence
+import numpy as np
+import pandas as pd
+import torch
+from sklearn.base import BaseEstimator
+from simplipy import SimpliPyEngine
+from simplipy.utils import construct_expressions
+from flash_ansr.expressions import SkeletonPool
+from flash_ansr.refine import Refiner, ConvergenceError
+from flash_ansr.scoring import compute_fvu, count_constants, is_constant_token, normalize_variance, score_from_fvu
+from flash_ansr.utils.paths import substitute_root_path
+class BruteForceModel(BaseEstimator):
+    """Exhaustive baseline that enumerates expressions in increasing length.
+    Expressions are generated shortest-first using ``simplipy.utils.construct_expressions``
+    over the operator and variable vocabulary defined by the provided
+    ``SkeletonPool``. Each candidate is refined with the shared ``Refiner`` to
+    fit constants against user-supplied data.
+    """
+    FLOAT64_EPS: float = float(np.finfo(np.float64).eps)
+    def __init__(
+        self,
+        *,
+        simplipy_engine: SimpliPyEngine,
+        skeleton_pool: str | dict[str, Any] | SkeletonPool,
+        max_expressions: int = 10_000,
+        max_length: int | None = None,
+        include_constant_token: bool = True,
+        ignore_holdouts: bool = True,
+        n_restarts: int = 8,
+        refiner_method: Literal[
+            'curve_fit_lm',
+            'minimize_bfgs',
+            'minimize_lbfgsb',
+            'minimize_neldermead',
+            'minimize_powell',
+            'least_squares_trf',
+            'least_squares_dogbox',
+        ] = 'curve_fit_lm',
+        refiner_p0_noise: Literal['uniform', 'normal'] | None = 'normal',
+        refiner_p0_noise_kwargs: dict | Literal['default'] | None = 'default',
+        numpy_errors: Literal['ignore', 'warn', 'raise', 'call', 'print', 'log'] | None = 'ignore',
+        length_penalty: float = 0.05,
+        constants_penalty: float = 0.0,
+        likelihood_penalty: float = 0.0,
+    ) -> None:
+        self.simplipy_engine = simplipy_engine
+        self.max_expressions = int(max_expressions)
+        self.max_length = max_length
+        self.include_constant_token = include_constant_token
+        self.ignore_holdouts = ignore_holdouts
+        self.n_restarts = n_restarts
+        self.refiner_method = refiner_method
+        self.refiner_p0_noise = refiner_p0_noise
+        if refiner_p0_noise_kwargs == 'default':
+            refiner_p0_noise_kwargs = {'loc': 0.0, 'scale': 5.0}
+        self.refiner_p0_noise_kwargs = copy.deepcopy(refiner_p0_noise_kwargs) if refiner_p0_noise_kwargs is not None else None
+        self.numpy_errors = numpy_errors
+        self.length_penalty = float(length_penalty)
+        self.constants_penalty = float(constants_penalty)
+        self.likelihood_penalty = float(likelihood_penalty)
+        self._pool = self._ensure_pool(skeleton_pool)
+        self._results: list[dict[str, Any]] = []
+        self.results: pd.DataFrame = pd.DataFrame()
+        self._input_dim: int | None = None
+    @property
+    def n_variables(self) -> int:
+        return self._pool.n_variables
+    def _ensure_pool(self, skeleton_pool_ref: str | dict[str, Any] | SkeletonPool) -> SkeletonPool:
+        if isinstance(skeleton_pool_ref, SkeletonPool):
+            pool = skeleton_pool_ref
+        elif isinstance(skeleton_pool_ref, str):
+            resolved = substitute_root_path(skeleton_pool_ref)
+            if os.path.isdir(resolved):
+                _, pool = SkeletonPool.load(resolved)
+            else:
+                pool = SkeletonPool.from_config(resolved)
+        elif isinstance(skeleton_pool_ref, dict):
+            pool = SkeletonPool.from_config(copy.deepcopy(skeleton_pool_ref))
+        else:
+            raise TypeError("`skeleton_pool` must be a SkeletonPool, path string, or configuration dictionary.")
+        if self.ignore_holdouts:
+            pool.clear_holdouts()
+        return pool
+    def _truncate_input(self, X: np.ndarray) -> np.ndarray:
+        n_features = X.shape[-1]
+        if n_features == self.n_variables:
+            return X
+        if n_features < self.n_variables:
+            pad_width = self.n_variables - n_features
+            pad = np.zeros((*X.shape[:-1], pad_width), dtype=X.dtype)
+            return np.concatenate([X, pad], axis=-1)
+        return X[..., : self.n_variables]
+    @staticmethod
+    def _normalize_variance(variance: float) -> float:
+        return normalize_variance(variance)
+    @staticmethod
+    def _compute_fvu(loss: float, sample_count: int, variance: float) -> float:
+        return compute_fvu(loss, sample_count, variance)
+    @staticmethod
+    def _is_constant_token(token: str) -> bool:
+        return is_constant_token(token)
+    @classmethod
+    def _count_constants(cls, expression: Sequence[str]) -> int:
+        return count_constants(expression)
+    @staticmethod
+    def _score_from_fvu(
+            fvu: float,
+            complexity: int,
+            constant_count: int,
+            log_prob: float | None,
+            length_penalty: float,
+            constants_penalty: float,
+            likelihood_penalty: float) -> float:
+        return score_from_fvu(
+            fvu, complexity, constant_count, log_prob,
+            length_penalty, constants_penalty, likelihood_penalty)
+    def _leaf_nodes(self) -> list[str]:
+        leaves = list(self._pool.variables)
+        if self.include_constant_token:
+            leaves.append('<constant>')
+        return leaves
+    def _non_leaf_nodes(self) -> dict[str, int]:
+        operator_weights = self._pool.operator_weights or {}
+        return {op: arity for op, arity in self.simplipy_engine.operator_arity.items() if operator_weights.get(op, 0) > 0}
+    def _expression_generator(self) -> Generator[tuple[str, ...], None, None]:
+        hashes_by_size: defaultdict[int, set[tuple[str, ...]]] = defaultdict(set)
+        seen: set[tuple[str, ...]] = set()
+        for leaf in self._leaf_nodes():
+            expr = (leaf,)
+            hashes_by_size[1].add(expr)
+            seen.add(expr)
+            yield expr
+            if len(seen) >= self.max_expressions:
+                return
+        target_length = 2
+        while len(seen) < self.max_expressions:
+            new_expressions: list[tuple[str, ...]] = []
+            for expr in construct_expressions(hashes_by_size, self._non_leaf_nodes(), must_have_sizes=None):
+                expr_len = len(expr)
+                if self.max_length is not None and expr_len > self.max_length:
+                    continue
+                if expr_len != target_length:
+                    continue
+                if expr in seen:
+                    continue
+                if not self.simplipy_engine.is_valid(list(expr)):
+                    continue
+                seen.add(expr)
+                new_expressions.append(expr)
+                yield expr
+                if len(seen) >= self.max_expressions:
+                    break
+            if not new_expressions:
+                break
+            hashes_by_size[target_length].update(new_expressions)
+            target_length += 1
+    def fit(self, X: np.ndarray | torch.Tensor | pd.DataFrame, y: np.ndarray | torch.Tensor | pd.DataFrame | Sequence[float], *, verbose: bool = False) -> "BruteForceModel":
+        if len(np.shape(y)) == 1:
+            y = np.reshape(y, (-1, 1))
+        if isinstance(X, torch.Tensor):
+            X_np = X.detach().cpu().numpy()
+        elif isinstance(X, pd.DataFrame):
+            X_np = X.values
+        else:
+            X_np = np.asarray(X)
+        if isinstance(y, torch.Tensor):
+            y_np = y.detach().cpu().numpy()
+        elif isinstance(y, (pd.DataFrame, pd.Series)):
+            y_np = y.values
+        else:
+            y_np = np.asarray(y)
+        if y_np.ndim == 1:
+            y_np = y_np.reshape(-1, 1)
+        elif y_np.shape[-1] != 1:
+            raise ValueError("The target data must have a single output dimension.")
+        X_np = self._truncate_input(np.asarray(X_np))
+        self._input_dim = X_np.shape[1]
+        sample_count = y_np.shape[0]
+        if sample_count <= 1:
+            y_variance = float('nan')
+        else:
+            y_variance = float(np.var(y_np, axis=0, ddof=1).item())
+        numpy_state = np.geterr()
+        np.seterr(all=self.numpy_errors)
+        results: list[dict[str, Any]] = []
+        for skeleton in self._expression_generator():
+            expression_tokens = list(skeleton)
+            try:
+                refiner = Refiner(self.simplipy_engine, n_variables=self.n_variables).fit(
+                    expression=expression_tokens,
+                    X=X_np,
+                    y=y_np,
+                    n_restarts=self.n_restarts,
+                    method=self.refiner_method,
+                    p0=None,
+                    p0_noise=self.refiner_p0_noise,
+                    p0_noise_kwargs=copy.deepcopy(self.refiner_p0_noise_kwargs) if self.refiner_p0_noise_kwargs is not None else None,
+                    converge_error='ignore',
+                )
+            except ConvergenceError:
+                continue
+            if len(refiner._all_constants_values) == 0:
+                continue
+            has_constants = len(refiner.constants_symbols) > 0
+            valid_fit = refiner.valid_fit or not has_constants
+            if not valid_fit:
+                continue
+            loss = float(refiner._all_constants_values[0][-1])
+            if not np.isfinite(loss):
+                continue
+            fvu = self._compute_fvu(loss, sample_count, y_variance)
+            if not np.isfinite(fvu):
+                continue
+            constant_count = self._count_constants(expression_tokens)
+            score = self._score_from_fvu(
+                fvu,
+                len(expression_tokens),
+                constant_count,
+                None,
+                self.length_penalty,
+                self.constants_penalty,
+                self.likelihood_penalty,
+            )
+            results.append({
+                'log_prob': float('nan'),
+                'fvu': fvu,
+                'score': score,
+                'expression': expression_tokens,
+                'constant_count': constant_count,
+                'complexity': len(expression_tokens),
+                'requested_complexity': None,
+                'raw_beam': expression_tokens,
+                'beam': expression_tokens,
+                'raw_beam_decoded': ' '.join(expression_tokens),
+                'function': refiner.expression_lambda,
+                'refiner': refiner,
+                'fits': copy.deepcopy(refiner._all_constants_values),
+                'prompt_metadata': None,
+            })
+            if len(results) >= self.max_expressions:
+                break
+        np.seterr(**numpy_state)
+        results.sort(key=lambda item: item['score'])
+        self._results = results
+        self.results = pd.DataFrame(results)
+        return self
+    def predict(self, X: np.ndarray | torch.Tensor | pd.DataFrame, nth_best: int = 0) -> np.ndarray:
+        if not self._results:
+            raise ValueError("The model has not been fitted yet. Please call `fit` first.")
+        if nth_best >= len(self._results):
+            raise IndexError(f"nth_best={nth_best} is out of range for {len(self._results)} results.")
+        refiner = self._results[nth_best]['refiner']
+        if isinstance(X, torch.Tensor):
+            X_np = X.detach().cpu().numpy()
+        elif isinstance(X, pd.DataFrame):
+            X_np = X.values
+        else:
+            X_np = np.asarray(X)
+        X_np = self._truncate_input(np.asarray(X_np))
+        return refiner.predict(X_np)
+    def get_expression(self, nth_best: int = 0, *, return_prefix: bool = False, precision: int = 2) -> list[str] | str:
+        if not self._results:
+            raise ValueError("The model has not been fitted yet. Please call `fit` first.")
+        if nth_best >= len(self._results):
+            raise IndexError(f"nth_best={nth_best} is out of range for {len(self._results)} results.")
+        refiner = self._results[nth_best]['refiner']
+        return refiner.transform(
+            self._results[nth_best]['expression'],
+            nth_best_constants=0,
+            return_prefix=return_prefix,
+            precision=precision,
+        )