PyPI - psyke - Versions diffs - 0.10.2.dev10__py3-none-any.whl → 0.10.4.dev1__py3-none-any.whl - Mend

psyke 0.10.2.dev10py3-none-any.whl → 0.10.4.dev1py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Potentially problematic release.

This version of psyke might be problematic. Click here for more details.

Files changed (8) hide show

psyke/extraction/hypercubic/gridrex/__init__.py CHANGED Viewed

@@ -5,12 +5,12 @@ from psyke.extraction.hypercubic.gridex import GridEx
 class GridREx(GridEx):
     """
-    Explanator implementing GridREx algorithm.
+    Explanator implementing GridREx algorithm, doi:10.24963/kr.2022/57.
     """
     def __init__(self, predictor, grid: Grid, min_examples: int, threshold: float, normalization,
                  seed=get_default_random_seed()):
         super().__init__(predictor, grid, min_examples, threshold, Target.REGRESSION, None, normalization, seed)
-    def _default_cube(self) -> RegressionCube:
+    def _default_cube(self, dimensions=None) -> RegressionCube:
         return RegressionCube()

psyke/genetic/fgin/__init__.py ADDED Viewed

@@ -0,0 +1,74 @@
+import numpy as np
+import pandas as pd
+from psyke import Target
+from psyke.genetic.gin import GIn
+import skfuzzy as skf
+class FGIn(GIn):
+    def __init__(self, train, valid, features, sigmas, slices, min_rules=1, poly=1, alpha=0.5, indpb=0.5, tournsize=3,
+                 metric='R2', output=Target.REGRESSION, warm=False):
+        super().__init__(train, valid, features, sigmas, slices, min_rules, poly, alpha, indpb, tournsize,
+                         metric, output, warm)
+        self.feature_to_idx = {f: i for i, f in enumerate(self.X.columns)}
+    def _evaluate(self, individual=None):
+        y_pred, valid_regions = self.__predict(individual or self.best, self.X if self.valid is None else self.valid[0])
+        if valid_regions < self.min_rules:
+            return -9999,
+        return self._score(self.y if self.valid is None else self.valid[1], y_pred),
+    @staticmethod
+    def __generate_membership(var, domain, thresholds, shape='tri'):
+        th = [var.min()] + [min(max(t, var.min()), var.max()) for t in thresholds] + [var.max()]
+        if shape == 'tri':
+            mid = [(x1 + x2) / 2 for x1, x2 in zip(th[:-1], th[1:])]
+            return [skf.trapmf(domain, [domain.min()] * 2 + mid[:2])] + \
+                   [skf.trimf(domain, [x1, x2, x3]) for x1, x2, x3 in zip(mid[:-2], mid[1:-1], mid[2:])] + \
+                   [skf.trapmf(domain, mid[-2:] + [domain.max()] * 2)]
+        if shape == 'trap':
+            beg = [None, domain.min()] + [(3 * x1 + x2) / 4 for x1, x2 in zip(th[1:-1], th[2:])] + [domain.max()]
+            end = [domain.min()] + [(x1 + 3 * x2) / 4 for x1, x2 in zip(th[:-2], th[1:-1])] + [domain.max()]
+            return [skf.trapmf(domain, [end[i - 1], beg[i], end[i], beg[i + 1]]) for i in range(1, len(th))]
+        raise ValueError('Supported shape values are only \'tri\' and \'trap\'')
+    @staticmethod
+    def __extend_domain(x, q_low=0.05, q_high=0.95, p=0.05, k_sigma=2.0, abs_min_margin=0.0):
+        ql, qh = np.quantile(x, [q_low, q_high])
+        margin = max(p * (qh - ql), k_sigma * np.std(x), abs_min_margin)
+        return np.array([ql - margin, qh + margin])
+    def __get_activations(self, x, functions_domains, valid_masks):
+        levels = [np.array([skf.interp_membership(domain, mf, x[index]) for mf in mfs])
+                  for mfs, domain, index in functions_domains.values()]
+        return np.prod(np.meshgrid(*levels, indexing='ij'), axis=0).ravel()[valid_masks]
+    def __fuzzify(self, cuts):
+        cuts = dict(zip(self.features, cuts))
+        doms = {c: FGIn.__extend_domain(self.X[c]) for c in self.features}
+        return {c: (FGIn.__generate_membership(self.X[c], doms[c], cuts[c], 'trap'), doms[c],
+                    self.feature_to_idx[c]) for c in self.features}
+    def __predict(self, individual=None, to_pred=None):
+        cuts = self._get_cuts(individual or self.best)
+        masks = np.array([self._region(to_pred, cuts) == r for r in range(np.prod([s + 1 for s in self.slices]))])
+        valid_masks = masks.sum(axis=1) >= 3
+        masks = [mask for mask in masks if mask.sum() >= 3]
+        functions_domains = self.__fuzzify(cuts)
+        pred = np.array([self._output_estimation(mask, to_pred) for mask in masks]).T
+        activations = np.array([self.__get_activations(x, functions_domains, valid_masks) for x in to_pred.values])
+        if self.output == Target.CLASSIFICATION:
+            classes, idx = np.unique(pred, return_inverse=True)
+            pred = classes[np.argmax(np.vstack([activations[:, idx == i].sum(axis=1) for i, c in enumerate(classes)]),
+                                     axis=0)]
+        else:
+            pred = (pred * activations).sum(axis=1)
+        return pd.DataFrame(pred, index=to_pred.index), len(masks)

psyke/genetic/gin/__init__.py CHANGED Viewed

@@ -34,13 +34,13 @@ class GIn:
         self.hof = None
         self.best = None
-        self.setup(warm)
+        self.__setup(warm)
-    def region(self, X, cuts):
-        indices = [np.searchsorted(np.array(cut), X[f].to_numpy(), side='right')
+    def _region(self, x, cuts):
+        indices = [np.searchsorted(np.array(cut), x[f].to_numpy(), side='right')
                    for cut, f in zip(cuts, self.features)]
-        regions = np.zeros(len(X), dtype=int)
+        regions = np.zeros(len(x), dtype=int)
         multiplier = 1
         for idx, n in zip(reversed(indices), reversed([len(cut) + 1 for cut in cuts])):
             regions += idx * multiplier
@@ -48,7 +48,7 @@ class GIn:
         return regions
-    def __output_estimation(self, mask, to_pred):
+    def _output_estimation(self, mask, to_pred):
         if self.output == Target.REGRESSION:
             return LinearRegression().fit(self.poly.fit_transform(self.X)[mask], self.y[mask]).predict(
                 self.poly.fit_transform(to_pred))
@@ -56,9 +56,9 @@ class GIn:
             return np.mean(self.y[mask])
         if self.output == Target.CLASSIFICATION:
             return mode(self.y[mask])
-        raise TypeError('Supported outputs are Target.{REGRESSION, CONSTANT, CLASSIFICATION}')
+        raise ValueError('Supported outputs are Target.{REGRESSION, CONSTANT, CLASSIFICATION}')
-    def __score(self, true, pred):
+    def _score(self, true, pred):
         if self.metric == 'R2':
             return r2_score(true, pred)
         if self.metric == 'MAE':
@@ -69,20 +69,22 @@ class GIn:
             return f1_score(true, pred, average='weighted')
         if self.metric == 'ACC':
             return accuracy_score(true, pred)
-        raise NameError('Supported metrics are R2, MAE, MSE, F1, ACC')
+        raise ValueError('Supported metrics are R2, MAE, MSE, F1, ACC')
     def predict(self, to_pred):
         return self.__predict(to_pred=to_pred)[0]
-    def __predict(self, individual=None, to_pred=None):
-        individual = individual or self.best
+    def _get_cuts(self, individual):
         boundaries = np.cumsum([0] + list(self.slices))
-        cuts = [sorted(individual[boundaries[i]:boundaries[i + 1]]) for i in range(len(self.slices))]
+        return [sorted(individual[boundaries[i]:boundaries[i + 1]]) for i in range(len(self.slices))]
+    def __predict(self, individual=None, to_pred=None):
+        cuts = self._get_cuts(individual or self.best)
-        regions = self.region(to_pred, cuts)
-        regionsT = self.region(self.X, cuts)
+        regions = self._region(to_pred, cuts)
+        regionsT = self._region(self.X, cuts)
-        y_pred = np.empty(len(to_pred), dtype=f'U{self.y.str.len().max()}') if self.output == Target.CLASSIFICATION \
+        pred = np.empty(len(to_pred), dtype=f'U{self.y.str.len().max()}') if self.output == Target.CLASSIFICATION \
             else np.zeros(len(to_pred))
         valid_regions = 0
@@ -91,20 +93,20 @@ class GIn:
             maskT = regionsT == r
             if min(mask.sum(), maskT.sum()) < 3:
                 if self.output != Target.CLASSIFICATION:
-                    y_pred[mask] = np.mean(self.y)
+                    pred[mask] = np.mean(self.y)
                 continue
-            y_pred[mask] = self.__output_estimation(maskT, to_pred[mask])
+            pred[mask] = self._output_estimation(maskT, to_pred[mask])
             valid_regions += 1
-        return y_pred, valid_regions
+        return pred, valid_regions
-    def evaluate(self, individual=None):
+    def _evaluate(self, individual=None):
         y_pred, valid_regions = self.__predict(individual or self.best, self.X if self.valid is None else self.valid[0])
         if valid_regions < self.min_rules:
             return -9999,
-        return self.__score(self.y if self.valid is None else self.valid[1], y_pred),
+        return self._score(self.y if self.valid is None else self.valid[1], y_pred),
-    def setup(self, warm=False):
+    def __setup(self, warm=False):
         if not warm:
             creator.create("FitnessMax", base.Fitness, weights=(1.0,))
             creator.create("Individual", list, fitness=creator.FitnessMax)
@@ -123,7 +125,7 @@ class GIn:
         self.toolbox.register("mutate", tools.mutGaussian, indpb=self.indpb, mu=0,
                               sigma=sum([[sig] * s for sig, s in zip(self.sigmas, self.slices)], []))
         self.toolbox.register("select", tools.selTournament, tournsize=self.tournsize)
-        self.toolbox.register("evaluate", self.evaluate)
+        self.toolbox.register("evaluate", self._evaluate)
         self.stats = tools.Statistics(lambda ind: ind.fitness.values[0])
         self.stats.register("avg", np.mean)
@@ -139,4 +141,4 @@ class GIn:
         result, log = algorithms.eaSimple(pop, self.toolbox, cxpb=cxpb, mutpb=mutpb, ngen=n_gen,
                                           stats=self.stats, halloffame=self.hof, verbose=False)
         self.best = tools.selBest(pop, 1)[0]
-        return self.best, self.evaluate()[0], result, log
+        return self.best, self._evaluate()[0], result, log

{psyke-0.10.2.dev10.dist-info → psyke-0.10.4.dev1.dist-info}/METADATA RENAMED Viewed

@@ -1,6 +1,6 @@
 Metadata-Version: 2.4
 Name: psyke
-Version: 0.10.2.dev10
+Version: 0.10.4.dev1
 Summary: Python-based implementation of PSyKE, i.e. a Platform for Symbolic Knowledge Extraction
 Home-page: https://github.com/psykei/psyke-python
 Author: Matteo Magnini

{psyke-0.10.2.dev10.dist-info → psyke-0.10.4.dev1.dist-info}/RECORD RENAMED Viewed

@@ -18,7 +18,7 @@ psyke/extraction/hypercubic/creepy/__init__.py,sha256=x8a1ftoYHixGpiDfM3u-6QBEDY
 psyke/extraction/hypercubic/divine/__init__.py,sha256=ClO8CITKKXoo7nhlBJagR1yAachsxLHYQlqggl-9eGE,3665
 psyke/extraction/hypercubic/ginger/__init__.py,sha256=7G8H07d6PyIfRjcQjTQbe1WhwpHce_ky7Sy61JoxbqA,4713
 psyke/extraction/hypercubic/gridex/__init__.py,sha256=tPPLGRJ-7fCt-OB-qq6W7EV0hqEuQVUGlXs2yyABo98,3161
-psyke/extraction/hypercubic/gridrex/__init__.py,sha256=h9usK5tFqd6ngBmRydsgkfQ1jlcQKj2uG72Tr1puFHk,595
+psyke/extraction/hypercubic/gridrex/__init__.py,sha256=4ToRAI1ugNC8FyvE6U2Kne3AEXfXmM5nR3PfypqKmzs,637
 psyke/extraction/hypercubic/hex/__init__.py,sha256=553AZjOT9thfqDGtVDI6WtgYNex2Y6dg53cEyuf7Q80,4805
 psyke/extraction/hypercubic/iter/__init__.py,sha256=bb0neiPcNlyyr-OUUjgw4vdkehnAsoyJzVJ88jAHtQ8,10233
 psyke/extraction/real/__init__.py,sha256=zAE_syurDqmFiopD5oLeIs9bROiuXy06wxoHmVqAhCA,5836
@@ -26,7 +26,8 @@ psyke/extraction/real/utils.py,sha256=4NNL15Eu7cmkG9b29GBP6CKgMTV1cmiJVS0k1MbWpI
 psyke/extraction/trepan/__init__.py,sha256=H8F_wpFLPcfyx2tgOOno8FwUomxfVxVl1vxlb0ClP1g,6931
 psyke/extraction/trepan/utils.py,sha256=iSUJ1ooNQT_VO1KfBZuIUeUsyUbGdQf_pSEE87vMeQg,2320
 psyke/genetic/__init__.py,sha256=47DEQpj8HBSa-_TImW-5JCeuQeRkm5NMpJWZG3hSuFU,0
-psyke/genetic/gin/__init__.py,sha256=svO8hwklJ96ZuMiB0qbwBH1B096HvymP5llVt0ntSow,5772
+psyke/genetic/fgin/__init__.py,sha256=iGRJ_7SlC1AwgAhW1_h6V_yp8jjTvAePGp9ftAKkuSQ,3772
+psyke/genetic/gin/__init__.py,sha256=5zQT7iSkBJ9vTre0T2liv4cU1ZcXBZtJx8_fzrQlEvI,5820
 psyke/schema/__init__.py,sha256=axv4ejZY0ItUwrC9IXb_yAhaQL5f1vwvXXmaIAHJmt0,26063
 psyke/tuning/__init__.py,sha256=yd_ForFmHeYbtRXltY1fOa-mPJvpE6ijzg50M_8Sdxw,3649
 psyke/tuning/crash/__init__.py,sha256=zIHEF75EFy_mRIieqzP04qKLG3GLsSc_mYZHpPfkzxU,2623
@@ -38,8 +39,8 @@ psyke/utils/logic.py,sha256=ioP25WMTYNYEzaRDNDe3kGNWqZ6DA_63t19d-ky_2kM,12227
 psyke/utils/metrics.py,sha256=Oo5BOonOSfo0qYsXWT5dmypZ7jiStByFC2MKEU0uMHg,2250
 psyke/utils/plot.py,sha256=dE8JJ6tQ0Ezosid-r2jqAisREjFe5LqExRzsVi5Ns-c,7785
 psyke/utils/sorted.py,sha256=C3CPW2JisND30BRk5c1sAAHs3Lb_wsRB2qZrYFuRnfM,678
-psyke-0.10.2.dev10.dist-info/licenses/LICENSE,sha256=G3mPaubObvkBXbsgTTeYGLk_pNEW8tc7HZr4u_wLEpU,11398
-psyke-0.10.2.dev10.dist-info/METADATA,sha256=DOa6rC0lTAZje50Bq2h_za8XPa1etUCy2zI6qDynPxE,8396
-psyke-0.10.2.dev10.dist-info/WHEEL,sha256=_zCd3N1l69ArxyTb8rzEoP9TpbYXkqRFSNOD5OuxnTs,91
-psyke-0.10.2.dev10.dist-info/top_level.txt,sha256=q1HglxOqqoIRukFtyis_ZNHczZg4gANRUPWkD7HAUTU,6
-psyke-0.10.2.dev10.dist-info/RECORD,,
+psyke-0.10.4.dev1.dist-info/licenses/LICENSE,sha256=G3mPaubObvkBXbsgTTeYGLk_pNEW8tc7HZr4u_wLEpU,11398
+psyke-0.10.4.dev1.dist-info/METADATA,sha256=TzMrtQX0iXkTWLHIViten-8okQ_PK_3Ez1HUdSQsrNk,8395
+psyke-0.10.4.dev1.dist-info/WHEEL,sha256=_zCd3N1l69ArxyTb8rzEoP9TpbYXkqRFSNOD5OuxnTs,91
+psyke-0.10.4.dev1.dist-info/top_level.txt,sha256=q1HglxOqqoIRukFtyis_ZNHczZg4gANRUPWkD7HAUTU,6
+psyke-0.10.4.dev1.dist-info/RECORD,,

{psyke-0.10.2.dev10.dist-info → psyke-0.10.4.dev1.dist-info}/WHEEL RENAMED Viewed

File without changes

{psyke-0.10.2.dev10.dist-info → psyke-0.10.4.dev1.dist-info}/licenses/LICENSE RENAMED Viewed

File without changes

{psyke-0.10.2.dev10.dist-info → psyke-0.10.4.dev1.dist-info}/top_level.txt RENAMED Viewed

File without changes

psyke 0.10.2.dev10__py3-none-any.whl → 0.10.4.dev1__py3-none-any.whl

Potentially problematic release.

psyke 0.10.2.dev10py3-none-any.whl → 0.10.4.dev1py3-none-any.whl