PyPI - tsadmetrics - Versions diffs - 0.1.3__py3-none-any.whl → 0.1.5__py3-none-any.whl - Mend

tsadmetrics 0.1.3py3-none-any.whl → 0.1.5py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (48) hide show

entorno/bin/activate_this.py +32 -0
entorno/bin/rst2html.py +23 -0
entorno/bin/rst2html4.py +26 -0
entorno/bin/rst2html5.py +33 -0
entorno/bin/rst2latex.py +26 -0
entorno/bin/rst2man.py +27 -0
entorno/bin/rst2odt.py +28 -0
entorno/bin/rst2odt_prepstyles.py +20 -0
entorno/bin/rst2pseudoxml.py +23 -0
entorno/bin/rst2s5.py +24 -0
entorno/bin/rst2xetex.py +27 -0
entorno/bin/rst2xml.py +23 -0
entorno/bin/rstpep2html.py +25 -0
experiments/scripts/compute_metrics.py +187 -0
experiments/scripts/metrics_complexity_analysis.py +109 -0
experiments/scripts/metro_experiment.py +133 -0
experiments/scripts/opt_metro_experiment.py +343 -0
tests/__init__.py +0 -0
tests/test_binary.py +759 -0
tests/test_non_binary.py +371 -0
tsadmetrics/_tsadeval/affiliation/__init__.py +0 -0
tsadmetrics/_tsadeval/affiliation/_affiliation_zone.py +86 -0
tsadmetrics/_tsadeval/affiliation/_integral_interval.py +464 -0
tsadmetrics/_tsadeval/affiliation/_single_ground_truth_event.py +68 -0
tsadmetrics/_tsadeval/affiliation/generics.py +135 -0
tsadmetrics/_tsadeval/affiliation/metrics.py +114 -0
tsadmetrics/_tsadeval/eTaPR_pkg/DataManage/File_IO.py +175 -0
tsadmetrics/_tsadeval/eTaPR_pkg/DataManage/Range.py +50 -0
tsadmetrics/_tsadeval/eTaPR_pkg/DataManage/Time_Plot.py +184 -0
tsadmetrics/_tsadeval/eTaPR_pkg/DataManage/__init__.py +0 -0
tsadmetrics/_tsadeval/eTaPR_pkg/__init__.py +0 -0
tsadmetrics/_tsadeval/eTaPR_pkg/etapr.py +386 -0
tsadmetrics/_tsadeval/eTaPR_pkg/tapr.py +362 -0
tsadmetrics/_tsadeval/prts/__init__.py +0 -0
tsadmetrics/_tsadeval/prts/base/__init__.py +0 -0
tsadmetrics/_tsadeval/prts/base/time_series_metrics.py +165 -0
tsadmetrics/_tsadeval/prts/basic_metrics_ts.py +121 -0
tsadmetrics/_tsadeval/prts/time_series_metrics/__init__.py +0 -0
tsadmetrics/_tsadeval/prts/time_series_metrics/fscore.py +61 -0
tsadmetrics/_tsadeval/prts/time_series_metrics/precision.py +86 -0
tsadmetrics/_tsadeval/prts/time_series_metrics/precision_recall.py +21 -0
tsadmetrics/_tsadeval/prts/time_series_metrics/recall.py +85 -0
{tsadmetrics-0.1.3.dist-info → tsadmetrics-0.1.5.dist-info}/METADATA +1 -1
tsadmetrics-0.1.5.dist-info/RECORD +62 -0
tsadmetrics-0.1.5.dist-info/top_level.txt +4 -0
tsadmetrics-0.1.3.dist-info/RECORD +0 -20
tsadmetrics-0.1.3.dist-info/top_level.txt +0 -1
{tsadmetrics-0.1.3.dist-info → tsadmetrics-0.1.5.dist-info}/WHEEL +0 -0

tsadmetrics/_tsadeval/eTaPR_pkg/etapr.py ADDED Viewed

@@ -0,0 +1,386 @@
+from .tapr import *
+import math
+import argparse
+from .DataManage import File_IO#, Time_Plot
+import numpy as np
+from .DataManage import Range as rng
+class eTaPR(TaPR):
+    def __init__(self, theta_p, theta_r, delta=0.0):
+        super(eTaPR, self).__init__(0.0, 0)
+        self._predictions_weight = []
+        self._predictions_total_weight = 0.0
+        self._prune_predictions = []
+        self._theta_p = theta_p
+        self._theta_r = theta_r
+        self._delta_ratio = delta
+        self._overlap_score_mat_org = np.zeros(1)
+        self._overlap_score_mat_elm = np.zeros(1) #eleminate by prunning
+        self._max_anomaly_score = []
+        self._max_prediction_score = []
+        self._weight_func = math.sqrt
+    def _gen_ambiguous(self):
+        for i in range(len(self._anomalies)):
+            start_id = self._anomalies[i].get_time()[1] + 1
+            end_id = start_id + int(self._delta_ratio * (self._anomalies[i].get_time()[1] - self._anomalies[i].get_time()[0]))
+            # if the next anomaly occurs during the theta, update the end_id
+            if i + 1 < len(self._anomalies) and end_id > self._anomalies[i + 1].get_time()[0]:
+                end_id = self._anomalies[i + 1].get_time()[0] - 1
+            if start_id > end_id:
+                start_id = -2
+                end_id = -1
+            self._ambiguous_inst.append(rng.Range(start_id, end_id, str(i)))
+    #load data -> build the score matrix -> do pruning
+    def set(self, anomalies: list, predictions: list) -> None:
+        #loading data
+        self.set_anomalies(anomalies)
+        self.set_predictions(predictions)
+        #computing weights
+        for a_prediction in self._predictions:
+            first, last = a_prediction.get_time()
+            temp_weight = math.sqrt(last-first+1)
+            self._predictions_weight.append(temp_weight)
+            self._predictions_total_weight += temp_weight
+        #computing the score matrix
+        self._overlap_score_mat_org = np.zeros((self.get_n_anomalies(), self.get_n_predictions()))
+        for anomaly_id in range(self.get_n_anomalies()):
+            for prediction_id in range(self.get_n_predictions()):
+                self._overlap_score_mat_org[anomaly_id, prediction_id] = \
+                    float(self._overlap_and_subsequent_score(self._anomalies[anomaly_id], self._ambiguous_inst[anomaly_id], self._predictions[prediction_id]))
+        #computing the maximum scores for each anomaly or prediction
+        for an_anomaly in self._anomalies:
+            start, end = an_anomaly.get_time()
+            self._max_anomaly_score.append(float(self._sum_of_func(start, end, start, end, self._uniform_func)))
+        for a_prediction in self._predictions:
+            self._max_prediction_score.append(a_prediction.get_len())
+        #pruning
+        self._pruning()
+    def _pruning(self):
+        self._overlap_score_mat_elm = self._overlap_score_mat_org.copy()
+        while True:
+            tars = self._overlap_score_mat_elm.sum(axis=1)/self._max_anomaly_score
+            elem_anomaly_ids = set(np.where(tars<self._theta_r)[0]) - set(np.where(tars==0.0)[0])
+            for id in elem_anomaly_ids:
+                self._overlap_score_mat_elm[id] = np.zeros(self.get_n_predictions())
+            taps = self._overlap_score_mat_elm.sum(axis=0)/self._max_prediction_score
+            elem_prediction_ids = set(np.where(taps<self._theta_p)[0]) - set(np.where(taps==0.0)[0])
+            for id in elem_prediction_ids:
+                self._overlap_score_mat_elm[:, id] = np.zeros(self.get_n_anomalies())
+            if len(elem_anomaly_ids) == 0 and len(elem_prediction_ids) == 0:
+                break
+    def _etar_d(self, theta: float) -> np.array and list:
+        if self.get_n_anomalies() == 0.0 or self.get_n_predictions() == 0.0:
+            return np.zeros(self.get_n_anomalies()), []
+        scores = self._overlap_score_mat_elm.sum(axis=1)/self._max_anomaly_score
+        scores = np.where(scores >= theta, 1.0, scores)
+        scores = np.where(scores <  theta, 0.0, scores)
+        detected_id_list = np.where(scores >= theta)[0]
+        return scores, detected_id_list
+    def eTaR_d(self) -> float and list:
+        _, detected_id_list = self._etar_d(self._theta_r)
+        return len(detected_id_list)/self.get_n_anomalies(), detected_id_list
+    def _etar_p(self) -> np.array:
+        if self.get_n_anomalies() == 0.0 or self.get_n_predictions() == 0.0:
+            return 0.0
+        scores = self._overlap_score_mat_elm.sum(axis=1) / self._max_anomaly_score
+        scores = np.where(scores > 1.0, 1.0, scores)
+        return scores
+    def eTaR_p(self) -> float:
+        scores = self._etar_p()
+        return scores.mean()
+    def eTaR(self) -> float:
+        detection_scores, detected_id_list = self._etar_d(self._theta_r)
+        portion_scores = self._etar_p()
+        return ((detection_scores + detection_scores * portion_scores)/2).mean(), portion_scores.mean(), len(detected_id_list)/self.get_n_anomalies(), detected_id_list
+    def _etap_d(self, theta: float) -> np.array and list:
+        if self.get_n_anomalies() == 0.0 or self.get_n_predictions() == 0.0:
+            return 0.0, []
+        scores = self._overlap_score_mat_elm.sum(axis=0) / self._max_prediction_score
+        scores = np.where(scores >= theta, 1.0, scores)
+        scores = np.where(scores <  theta, 0.0, scores)
+        correct_id_list = np.where(scores >= theta)[0]
+        return scores, correct_id_list
+    def eTaP_d(self) -> float and list:
+        _, correct_id_list = self._etap_d(self._theta_p)
+        tapd = 0.0
+        for correct_id in correct_id_list:
+            tapd += self._predictions_weight[correct_id]
+        tapd /= float(self._predictions_total_weight)
+        return tapd, correct_id_list
+    def _etap_p(self) -> np.array:
+        if self.get_n_anomalies() == 0.0 or self.get_n_predictions() == 0.0:
+            return 0.0
+        scores = self._overlap_score_mat_elm.sum(axis=0) / self._max_prediction_score
+        return scores
+    def eTaP_p(self) -> float:
+        scores = self._etap_p()
+        final_score = 0.0
+        for i in range(len(scores)):
+            final_score += float(self._predictions_weight[i]) * scores[i]
+        final_score /= float(self._predictions_total_weight)
+        return final_score
+    def eTaP(self) -> float:
+        #Computing etap_d and etap_p manually to optimize the performance
+        etap_d = 0
+        etap_p = 0
+        if self.get_n_anomalies() == 0.0 or self.get_n_predictions() == 0.0:
+            etap_d,etap_p = 0.0, 0.0
+        etap_d = self._overlap_score_mat_elm.sum(axis=0) / self._max_prediction_score
+        etap_p = etap_d
+        etap_d = np.where(etap_d >= self._theta_p, 1.0, etap_d)
+        etap_d = np.where(etap_d <  self._theta_p, 0.0, etap_d)
+        corrected_id_list = np.where(etap_d >= self._theta_p)[0]
+        detection_scores = etap_d
+        portion_scores = etap_p
+        eTaP_d,eTaP_p = 0.0,0.0
+        scores = (detection_scores + detection_scores * portion_scores)/2
+        final_score = 0.0
+        for i in range(max(len(scores),len(etap_d),len(corrected_id_list))):
+            if i < len(scores):
+                final_score += float(self._predictions_weight[i]) * scores[i]
+            if i < len(etap_p):
+                eTaP_p += float(self._predictions_weight[i]) * etap_p[i]
+            if i < len(corrected_id_list):
+                eTaP_d += self._predictions_weight[corrected_id_list[i]]
+        final_score /= float(self._predictions_total_weight)
+        eTaP_d /= float(self._predictions_total_weight)
+        eTaP_p /= float(self._predictions_total_weight)
+        self.eTaP_d_value = eTaP_d
+        self.eTaP_p_value = eTaP_p
+        self.corrected_id_list = corrected_id_list
+        return final_score
+    # conventional precision
+    def precision(self) -> float:
+        if self.get_n_anomalies() == 0.0 or self.get_n_predictions() == 0.0:
+            return 0.0
+        return self._overlap_score_mat_org.sum() / sum(self._max_prediction_score)
+    # conventional recall
+    def recall(self) -> float:
+        if self.get_n_anomalies() == 0.0 or self.get_n_predictions() == 0.0:
+            return 0.0
+        return self._overlap_score_mat_org.sum() / sum(self._max_anomaly_score)
+    # point adjust precision
+    def point_adjust_precision(self, theta: float) -> float:
+        if self.get_n_anomalies() == 0.0 or self.get_n_predictions() == 0.0:
+            return 0.0
+        _, detected_id_list = self._TaR_d(self._anomalies, [ rng.Range(-2, -1, '' ) for i in range(len(self._anomalies)) ], self._predictions, theta)
+        hit_cnt = 0
+        for detected_id in detected_id_list:
+            hit_cnt += self._anomalies[detected_id].get_len()
+        extended_predictions_len = sum(self._max_prediction_score) + hit_cnt - self._overlap_score_mat_org.sum()
+        return hit_cnt / extended_predictions_len
+    def point_adjust_recall(self, theta: float) -> float:
+        if self.get_n_anomalies() == 0.0 or self.get_n_predictions() == 0.0:
+            return 0.0
+        _, detected_id_list = self._TaR_d(self._anomalies, [ rng.Range(-2, -1, '' ) for i in range(len(self._anomalies)) ], self._predictions, theta)
+        hit_cnt = 0
+        for detected_id in detected_id_list:
+            hit_cnt += self._anomalies[detected_id].get_len()
+        return hit_cnt / sum(self._max_anomaly_score)
+import time
+def evaluate_w_ranges(anomalies: list, predictions: list, theta_p: float, theta_r: float, delta: float = 0.0) -> dict:
+    assert(0.0 <= theta_p <= 1.0)
+    assert(0.0 <= theta_r <= 1.0)
+    assert(0.0 <= delta <= 1.0)
+    ev = eTaPR(theta_p, theta_r, delta)
+    ev.set(anomalies, predictions)
+    tar_value, tarp_value, tard_value, detected_id_list = ev.eTaR()
+    tap_value = ev.eTaP()
+    tapd_value = ev.eTaP_d_value
+    tapp_value = ev.eTaP_p_value
+    result = {}
+    result['eTaR'] = tar_value
+    result['eTaRd'] = tard_value
+    result['eTaRp'] = tarp_value
+    result['eTaP'] = tap_value
+    result['eTaPd'] = tapd_value
+    result['eTaPp'] = tapp_value
+    # detected_anomalies = []
+    # for id in detected_id_list:
+    #     detected_anomalies.append(anomalies[id])
+    # correct_predictions = []
+    # for id in correct_id_list:
+    #     correct_predictions.append(predictions[id])
+    # result['Detected_Anomalies'] = detected_anomalies
+    # result['Correct_Predictions'] = correct_predictions
+    if tar_value + tap_value == 0:
+        result['f1'] = 0.0
+    else:
+        result['f1'] = (2 * tar_value * tap_value) / (tar_value + tap_value)
+    # false_alarm = 0
+    # false_alarm_cnt = 0
+    # for id in range(len(predictions)):
+    #     if id not in correct_id_list:
+    #         false_alarm += predictions[id].get_len()
+    #         false_alarm_cnt += 1
+    # result['False Alarm'] = false_alarm
+    # result['N False Alarm'] = false_alarm_cnt
+    # result['precision'] = ev.precision()
+    # result['recall'] = ev.recall()
+    # result['point_adjust_precision'] = ev.point_adjust_precision(1e-10)
+    # result['point_adjust_recall'] = ev.point_adjust_recall(1e-10)
+    return result
+def evaluate_w_streams(anomalies: list, predictions: list, theta_p = 0.7, theta_r: float = 0.1, delta: float = 0.0) -> dict:
+    assert(0.0 <= theta_p <= 1.0)
+    assert(0.0 <= theta_r <= 1.0)
+    assert(0.0 <= delta <= 1.0)
+    anomalous_ranges = File_IO.load_stream_2_range(anomalies, 0, 1, True)
+    predicted_ranges = File_IO.load_stream_2_range(predictions, 0, 1, True)
+    return evaluate_w_ranges(anomalies =anomalous_ranges,
+                   predictions =predicted_ranges,
+                   theta_p=theta_p,
+                   theta_r=theta_r,
+                   delta=delta)
+def evaluate_w_files(anomaly_file: str, prediction_file: str, file_type: str, theta_p: float, theta_r: float, delta: float = 0.0) -> dict:
+    assert(0.0 <= theta_p <= 1.0)
+    assert(0.0 <= theta_r <= 1.0)
+    assert(0.0 <= delta <= 1.0)
+    anomalies = File_IO.load_file(anomaly_file, file_type)
+    predictions = File_IO.load_file(prediction_file, file_type)
+    return evaluate_w_ranges(anomalies, predictions, theta_p, theta_r, delta)
+def print_results(result: dict, verbose: bool) -> None:
+    print('\n[TaR]:', "%0.5f" % result['TaR'])
+    print("\t* Detection score:", "%0.5f" % result['TaRd'])
+    print("\t* Portion score:", "%0.5f" % result['TaRp'])
+    if verbose:
+        buf = '\t\tdetected anomalies: '
+        if len(result['Detected_Anomalies']) == 0:
+            buf += "None  "
+        else:
+            for value in result['Detected_Anomalies']:
+                buf += value.get_name() + '(' + str(value.get_time()[0]) + ':' + str(value.get_time()[1]) + '), '
+        print(buf[:-2])
+    print('\n[TaP]:', "%0.5f" % result['TaP'])
+    print("\t* Detection score:", "%0.5f" % result['TaPd'])
+    print("\t* Portion score:", "%0.5f" % result['TaPp'])
+    if verbose:
+        buf = '\t\tcorrect predictions: '
+        if len(result['Correct_Predictions']) == 0:
+            buf += "None  "
+        else:
+            for value in result['Correct_Predictions']:
+                buf += value.get_name() + '(' + str(value.get_time()[0]) + ':' + str(value.get_time()[1]) + '), '
+        print(buf[:-2])
+def draw_graph(anomalies: list, predictions: list, graph_dst: str) -> None:
+    assert (graph_dst == 'screen' or graph_dst == 'file' or graph_dst == 'none' or graph_dst == 'all')
+    if graph_dst == 'screen' or graph_dst == 'file' or graph_dst == 'all':
+        Time_Plot.draw_graphs(anomalies, predictions, graph_dst)
+if __name__ == '__main__':
+    argument_parser = argparse.ArgumentParser()
+    argument_parser.add_argument("--anomalies", help="anomaly file name (ground truth)", required=True)
+    argument_parser.add_argument("--predictions", help="prediction file name", required=True)
+    argument_parser.add_argument("--filetype", help="choose the file type between range and stream", required=True)
+    argument_parser.add_argument("--graph", help="show graph of results")
+    argument_parser.add_argument("--verbose", help="show detail results", action='store_true')
+    argument_parser.add_argument("--theta_r", help="set parameter theta_r")
+    argument_parser.add_argument("--theta_p", help="set parameter theta_p")
+    argument_parser.add_argument("--delta", help="set parameter delta")
+    # arguments = argument_parser.parse_args()
+    arguments = argument_parser.parse_args()
+    theta_p, theta_r, delta, graph = 0.5, 0.1, 0.0, 'none'  #default values
+    if arguments.tp is not None:
+        theta_p = float(arguments.tp)
+    if arguments.tr is not None:
+        theta_r = float(arguments.tr)
+    if arguments.delta is not None:
+        delta = int(arguments.delta)
+    if arguments.graph is not None:
+        graph = arguments.graph
+    # assert(isinstance(delta, int))
+    assert(graph == 'screen' or graph == 'file' or graph == 'none' or graph == 'all')
+    anomalies = File_IO.load_file(arguments.anomalies, arguments.filetype)
+    predictions = File_IO.load_file(arguments.predictions, arguments.filetype)
+    results = evaluate_w_ranges(anomalies, predictions, theta_p, theta_r, delta)
+    print_results(results, arguments.verbose)
+    draw_graph(anomalies, predictions, graph)

tsadmetrics 0.1.3__py3-none-any.whl → 0.1.5__py3-none-any.whl

tsadmetrics 0.1.3py3-none-any.whl → 0.1.5py3-none-any.whl