PyPI - accelforge - Versions diffs - 0.0.1__py3-none-any.whl - Mend

accelforge 0.0.1__py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Potentially problematic release.

This version of accelforge might be problematic. Click here for more details.

Files changed (258) hide show

accelforge/__init__.py +21 -0
accelforge/_accelerated_imports.py +16 -0
accelforge/_deprecate/_simanneal/evalmapping.py +271 -0
accelforge/_deprecate/_simanneal/mapspaceglobals.py +298 -0
accelforge/_deprecate/_simanneal/simanneal.py +666 -0
accelforge/_deprecate/_simanneal/tracking.py +105 -0
accelforge/_deprecate/_simanneal/wrappers.py +218 -0
accelforge/_deprecate/_simanneal2/__init__.py +7 -0
accelforge/_deprecate/_simanneal2/simanneal.py +493 -0
accelforge/_deprecate/_simanneal2/tracking.py +116 -0
accelforge/_deprecate/compatibility_util.py +181 -0
accelforge/_deprecate/layerdeduplication/__init__.py +2 -0
accelforge/_deprecate/layerdeduplication/group_similar_einsums.py +160 -0
accelforge/_deprecate/layerdeduplication/grouped_einsums.py +84 -0
accelforge/_deprecate/mapping_filter_tags/__init__.py +2 -0
accelforge/_deprecate/mapping_filter_tags/ffmt.py +212 -0
accelforge/_deprecate/mapping_filter_tags/onesplit.py +24 -0
accelforge/_deprecate/mapping_filter_tags/util.py +24 -0
accelforge/_deprecate/tags.py +69 -0
accelforge/_deprecate/viz/__init__.py +0 -0
accelforge/_deprecate/viz/interactive.py +159 -0
accelforge/_deprecate/viz/reservationtree.py +307 -0
accelforge/_deprecate/viz/ski_slope.py +88 -0
accelforge/_version.py +15 -0
accelforge/examples.py +39 -0
accelforge/frontend/__init__.py +10 -0
accelforge/frontend/_binding.py +129 -0
accelforge/frontend/_workload_isl/__init__.py +2 -0
accelforge/frontend/_workload_isl/_isl.py +149 -0
accelforge/frontend/_workload_isl/_symbolic.py +141 -0
accelforge/frontend/arch copy.py +1544 -0
accelforge/frontend/arch.py +1642 -0
accelforge/frontend/config.py +63 -0
accelforge/frontend/mapper/__init__.py +5 -0
accelforge/frontend/mapper/ffm.py +126 -0
accelforge/frontend/mapper/mapper.py +7 -0
accelforge/frontend/mapper/metrics.py +30 -0
accelforge/frontend/mapping/__init__.py +1 -0
accelforge/frontend/mapping/mapping.py +1736 -0
accelforge/frontend/model.py +14 -0
accelforge/frontend/renames.py +150 -0
accelforge/frontend/spec copy.py +230 -0
accelforge/frontend/spec.py +301 -0
accelforge/frontend/variables.py +12 -0
accelforge/frontend/workload.py +952 -0
accelforge/mapper/FFM/__init__.py +9 -0
accelforge/mapper/FFM/_join_pmappings/__init__.py +0 -0
accelforge/mapper/FFM/_join_pmappings/compatibility.py +653 -0
accelforge/mapper/FFM/_join_pmappings/compress_pmappings.py +140 -0
accelforge/mapper/FFM/_join_pmappings/join_pmappings.py +703 -0
accelforge/mapper/FFM/_join_pmappings/pmapping_dataframe.py +901 -0
accelforge/mapper/FFM/_join_pmappings/pmapping_group.py +337 -0
accelforge/mapper/FFM/_make_pmappings/contraints/__init__.py +0 -0
accelforge/mapper/FFM/_make_pmappings/contraints/constraints.py +360 -0
accelforge/mapper/FFM/_make_pmappings/make_pmapping_templates/__init__.py +1 -0
accelforge/mapper/FFM/_make_pmappings/make_pmapping_templates/make_loops.py +373 -0
accelforge/mapper/FFM/_make_pmappings/make_pmapping_templates/make_pmapping_templates.py +463 -0
accelforge/mapper/FFM/_make_pmappings/make_pmapping_templates/make_reservations.py +95 -0
accelforge/mapper/FFM/_make_pmappings/make_pmapping_templates/make_storage_order.py +382 -0
accelforge/mapper/FFM/_make_pmappings/make_pmapping_templates/make_storages.py +155 -0
accelforge/mapper/FFM/_make_pmappings/make_pmappings.py +411 -0
accelforge/mapper/FFM/_make_pmappings/make_pmappings_from_templates/__init__.py +1 -0
accelforge/mapper/FFM/_make_pmappings/make_pmappings_from_templates/make_pmappings_from_templates.py +407 -0
accelforge/mapper/FFM/_make_pmappings/make_pmappings_from_templates/make_tile_shapes.py +1681 -0
accelforge/mapper/FFM/_make_pmappings/make_pmappings_from_templates/run_model.py +170 -0
accelforge/mapper/FFM/_make_pmappings/make_pmappings_from_templates/symbol_relations.py +174 -0
accelforge/mapper/FFM/_make_pmappings/pmapper_job.py +282 -0
accelforge/mapper/FFM/_pareto_df/df_convention.py +273 -0
accelforge/mapper/FFM/_pareto_df/pareto copy.py +836 -0
accelforge/mapper/FFM/_pareto_df/pareto.py +508 -0
accelforge/mapper/FFM/data.py +61 -0
accelforge/mapper/FFM/main copy.py +236 -0
accelforge/mapper/FFM/main.py +208 -0
accelforge/mapper/FFM/mappings.py +510 -0
accelforge/mapper/FFM/pmappings.py +310 -0
accelforge/mapper/__init__.py +4 -0
accelforge/mapper.py +0 -0
accelforge/model/__init__.py +1 -0
accelforge/model/_looptree/__init__.py +0 -0
accelforge/model/_looptree/accesses.py +335 -0
accelforge/model/_looptree/capacity/__init__.py +1 -0
accelforge/model/_looptree/capacity/aggregators.py +36 -0
accelforge/model/_looptree/capacity/capacity.py +47 -0
accelforge/model/_looptree/energy.py +150 -0
accelforge/model/_looptree/equivalent_ranks.py +29 -0
accelforge/model/_looptree/latency/__init__.py +1 -0
accelforge/model/_looptree/latency/latency.py +98 -0
accelforge/model/_looptree/latency/memory.py +120 -0
accelforge/model/_looptree/latency/processors.py +92 -0
accelforge/model/_looptree/mapping_utilities.py +71 -0
accelforge/model/_looptree/reuse/__init__.py +4 -0
accelforge/model/_looptree/reuse/isl/__init__.py +1 -0
accelforge/model/_looptree/reuse/isl/des.py +59 -0
accelforge/model/_looptree/reuse/isl/isl_functions.py +374 -0
accelforge/model/_looptree/reuse/isl/mapping_to_isl/__init__.py +4 -0
accelforge/model/_looptree/reuse/isl/mapping_to_isl/analyze_mapping.py +297 -0
accelforge/model/_looptree/reuse/isl/mapping_to_isl/skews_from_mapping.py +236 -0
accelforge/model/_looptree/reuse/isl/mapping_to_isl/tiling.py +685 -0
accelforge/model/_looptree/reuse/isl/mapping_to_isl/types.py +188 -0
accelforge/model/_looptree/reuse/isl/spatial.py +260 -0
accelforge/model/_looptree/reuse/isl/temporal.py +182 -0
accelforge/model/_looptree/reuse/symbolic/__init__.py +1 -0
accelforge/model/_looptree/reuse/symbolic/symbolic copy 2.py +1346 -0
accelforge/model/_looptree/reuse/symbolic/symbolic copy.py +1408 -0
accelforge/model/_looptree/reuse/symbolic/symbolic.py +1396 -0
accelforge/model/_looptree/run.py +122 -0
accelforge/model/_looptree/types.py +26 -0
accelforge/model/_looptree/visualization/__init__.py +0 -0
accelforge/model/_looptree/visualization/occupancy.py +11 -0
accelforge/model/main.py +222 -0
accelforge/plotting/__init__.py +2 -0
accelforge/plotting/mappings.py +219 -0
accelforge/plotting/specs.py +57 -0
accelforge/util/__init__.py +4 -0
accelforge/util/_base_analysis_types.py +24 -0
accelforge/util/_basetypes.py +1089 -0
accelforge/util/_frozenset.py +36 -0
accelforge/util/_isl.py +29 -0
accelforge/util/_itertools.py +14 -0
accelforge/util/_mathfuncs.py +57 -0
accelforge/util/_parse_expressions.py +339 -0
accelforge/util/_picklecache.py +32 -0
accelforge/util/_setexpressions.py +268 -0
accelforge/util/_sympy/__init__.py +0 -0
accelforge/util/_sympy/broadcast_max.py +18 -0
accelforge/util/_visualization.py +112 -0
accelforge/util/_yaml.py +579 -0
accelforge/util/parallel.py +193 -0
accelforge-0.0.1.dist-info/METADATA +64 -0
accelforge-0.0.1.dist-info/RECORD +258 -0
accelforge-0.0.1.dist-info/WHEEL +5 -0
accelforge-0.0.1.dist-info/licenses/LICENSE +19 -0
accelforge-0.0.1.dist-info/top_level.txt +5 -0
docs/_build/html/_sources/fastfusion.frontend.mapper.rst.txt +37 -0
docs/_build/html/_sources/fastfusion.frontend.rst.txt +70 -0
docs/_build/html/_sources/fastfusion.frontend.workload.rst.txt +21 -0
docs/_build/html/_sources/fastfusion.mapper.FFM.rst.txt +37 -0
docs/_build/html/_sources/fastfusion.mapper.rst.txt +18 -0
docs/_build/html/_sources/fastfusion.rst.txt +20 -0
docs/_build/html/_sources/fastfusion.util.rst.txt +21 -0
docs/_build/html/_sources/index.rst.txt +87 -0
docs/_build/html/_sources/modules.rst.txt +7 -0
docs/_build/html/_sources/notes/citation.rst.txt +45 -0
docs/_build/html/_sources/notes/definitions.rst.txt +43 -0
docs/_build/html/_sources/notes/faqs.rst.txt +39 -0
docs/_build/html/_sources/notes/modeling/accelerator_energy_latency.rst.txt +72 -0
docs/_build/html/_sources/notes/modeling/component_energy_area.rst.txt +96 -0
docs/_build/html/_sources/notes/modeling/mapping.rst.txt +100 -0
docs/_build/html/_sources/notes/modeling.rst.txt +33 -0
docs/_build/html/_sources/notes/parsing/arithmetic_parsing.rst.txt +136 -0
docs/_build/html/_sources/notes/parsing/setexpressions.rst.txt +63 -0
docs/_build/html/_sources/notes/parsing/yaml_parsing.rst.txt +176 -0
docs/_build/html/_sources/notes/quickstart_and_installation.rst.txt +9 -0
docs/_build/html/_sources/notes/spec/architecture.rst.txt +133 -0
docs/_build/html/_sources/notes/spec/mapping.rst.txt +12 -0
docs/_build/html/_sources/notes/spec/workload.rst.txt +83 -0
docs/_build/html/_sources/notes/spec.rst.txt +36 -0
docs/source/_ext/include_attrs.py +213 -0
docs/source/_ext/include_docstring.py +364 -0
docs/source/_ext/include_functions.py +154 -0
docs/source/_ext/include_notebook.py +131 -0
docs/source/_ext/include_yaml.py +119 -0
docs/source/_ext/inherited_attributes.py +222 -0
docs/source/_ext/paths.py +4 -0
docs/source/conf.py +79 -0
examples/arches/compute_in_memory/_include.yaml +74 -0
examples/arches/compute_in_memory/_include_functions.py +229 -0
examples/arches/compute_in_memory/_load_spec.py +57 -0
examples/arches/compute_in_memory/components/c2c_multiplier.py +181 -0
examples/arches/compute_in_memory/components/dac_c2c_r2r.py +605 -0
examples/arches/compute_in_memory/components/misc.py +195 -0
examples/arches/compute_in_memory/components/util/bit_functions.py +51 -0
examples/arches/compute_in_memory/components/zero_comparator.py +92 -0
examples/arches/compute_in_memory/isaac.yaml +233 -0
examples/arches/compute_in_memory/memory_cells/ecram_demo.yaml +63 -0
examples/arches/compute_in_memory/memory_cells/rram_example.yaml +63 -0
examples/arches/compute_in_memory/memory_cells/rram_isaac_isca_2016.yaml +64 -0
examples/arches/compute_in_memory/memory_cells/rram_neurosim_default.yaml +63 -0
examples/arches/compute_in_memory/memory_cells/rram_raella_isca_2023.yaml +70 -0
examples/arches/compute_in_memory/memory_cells/rram_wan_nature_2022.yaml +63 -0
examples/arches/compute_in_memory/memory_cells/sram_colonnade_jssc_2021.yaml +63 -0
examples/arches/compute_in_memory/memory_cells/sram_example.yaml +63 -0
examples/arches/compute_in_memory/memory_cells/sram_jia_jssc_2020.yaml +63 -0
examples/arches/compute_in_memory/memory_cells/sram_sinangil_jssc_2021.yaml +63 -0
examples/arches/compute_in_memory/memory_cells/sram_wang_vlsi_2022.yaml +63 -0
examples/arches/compute_in_memory/wang_vlsi_2022.yaml +289 -0
examples/arches/eyeriss.yaml +68 -0
examples/arches/fanout_variations/at_glb.yaml +31 -0
examples/arches/fanout_variations/at_glb_with_fanout_node.yaml +34 -0
examples/arches/fanout_variations/at_mac.yaml +31 -0
examples/arches/fanout_variations/at_mac_with_constraints.yaml +38 -0
examples/arches/fanout_variations/at_mac_with_fanout_node.yaml +34 -0
examples/arches/nvdla.yaml +47 -0
examples/arches/simple.yaml +28 -0
examples/arches/tpu_v4i.yaml +67 -0
examples/mappings/unfused_matmuls_to_simple.yaml +33 -0
examples/misc/component_annotated.yaml +33 -0
examples/workloads/gpt3_6.7B.yaml +124 -0
examples/workloads/matmuls.yaml +20 -0
examples/workloads/mobilenet_28.yaml +81 -0
examples/workloads/mobilenet_various_separate.yaml +106 -0
examples/workloads/three_matmuls_annotated.yaml +59 -0
notebooks/.ipynb_checkpoints/fastfusion_arch_study_michael-checkpoint.ipynb +359 -0
notebooks/compute_in_memory/_scripts.py +339 -0
notebooks/compute_in_memory/isaac.guide.ipynb +270 -0
notebooks/compute_in_memory/wang_vlsi_2022.ipynb +602 -0
notebooks/paths.py +4 -0
notebooks/tutorials/.ipynb_checkpoints/1_FFM-checkpoint.ipynb +3110 -0
notebooks/tutorials/FFM.ipynb +3498 -0
notebooks/tutorials/_include.py +48 -0
notebooks/tutorials/component_energy_area.ipynb +363 -0
tests/Q_mapping.yaml +38 -0
tests/__init__.py +0 -0
tests/conv.mapping.yaml +27 -0
tests/conv.workload.yaml +13 -0
tests/conv_sym.mapping.yaml +43 -0
tests/copy.mapping.yaml +35 -0
tests/copy.workload.yaml +15 -0
tests/distribuffers/__init__.py +0 -0
tests/distribuffers/multicast/test_cases.yaml +482 -0
tests/distribuffers/spec/binding/valid_bindings.yaml +97 -0
tests/distribuffers/spec/distributed.yaml +100 -0
tests/distribuffers/spec/logical_arch.yaml +32 -0
tests/distribuffers/spec/physical_arch.yaml +69 -0
tests/distribuffers/test_binding.py +48 -0
tests/frontend/__init__.py +0 -0
tests/frontend/test_mapping_viz.py +52 -0
tests/mapper/__init__.py +0 -0
tests/mapper/configs/conv1d/conv1d.mapping.yaml +31 -0
tests/mapper/configs/conv1d/conv1d.workload.yaml +11 -0
tests/mapper/configs/two_conv1d/two_conv1d.expected.yaml +38 -0
tests/mapper/configs/two_conv1d/two_conv1d.mapping.yaml +54 -0
tests/mapper/configs/two_conv1d/two_conv1d.workload.yaml +19 -0
tests/mapper/test_mapping_to_isl.py +90 -0
tests/mapper/test_spatial_reuse_analysis.py +67 -0
tests/mapper/test_temporal_reuse_analysis.py +56 -0
tests/mapper/util.py +58 -0
tests/matmul.mapping.yaml +29 -0
tests/matmul.workload.yaml +12 -0
tests/matmul_spatial.mapping.yaml +44 -0
tests/mha.renames.yaml +65 -0
tests/mha.workload.yaml +67 -0
tests/mha.yaml +59 -0
tests/mha_full.workload.yaml +67 -0
tests/mobilenet.workload.yaml +35 -0
tests/mobilenet_long.workload.yaml +64 -0
tests/pmappingcache.py +24 -0
tests/processing_stage.arch.yaml +40 -0
tests/snowcat.arch.yaml +36 -0
tests/test_ffm_join_pmappings.py +106 -0
tests/test_ffm_make_pmappings.py +82 -0
tests/test_ffm_make_tile_shapes.py +49 -0
tests/test_mapper.py +100 -0
tests/test_model.py +37 -0
tests/test_plotting.py +72 -0
tests/test_processing_stage.py +46 -0
tests/test_symbolic_model.py +248 -0
tests/test_workload.py +141 -0

accelforge/mapper/FFM/_pareto_df/pareto.py ADDED Viewed

@@ -0,0 +1,508 @@
+import functools
+from math import prod
+import time
+import pandas as pd
+from paretoset import paretoset
+from joblib import delayed
+from sympy import factorint
+from accelforge._accelerated_imports import np
+from accelforge.util.parallel import parallel
+from accelforge.mapper.FFM._pareto_df.df_convention import (
+    col_used_in_pareto,
+    is_fused_loop_col,
+    is_n_iterations_col,
+    is_objective_col,
+)
+def dominates(a: pd.Series, b: pd.Series) -> bool:
+    return all(a[i] <= b[i] for i in range(len(a)))
+def check_dominance(df: pd.DataFrame, n_optimal: int):
+    # mask = np.zeros(len(df), dtype=bool)
+    # mask[:new_point] = True
+    mask = np.zeros(len(df) - n_optimal, dtype=bool)
+    for col in df.columns:
+        compare = df.iloc[n_optimal - 1][col]
+        mask = mask | (df[col].iloc[n_optimal:] < compare)
+    return np.concatenate([np.ones(n_optimal, dtype=bool), mask])
+def quickpareto(df: pd.DataFrame) -> pd.DataFrame:
+    # Step 1: Sort by the column with the most unique values
+    # Step 2: Extract the first row. Add it to the pareto set
+    # Step 3: Remove all dominated points
+    # Step 4: Repeat until no more points to add
+    # Step 1: Sort by the column with the most unique values
+    original_len = len(df)
+    col_to_sort = max(df.columns, key=lambda c: df[c].nunique())
+    df = df.sort_values(by=col_to_sort).drop(columns=[col_to_sort])
+    new_point = 0
+    while new_point < len(df):
+        mask = check_dominance(df, new_point + 1)
+        df = df[mask]
+        new_point += 1
+    # Turn the index into a mask
+    mask = np.zeros(original_len, dtype=bool)
+    mask[df.index] = True
+    return mask
+def makepareto_quick2(mappings: pd.DataFrame, columns: list[str]) -> pd.DataFrame:
+    from fast_pareto import is_pareto_front
+    m2 = mappings[columns]
+    m2 = m2[is_pareto_front(m2.to_numpy())].drop_duplicates()
+    return mappings.loc[m2.index]
+def makepareto_quick(mappings: pd.DataFrame, columns: list[str]) -> pd.DataFrame:
+    return mappings[quickpareto(mappings[columns])]
+def paretofy_chunk(chunk, sense: list[str]):
+    return paretoset(chunk, sense=sense)
+def makepareto_merge(
+    mappings: pd.DataFrame,
+    columns: list[str],
+    parallelize: bool = False,
+    split_by_cols: list[str] = (),
+) -> pd.DataFrame:
+    chunk_size = 10000
+    if len(mappings) <= 1:
+        return mappings
+    sense = ["min"] * len(columns) + ["diff"] * len(split_by_cols)
+    to_chunk = mappings[columns + list(split_by_cols)]
+    chunks = parallel(
+        [
+            delayed(paretofy_chunk)(chunk, sense)
+            for chunk in [
+                to_chunk[i : i + chunk_size]
+                for i in range(0, len(to_chunk), chunk_size)
+            ]
+        ],
+        n_jobs=1 if parallelize else None,
+    )
+    mappings = mappings[np.concatenate(chunks)]
+    return mappings[paretoset(mappings[columns + list(split_by_cols)], sense=sense)]
+def makepareto_time_compare(mappings: pd.DataFrame, columns: list[str]) -> pd.DataFrame:
+    t0 = time.time()
+    pareto = makepareto_merge(mappings, columns)
+    t1 = time.time()
+    merge_time = t1 - t0
+    print(
+        f"Time to make pareto with merge: {t1 - t0: .2f}. Number of pareto points: {len(pareto)}"
+    )
+    t0 = time.time()
+    pareto2 = makepareto_quick2(mappings, columns)
+    t1 = time.time()
+    print(
+        f"Time to make pareto with quick: {t1 - t0: .2f}. Number of pareto points: {len(pareto2)}"
+    )
+    quick_time = t1 - t0
+    print(f"Quick is {quick_time / merge_time: .2f}x slower")
+    if len(pareto) != len(pareto2):
+        print(f"mismatch: {len(pareto)} != {len(pareto2)}")
+        makepareto_quick2(mappings)
+    return pareto2
+# 2d. Blockwise vectorized CuPy Pareto front with sorting by one objective (full check)
+# 2c. Fully vectorized CuPy brute-force Pareto front
+# (returns numpy mask for compatibility)
+def pareto_front_cupy_vectorized(X):
+    # if len(X) > 1000:
+    #     return X[paretoset(X.get(), sense=["min"] * X.shape[1])]
+    # Broadcast X_gpu to (n, n, m) for all-pairs comparison
+    A = X[:, None, :]  # shape (n, 1, m)
+    B = X[None, :, :]  # shape (1, n, m)
+    less_equal = (B <= A).all(axis=2)  # shape (n, n)
+    strictly_less = (B < A).any(axis=2)  # shape (n, n)
+    dominated = less_equal & strictly_less  # shape (n, n)
+    is_pareto = ~dominated.any(axis=1)
+    return is_pareto
+# 2d. Recursive blockwise merge CuPy Pareto front with sorting by one objective
+def pareto_front_cupy_blockwise_sorted_recursive(X, block_size=2000):
+    N = X.shape[0]
+    if N <= block_size:
+        # Base case: just compute Pareto front directly
+        mask = pareto_front_cupy_vectorized(X)
+        return mask
+    # Split into two halves
+    mid = N // 2
+    a, b = X[:mid], X[mid:]
+    mask_a = pareto_front_cupy_blockwise_sorted_recursive(a, block_size)
+    mask_b = pareto_front_cupy_blockwise_sorted_recursive(b, block_size)
+    # Get Pareto-optimal points from both halves
+    pareto_points_a = a[mask_a]
+    pareto_points_b = b[mask_b]
+    merged_points = np.vstack([pareto_points_a, pareto_points_b])
+    # Compute Pareto front of the merged set
+    merged_mask = pareto_front_cupy_vectorized(merged_points)
+    merged_indices = np.where(merged_mask)[0]
+    # Map merged_indices back to the original indices in X
+    # First, get the indices in X for the merged points
+    indices_a = np.where(mask_a)[0]
+    indices_b = np.where(mask_b)[0] + mid
+    all_indices = np.concatenate([indices_a, indices_b])
+    merged_indices_in_X = all_indices[merged_indices]
+    # Build the final mask for X
+    mask = np.zeros(N, dtype=bool)
+    mask[merged_indices_in_X] = True
+    return mask
+# def makepareto(
+#     mappings: pd.DataFrame,
+#     columns: list[str] = None,
+#     parallelize: bool = False,
+#     split_by_cols: list[str] = (),
+# ) -> pd.DataFrame:
+#     # return makepareto_time_compare(mappings)
+#     if columns is None:
+#         columns = [c for c in mappings.columns if col_used_in_pareto(c)]
+#     if _accelerated_imports.ACCELERATED:
+#         mask = pareto_front_cupy_blockwise_sorted_recursive(mappings[columns].to_cupy())
+#         return mappings[mask]
+TOLERANCE = 0.0
+def logify(x: pd.Series) -> pd.Series:
+    if 0 < TOLERANCE < 1:
+        pass
+    else:
+        assert (
+            TOLERANCE == 0
+        ), f"Tolerance must be between 0 and 1. Tolerance {TOLERANCE} is invalid."
+        return x
+    if x.min() <= 0:
+        return x
+    logged = np.log(x)
+    return np.round(logged / TOLERANCE) * TOLERANCE
+def makepareto(
+    mappings: pd.DataFrame,
+    columns: list[str] = None,
+    parallelize: bool = False,
+    split_by_cols: list[str] = (),
+) -> pd.DataFrame:
+    # return makepareto_time_compare(mappings)
+    if columns is None:
+        columns = [c for c in mappings.columns if col_used_in_pareto(c)]
+    # Number of iterations is derived from the tile shapes, so we don't need to use it,
+    # since any row with the same tile shapes will have the same number of iterations.
+    split_by_cols = list(split_by_cols) + [
+        c
+        for c in mappings.columns
+        if is_fused_loop_col(c) and not is_n_iterations_col(c)
+    ]
+    goals = []
+    to_pareto = []
+    pareto_cols = []
+    for c in mappings.columns:
+        if mappings[c].nunique() <= 1:
+            continue
+        if c in columns and is_objective_col(c):  # or col_used_in_pareto(c)):
+            to_pareto.append(logify(mappings[c]))
+            pareto_cols.append(c)
+            goals += ["min"]
+        elif c in split_by_cols:
+            to_pareto.append(mappings[c])
+            pareto_cols.append(c)
+            goals.append("diff")
+        elif c in columns:
+            to_pareto.append(mappings[c])
+            pareto_cols.append(c)
+            goals.append("min")
+    if not to_pareto:
+        return mappings.iloc[0:1]
+    return mappings[paretoset(pd.concat(to_pareto, axis=1), sense=goals)]
+    f = pd.concat(to_pareto, axis=1)
+    x = list(f.groupby([c for c, d in zip(pareto_cols, goals) if d == "diff"]))
+    print(x)
+@functools.lru_cache(maxsize=10000)
+def _factorint_cached(x: int):
+    return factorint(x)
+def prime_factor_counts(arr: np.ndarray) -> np.ndarray:
+    arr = np.asarray(arr, dtype=int)
+    unique_vals = np.unique(arr)
+    factorizations = {x: _factorint_cached(x) for x in unique_vals}
+    # Gather all unique primes
+    all_primes = sorted({p for f in factorizations.values() for p in f})
+    # Build result matrix
+    result = np.zeros((len(arr), len(all_primes)), dtype=int)
+    prime_index = {p: j for j, p in enumerate(all_primes)}
+    for i, x in enumerate(arr):
+        for p, exp in factorizations[x].items():
+            result[i, prime_index[p]] = exp
+    return result
+def paretoset_grouped_dirty(df: pd.DataFrame, sense: list[str]):
+    # return paretoset(df, sense=sense)
+    assert all(i == c for i, c in enumerate(df.columns))
+    assert len(sense) == len(df.columns)
+    from paretoset.algorithms_numba import paretoset_jit
+    from paretoset.algorithms_numba import BNL
+    for c in df.columns:
+        if sense[c] == "max":
+            df[c] = -df[c]
+            sense[c] = "min"
+    GROUP_SIZE = 128
+    group_by = [c for c in df.columns if sense[c] == "diff"]
+    n_groups = prod(len(df[c].unique()) for c in group_by)
+    if len(df) / n_groups < GROUP_SIZE:
+        return paretoset(df, sense=sense)
+    c2unique = {c: len(df[c].unique()) for c in df.columns if c not in group_by}
+    while c2unique:
+        col, n = min(c2unique.items(), key=lambda x: x[1])
+        c2unique.pop(col)
+        n_groups *= n
+        if len(df) / n_groups < GROUP_SIZE:
+            break
+        group_by.append(col)
+    n_diffs = sum(x == "diff" for x in sense)
+    if len(group_by) < 2 or len(group_by) == n_diffs:
+        return paretoset(df, sense=sense)
+    def _row_from_group(mins, group):
+        per_col_mins = group.min(axis=0)
+        per_col_maxs = group.max(axis=0)
+        good_row = group.iloc[
+            np.argmin((group ** (1 / len(group.columns))).prod(axis=1))
+        ]
+        return [mins, per_col_mins, per_col_maxs, good_row, group]
+    groups = list(df.groupby(group_by))
+    groups_by_diff = {}
+    keepcols = [c for c in df.columns if c not in group_by]
+    for x, group in groups:
+        diffs, mins = x[:n_diffs], x[n_diffs:]
+        group = group[keepcols]
+        groups_by_diff.setdefault(diffs, []).append(_row_from_group(mins, group))
+    # print(f'Grouped into {len(groups)} groups using {len(group_by)} columns')
+    # orig_size = len(df)
+    # n_groups = len(groups)
+    # n_cols = len(keepcols)
+    # new_size = sum(len(g2) for g in groups_by_diff.values() for _, _, _, g2 in g)
+    # print(f'Grouped into {n_groups} groups, {orig_size} -> {new_size} rows, {n_cols} columns. Remaining {len(keepcols)} columns')
+    for groups in groups_by_diff.values():
+        for i, (
+            mins_a,
+            per_col_mins_a,
+            per_col_maxs_a,
+            good_row_a,
+            group_a,
+        ) in enumerate(groups):
+            if group_a is None:
+                continue
+            for j, (
+                mins_b,
+                per_col_mins_b,
+                per_col_maxs_b,
+                good_row_b,
+                group_b,
+            ) in enumerate(groups):
+                if group_b is None or i == j:
+                    continue
+                if all(a <= b for a, b in zip(good_row_a, per_col_mins_b)):
+                    groups[j][-1] = None
+                    continue
+                if all(a <= b for a, b in zip(good_row_a, good_row_b)):
+                    # The good row of a dominates the good row of b. It'll likely
+                    # dominate many b!
+                    group_b = group_b[(group_b < good_row_a).any(axis=1)]
+                    if len(group_b) == 0:
+                        groups[j][-1] = None
+                        continue
+                    groups[j].clear()
+                    groups[j].extend(_row_from_group(mins_b, group_b))
+                # # a can only dominate b if all of the min columns dominate
+                # if not all(a <= b for a, b in zip(mins_a, mins_b)):
+                #     continue
+                # # Check if any b beats all a. If so, continue.
+                # if any(a > b for a, b in zip(per_col_mins_a, per_col_maxs_b)):
+                #     continue
+                # # # Check if any a beats every b. If so, get rid of b.
+                # # a_doms = all(a <= b for a, b in zip(per_col_maxs_a, per_col_mins_b))
+                # # if a_doms:
+                # #     groups[j][-1] = None
+                # #     # print(f'Dropping dominated group {j}')
+                # #     continue
+                # row_a = group_a.iloc[np.random.randint(len(group_a))]
+                # if all(a <= b for a, b in zip(row_w_min_first_obj_b, per_col_mins_b)):
+                #     groups[j][-1] = None
+                # Everything below just ended up making things slower
+                # if any(a > b for a, b in zip(row_a, per_col_maxs_b)):
+                #     continue
+                # continue
+                # # Grab a random a. Get rid of all b that are dominated by it.
+                # a_lt_b_maxes = group_a.iloc[
+                #     np.where(np.all(group_a <= per_col_maxs_b, axis=1))[0]
+                # ]
+                # if len(a_lt_b_maxes) == 0:
+                #     continue
+                # row_a = a_lt_b_maxes.iloc[np.random.randint(len(a_lt_b_maxes))]
+                # b_idx = np.where(np.any(group_b < row_a, axis=1))[0]
+                # if len(b_idx) == 0:
+                #     groups[j][-1] = None
+                # else:
+                #     groups[j][-1] = group_b.iloc[b_idx]
+                #     groups[j][1] = group_b.iloc[b_idx].min(axis=0)
+                #     groups[j][2] = group_b.iloc[b_idx].max(axis=0)
+                # # Now we're in a case where a may dominate b. Update b.
+                # catted = pd.concat([group_a, group_b], axis=0)
+                # mask = np.concatenate([
+                #     np.zeros(len(group_a), dtype=bool),
+                #     np.ones(len(group_b), dtype=bool)
+                # ])
+                # catted = catted[paretoset_jit(catted.to_numpy()) & mask]
+                # groups[j][1] = catted.min(axis=0)
+                # groups[j][2] = catted.max(axis=0)
+                # groups[j][3] = catted
+    result = np.zeros(len(df), dtype=bool)
+    for group in groups_by_diff.values():
+        for _, _, _, _, group in group:
+            if group is not None:
+                result[group[paretoset_jit(group.to_numpy())].index] = True
+    return result
+def makepareto_numpy(
+    mappings: np.ndarray,
+    goals: list[str],
+    dirty: bool = False,
+) -> pd.DataFrame:
+    to_pareto = []
+    new_goals = []
+    assert len(goals) == mappings.shape[1]
+    for c in range(mappings.shape[1]):
+        if len(np.unique(mappings[:, c])) <= 1:
+            continue
+        goal = goals[c]
+        # if goal != "diff" and dirty and len(np.unique(mappings[:, c])) < np.log2(mappings.shape[0]):
+        #     # print(f"Changed {goal} to diff because there are {len(np.unique(mappings[:, c]))} unique values for {mappings.shape[0]} rows")
+        #     goal = "diff"
+        if goal in ["min", "max"]:
+            l = logify(mappings[:, c].reshape((-1, 1)))
+            to_pareto.append(l if goal == "min" else -l)
+            new_goals.append("min")
+        elif goal == "diff":
+            to_pareto.append(mappings[:, c].reshape((-1, 1)))
+            new_goals.append("diff")
+        elif goal == "min_per_prime_factor":
+            if not dirty:
+                # Paretoset tends to be faster with these as diffs. Tanner tried for a
+                # long time to get min_per_prime_factor to be faster, but it
+                # didn't work. What it would do is say that if one choice for an inner
+                # loop has used up fewer of every prime factor than another choice, then
+                # the latter would give a superset of options for outer loops.
+                # Intuitively, we could enable more pruning by doing this instead of
+                # "diff", which is overconservative. Likewise, we could do "min" for
+                # imperfect instead of "diff". However, this ultimately made things
+                # slower because it didn't get much Pareto pruning, but caused many more
+                # Pareto comparisons ("diff" partitioning into N partitions --> N^2
+                # improvement). I hypothesize that the reason that it doesn't improve
+                # pruning much is that when we've enumerated a loop but not the loop
+                # above it, the given loop is almost always trading off tile shape for
+                # accesses, leading to no point being dominated by another point.
+                to_pareto.append(mappings[:, c].reshape((-1, 1)))
+                new_goals.append("diff")
+            else:
+                counts = prime_factor_counts(mappings[:, c])
+                for i in range(counts.shape[1]):
+                    to_pareto.append(counts[:, i].reshape((-1, 1)))
+                    new_goals.append("min")
+        elif goal == "max_per_prime_factor":
+            if not dirty:
+                # See above big comment.
+                to_pareto.append(mappings[:, c].reshape((-1, 1)))
+                new_goals.append("diff")
+            else:
+                counts = prime_factor_counts(mappings[:, c])
+                for i in range(counts.shape[1]):
+                    to_pareto.append(counts[:, i].reshape((-1, 1)))
+                    new_goals.append("max")
+        else:
+            raise ValueError(f"Unknown goal: {goal}")
+    if not to_pareto:
+        n = np.zeros(mappings.shape[0], dtype=bool)
+        n[0] = True
+        return n
+    df = pd.DataFrame(np.concatenate(to_pareto, axis=1), columns=range(len(to_pareto)))
+    if dirty:
+        return paretoset_grouped_dirty(df, sense=new_goals)
+    return paretoset(df, sense=new_goals)

accelforge/mapper/FFM/data.py ADDED Viewed

@@ -0,0 +1,61 @@
+"""
+Results from mapping exploration.
+"""
+import pandas as pd
+from accelforge.mapper.FFM._pareto_df.df_convention import col2action
+from accelforge.util._base_analysis_types import ActionKey, VerboseActionKey
+class ResultDataFrame(pd.DataFrame):
+    @property
+    def _constructor(self):
+        return ResultDataFrame
+    @property
+    def _constructor_sliced(self):
+        return pd.Series
+    @property
+    def actions(self) -> "ResultDataFrame":
+        """Returns a ResultDataFrame with all action-related columns."""
+        action_columns = [col for col in self.columns if "action" in col]
+        return self[[action_columns]]
+    @property
+    def actions_df(self) -> "ActionDataFrame":
+        """Return an ActionDataFrame."""
+        df = self.actions
+        if any(isinstance(col2action(col), VerboseActionKey) for col in df.columns):
+            columns = [
+                col
+                for col in df.columns
+                if isinstance(col2action(col), VerboseActionKey)
+            ]
+    @property
+    def energy(self) -> "ResultDataFrame":
+        """Returns a ResultDataFrame with all energy-related columns."""
+        action_columns = [col for col in self.columns if "energy" in col]
+        return self[[action_columns]]
+class ActionDataFrame(pd.DataFrame):
+    """
+    A hierarchical column dataframe with action counts.
+    """
+    @property
+    def _constructor(self):
+        return ResultDataFrame
+    @property
+    def _constructor_sliced(self):
+        return pd.Series
+class VerboseActionDataFrame(pd.DataFrame):
+    """
+    A hierarchical column dataframe with verbose action counts.
+    """