PyPI - accelforge - Versions diffs - 0.0.1__py3-none-any.whl - Mend

accelforge 0.0.1__py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (258) hide show

accelforge/__init__.py +21 -0
accelforge/_accelerated_imports.py +16 -0
accelforge/_deprecate/_simanneal/evalmapping.py +271 -0
accelforge/_deprecate/_simanneal/mapspaceglobals.py +298 -0
accelforge/_deprecate/_simanneal/simanneal.py +666 -0
accelforge/_deprecate/_simanneal/tracking.py +105 -0
accelforge/_deprecate/_simanneal/wrappers.py +218 -0
accelforge/_deprecate/_simanneal2/__init__.py +7 -0
accelforge/_deprecate/_simanneal2/simanneal.py +493 -0
accelforge/_deprecate/_simanneal2/tracking.py +116 -0
accelforge/_deprecate/compatibility_util.py +181 -0
accelforge/_deprecate/layerdeduplication/__init__.py +2 -0
accelforge/_deprecate/layerdeduplication/group_similar_einsums.py +160 -0
accelforge/_deprecate/layerdeduplication/grouped_einsums.py +84 -0
accelforge/_deprecate/mapping_filter_tags/__init__.py +2 -0
accelforge/_deprecate/mapping_filter_tags/ffmt.py +212 -0
accelforge/_deprecate/mapping_filter_tags/onesplit.py +24 -0
accelforge/_deprecate/mapping_filter_tags/util.py +24 -0
accelforge/_deprecate/tags.py +69 -0
accelforge/_deprecate/viz/__init__.py +0 -0
accelforge/_deprecate/viz/interactive.py +159 -0
accelforge/_deprecate/viz/reservationtree.py +307 -0
accelforge/_deprecate/viz/ski_slope.py +88 -0
accelforge/_version.py +15 -0
accelforge/examples.py +39 -0
accelforge/frontend/__init__.py +10 -0
accelforge/frontend/_binding.py +129 -0
accelforge/frontend/_workload_isl/__init__.py +2 -0
accelforge/frontend/_workload_isl/_isl.py +149 -0
accelforge/frontend/_workload_isl/_symbolic.py +141 -0
accelforge/frontend/arch copy.py +1544 -0
accelforge/frontend/arch.py +1642 -0
accelforge/frontend/config.py +63 -0
accelforge/frontend/mapper/__init__.py +5 -0
accelforge/frontend/mapper/ffm.py +126 -0
accelforge/frontend/mapper/mapper.py +7 -0
accelforge/frontend/mapper/metrics.py +30 -0
accelforge/frontend/mapping/__init__.py +1 -0
accelforge/frontend/mapping/mapping.py +1736 -0
accelforge/frontend/model.py +14 -0
accelforge/frontend/renames.py +150 -0
accelforge/frontend/spec copy.py +230 -0
accelforge/frontend/spec.py +301 -0
accelforge/frontend/variables.py +12 -0
accelforge/frontend/workload.py +952 -0
accelforge/mapper/FFM/__init__.py +9 -0
accelforge/mapper/FFM/_join_pmappings/__init__.py +0 -0
accelforge/mapper/FFM/_join_pmappings/compatibility.py +653 -0
accelforge/mapper/FFM/_join_pmappings/compress_pmappings.py +140 -0
accelforge/mapper/FFM/_join_pmappings/join_pmappings.py +703 -0
accelforge/mapper/FFM/_join_pmappings/pmapping_dataframe.py +901 -0
accelforge/mapper/FFM/_join_pmappings/pmapping_group.py +337 -0
accelforge/mapper/FFM/_make_pmappings/contraints/__init__.py +0 -0
accelforge/mapper/FFM/_make_pmappings/contraints/constraints.py +360 -0
accelforge/mapper/FFM/_make_pmappings/make_pmapping_templates/__init__.py +1 -0
accelforge/mapper/FFM/_make_pmappings/make_pmapping_templates/make_loops.py +373 -0
accelforge/mapper/FFM/_make_pmappings/make_pmapping_templates/make_pmapping_templates.py +463 -0
accelforge/mapper/FFM/_make_pmappings/make_pmapping_templates/make_reservations.py +95 -0
accelforge/mapper/FFM/_make_pmappings/make_pmapping_templates/make_storage_order.py +382 -0
accelforge/mapper/FFM/_make_pmappings/make_pmapping_templates/make_storages.py +155 -0
accelforge/mapper/FFM/_make_pmappings/make_pmappings.py +411 -0
accelforge/mapper/FFM/_make_pmappings/make_pmappings_from_templates/__init__.py +1 -0
accelforge/mapper/FFM/_make_pmappings/make_pmappings_from_templates/make_pmappings_from_templates.py +407 -0
accelforge/mapper/FFM/_make_pmappings/make_pmappings_from_templates/make_tile_shapes.py +1681 -0
accelforge/mapper/FFM/_make_pmappings/make_pmappings_from_templates/run_model.py +170 -0
accelforge/mapper/FFM/_make_pmappings/make_pmappings_from_templates/symbol_relations.py +174 -0
accelforge/mapper/FFM/_make_pmappings/pmapper_job.py +282 -0
accelforge/mapper/FFM/_pareto_df/df_convention.py +273 -0
accelforge/mapper/FFM/_pareto_df/pareto copy.py +836 -0
accelforge/mapper/FFM/_pareto_df/pareto.py +508 -0
accelforge/mapper/FFM/data.py +61 -0
accelforge/mapper/FFM/main copy.py +236 -0
accelforge/mapper/FFM/main.py +208 -0
accelforge/mapper/FFM/mappings.py +510 -0
accelforge/mapper/FFM/pmappings.py +310 -0
accelforge/mapper/__init__.py +4 -0
accelforge/mapper.py +0 -0
accelforge/model/__init__.py +1 -0
accelforge/model/_looptree/__init__.py +0 -0
accelforge/model/_looptree/accesses.py +335 -0
accelforge/model/_looptree/capacity/__init__.py +1 -0
accelforge/model/_looptree/capacity/aggregators.py +36 -0
accelforge/model/_looptree/capacity/capacity.py +47 -0
accelforge/model/_looptree/energy.py +150 -0
accelforge/model/_looptree/equivalent_ranks.py +29 -0
accelforge/model/_looptree/latency/__init__.py +1 -0
accelforge/model/_looptree/latency/latency.py +98 -0
accelforge/model/_looptree/latency/memory.py +120 -0
accelforge/model/_looptree/latency/processors.py +92 -0
accelforge/model/_looptree/mapping_utilities.py +71 -0
accelforge/model/_looptree/reuse/__init__.py +4 -0
accelforge/model/_looptree/reuse/isl/__init__.py +1 -0
accelforge/model/_looptree/reuse/isl/des.py +59 -0
accelforge/model/_looptree/reuse/isl/isl_functions.py +374 -0
accelforge/model/_looptree/reuse/isl/mapping_to_isl/__init__.py +4 -0
accelforge/model/_looptree/reuse/isl/mapping_to_isl/analyze_mapping.py +297 -0
accelforge/model/_looptree/reuse/isl/mapping_to_isl/skews_from_mapping.py +236 -0
accelforge/model/_looptree/reuse/isl/mapping_to_isl/tiling.py +685 -0
accelforge/model/_looptree/reuse/isl/mapping_to_isl/types.py +188 -0
accelforge/model/_looptree/reuse/isl/spatial.py +260 -0
accelforge/model/_looptree/reuse/isl/temporal.py +182 -0
accelforge/model/_looptree/reuse/symbolic/__init__.py +1 -0
accelforge/model/_looptree/reuse/symbolic/symbolic copy 2.py +1346 -0
accelforge/model/_looptree/reuse/symbolic/symbolic copy.py +1408 -0
accelforge/model/_looptree/reuse/symbolic/symbolic.py +1396 -0
accelforge/model/_looptree/run.py +122 -0
accelforge/model/_looptree/types.py +26 -0
accelforge/model/_looptree/visualization/__init__.py +0 -0
accelforge/model/_looptree/visualization/occupancy.py +11 -0
accelforge/model/main.py +222 -0
accelforge/plotting/__init__.py +2 -0
accelforge/plotting/mappings.py +219 -0
accelforge/plotting/specs.py +57 -0
accelforge/util/__init__.py +4 -0
accelforge/util/_base_analysis_types.py +24 -0
accelforge/util/_basetypes.py +1089 -0
accelforge/util/_frozenset.py +36 -0
accelforge/util/_isl.py +29 -0
accelforge/util/_itertools.py +14 -0
accelforge/util/_mathfuncs.py +57 -0
accelforge/util/_parse_expressions.py +339 -0
accelforge/util/_picklecache.py +32 -0
accelforge/util/_setexpressions.py +268 -0
accelforge/util/_sympy/__init__.py +0 -0
accelforge/util/_sympy/broadcast_max.py +18 -0
accelforge/util/_visualization.py +112 -0
accelforge/util/_yaml.py +579 -0
accelforge/util/parallel.py +193 -0
accelforge-0.0.1.dist-info/METADATA +64 -0
accelforge-0.0.1.dist-info/RECORD +258 -0
accelforge-0.0.1.dist-info/WHEEL +5 -0
accelforge-0.0.1.dist-info/licenses/LICENSE +19 -0
accelforge-0.0.1.dist-info/top_level.txt +5 -0
docs/_build/html/_sources/fastfusion.frontend.mapper.rst.txt +37 -0
docs/_build/html/_sources/fastfusion.frontend.rst.txt +70 -0
docs/_build/html/_sources/fastfusion.frontend.workload.rst.txt +21 -0
docs/_build/html/_sources/fastfusion.mapper.FFM.rst.txt +37 -0
docs/_build/html/_sources/fastfusion.mapper.rst.txt +18 -0
docs/_build/html/_sources/fastfusion.rst.txt +20 -0
docs/_build/html/_sources/fastfusion.util.rst.txt +21 -0
docs/_build/html/_sources/index.rst.txt +87 -0
docs/_build/html/_sources/modules.rst.txt +7 -0
docs/_build/html/_sources/notes/citation.rst.txt +45 -0
docs/_build/html/_sources/notes/definitions.rst.txt +43 -0
docs/_build/html/_sources/notes/faqs.rst.txt +39 -0
docs/_build/html/_sources/notes/modeling/accelerator_energy_latency.rst.txt +72 -0
docs/_build/html/_sources/notes/modeling/component_energy_area.rst.txt +96 -0
docs/_build/html/_sources/notes/modeling/mapping.rst.txt +100 -0
docs/_build/html/_sources/notes/modeling.rst.txt +33 -0
docs/_build/html/_sources/notes/parsing/arithmetic_parsing.rst.txt +136 -0
docs/_build/html/_sources/notes/parsing/setexpressions.rst.txt +63 -0
docs/_build/html/_sources/notes/parsing/yaml_parsing.rst.txt +176 -0
docs/_build/html/_sources/notes/quickstart_and_installation.rst.txt +9 -0
docs/_build/html/_sources/notes/spec/architecture.rst.txt +133 -0
docs/_build/html/_sources/notes/spec/mapping.rst.txt +12 -0
docs/_build/html/_sources/notes/spec/workload.rst.txt +83 -0
docs/_build/html/_sources/notes/spec.rst.txt +36 -0
docs/source/_ext/include_attrs.py +213 -0
docs/source/_ext/include_docstring.py +364 -0
docs/source/_ext/include_functions.py +154 -0
docs/source/_ext/include_notebook.py +131 -0
docs/source/_ext/include_yaml.py +119 -0
docs/source/_ext/inherited_attributes.py +222 -0
docs/source/_ext/paths.py +4 -0
docs/source/conf.py +79 -0
examples/arches/compute_in_memory/_include.yaml +74 -0
examples/arches/compute_in_memory/_include_functions.py +229 -0
examples/arches/compute_in_memory/_load_spec.py +57 -0
examples/arches/compute_in_memory/components/c2c_multiplier.py +181 -0
examples/arches/compute_in_memory/components/dac_c2c_r2r.py +605 -0
examples/arches/compute_in_memory/components/misc.py +195 -0
examples/arches/compute_in_memory/components/util/bit_functions.py +51 -0
examples/arches/compute_in_memory/components/zero_comparator.py +92 -0
examples/arches/compute_in_memory/isaac.yaml +233 -0
examples/arches/compute_in_memory/memory_cells/ecram_demo.yaml +63 -0
examples/arches/compute_in_memory/memory_cells/rram_example.yaml +63 -0
examples/arches/compute_in_memory/memory_cells/rram_isaac_isca_2016.yaml +64 -0
examples/arches/compute_in_memory/memory_cells/rram_neurosim_default.yaml +63 -0
examples/arches/compute_in_memory/memory_cells/rram_raella_isca_2023.yaml +70 -0
examples/arches/compute_in_memory/memory_cells/rram_wan_nature_2022.yaml +63 -0
examples/arches/compute_in_memory/memory_cells/sram_colonnade_jssc_2021.yaml +63 -0
examples/arches/compute_in_memory/memory_cells/sram_example.yaml +63 -0
examples/arches/compute_in_memory/memory_cells/sram_jia_jssc_2020.yaml +63 -0
examples/arches/compute_in_memory/memory_cells/sram_sinangil_jssc_2021.yaml +63 -0
examples/arches/compute_in_memory/memory_cells/sram_wang_vlsi_2022.yaml +63 -0
examples/arches/compute_in_memory/wang_vlsi_2022.yaml +289 -0
examples/arches/eyeriss.yaml +68 -0
examples/arches/fanout_variations/at_glb.yaml +31 -0
examples/arches/fanout_variations/at_glb_with_fanout_node.yaml +34 -0
examples/arches/fanout_variations/at_mac.yaml +31 -0
examples/arches/fanout_variations/at_mac_with_constraints.yaml +38 -0
examples/arches/fanout_variations/at_mac_with_fanout_node.yaml +34 -0
examples/arches/nvdla.yaml +47 -0
examples/arches/simple.yaml +28 -0
examples/arches/tpu_v4i.yaml +67 -0
examples/mappings/unfused_matmuls_to_simple.yaml +33 -0
examples/misc/component_annotated.yaml +33 -0
examples/workloads/gpt3_6.7B.yaml +124 -0
examples/workloads/matmuls.yaml +20 -0
examples/workloads/mobilenet_28.yaml +81 -0
examples/workloads/mobilenet_various_separate.yaml +106 -0
examples/workloads/three_matmuls_annotated.yaml +59 -0
notebooks/.ipynb_checkpoints/fastfusion_arch_study_michael-checkpoint.ipynb +359 -0
notebooks/compute_in_memory/_scripts.py +339 -0
notebooks/compute_in_memory/isaac.guide.ipynb +270 -0
notebooks/compute_in_memory/wang_vlsi_2022.ipynb +602 -0
notebooks/paths.py +4 -0
notebooks/tutorials/.ipynb_checkpoints/1_FFM-checkpoint.ipynb +3110 -0
notebooks/tutorials/FFM.ipynb +3498 -0
notebooks/tutorials/_include.py +48 -0
notebooks/tutorials/component_energy_area.ipynb +363 -0
tests/Q_mapping.yaml +38 -0
tests/__init__.py +0 -0
tests/conv.mapping.yaml +27 -0
tests/conv.workload.yaml +13 -0
tests/conv_sym.mapping.yaml +43 -0
tests/copy.mapping.yaml +35 -0
tests/copy.workload.yaml +15 -0
tests/distribuffers/__init__.py +0 -0
tests/distribuffers/multicast/test_cases.yaml +482 -0
tests/distribuffers/spec/binding/valid_bindings.yaml +97 -0
tests/distribuffers/spec/distributed.yaml +100 -0
tests/distribuffers/spec/logical_arch.yaml +32 -0
tests/distribuffers/spec/physical_arch.yaml +69 -0
tests/distribuffers/test_binding.py +48 -0
tests/frontend/__init__.py +0 -0
tests/frontend/test_mapping_viz.py +52 -0
tests/mapper/__init__.py +0 -0
tests/mapper/configs/conv1d/conv1d.mapping.yaml +31 -0
tests/mapper/configs/conv1d/conv1d.workload.yaml +11 -0
tests/mapper/configs/two_conv1d/two_conv1d.expected.yaml +38 -0
tests/mapper/configs/two_conv1d/two_conv1d.mapping.yaml +54 -0
tests/mapper/configs/two_conv1d/two_conv1d.workload.yaml +19 -0
tests/mapper/test_mapping_to_isl.py +90 -0
tests/mapper/test_spatial_reuse_analysis.py +67 -0
tests/mapper/test_temporal_reuse_analysis.py +56 -0
tests/mapper/util.py +58 -0
tests/matmul.mapping.yaml +29 -0
tests/matmul.workload.yaml +12 -0
tests/matmul_spatial.mapping.yaml +44 -0
tests/mha.renames.yaml +65 -0
tests/mha.workload.yaml +67 -0
tests/mha.yaml +59 -0
tests/mha_full.workload.yaml +67 -0
tests/mobilenet.workload.yaml +35 -0
tests/mobilenet_long.workload.yaml +64 -0
tests/pmappingcache.py +24 -0
tests/processing_stage.arch.yaml +40 -0
tests/snowcat.arch.yaml +36 -0
tests/test_ffm_join_pmappings.py +106 -0
tests/test_ffm_make_pmappings.py +82 -0
tests/test_ffm_make_tile_shapes.py +49 -0
tests/test_mapper.py +100 -0
tests/test_model.py +37 -0
tests/test_plotting.py +72 -0
tests/test_processing_stage.py +46 -0
tests/test_symbolic_model.py +248 -0
tests/test_workload.py +141 -0

accelforge/_deprecate/_simanneal2/simanneal.py ADDED Viewed

@@ -0,0 +1,493 @@
+import inspect
+import os
+import random
+from typing import Callable, Generator
+from fastfusion import arch, util
+from fastfusion import Spec
+from fastfusion.frontend.mapper.metrics import Metrics
+from fastfusion.mapper.FFM.pmappings import MultiEinsumPmappings
+from fastfusion.mapper.FFM._join_pmappings.compress_pmappings import (
+    compress_einsum2pmappings,
+    decompress_pmappings,
+)
+from fastfusion.frontend.workload import EinsumName
+from fastfusion.frontend.mapping import Mapping
+from fastfusion.mapper.FFM import PmappingGroup
+from fastfusion.mapper.FFM._pareto_df.df_convention import (
+    MAPPING_COLUMN,
+    col2nameloop,
+)
+from fastfusion.mapper.FFM._join_pmappings.pmapping_group import PmappingDataframe
+from fastfusion.mapper.FFM._make_pmappings.make_pmappings import (
+    get_rank_variable_bounds_for_all_einsums,
+)
+from fastfusion._accelerated_imports import pd
+import joblib
+from fastfusion.mapper.FFM._join_pmappings.compatibility import Compatibility
+from fastfusion.mapper._simanneal2.tracking import EvaluationsScoreTracker
+# Simulated annealing algorithm
+# -----------------------------
+# Given:
+# - Pmappings for each Einsum
+# 1. Make a compatibility -> PmappingGroups dict for each Einsum
+# 2. While True:
+#    a. Randomly change a compatibility choice for one Einsum
+# Functions:
+# - Given compatibility choices & pmapping index numbers, return a score
+# - Given compatibility choices & pmapping index numbers, make sure all compatibilities
+#   & indices match
+class FailedMutation(Exception):
+    pass
+class MapspaceGlobals:
+    def __init__(
+        self,
+        einsum2sims: dict[EinsumName, list[PmappingGroup]],
+        resource2capacity: dict[str, int],
+        aliased_tensors: dict[str, set[str]],
+        objective_function: Callable[[pd.Series], float],
+        tracker: EvaluationsScoreTracker,
+    ) -> None:
+        self.einsum2sims: dict[EinsumName, list[PmappingGroup]] = einsum2sims
+        self.resource2capacity: dict[str, int] = resource2capacity
+        self.aliased_tensors: dict[str, set[str]] = aliased_tensors
+        self.objective_function: Callable[[pd.Series], float] = objective_function
+        self.tracker: EvaluationsScoreTracker = tracker
+class SimAnnealMapping:
+    def __init__(self, mapspace_globals: MapspaceGlobals) -> None:
+        # self.einsum2sim: dict[EinsumName, PmappingGroup] = {
+        #     e: random.choice(s) for e, s in mapspace_globals.einsum2sims.items()
+        # }
+        self.mapspace_globals: MapspaceGlobals = mapspace_globals
+        self.einsum2sim: dict[EinsumName, PmappingGroup] = {
+            e: random.choice(s) for e, s in mapspace_globals.einsum2sims.items()
+        }
+        self.einsum2index: dict[EinsumName, int] = {e: 0 for e in self.einsum2sim}
+        self.ensure_match(list(self.einsum2sim.keys())[0])
+        for e in self.einsum2sim:
+            self.randomize_index(e)
+        self._prev_score = None
+    def mutate(self) -> None:
+        # Pick a random einsum
+        e = random.choice(list(self.einsum2sim.keys()))
+        random.choice(
+            [
+                self.randomize_index,
+                self.randomize_sim,
+            ]
+        )(e)
+        self.ensure_match(e)
+    def randomize_index(self, e: EinsumName) -> None:
+        self._prev_score = None
+        self.einsum2index[e] = random.randint(0, 10000000000000)
+        self.mapspace_globals.tracker.add_evaluation(1, float("inf"))
+    def randomize_sim(self, e: EinsumName) -> None:
+        self.einsum2sim[e] = random.choice(self.mapspace_globals.einsum2sims[e])
+        self.randomize_index(e)
+    def _einsum_position_in_list(self, e: EinsumName) -> int:
+        return list(self.einsum2sim.keys()).index(e)
+    def ensure_match(
+        self,
+        lock_choice_for_einsum: EinsumName,
+    ) -> None:
+        new_einsum2sim: dict[EinsumName, PmappingGroup] = {}
+        # Grab all the compatibilities that match
+        for i, (e, s) in enumerate(list(self.einsum2sim.items())):
+            if e == lock_choice_for_einsum:
+                new_einsum2sim[e] = s
+                continue
+            following_tensors = self._einsum2tensors(range(i + 1, len(self.einsum2sim)))
+            to_check = [(s2, s) for s2 in new_einsum2sim.values()]
+            if i < self._einsum_position_in_list(lock_choice_for_einsum):
+                to_check.append((s, self.einsum2sim[lock_choice_for_einsum]))
+            else:
+                to_check.append((self.einsum2sim[lock_choice_for_einsum], s))
+            for left, right in to_check:
+                c = left.compatibility.clear_dead_tensors(
+                    right.compatibility.tensor_names
+                ).clear_tile_patterns_and_reservation_indices()
+                c2 = right.compatibility.clear_dead_tensors(
+                    left.compatibility.tensor_names
+                ).clear_tile_patterns_and_reservation_indices()
+                if c != c2:
+                    break
+                c = left.compatibility.clear_dead_tensors(
+                    following_tensors
+                ).clear_tile_patterns_and_reservation_indices()
+                c2 = right.compatibility.clear_dead_tensors(
+                    following_tensors
+                ).clear_tile_patterns_and_reservation_indices()
+                # Can't merge. I have more loops than the next, so my dataflow can't be
+                # carried through a LoopTree to where it's needed.
+                if c.n_loops > c2.n_loops:
+                    break
+            else:
+                new_einsum2sim[e] = s
+        # Grab compatibilities that don't match
+        def _matches(s: PmappingGroup, c: Compatibility) -> bool:
+            cs = s.compatibility.clear_dead_tensors(
+                c.tensor_names
+            ).clear_tile_patterns_and_reservation_indices()
+            cn = c.clear_dead_tensors(
+                s.compatibility.tensor_names
+            ).clear_tile_patterns_and_reservation_indices()
+            return cs == cn
+        for e, pmapping_groups in self.mapspace_globals.einsum2sims.items():
+            if e in new_einsum2sim:
+                continue
+            for s in new_einsum2sim.values():
+                pmapping_groups = [
+                    s2 for s2 in pmapping_groups if _matches(s2, s.compatibility)
+                ]
+            if not pmapping_groups:
+                # print(f"No compatible PmappingGroups found for {e}")
+                raise FailedMutation(f"No compatible PmappingGroups found for {e}")
+            new_einsum2sim[e] = random.choice(pmapping_groups)
+            self.randomize_index(e)
+            # pmapping_groups = self.mapspace_globals.einsum2sims[e]
+            # [s.compatibility for s in self.einsum2sim.values()]
+            # [s.compatibility for s in new_einsum2sim.values()]
+            # {e: s.compatibility for e, s in new_einsum2sim.items()}
+        assert len(new_einsum2sim) == len(self.einsum2sim)
+        assert set(new_einsum2sim.keys()) == set(self.einsum2sim.keys())
+        self.einsum2sim = {k: new_einsum2sim[k] for k in self.einsum2sim.keys()}
+    def _einsum2tensors(
+        self, e: EinsumName | int | Generator[EinsumName | int, None, None]
+    ) -> set[str]:
+        if isinstance(e, Generator) or isinstance(e, range):
+            return set.union(set(), *(self._einsum2tensors(i) for i in e))
+        if isinstance(e, int):
+            e = list(self.einsum2sim.keys())[e]
+        return self.einsum2sim[e].compatibility.tensor_names
+    def _access_index(self, e: EinsumName, index_override: int | None = None):
+        s = self.einsum2sim[e]
+        data = s.mappings.data
+        i = self.einsum2index[e] if index_override is None else index_override
+        i %= len(data)
+        return PmappingGroup(
+            compatibility=s.compatibility,
+            mappings=PmappingDataframe(data.iloc[i : i + 1]),
+        )
+    def get_score(self) -> float:
+        if self._prev_score is not None:
+            return self._prev_score
+        items: list[tuple[EinsumName, PmappingGroup]] = list(self.einsum2sim.items())
+        joined: PmappingGroup = items.pop(0)[1]
+        for i, (e, s) in enumerate(items):
+            right_tensors = self._einsum2tensors(i)
+            live_tensors = self._einsum2tensors(range(i + 1, len(items)))
+            joined.compatibility = joined.compatibility.clear_dead_tensors(
+                live_tensors | right_tensors
+            )
+            def _merge_next(
+                left: PmappingGroup,
+                right: PmappingGroup,
+                apply_resource_limit: bool = True,
+            ) -> PmappingGroup:
+                try:
+                    return left.merge_next(
+                        right,
+                        live_tensors=live_tensors,
+                        live_tensors_with_right=live_tensors | right_tensors,
+                        aliased_tensors=self.mapspace_globals.aliased_tensors,
+                        compatibility_joined=joined.compatibility.merge_next(
+                            s.compatibility, live_tensors
+                        ),
+                        resource2capacity=(
+                            self.mapspace_globals.resource2capacity
+                            if apply_resource_limit
+                            else None
+                        ),
+                        drop_valid_reservations=True,
+                        delay=False,
+                    )
+                except ValueError as err:
+                    # print(err)
+                    raise FailedMutation(f"No valid pmappings: {err}")
+            # Try to merge using the index we already have set
+            joined_new = _merge_next(joined, self._access_index(e))
+            if len(joined_new.mappings.data) == 1:
+                joined = joined_new
+                # print(' '.join(f'{k}={v}' for k, v in dict(joined.mappings.data.iloc[0]).items() if col2nameloop(k)))
+                continue
+            if len(joined_new.mappings.data) > 1:
+                raise ValueError(
+                    f"Got {len(joined_new.mappings.data)} pmappings for {e}"
+                )
+            # No valid pmappings! Merge all possible, then pick one
+            self.mapspace_globals.tracker.add_evaluation(1, float("inf"))
+            s = self.einsum2sim[e]
+            s.mappings.data["_INDEX"] = list(range(len(s.mappings.data)))
+            joined_new = _merge_next(
+                joined,
+                s,
+                apply_resource_limit=False,
+            )
+            s.mappings._data = s.mappings.data.drop(columns=["_INDEX"])
+            try:
+                i = random.choice(list(set(joined_new.mappings.data["_INDEX"])))
+            except IndexError:
+                raise FailedMutation(f"No valid pmappings for {e}")
+            # Now that we've picked, merge with the index we just set
+            joined_new = _merge_next(joined, self._access_index(e, i))
+            if len(joined_new.mappings.data) == 1:
+                # If it worked, set the index
+                self.einsum2index[e] = i
+                joined = joined_new
+                # print(' '.join(f'{k}={v}' for k, v in dict(joined.mappings.data.iloc[0]).items() if col2nameloop(k)))
+                continue
+            if len(joined_new.mappings.data) > 1:
+                raise ValueError(
+                    f"Got {len(joined_new.mappings.data)} pmappings for {e}"
+                )
+            raise FailedMutation(
+                f"Got {len(joined_new.mappings.data)} pmappings for {e}"
+            )
+        assert len(joined.mappings.data) == 1
+        score = self.mapspace_globals.objective_function(joined.mappings.data.iloc[0])
+        self.mapspace_globals.tracker.add_evaluation(0, score)
+        self._prev_score = score
+        return score
+    def copy(self) -> "SimAnnealMapping":
+        s = SimAnnealMapping(self.mapspace_globals)
+        s.einsum2sim = self.einsum2sim.copy()
+        s.einsum2index = self.einsum2index.copy()
+        s._prev_score = self._prev_score
+        return s
+def get_random_mapping(mapspace_globals: MapspaceGlobals) -> SimAnnealMapping:
+    while True:
+        try:
+            s = SimAnnealMapping(mapspace_globals)
+            s.get_score()
+            return s
+        except FailedMutation:
+            if mapspace_globals.tracker.finished():
+                return None
+            continue
+def join_pmappings(
+    pmapping_groups: dict[EinsumName, list[PmappingGroup]],
+    spec: Spec,
+    resource2capacity: dict[str, int],
+    tracker: EvaluationsScoreTracker,
+    pop_size_per_thread: int,
+) -> PmappingGroup:
+    objective = spec.mapper.ffm.metrics
+    if objective == Metrics.ENERGY:
+        objective_function = lambda x: x["Total<SEP>energy"]
+    elif objective == Metrics.LATENCY:
+        objective_function = lambda x: x["Total<SEP>latency"]
+    elif objective == (Metrics.ENERGY | Metrics.LATENCY):
+        objective_function = lambda x: x["Total<SEP>energy"] * x["Total<SEP>latency"]
+    else:
+        raise ValueError(f"Unknown objective {objective}")
+    # print(f'Resource2capacity: {resource2capacity}')
+    mapspace_globals = MapspaceGlobals(
+        einsum2sims=pmapping_groups,
+        resource2capacity=resource2capacity,
+        aliased_tensors=spec.workload.get_tensor_copies(),
+        objective_function=objective_function,
+        tracker=tracker,
+    )
+    mappings = []
+    while len(mappings) < pop_size_per_thread:
+        mappings.append(get_random_mapping(mapspace_globals))
+        if tracker.finished():
+            return
+    print(f"Completed making initial population of {len(mappings)} mappings")
+    i = 0
+    while True:
+        if i > 1e6:
+            break
+        i += 1
+        for i, m in enumerate(list(mappings)):
+            try:
+                new = m.copy()
+                new.mutate()
+                if new.get_score() < m.get_score():
+                    mappings[i] = new
+                # 0 evaluations because they've been accounted for in the mutation and
+                # score calculation functions
+                if tracker.finished():
+                    break
+            except FailedMutation:
+                continue
+            # else:
+            #     for einsum_name, sim in simanneal_mapping.einsum2sim.items():
+            #         print(f"Einsum {einsum_name}, index {simanneal_mapping.einsum2index[einsum_name]}")
+            #         for c in sim.compatibility.tensors:
+            #             print(f'\t{c}')
+            #         df = sim.mappings.data.iloc[simanneal_mapping.einsum2index[einsum_name] % len(sim.mappings.data)]
+            #         for s in sim.compatibility.symbols():
+            #             print(f'\t{s} = {df[s]}')
+            # print(f"Iteration {i}: Score {new_score} (prev {prev_score})")
+    # raise ValueError("No valid mapping found")
+def get_n_tile_shapes(sim: PmappingGroup) -> int:
+    df = sim.mappings.data
+    symbols = sim.compatibility.symbols()
+    cols = [c for c in df.columns if c in symbols]
+    if not cols:
+        return 1
+    return len(df.groupby(cols).size())
+def join_pmappings(
+    spec: Spec,
+    pmappings: MultiEinsumPmappings,
+    max_evaluations: int = 1,
+    population_size=100,
+    score_target: float | None = None,
+) -> EvaluationsScoreTracker:
+    tracker = EvaluationsScoreTracker(
+        max_evaluations=max_evaluations / util.N_PARALLEL_PROCESSES,
+        stop_at_score=None,
+        print_period=1,
+    )
+    if score_target is not None:
+        tracker.multiply_score_by(1 / score_target)
+    pop_size_per_thread = population_size // util.N_PARALLEL_PROCESSES
+    # Multiply by the number of einsums
+    tracker.multiply_scale_by(len(pmappings.einsum2pmappings))
+    # Expected #pmappings before a Pareto-optimal one is found
+    # tracker.multiply_scale_by(pmappings._evaluated_pmappings_for_simanneal_baseline_compare() / pmappings.n_pareto_optimal_pmappings())
+    tracker.multiply_scale_by(
+        pmappings.n_evaluated_pmappings() / pmappings.n_pareto_optimal_pmappings()
+    )
+    # Normalize to the speed of the intra-Einsum pmapper
+    tracker.multiply_scale_by(1 / pmappings.n_evaluated_pmappings())
+    for einsum_name, einsum_pmappings in pmappings.einsum2pmappings.items():
+        total = sum(len(p.mappings.data) for p in einsum_pmappings)
+        n_compatibilities = len(einsum_pmappings)
+        print(
+            f"Einsum {einsum_name} has {total} pmappings with {n_compatibilities} compatibilities"
+        )
+        if total == 0:
+            raise ValueError(f"Einsum {einsum_name} has no pmappings")
+    print(f"TODO: Populate PmappingGroups with all permutations")
+    compressed, decompress_data = compress_einsum2pmappings(pmappings.einsum2pmappings)
+    permuted = {}
+    for einsum_name, einsum_sims in compressed.items():
+        for s in einsum_sims:
+            for c_perm, _ in s.compatibility.make_equivalent_permutations():
+                permuted.setdefault(einsum_name, []).append(
+                    PmappingGroup(
+                        compatibility=c_perm,
+                        mappings=s.mappings,
+                    )
+                )
+    tile_shapes = [
+        get_n_tile_shapes(s)
+        for pmapping_groups in compressed.values()
+        for s in pmapping_groups
+    ]
+    # average_tile_shapes = sum(tile_shapes) / len(tile_shapes)
+    # print(f"Average tile shapes: {average_tile_shapes}")
+    # tracker.multiply_scale_by(average_tile_shapes)
+    def parallel_join(
+        permuted: dict[EinsumName, list[PmappingGroup]],
+        spec: Spec,
+        resource2capacity: dict[str, int],
+        tracker: EvaluationsScoreTracker,
+        pop_size_per_thread: int,
+    ) -> EvaluationsScoreTracker:
+        join_pmappings(permuted, spec, resource2capacity, tracker, pop_size_per_thread)
+        return tracker
+    trackers = util.parallel(
+        joblib.delayed(parallel_join)(
+            permuted,
+            spec,
+            pmappings.resource2capacity,
+            tracker,
+            pop_size_per_thread,
+        )
+        for _ in range(util.N_PARALLEL_PROCESSES)
+    )
+    t0 = trackers[0]
+    for t in trackers[1:]:
+        t0.merge_with(t)
+    # for einsum_name in pmappings.einsum2pmappings:
+    #     col = f"{einsum_name}<SEP>{MAPPING_COLUMN}"
+    #     joined.data[col] = joined.data[col].apply(
+    #         lambda x: pmappings.pmapping_objects[einsum_name][x]
+    #     )
+    # rank_variable_bounds = get_rank_variable_bounds_for_all_einsums(spec)
+    # joined.data[f"Total<SEP>{MAPPING_COLUMN}"] = joined.data.apply(
+    #     lambda row: MappingFromRow(row, spec, rank_variable_bounds), axis=1
+    # )
+    # # Fill nans with 0. We might get missing columns for some mapping entries if there
+    # # are energy entries for some pmappings but not others (e.g., one pmapping accesses
+    # # DRAM while another doesn't.)
+    # joined._data = joined.data.fillna(0)
+    return t0  # Mappings(spec, list(pmappings.einsum2pmappings.keys()), joined.data)

accelforge/_deprecate/_simanneal2/tracking.py ADDED Viewed

@@ -0,0 +1,116 @@
+import time
+class EvaluationsScoreTracker:
+    def __init__(
+        self, max_evaluations: int, stop_at_score: float, print_period: int = 10
+    ):
+        self.max_evaluations = max_evaluations
+        self.stop_at_score = stop_at_score
+        self.evaluations = 0
+        self.score = float("inf")
+        self.history = [(0, float("inf"))]
+        self._scale_by = 1
+        self._scale_score_by = 1
+        self.print_period = print_period
+        self.prev_print_time = None
+        self.print_stopped_text = False
+        self.n_mappings = {}
+        self.runtime = {}
+    def add_evaluation(self, n_evaluations: int, best_score: float):
+        self.evaluations += n_evaluations * self._scale_by
+        self.score = min(self.score, best_score * self._scale_score_by)
+        # Same score as before, remove the last entry
+        if len(self.history) > 2 and self.history[-2][1] == self.score:
+            self.history.pop(-1)
+        self.history.append((self.evaluations, self.score))
+        cur_time = time.time()
+        if (
+            self.prev_print_time is None
+            or cur_time - self.prev_print_time > self.print_period
+        ):
+            self.prev_print_time = cur_time
+            print(f"Evaluations: {self.evaluations}, Score: {self.score}")
+        if self.max_evaluations is not None and self.evaluations > self.max_evaluations:
+            self.clean_history()
+            if not self.print_stopped_text:
+                print(
+                    f"Stopping due to evaluations {self.evaluations} > {self.max_evaluations}"
+                )
+                self.print_stopped_text = True
+            return True
+        if self.stop_at_score is not None and self.score < self.stop_at_score:
+            self.clean_history()
+            if not self.print_stopped_text:
+                print(f"Stopping due to score {self.score} < {self.stop_at_score}")
+                self.print_stopped_text = True
+            return True
+        return False
+    def finished(self):
+        enough_evaluations = (
+            self.max_evaluations is not None and self.evaluations > self.max_evaluations
+        )
+        enough_score = (
+            self.stop_at_score is not None and self.score < self.stop_at_score
+        )
+        return enough_evaluations or enough_score
+    def multiply_scale_by(self, scale_by: float):
+        self._scale_by *= scale_by
+    def multiply_score_by(self, scale_by: float):
+        self._scale_score_by *= scale_by
+    def __repr__(self):
+        return f"Evaluations: {self.evaluations}, Score: {self.score}"
+    def __str__(self):
+        return f"Evaluations: {self.evaluations}, Score: {self.score}"
+    def clean_history(self):
+        keep_indices = [0]
+        for i in range(1, len(self.history) - 1):
+            if (
+                self.history[i][1] != self.history[i - 1][1]
+                or self.history[i][1] != self.history[i + 1][1]
+            ):
+                keep_indices.append(i)
+        keep_indices.append(len(self.history) - 1)
+        self.history = [self.history[i] for i in keep_indices]
+    def merge_with(self, other: "EvaluationsScoreTracker"):
+        self.score = min(self.score, other.score)
+        self.evaluations += other.evaluations
+        i, j = 1, 1
+        history = [(0, float("inf"))]
+        cur_score = float("inf")
+        cur_evaluations = 0
+        while i < len(self.history) or j < len(other.history):
+            # Grab whichever has the lowest evaluations
+            if i < len(self.history) and (
+                j == len(other.history) or self.history[i][0] < other.history[j][0]
+            ):
+                new_evaluations = self.history[i][0] - self.history[i - 1][0]
+                new_score = self.history[i][1]
+                cur_evaluations += new_evaluations
+                cur_score = min(cur_score, new_score)
+                history.append((cur_evaluations, cur_score))
+                i += 1
+            elif j < len(other.history):
+                new_evaluations = other.history[j][0] - other.history[j - 1][0]
+                new_score = other.history[j][1]
+                cur_evaluations += new_evaluations
+                cur_score = min(cur_score, new_score)
+                history.append((cur_evaluations, cur_score))
+                j += 1
+        self.history = history
+        self.clean_history()
+    def increase_all_evaluations(self, n_evaluations: int):
+        self.evaluations += n_evaluations
+        self.history = [(e + n_evaluations, s) for e, s in self.history]