PyPI - bead - Versions diffs - 0.1.0__py3-none-any.whl - Mend

bead 0.1.0__py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (231) hide show

bead/__init__.py +11 -0
bead/__main__.py +11 -0
bead/active_learning/__init__.py +15 -0
bead/active_learning/config.py +231 -0
bead/active_learning/loop.py +566 -0
bead/active_learning/models/__init__.py +24 -0
bead/active_learning/models/base.py +852 -0
bead/active_learning/models/binary.py +910 -0
bead/active_learning/models/categorical.py +943 -0
bead/active_learning/models/cloze.py +862 -0
bead/active_learning/models/forced_choice.py +956 -0
bead/active_learning/models/free_text.py +773 -0
bead/active_learning/models/lora.py +365 -0
bead/active_learning/models/magnitude.py +835 -0
bead/active_learning/models/multi_select.py +795 -0
bead/active_learning/models/ordinal_scale.py +811 -0
bead/active_learning/models/peft_adapter.py +155 -0
bead/active_learning/models/random_effects.py +639 -0
bead/active_learning/selection.py +354 -0
bead/active_learning/strategies.py +391 -0
bead/active_learning/trainers/__init__.py +26 -0
bead/active_learning/trainers/base.py +210 -0
bead/active_learning/trainers/data_collator.py +172 -0
bead/active_learning/trainers/dataset_utils.py +261 -0
bead/active_learning/trainers/huggingface.py +304 -0
bead/active_learning/trainers/lightning.py +324 -0
bead/active_learning/trainers/metrics.py +424 -0
bead/active_learning/trainers/mixed_effects.py +551 -0
bead/active_learning/trainers/model_wrapper.py +509 -0
bead/active_learning/trainers/registry.py +104 -0
bead/adapters/__init__.py +11 -0
bead/adapters/huggingface.py +61 -0
bead/behavioral/__init__.py +116 -0
bead/behavioral/analytics.py +646 -0
bead/behavioral/extraction.py +343 -0
bead/behavioral/merging.py +343 -0
bead/cli/__init__.py +11 -0
bead/cli/active_learning.py +513 -0
bead/cli/active_learning_commands.py +779 -0
bead/cli/completion.py +359 -0
bead/cli/config.py +624 -0
bead/cli/constraint_builders.py +286 -0
bead/cli/deployment.py +859 -0
bead/cli/deployment_trials.py +493 -0
bead/cli/deployment_ui.py +332 -0
bead/cli/display.py +378 -0
bead/cli/items.py +960 -0
bead/cli/items_factories.py +776 -0
bead/cli/list_constraints.py +714 -0
bead/cli/lists.py +490 -0
bead/cli/main.py +430 -0
bead/cli/models.py +877 -0
bead/cli/resource_loaders.py +621 -0
bead/cli/resources.py +1036 -0
bead/cli/shell.py +356 -0
bead/cli/simulate.py +840 -0
bead/cli/templates.py +1158 -0
bead/cli/training.py +1080 -0
bead/cli/utils.py +614 -0
bead/cli/workflow.py +1273 -0
bead/config/__init__.py +68 -0
bead/config/active_learning.py +1009 -0
bead/config/config.py +192 -0
bead/config/defaults.py +118 -0
bead/config/deployment.py +217 -0
bead/config/env.py +147 -0
bead/config/item.py +45 -0
bead/config/list.py +193 -0
bead/config/loader.py +149 -0
bead/config/logging.py +42 -0
bead/config/model.py +49 -0
bead/config/paths.py +46 -0
bead/config/profiles.py +320 -0
bead/config/resources.py +47 -0
bead/config/serialization.py +210 -0
bead/config/simulation.py +206 -0
bead/config/template.py +238 -0
bead/config/validation.py +267 -0
bead/data/__init__.py +65 -0
bead/data/base.py +87 -0
bead/data/identifiers.py +97 -0
bead/data/language_codes.py +61 -0
bead/data/metadata.py +270 -0
bead/data/range.py +123 -0
bead/data/repository.py +358 -0
bead/data/serialization.py +249 -0
bead/data/timestamps.py +89 -0
bead/data/validation.py +349 -0
bead/data_collection/__init__.py +11 -0
bead/data_collection/jatos.py +223 -0
bead/data_collection/merger.py +154 -0
bead/data_collection/prolific.py +198 -0
bead/deployment/__init__.py +5 -0
bead/deployment/distribution.py +402 -0
bead/deployment/jatos/__init__.py +1 -0
bead/deployment/jatos/api.py +200 -0
bead/deployment/jatos/exporter.py +210 -0
bead/deployment/jspsych/__init__.py +9 -0
bead/deployment/jspsych/biome.json +44 -0
bead/deployment/jspsych/config.py +411 -0
bead/deployment/jspsych/generator.py +598 -0
bead/deployment/jspsych/package.json +51 -0
bead/deployment/jspsych/pnpm-lock.yaml +2141 -0
bead/deployment/jspsych/randomizer.py +299 -0
bead/deployment/jspsych/src/lib/list-distributor.test.ts +327 -0
bead/deployment/jspsych/src/lib/list-distributor.ts +1282 -0
bead/deployment/jspsych/src/lib/randomizer.test.ts +232 -0
bead/deployment/jspsych/src/lib/randomizer.ts +367 -0
bead/deployment/jspsych/src/plugins/cloze-dropdown.ts +252 -0
bead/deployment/jspsych/src/plugins/forced-choice.ts +265 -0
bead/deployment/jspsych/src/plugins/plugins.test.ts +141 -0
bead/deployment/jspsych/src/plugins/rating.ts +248 -0
bead/deployment/jspsych/src/slopit/index.ts +9 -0
bead/deployment/jspsych/src/types/jatos.d.ts +256 -0
bead/deployment/jspsych/src/types/jspsych.d.ts +228 -0
bead/deployment/jspsych/templates/experiment.css +1 -0
bead/deployment/jspsych/templates/experiment.js.template +289 -0
bead/deployment/jspsych/templates/index.html +51 -0
bead/deployment/jspsych/templates/randomizer.js +241 -0
bead/deployment/jspsych/templates/randomizer.js.template +313 -0
bead/deployment/jspsych/trials.py +723 -0
bead/deployment/jspsych/tsconfig.json +23 -0
bead/deployment/jspsych/tsup.config.ts +30 -0
bead/deployment/jspsych/ui/__init__.py +1 -0
bead/deployment/jspsych/ui/components.py +383 -0
bead/deployment/jspsych/ui/styles.py +411 -0
bead/dsl/__init__.py +80 -0
bead/dsl/ast.py +168 -0
bead/dsl/context.py +178 -0
bead/dsl/errors.py +71 -0
bead/dsl/evaluator.py +570 -0
bead/dsl/grammar.lark +81 -0
bead/dsl/parser.py +231 -0
bead/dsl/stdlib.py +929 -0
bead/evaluation/__init__.py +13 -0
bead/evaluation/convergence.py +485 -0
bead/evaluation/interannotator.py +398 -0
bead/items/__init__.py +40 -0
bead/items/adapters/__init__.py +70 -0
bead/items/adapters/anthropic.py +224 -0
bead/items/adapters/api_utils.py +167 -0
bead/items/adapters/base.py +216 -0
bead/items/adapters/google.py +259 -0
bead/items/adapters/huggingface.py +1074 -0
bead/items/adapters/openai.py +323 -0
bead/items/adapters/registry.py +202 -0
bead/items/adapters/sentence_transformers.py +224 -0
bead/items/adapters/togetherai.py +309 -0
bead/items/binary.py +515 -0
bead/items/cache.py +558 -0
bead/items/categorical.py +593 -0
bead/items/cloze.py +757 -0
bead/items/constructor.py +784 -0
bead/items/forced_choice.py +413 -0
bead/items/free_text.py +681 -0
bead/items/generation.py +432 -0
bead/items/item.py +396 -0
bead/items/item_template.py +787 -0
bead/items/magnitude.py +573 -0
bead/items/multi_select.py +621 -0
bead/items/ordinal_scale.py +569 -0
bead/items/scoring.py +448 -0
bead/items/validation.py +723 -0
bead/lists/__init__.py +30 -0
bead/lists/balancer.py +263 -0
bead/lists/constraints.py +1067 -0
bead/lists/experiment_list.py +286 -0
bead/lists/list_collection.py +378 -0
bead/lists/partitioner.py +1141 -0
bead/lists/stratification.py +254 -0
bead/participants/__init__.py +73 -0
bead/participants/collection.py +699 -0
bead/participants/merging.py +312 -0
bead/participants/metadata_spec.py +491 -0
bead/participants/models.py +276 -0
bead/resources/__init__.py +29 -0
bead/resources/adapters/__init__.py +19 -0
bead/resources/adapters/base.py +104 -0
bead/resources/adapters/cache.py +128 -0
bead/resources/adapters/glazing.py +508 -0
bead/resources/adapters/registry.py +117 -0
bead/resources/adapters/unimorph.py +796 -0
bead/resources/classification.py +856 -0
bead/resources/constraint_builders.py +329 -0
bead/resources/constraints.py +165 -0
bead/resources/lexical_item.py +223 -0
bead/resources/lexicon.py +744 -0
bead/resources/loaders.py +209 -0
bead/resources/template.py +441 -0
bead/resources/template_collection.py +707 -0
bead/resources/template_generation.py +349 -0
bead/simulation/__init__.py +29 -0
bead/simulation/annotators/__init__.py +15 -0
bead/simulation/annotators/base.py +175 -0
bead/simulation/annotators/distance_based.py +135 -0
bead/simulation/annotators/lm_based.py +114 -0
bead/simulation/annotators/oracle.py +182 -0
bead/simulation/annotators/random.py +181 -0
bead/simulation/dsl_extension/__init__.py +3 -0
bead/simulation/noise_models/__init__.py +13 -0
bead/simulation/noise_models/base.py +42 -0
bead/simulation/noise_models/random_noise.py +82 -0
bead/simulation/noise_models/systematic.py +132 -0
bead/simulation/noise_models/temperature.py +86 -0
bead/simulation/runner.py +144 -0
bead/simulation/strategies/__init__.py +23 -0
bead/simulation/strategies/base.py +123 -0
bead/simulation/strategies/binary.py +103 -0
bead/simulation/strategies/categorical.py +123 -0
bead/simulation/strategies/cloze.py +224 -0
bead/simulation/strategies/forced_choice.py +127 -0
bead/simulation/strategies/free_text.py +105 -0
bead/simulation/strategies/magnitude.py +116 -0
bead/simulation/strategies/multi_select.py +129 -0
bead/simulation/strategies/ordinal_scale.py +131 -0
bead/templates/__init__.py +27 -0
bead/templates/adapters/__init__.py +17 -0
bead/templates/adapters/base.py +128 -0
bead/templates/adapters/cache.py +178 -0
bead/templates/adapters/huggingface.py +312 -0
bead/templates/combinatorics.py +103 -0
bead/templates/filler.py +605 -0
bead/templates/renderers.py +177 -0
bead/templates/resolver.py +178 -0
bead/templates/strategies.py +1806 -0
bead/templates/streaming.py +195 -0
bead-0.1.0.dist-info/METADATA +212 -0
bead-0.1.0.dist-info/RECORD +231 -0
bead-0.1.0.dist-info/WHEEL +4 -0
bead-0.1.0.dist-info/entry_points.txt +2 -0
bead-0.1.0.dist-info/licenses/LICENSE +21 -0

bead/simulation/strategies/multi_select.py ADDED Viewed

@@ -0,0 +1,129 @@
+"""Multi-select simulation strategy."""
+from __future__ import annotations
+from typing import TYPE_CHECKING
+import numpy as np
+from bead.simulation.strategies.base import SimulationStrategy
+if TYPE_CHECKING:
+    from bead.items.item import Item
+    from bead.items.item_template import ItemTemplate
+class MultiSelectStrategy(SimulationStrategy):
+    """Strategy for multi_select tasks.
+    Handles tasks where multiple options can be selected independently.
+    Uses model outputs to compute independent selection probabilities
+    for each option via sigmoid.
+    For each option i:
+        P(select option i) = sigmoid(score_i / temperature)
+    Parameters
+    ----------
+    threshold
+        Probability threshold for selection. Default: 0.5.
+    temperature
+        Temperature for scaling decisions. Default: 1.0.
+    Examples
+    --------
+    >>> strategy = MultiSelectStrategy()
+    >>> strategy.supported_task_type
+    'multi_select'
+    """
+    def __init__(self, threshold: float = 0.5, temperature: float = 1.0) -> None:
+        self.threshold = threshold
+        self.temperature = temperature
+    @property
+    def supported_task_type(self) -> str:
+        """Return 'multi_select'."""
+        return "multi_select"
+    def validate_item(self, item: Item, item_template: ItemTemplate) -> None:
+        """Validate item for multi-select.
+        Checks:
+        - task_type is 'multi_select'
+        - task_spec.options is defined
+        - At least 2 options
+        Parameters
+        ----------
+        item : Item
+            Item to validate.
+        item_template : ItemTemplate
+            Template defining task.
+        Raises
+        ------
+        ValueError
+            If validation fails.
+        """
+        if item_template.task_type != "multi_select":
+            msg = f"Expected task_type 'multi_select', got '{item_template.task_type}'"
+            raise ValueError(msg)
+        if not item_template.task_spec.options:
+            raise ValueError("task_spec.options must be defined for multi_select")
+        if len(item_template.task_spec.options) < 2:
+            raise ValueError("multi_select requires at least 2 options")
+    def simulate_response(
+        self,
+        item: Item,
+        item_template: ItemTemplate,
+        model_output_key: str,
+        rng: np.random.RandomState,
+    ) -> list[str]:
+        """Generate multi-select response.
+        Parameters
+        ----------
+        item : Item
+            Item to respond to.
+        item_template : ItemTemplate
+            Template defining task.
+        model_output_key : str
+            Key for model outputs (e.g., "lm_score").
+        rng : np.random.RandomState
+            Random number generator.
+        Returns
+        -------
+        list[str]
+            List of selected option names.
+        """
+        options = item_template.task_spec.options
+        assert options is not None, "options validated in validate()"
+        n_options = len(options)
+        # extract model outputs for each option
+        scores = self.extract_model_outputs(item, model_output_key, n_options)
+        if scores is None:
+            # fallback to random selection (each option has threshold probability)
+            selected = []
+            for option in options:
+                if rng.random() < self.threshold:
+                    selected.append(option)
+            return selected
+        # compute selection probability for each option using sigmoid
+        selected = []
+        for option, score in zip(options, scores, strict=True):
+            # sigmoid(score / temperature)
+            prob = 1.0 / (1.0 + np.exp(-score / self.temperature))
+            # sample selection
+            if rng.random() < prob:
+                selected.append(option)
+        return selected

bead/simulation/strategies/ordinal_scale.py ADDED Viewed

@@ -0,0 +1,131 @@
+"""Ordinal scale simulation strategy."""
+from __future__ import annotations
+from typing import TYPE_CHECKING
+import numpy as np
+from bead.simulation.strategies.base import SimulationStrategy
+if TYPE_CHECKING:
+    from bead.items.item import Item
+    from bead.items.item_template import ItemTemplate
+class OrdinalScaleStrategy(SimulationStrategy):
+    """Strategy for ordinal_scale tasks (Likert scales).
+    Handles discrete ordinal scales (e.g., 1-7, 1-5). Maps model outputs
+    to scale positions, then samples with noise around that position.
+    For ordinal scales with LM score:
+        - Map score to continuous position on scale
+        - Add noise
+        - Round to nearest integer within bounds
+    Examples
+    --------
+    >>> strategy = OrdinalScaleStrategy()
+    >>> strategy.supported_task_type
+    'ordinal_scale'
+    """
+    @property
+    def supported_task_type(self) -> str:
+        """Return 'ordinal_scale'.
+        Returns
+        -------
+        str
+            Task type identifier.
+        """
+        return "ordinal_scale"
+    def validate_item(self, item: Item, item_template: ItemTemplate) -> None:
+        """Validate item for ordinal scale.
+        Checks:
+        - task_type is 'ordinal_scale'
+        - task_spec.scale_bounds is defined
+        - scale_bounds has valid min/max
+        Parameters
+        ----------
+        item : Item
+            Item to validate.
+        item_template : ItemTemplate
+            Template defining task.
+        Raises
+        ------
+        ValueError
+            If validation fails.
+        """
+        if item_template.task_type != "ordinal_scale":
+            msg = f"Expected task_type 'ordinal_scale', got '{item_template.task_type}'"
+            raise ValueError(msg)
+        if not item_template.task_spec.scale_bounds:
+            msg = "task_spec.scale_bounds must be defined for ordinal_scale"
+            raise ValueError(msg)
+        min_val, max_val = item_template.task_spec.scale_bounds
+        if min_val >= max_val:
+            msg = f"scale_bounds min ({min_val}) must be less than max ({max_val})"
+            raise ValueError(msg)
+    def simulate_response(
+        self,
+        item: Item,
+        item_template: ItemTemplate,
+        model_output_key: str,
+        rng: np.random.RandomState,
+    ) -> int:
+        """Generate ordinal scale response.
+        Parameters
+        ----------
+        item : Item
+            Item to respond to.
+        item_template : ItemTemplate
+            Template defining task.
+        model_output_key : str
+            Key for model outputs (e.g., "lm_score").
+        rng : np.random.RandomState
+            Random number generator.
+        Returns
+        -------
+        int
+            Rating on ordinal scale.
+        """
+        scale_bounds = item_template.task_spec.scale_bounds
+        if scale_bounds is None:
+            msg = "task_spec.scale_bounds must be defined"
+            raise ValueError(msg)
+        min_val, max_val = scale_bounds
+        scale_range = max_val - min_val
+        # extract model output (expecting single score)
+        scores = self.extract_model_outputs(item, model_output_key, required_count=1)
+        if scores is None:
+            # fallback to uniform random across scale
+            return int(rng.randint(min_val, max_val + 1))
+        # map LM score to scale position; use sigmoid to map unbounded score to [0, 1]
+        score = scores[0]
+        sigmoid_score = 1.0 / (1.0 + np.exp(-score))
+        # map [0, 1] to scale range
+        continuous_rating = min_val + sigmoid_score * scale_range
+        # round to nearest integer
+        rating = int(np.round(continuous_rating))
+        # clamp to scale bounds (in case of rounding issues)
+        rating = max(min_val, min(max_val, rating))
+        return rating

bead/templates/__init__.py ADDED Viewed

@@ -0,0 +1,27 @@
+"""Template filling functionality.
+Provides template filling strategies (exhaustive, random, stratified) and
+constraint resolution for generating experimental stimuli.
+"""
+from __future__ import annotations
+from bead.templates.filler import CSPFiller, FilledTemplate, TemplateFiller
+from bead.templates.resolver import ConstraintResolver
+from bead.templates.strategies import (
+    ExhaustiveStrategy,
+    RandomStrategy,
+    StrategyFiller,
+    StratifiedStrategy,
+)
+__all__ = [
+    "TemplateFiller",  # ABC
+    "CSPFiller",
+    "StrategyFiller",
+    "FilledTemplate",
+    "ConstraintResolver",
+    "ExhaustiveStrategy",
+    "RandomStrategy",
+    "StratifiedStrategy",
+]

bead/templates/adapters/__init__.py ADDED Viewed

@@ -0,0 +1,17 @@
+"""Template filling model adapters.
+Provides masked language model adapters for template filling (Stage 2).
+Separate from judgment prediction models (Stage 3).
+"""
+from __future__ import annotations
+from bead.templates.adapters.base import TemplateFillingModelAdapter
+from bead.templates.adapters.cache import ModelOutputCache
+from bead.templates.adapters.huggingface import HuggingFaceMLMAdapter
+__all__ = [
+    "TemplateFillingModelAdapter",
+    "ModelOutputCache",
+    "HuggingFaceMLMAdapter",
+]

bead/templates/adapters/base.py ADDED Viewed

@@ -0,0 +1,128 @@
+"""Base adapter for template filling models.
+This module defines the abstract interface for models used in template filling.
+These adapters are SEPARATE from judgment prediction model adapters (Stage 6).
+"""
+from __future__ import annotations
+from abc import ABC, abstractmethod
+from pathlib import Path
+class TemplateFillingModelAdapter(ABC):
+    """Base adapter for models used in template filling.
+    This is SEPARATE from judgment prediction model adapters,
+    which are used later in the pipeline for predicting human judgments.
+    Parameters
+    ----------
+    model_name : str
+        Model identifier (e.g., "bert-base-uncased")
+    device : str
+        Computation device ("cpu", "cuda", "mps")
+    cache_dir : Path | None
+        Directory for caching model files
+    Examples
+    --------
+    >>> from bead.templates.adapters import TemplateFillingModelAdapter
+    >>> # Implemented by HuggingFaceMLMAdapter
+    >>> adapter = HuggingFaceMLMAdapter("bert-base-uncased", device="cpu")
+    >>> adapter.load_model()
+    >>> predictions = adapter.predict_masked_token(
+    ...     text="The cat [MASK] on the mat",
+    ...     mask_position=2,
+    ...     top_k=5
+    ... )
+    >>> adapter.unload_model()
+    """
+    def __init__(
+        self,
+        model_name: str,
+        device: str = "cpu",
+        cache_dir: Path | None = None,
+    ) -> None:
+        self.model_name = model_name
+        self.device = device
+        self.cache_dir = cache_dir
+        self._model_loaded = False
+    @abstractmethod
+    def load_model(self) -> None:
+        """Load model into memory.
+        Raises
+        ------
+        RuntimeError
+            If model loading fails
+        """
+        pass
+    @abstractmethod
+    def unload_model(self) -> None:
+        """Unload model from memory to free resources."""
+        pass
+    @abstractmethod
+    def predict_masked_token(
+        self,
+        text: str,
+        mask_position: int,
+        top_k: int = 10,
+    ) -> list[tuple[str, float]]:
+        """Predict masked token at specified position.
+        Parameters
+        ----------
+        text : str
+            Text with mask token (e.g., "The cat [MASK] quickly")
+        mask_position : int
+            Token position of mask (0-indexed)
+        top_k : int
+            Number of top predictions to return
+        Returns
+        -------
+        list[tuple[str, float]]
+            List of (token, log_probability) tuples, sorted by probability
+        Raises
+        ------
+        RuntimeError
+            If model is not loaded
+        ValueError
+            If mask_position is invalid
+        Examples
+        --------
+        >>> predictions = adapter.predict_masked_token(
+        ...     text="The cat [MASK] on the mat",
+        ...     mask_position=2,
+        ...     top_k=3
+        ... )
+        >>> predictions
+        [("sat", -0.5), ("slept", -1.2), ("jumped", -1.5)]
+        """
+        pass
+    def is_loaded(self) -> bool:
+        """Check if model is loaded.
+        Returns
+        -------
+        bool
+            True if model is loaded in memory
+        """
+        return self._model_loaded
+    def __enter__(self) -> TemplateFillingModelAdapter:
+        """Context manager entry."""
+        self.load_model()
+        return self
+    def __exit__(self, *args: object) -> None:
+        """Context manager exit."""
+        self.unload_model()

bead/templates/adapters/cache.py ADDED Viewed

@@ -0,0 +1,178 @@
+"""Content-addressable cache for model predictions.
+This module implements caching for template filling model predictions
+using SHA256-based content addressing.
+"""
+from __future__ import annotations
+import hashlib
+import json
+from pathlib import Path
+class ModelOutputCache:
+    """Content-addressable cache for model predictions.
+    Uses SHA256 hashing to create deterministic cache keys based on:
+    - Model name
+    - Input text
+    - Mask position
+    - Top-K parameter
+    Parameters
+    ----------
+    cache_dir : Path
+        Directory for cache storage
+    enabled : bool
+        Enable/disable caching
+    Examples
+    --------
+    >>> cache = ModelOutputCache(cache_dir=Path("/tmp/cache"), enabled=True)
+    >>> key_args = ("bert-base-uncased", "The cat [MASK]", 2, 10)
+    >>> predictions = cache.get(*key_args)
+    >>> if predictions is None:
+    ...     predictions = model.predict(...)
+    ...     cache.set(*key_args, predictions)
+    """
+    def __init__(self, cache_dir: Path, enabled: bool = True) -> None:
+        self.cache_dir = cache_dir
+        self.enabled = enabled
+        if self.enabled:
+            self.cache_dir.mkdir(parents=True, exist_ok=True)
+    def _compute_key(
+        self,
+        model_name: str,
+        input_text: str,
+        mask_position: int,
+        top_k: int,
+    ) -> str:
+        """Compute cache key from inputs.
+        Parameters
+        ----------
+        model_name : str
+            Model identifier
+        input_text : str
+            Input text with mask
+        mask_position : int
+            Position of mask token
+        top_k : int
+            Number of predictions
+        Returns
+        -------
+        str
+            SHA256 hex digest
+        """
+        # create deterministic key
+        key_data = {
+            "model_name": model_name,
+            "input_text": input_text,
+            "mask_position": mask_position,
+            "top_k": top_k,
+        }
+        # serialize to JSON with sorted keys for determinism
+        key_json = json.dumps(key_data, sort_keys=True)
+        # hash with SHA256
+        return hashlib.sha256(key_json.encode("utf-8")).hexdigest()
+    def get(
+        self,
+        model_name: str,
+        input_text: str,
+        mask_position: int,
+        top_k: int,
+    ) -> list[tuple[str, float]] | None:
+        """Get cached predictions.
+        Parameters
+        ----------
+        model_name : str
+            Model identifier
+        input_text : str
+            Input text
+        mask_position : int
+            Mask position
+        top_k : int
+            Number of predictions
+        Returns
+        -------
+        list[tuple[str, float]] | None
+            Cached predictions or None if not found
+        """
+        if not self.enabled:
+            return None
+        cache_key = self._compute_key(model_name, input_text, mask_position, top_k)
+        cache_file = self.cache_dir / f"{cache_key}.json"
+        if not cache_file.exists():
+            return None
+        try:
+            with open(cache_file) as f:
+                data = json.load(f)
+                return [(item["token"], item["log_prob"]) for item in data]
+        except (json.JSONDecodeError, KeyError, OSError):
+            # cache corruption; return None
+            return None
+    def set(
+        self,
+        model_name: str,
+        input_text: str,
+        mask_position: int,
+        top_k: int,
+        predictions: list[tuple[str, float]],
+    ) -> None:
+        """Store predictions in cache.
+        Parameters
+        ----------
+        model_name : str
+            Model identifier
+        input_text : str
+            Input text
+        mask_position : int
+            Mask position
+        top_k : int
+            Number of predictions
+        predictions : list[tuple[str, float]]
+            Predictions to cache
+        """
+        if not self.enabled:
+            return
+        cache_key = self._compute_key(model_name, input_text, mask_position, top_k)
+        cache_file = self.cache_dir / f"{cache_key}.json"
+        # convert to serializable format
+        data = [
+            {"token": token, "log_prob": log_prob} for token, log_prob in predictions
+        ]
+        try:
+            with open(cache_file, "w") as f:
+                json.dump(data, f, indent=2)
+        except OSError:
+            # silently fail on cache write errors
+            pass
+    def clear(self) -> None:
+        """Clear all cached predictions."""
+        if not self.enabled or not self.cache_dir.exists():
+            return
+        for cache_file in self.cache_dir.glob("*.json"):
+            try:
+                cache_file.unlink()
+            except OSError:
+                pass