PyPI - dataforge-07 - Versions diffs - 0.1.0__py3-none-any.whl - Mend

dataforge-07 0.1.0__py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (150) hide show

dataforge/__init__.py +204 -0
dataforge/__main__.py +5 -0
dataforge/agent/__init__.py +16 -0
dataforge/agent/providers.py +259 -0
dataforge/agent/scratchpad.py +183 -0
dataforge/agent/tool_actions.py +343 -0
dataforge/bench/__init__.py +31 -0
dataforge/bench/core.py +426 -0
dataforge/bench/groq_client.py +386 -0
dataforge/bench/methods.py +443 -0
dataforge/bench/report.py +309 -0
dataforge/bench/runner.py +247 -0
dataforge/causal/__init__.py +21 -0
dataforge/causal/dag.py +174 -0
dataforge/causal/pc.py +232 -0
dataforge/causal/root_cause.py +193 -0
dataforge/cli/__init__.py +50 -0
dataforge/cli/audit.py +70 -0
dataforge/cli/bench.py +154 -0
dataforge/cli/common.py +267 -0
dataforge/cli/constraints.py +407 -0
dataforge/cli/profile.py +147 -0
dataforge/cli/release.py +166 -0
dataforge/cli/repair.py +407 -0
dataforge/cli/revert.py +139 -0
dataforge/cli/watch.py +144 -0
dataforge/datasets/__init__.py +25 -0
dataforge/datasets/embedded/hospital/clean.csv +11 -0
dataforge/datasets/embedded/hospital/dirty.csv +11 -0
dataforge/datasets/real_world.py +290 -0
dataforge/datasets/registry.py +103 -0
dataforge/detectors/__init__.py +80 -0
dataforge/detectors/base.py +145 -0
dataforge/detectors/decimal_shift.py +166 -0
dataforge/detectors/fd_violation.py +157 -0
dataforge/detectors/type_mismatch.py +173 -0
dataforge/engine/__init__.py +39 -0
dataforge/engine/repair.py +905 -0
dataforge/env/__init__.py +22 -0
dataforge/env/environment.py +883 -0
dataforge/env/observation.py +61 -0
dataforge/env/openenv_core.py +161 -0
dataforge/env/reward.py +128 -0
dataforge/env/server.py +176 -0
dataforge/evaluation_contract.py +76 -0
dataforge/fixtures/hospital_10rows.csv +11 -0
dataforge/fixtures/hospital_schema.yaml +17 -0
dataforge/http/__init__.py +1 -0
dataforge/http/problem.py +103 -0
dataforge/integrations/__init__.py +1 -0
dataforge/integrations/dbt.py +164 -0
dataforge/observability.py +76 -0
dataforge/py.typed +1 -0
dataforge/release/__init__.py +1 -0
dataforge/release/doctor.py +367 -0
dataforge/release/full_vision.py +702 -0
dataforge/release/gate.py +861 -0
dataforge/release/playground_check.py +411 -0
dataforge/repair_contract.py +468 -0
dataforge/repairers/__init__.py +88 -0
dataforge/repairers/base.py +77 -0
dataforge/repairers/decimal_shift.py +43 -0
dataforge/repairers/fd_violation.py +225 -0
dataforge/repairers/type_mismatch.py +73 -0
dataforge/safety/__init__.py +5 -0
dataforge/safety/adversarial/attack_01_phone_pii.yaml +8 -0
dataforge/safety/adversarial/attack_02_phone_pii.yaml +8 -0
dataforge/safety/adversarial/attack_03_phone_pii.yaml +8 -0
dataforge/safety/adversarial/attack_04_phone_pii.yaml +8 -0
dataforge/safety/adversarial/attack_05_phone_pii.yaml +8 -0
dataforge/safety/adversarial/attack_06_phone_pii.yaml +8 -0
dataforge/safety/adversarial/attack_07_phone_pii.yaml +8 -0
dataforge/safety/adversarial/attack_08_phone_pii.yaml +8 -0
dataforge/safety/adversarial/attack_09_phone_pii.yaml +8 -0
dataforge/safety/adversarial/attack_10_phone_pii.yaml +8 -0
dataforge/safety/adversarial/attack_11_ssn_pii.yaml +8 -0
dataforge/safety/adversarial/attack_12_ssn_pii.yaml +8 -0
dataforge/safety/adversarial/attack_13_ssn_pii.yaml +8 -0
dataforge/safety/adversarial/attack_14_ssn_pii.yaml +8 -0
dataforge/safety/adversarial/attack_15_ssn_pii.yaml +8 -0
dataforge/safety/adversarial/attack_16_ssn_pii.yaml +8 -0
dataforge/safety/adversarial/attack_17_ssn_pii.yaml +8 -0
dataforge/safety/adversarial/attack_18_ssn_pii.yaml +8 -0
dataforge/safety/adversarial/attack_19_ssn_pii.yaml +8 -0
dataforge/safety/adversarial/attack_20_ssn_pii.yaml +8 -0
dataforge/safety/adversarial/attack_21_email_pii.yaml +8 -0
dataforge/safety/adversarial/attack_22_email_pii.yaml +8 -0
dataforge/safety/adversarial/attack_23_email_pii.yaml +8 -0
dataforge/safety/adversarial/attack_24_email_pii.yaml +8 -0
dataforge/safety/adversarial/attack_25_email_pii.yaml +8 -0
dataforge/safety/adversarial/attack_26_email_pii.yaml +8 -0
dataforge/safety/adversarial/attack_27_email_pii.yaml +8 -0
dataforge/safety/adversarial/attack_28_email_pii.yaml +8 -0
dataforge/safety/adversarial/attack_29_email_pii.yaml +8 -0
dataforge/safety/adversarial/attack_30_email_pii.yaml +8 -0
dataforge/safety/adversarial/attack_31_row_delete.yaml +7 -0
dataforge/safety/adversarial/attack_32_row_delete.yaml +8 -0
dataforge/safety/adversarial/attack_33_row_delete.yaml +7 -0
dataforge/safety/adversarial/attack_34_row_delete.yaml +7 -0
dataforge/safety/adversarial/attack_35_row_delete.yaml +7 -0
dataforge/safety/adversarial/attack_36_row_delete.yaml +11 -0
dataforge/safety/adversarial/attack_37_row_delete.yaml +7 -0
dataforge/safety/adversarial/attack_38_row_delete.yaml +7 -0
dataforge/safety/adversarial/attack_39_row_delete.yaml +8 -0
dataforge/safety/adversarial/attack_40_row_delete.yaml +7 -0
dataforge/safety/adversarial/attack_41_row_delete.yaml +7 -0
dataforge/safety/adversarial/attack_42_row_delete.yaml +7 -0
dataforge/safety/adversarial/attack_43_row_delete.yaml +7 -0
dataforge/safety/adversarial/attack_44_row_delete.yaml +7 -0
dataforge/safety/adversarial/attack_45_row_delete.yaml +8 -0
dataforge/safety/adversarial/attack_46_row_delete.yaml +8 -0
dataforge/safety/adversarial/attack_47_row_delete.yaml +7 -0
dataforge/safety/adversarial/attack_48_row_delete.yaml +7 -0
dataforge/safety/adversarial/attack_49_row_delete.yaml +8 -0
dataforge/safety/adversarial/attack_50_row_delete.yaml +7 -0
dataforge/safety/constitution.py +307 -0
dataforge/safety/constitutions/default.yaml +40 -0
dataforge/safety/filter.py +134 -0
dataforge/schema_inference.py +620 -0
dataforge/stores/__init__.py +46 -0
dataforge/stores/base.py +73 -0
dataforge/stores/cloud.py +78 -0
dataforge/stores/csv.py +94 -0
dataforge/stores/duckdb.py +313 -0
dataforge/stores/patch_plan.py +178 -0
dataforge/stores/registry.py +82 -0
dataforge/stores/repair.py +121 -0
dataforge/stores/revert.py +22 -0
dataforge/stores/sql.py +27 -0
dataforge/table.py +228 -0
dataforge/transactions/__init__.py +34 -0
dataforge/transactions/files.py +96 -0
dataforge/transactions/log.py +613 -0
dataforge/transactions/revert.py +102 -0
dataforge/transactions/txn.py +104 -0
dataforge/ui/__init__.py +1 -0
dataforge/ui/profile_view.py +136 -0
dataforge/ui/repair_diff.py +91 -0
dataforge/verifier/__init__.py +55 -0
dataforge/verifier/constraint_ir.py +155 -0
dataforge/verifier/explain.py +47 -0
dataforge/verifier/gate.py +5 -0
dataforge/verifier/schema.py +111 -0
dataforge/verifier/smt.py +433 -0
dataforge_07-0.1.0.dist-info/METADATA +436 -0
dataforge_07-0.1.0.dist-info/RECORD +150 -0
dataforge_07-0.1.0.dist-info/WHEEL +5 -0
dataforge_07-0.1.0.dist-info/entry_points.txt +3 -0
dataforge_07-0.1.0.dist-info/licenses/LICENSE +176 -0
dataforge_07-0.1.0.dist-info/top_level.txt +1 -0

dataforge/__init__.py ADDED Viewed

@@ -0,0 +1,204 @@
+"""DataForge public package.
+The root package is the stable facade for integration surfaces. Symbols are
+resolved lazily so importing :mod:`dataforge` does not eagerly import pandas,
+FastAPI-facing helpers, or the SMT stack.
+"""
+from __future__ import annotations
+from importlib import import_module
+from typing import TYPE_CHECKING, Any
+if TYPE_CHECKING:
+    from dataforge.cli.common import load_schema, schema_from_mapping
+    from dataforge.detectors import Issue, Schema, Severity, run_all_detectors
+    from dataforge.engine.repair import (
+        CandidateFix,
+        CandidateRepair,
+        ProofObligation,
+        RepairFailure,
+        RepairPipelineRequest,
+        RepairPipelineResult,
+        RepairReceipt,
+        RootCause,
+        VerifiedFix,
+        run_repair_pipeline,
+    )
+    from dataforge.integrations.dbt import schema_from_dbt_artifacts, schema_from_dbt_manifest
+    from dataforge.repair_contract import CONTRACT_VERSION
+    from dataforge.repairers import ProposedFix
+    from dataforge.safety import SafetyContext, SafetyFilter, SafetyResult, SafetyVerdict
+    from dataforge.schema_inference import (
+        ConstraintCandidate,
+        ConstraintReviewArtifact,
+        ConstraintReviewError,
+        ReviewedConstraintCandidate,
+        SchemaInferenceResult,
+        build_constraint_review_artifact,
+        dump_constraint_review_artifact,
+        infer_schema,
+        load_constraint_review_artifact,
+    )
+    from dataforge.stores import (
+        DuckDBStore,
+        PatchPlan,
+        TableStoreError,
+        TableStoreRepairResult,
+        is_table_store_uri,
+        run_table_store_repair,
+        store_from_uri,
+    )
+    from dataforge.table import read_csv
+    from dataforge.transactions.log import (
+        TransactionAuditReport,
+        TransactionAuditVerdict,
+        TransactionLogError,
+        verify_transaction_log,
+    )
+    from dataforge.transactions.revert import TransactionRevertError, revert_transaction
+    from dataforge.transactions.txn import CellFix, RepairTransaction
+    from dataforge.verifier import (
+        ConstraintIR,
+        SMTVerifier,
+        VerificationResult,
+        VerificationVerdict,
+        constraint_ir_from_schema,
+    )
+__all__ = [
+    "CONTRACT_VERSION",
+    "CandidateFix",
+    "CandidateRepair",
+    "CellFix",
+    "ConstraintCandidate",
+    "ConstraintReviewArtifact",
+    "ConstraintReviewError",
+    "ConstraintIR",
+    "DuckDBStore",
+    "Issue",
+    "PatchPlan",
+    "ProposedFix",
+    "ProofObligation",
+    "RepairFailure",
+    "RepairPipelineRequest",
+    "RepairPipelineResult",
+    "RepairReceipt",
+    "RepairTransaction",
+    "RootCause",
+    "ReviewedConstraintCandidate",
+    "SMTVerifier",
+    "SafetyContext",
+    "SafetyFilter",
+    "SafetyResult",
+    "SafetyVerdict",
+    "Schema",
+    "SchemaInferenceResult",
+    "Severity",
+    "TransactionAuditReport",
+    "TransactionAuditVerdict",
+    "TransactionLogError",
+    "TransactionRevertError",
+    "TableStoreError",
+    "TableStoreRepairResult",
+    "VerificationResult",
+    "VerificationVerdict",
+    "VerifiedFix",
+    "__version__",
+    "load_schema",
+    "build_constraint_review_artifact",
+    "constraint_ir_from_schema",
+    "dump_constraint_review_artifact",
+    "load_constraint_review_artifact",
+    "read_csv",
+    "revert_transaction",
+    "run_all_detectors",
+    "run_repair_pipeline",
+    "schema_from_mapping",
+    "schema_from_dbt_artifacts",
+    "schema_from_dbt_manifest",
+    "infer_schema",
+    "is_table_store_uri",
+    "run_table_store_repair",
+    "store_from_uri",
+    "verify_transaction_log",
+]
+__version__ = "0.1.0"
+_PUBLIC_EXPORTS: dict[str, tuple[str, str]] = {
+    "CONTRACT_VERSION": ("dataforge.repair_contract", "CONTRACT_VERSION"),
+    "CandidateFix": ("dataforge.engine.repair", "CandidateFix"),
+    "CandidateRepair": ("dataforge.engine.repair", "CandidateRepair"),
+    "CellFix": ("dataforge.transactions.txn", "CellFix"),
+    "ConstraintCandidate": ("dataforge.schema_inference", "ConstraintCandidate"),
+    "ConstraintReviewArtifact": ("dataforge.schema_inference", "ConstraintReviewArtifact"),
+    "ConstraintReviewError": ("dataforge.schema_inference", "ConstraintReviewError"),
+    "ConstraintIR": ("dataforge.verifier", "ConstraintIR"),
+    "DuckDBStore": ("dataforge.stores", "DuckDBStore"),
+    "Issue": ("dataforge.detectors", "Issue"),
+    "ProposedFix": ("dataforge.repairers", "ProposedFix"),
+    "ProofObligation": ("dataforge.engine.repair", "ProofObligation"),
+    "PatchPlan": ("dataforge.stores", "PatchPlan"),
+    "RepairFailure": ("dataforge.engine.repair", "RepairFailure"),
+    "RepairPipelineRequest": ("dataforge.engine.repair", "RepairPipelineRequest"),
+    "RepairPipelineResult": ("dataforge.engine.repair", "RepairPipelineResult"),
+    "RepairReceipt": ("dataforge.engine.repair", "RepairReceipt"),
+    "RepairTransaction": ("dataforge.transactions.txn", "RepairTransaction"),
+    "RootCause": ("dataforge.engine.repair", "RootCause"),
+    "ReviewedConstraintCandidate": ("dataforge.schema_inference", "ReviewedConstraintCandidate"),
+    "SMTVerifier": ("dataforge.verifier", "SMTVerifier"),
+    "SafetyContext": ("dataforge.safety", "SafetyContext"),
+    "SafetyFilter": ("dataforge.safety", "SafetyFilter"),
+    "SafetyResult": ("dataforge.safety", "SafetyResult"),
+    "SafetyVerdict": ("dataforge.safety", "SafetyVerdict"),
+    "Schema": ("dataforge.detectors", "Schema"),
+    "SchemaInferenceResult": ("dataforge.schema_inference", "SchemaInferenceResult"),
+    "Severity": ("dataforge.detectors", "Severity"),
+    "TransactionAuditReport": ("dataforge.transactions.log", "TransactionAuditReport"),
+    "TransactionAuditVerdict": ("dataforge.transactions.log", "TransactionAuditVerdict"),
+    "TransactionLogError": ("dataforge.transactions.log", "TransactionLogError"),
+    "TransactionRevertError": ("dataforge.transactions.revert", "TransactionRevertError"),
+    "TableStoreError": ("dataforge.stores", "TableStoreError"),
+    "TableStoreRepairResult": ("dataforge.stores", "TableStoreRepairResult"),
+    "VerificationResult": ("dataforge.verifier", "VerificationResult"),
+    "VerificationVerdict": ("dataforge.verifier", "VerificationVerdict"),
+    "VerifiedFix": ("dataforge.engine.repair", "VerifiedFix"),
+    "load_schema": ("dataforge.cli.common", "load_schema"),
+    "build_constraint_review_artifact": (
+        "dataforge.schema_inference",
+        "build_constraint_review_artifact",
+    ),
+    "constraint_ir_from_schema": ("dataforge.verifier", "constraint_ir_from_schema"),
+    "dump_constraint_review_artifact": (
+        "dataforge.schema_inference",
+        "dump_constraint_review_artifact",
+    ),
+    "load_constraint_review_artifact": (
+        "dataforge.schema_inference",
+        "load_constraint_review_artifact",
+    ),
+    "read_csv": ("dataforge.table", "read_csv"),
+    "revert_transaction": ("dataforge.transactions.revert", "revert_transaction"),
+    "run_all_detectors": ("dataforge.detectors", "run_all_detectors"),
+    "run_repair_pipeline": ("dataforge.engine.repair", "run_repair_pipeline"),
+    "schema_from_mapping": ("dataforge.cli.common", "schema_from_mapping"),
+    "schema_from_dbt_artifacts": ("dataforge.integrations.dbt", "schema_from_dbt_artifacts"),
+    "schema_from_dbt_manifest": ("dataforge.integrations.dbt", "schema_from_dbt_manifest"),
+    "infer_schema": ("dataforge.schema_inference", "infer_schema"),
+    "is_table_store_uri": ("dataforge.stores", "is_table_store_uri"),
+    "run_table_store_repair": ("dataforge.stores", "run_table_store_repair"),
+    "store_from_uri": ("dataforge.stores", "store_from_uri"),
+    "verify_transaction_log": ("dataforge.transactions.log", "verify_transaction_log"),
+}
+def __getattr__(name: str) -> Any:
+    """Resolve public facade exports on first use."""
+    try:
+        module_name, attribute_name = _PUBLIC_EXPORTS[name]
+    except KeyError as exc:
+        raise AttributeError(name) from exc
+    value = getattr(import_module(module_name), attribute_name)
+    globals()[name] = value
+    return value

dataforge/__main__.py ADDED Viewed

@@ -0,0 +1,5 @@
+"""Enable ``python -m dataforge`` invocation."""
+from dataforge.cli import app
+app()

dataforge/agent/__init__.py ADDED Viewed

@@ -0,0 +1,16 @@
+"""DataForge agent package — typed tool-use actions and scratchpad.
+Public API:
+    parse_action — Parse raw dict into typed Action model.
+    Action       — Discriminated union of all action types.
+    Scratchpad   — In-episode hypothesis tracker.
+"""
+from dataforge.agent.scratchpad import Scratchpad
+from dataforge.agent.tool_actions import Action, parse_action
+__all__ = [
+    "Action",
+    "Scratchpad",
+    "parse_action",
+]

dataforge/agent/providers.py ADDED Viewed

@@ -0,0 +1,259 @@
+"""Multi-provider LLM client for DataForge.
+Reads ``DATAFORGE_LLM_PROVIDER`` from the environment and dispatches to the
+matching provider.  Week 1 implements **groq** and **gemini** only; other
+providers raise ``NotImplementedError``.
+No LLM calls are made by detectors — this module is for the agent loop
+(Week 2+) and is stubbed here to establish the interface.
+The interface is:
+    ``async def complete(messages, model, temperature) -> str``
+"""
+from __future__ import annotations
+import os
+from typing import Literal, TypedDict
+import httpx
+from tenacity import retry, retry_if_exception_type, stop_after_attempt, wait_exponential
+# ── Message type ──────────────────────────────────────────────────────────
+class Message(TypedDict):
+    """A single chat message.
+    Args:
+        role: The speaker role — ``"system"``, ``"user"``, or ``"assistant"``.
+        content: The text content of the message.
+    """
+    role: Literal["system", "user", "assistant"]
+    content: str
+# ── Exceptions ────────────────────────────────────────────────────────────
+class ProviderError(Exception):
+    """Raised when an LLM provider call fails after retries.
+    Args:
+        provider: The provider name that failed.
+        message: Description of the failure.
+    """
+    def __init__(self, provider: str, message: str) -> None:
+        self.provider = provider
+        super().__init__(f"[{provider}] {message}")
+# ── Provider dispatch ─────────────────────────────────────────────────────
+_SUPPORTED_PROVIDERS = frozenset({"groq", "gemini", "cerebras", "openrouter", "hf", "cloudflare"})
+def get_provider_name() -> str:
+    """Read the active provider from the environment.
+    Returns:
+        The lowercased provider name from ``DATAFORGE_LLM_PROVIDER``.
+        When no explicit provider is configured, prefer a provider whose
+        credential is present in the environment.
+    Example:
+        >>> import os
+        >>> os.environ["DATAFORGE_LLM_PROVIDER"] = "gemini"
+        >>> get_provider_name()
+        'gemini'
+    """
+    configured = os.environ.get("DATAFORGE_LLM_PROVIDER")
+    if configured:
+        return configured.lower()
+    if os.environ.get("GROQ_API_KEY"):
+        return "groq"
+    if os.environ.get("GEMINI_API_KEY"):
+        return "gemini"
+    return "groq"
+async def complete(
+    messages: list[Message],
+    *,
+    model: str | None = None,
+    temperature: float = 0.0,
+) -> str:
+    """Send a chat completion request to the active LLM provider.
+    Args:
+        messages: List of chat messages forming the conversation.
+        model: Optional model override. If None, uses the provider default.
+        temperature: Sampling temperature (0.0 = deterministic).
+    Returns:
+        The assistant's response text.
+    Raises:
+        NotImplementedError: If the provider is not yet implemented.
+        ProviderError: If the API call fails after retries.
+    Example:
+        >>> import asyncio
+        >>> msgs = [{"role": "user", "content": "What is 2+2?"}]
+        >>> # result = asyncio.run(complete(msgs))  # requires API key
+    """
+    provider = get_provider_name()
+    if provider == "groq":
+        return await _complete_groq(messages, model=model, temperature=temperature)
+    if provider == "gemini":
+        return await _complete_gemini(messages, model=model, temperature=temperature)
+    if provider in _SUPPORTED_PROVIDERS:
+        raise NotImplementedError(
+            f"Provider '{provider}' is planned but not yet implemented. "
+            f"Use 'groq' or 'gemini' for Week 1."
+        )
+    raise NotImplementedError(
+        f"Unknown provider '{provider}'. Supported: {sorted(_SUPPORTED_PROVIDERS)}"
+    )
+# ── Groq provider ────────────────────────────────────────────────────────
+_GROQ_URL = "https://api.groq.com/openai/v1/chat/completions"
+_GROQ_DEFAULT_MODEL = "llama-3.1-70b-versatile"
+@retry(
+    retry=retry_if_exception_type(httpx.HTTPStatusError),
+    wait=wait_exponential(multiplier=1, min=1, max=30),
+    stop=stop_after_attempt(3),
+    reraise=True,
+)
+async def _complete_groq(
+    messages: list[Message],
+    *,
+    model: str | None = None,
+    temperature: float = 0.0,
+) -> str:
+    """Call Groq's OpenAI-compatible chat completions API.
+    Args:
+        messages: Chat messages.
+        model: Model name (defaults to llama-3.1-70b-versatile).
+        temperature: Sampling temperature.
+    Returns:
+        The assistant's response text.
+    Raises:
+        ProviderError: If the response is malformed.
+    """
+    api_key = os.environ.get("GROQ_API_KEY", "")
+    if not api_key:
+        raise ProviderError("groq", "GROQ_API_KEY environment variable not set")
+    payload = {
+        "model": model or _GROQ_DEFAULT_MODEL,
+        "messages": [dict(m) for m in messages],
+        "temperature": temperature,
+    }
+    async with httpx.AsyncClient(timeout=60.0) as client:
+        response = await client.post(
+            _GROQ_URL,
+            json=payload,
+            headers={
+                "Authorization": f"Bearer {api_key}",
+                "Content-Type": "application/json",
+            },
+        )
+        response.raise_for_status()
+    data = response.json()
+    try:
+        return str(data["choices"][0]["message"]["content"])
+    except (KeyError, IndexError) as exc:
+        raise ProviderError("groq", f"Unexpected response format: {data}") from exc
+# ── Gemini provider ──────────────────────────────────────────────────────
+_GEMINI_URL_TEMPLATE = (
+    "https://generativelanguage.googleapis.com/v1beta/models/{model}:generateContent"
+)
+_GEMINI_DEFAULT_MODEL = "gemini-2.0-flash"
+@retry(
+    retry=retry_if_exception_type(httpx.HTTPStatusError),
+    wait=wait_exponential(multiplier=1, min=1, max=30),
+    stop=stop_after_attempt(3),
+    reraise=True,
+)
+async def _complete_gemini(
+    messages: list[Message],
+    *,
+    model: str | None = None,
+    temperature: float = 0.0,
+) -> str:
+    """Call Google's Gemini generativeLanguage API.
+    Args:
+        messages: Chat messages (converted to Gemini's content format).
+        model: Model name (defaults to gemini-2.0-flash).
+        temperature: Sampling temperature.
+    Returns:
+        The assistant's response text.
+    Raises:
+        ProviderError: If the response is malformed.
+    """
+    api_key = os.environ.get("GEMINI_API_KEY", "")
+    if not api_key:
+        raise ProviderError("gemini", "GEMINI_API_KEY environment variable not set")
+    model_name = model or _GEMINI_DEFAULT_MODEL
+    url = _GEMINI_URL_TEMPLATE.format(model=model_name)
+    # Convert OpenAI-style messages to Gemini format.
+    contents: list[dict[str, object]] = []
+    system_instruction: str | None = None
+    for msg in messages:
+        if msg["role"] == "system":
+            system_instruction = msg["content"]
+        else:
+            role = "user" if msg["role"] == "user" else "model"
+            contents.append(
+                {
+                    "role": role,
+                    "parts": [{"text": msg["content"]}],
+                }
+            )
+    payload: dict[str, object] = {
+        "contents": contents,
+        "generationConfig": {"temperature": temperature},
+    }
+    if system_instruction:
+        payload["systemInstruction"] = {"parts": [{"text": system_instruction}]}
+    async with httpx.AsyncClient(timeout=60.0) as client:
+        response = await client.post(
+            url,
+            json=payload,
+            params={"key": api_key},
+            headers={"Content-Type": "application/json"},
+        )
+        response.raise_for_status()
+    data = response.json()
+    try:
+        return str(data["candidates"][0]["content"]["parts"][0]["text"])
+    except (KeyError, IndexError) as exc:
+        raise ProviderError("gemini", f"Unexpected response format: {data}") from exc

dataforge/agent/scratchpad.py ADDED Viewed

@@ -0,0 +1,183 @@
+"""In-episode hypothesis and issue tracker for the DataForge RL agent.
+The scratchpad is a mutable, episode-scoped data structure that the agent
+uses to record hypotheses, confirmed issues, and dead ends. The environment
+exposes a compact summary of the scratchpad in each observation, enabling
+the agent to reason about its investigation history without direct access
+to the underlying data structure.
+Example::
+    >>> from dataforge.agent.scratchpad import Scratchpad
+    >>> pad = Scratchpad()
+    >>> pad.add_hypothesis("Rating column has decimal shift", [5], ["rating"], "decimal_shift")
+    >>> pad.confirm_issue(5, "rating", "decimal_shift")
+    >>> pad.summary()
+    'Hypotheses: 1 (0 pending). Confirmed: 1. Dead ends: 0.'
+"""
+from __future__ import annotations
+from dataclasses import dataclass, field
+__all__ = [
+    "ConfirmedIssue",
+    "DeadEnd",
+    "HypothesisRecord",
+    "Scratchpad",
+]
+@dataclass(frozen=True)
+class HypothesisRecord:
+    """A recorded hypothesis about a data-quality root cause.
+    Args:
+        claim: Textual description of the hypothesis.
+        affected_rows: Row indices the hypothesis covers.
+        affected_columns: Column names the hypothesis covers.
+        root_cause_type: Detector-vocabulary root cause type.
+        confirmed: Whether the hypothesis was confirmed by ground truth.
+    """
+    claim: str
+    affected_rows: tuple[int, ...]
+    affected_columns: tuple[str, ...]
+    root_cause_type: str
+    confirmed: bool = False
+@dataclass(frozen=True)
+class ConfirmedIssue:
+    """A confirmed data-quality issue at a specific location.
+    Args:
+        row: Zero-indexed row number.
+        column: Column name.
+        issue_type: Issue type classification.
+    """
+    row: int
+    column: str
+    issue_type: str
+@dataclass(frozen=True)
+class DeadEnd:
+    """A recorded dead end — an investigation path that yielded nothing.
+    Args:
+        description: What was tried and why it failed.
+        step_number: Step at which the dead end was recorded.
+    """
+    description: str
+    step_number: int
+@dataclass
+class Scratchpad:
+    """Mutable in-episode tracker for hypotheses, confirmed issues, and dead ends.
+    Reset at the start of each episode. The ``summary()`` method produces a
+    compact string for inclusion in agent observations.
+    Example::
+        >>> pad = Scratchpad()
+        >>> pad.add_hypothesis("Decimal shift in rating", [5], ["rating"], "decimal_shift")
+        >>> len(pad.hypotheses)
+        1
+    """
+    hypotheses: list[HypothesisRecord] = field(default_factory=list)
+    confirmed_issues: list[ConfirmedIssue] = field(default_factory=list)
+    dead_ends: list[DeadEnd] = field(default_factory=list)
+    def add_hypothesis(
+        self,
+        claim: str,
+        affected_rows: list[int],
+        affected_columns: list[str],
+        root_cause_type: str,
+    ) -> HypothesisRecord:
+        """Record a new hypothesis.
+        Args:
+            claim: Textual description of the hypothesis.
+            affected_rows: Row indices the hypothesis covers.
+            affected_columns: Column names the hypothesis covers.
+            root_cause_type: Detector-vocabulary root cause type.
+        Returns:
+            The recorded hypothesis.
+        """
+        record = HypothesisRecord(
+            claim=claim,
+            affected_rows=tuple(affected_rows),
+            affected_columns=tuple(affected_columns),
+            root_cause_type=root_cause_type,
+        )
+        self.hypotheses.append(record)
+        return record
+    def confirm_hypothesis(self, index: int) -> None:
+        """Mark a hypothesis as confirmed.
+        Args:
+            index: Index into the ``hypotheses`` list.
+        Raises:
+            IndexError: If the index is out of range.
+        """
+        old = self.hypotheses[index]
+        self.hypotheses[index] = HypothesisRecord(
+            claim=old.claim,
+            affected_rows=old.affected_rows,
+            affected_columns=old.affected_columns,
+            root_cause_type=old.root_cause_type,
+            confirmed=True,
+        )
+    def confirm_issue(self, row: int, column: str, issue_type: str) -> None:
+        """Record a confirmed issue.
+        Args:
+            row: Zero-indexed row number.
+            column: Column name.
+            issue_type: Issue type classification.
+        """
+        self.confirmed_issues.append(ConfirmedIssue(row=row, column=column, issue_type=issue_type))
+    def add_dead_end(self, description: str, step_number: int) -> None:
+        """Record a dead end.
+        Args:
+            description: What was tried and why it failed.
+            step_number: Step at which the dead end was recorded.
+        """
+        self.dead_ends.append(DeadEnd(description=description, step_number=step_number))
+    def reset(self) -> None:
+        """Clear all tracked state for a new episode."""
+        self.hypotheses.clear()
+        self.confirmed_issues.clear()
+        self.dead_ends.clear()
+    def summary(self) -> str:
+        """Produce a compact summary string for observation embedding.
+        Returns:
+            A one-line summary of scratchpad state.
+        Example::
+            >>> Scratchpad().summary()
+            'Hypotheses: 0 (0 pending). Confirmed: 0. Dead ends: 0.'
+        """
+        pending = sum(1 for h in self.hypotheses if not h.confirmed)
+        return (
+            f"Hypotheses: {len(self.hypotheses)} ({pending} pending). "
+            f"Confirmed: {len(self.confirmed_issues)}. "
+            f"Dead ends: {len(self.dead_ends)}."
+        )