PyPI - data-designer-engine - Versions diffs - 0.4.0__py3-none-any.whl → 0.4.0rc2__py3-none-any.whl - Mend

data-designer-engine 0.4.0py3-none-any.whl → 0.4.0rc2py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (9) hide show

data_designer/engine/_version.py CHANGED Viewed

@@ -28,7 +28,7 @@ version_tuple: VERSION_TUPLE
 commit_id: COMMIT_ID
 __commit_id__: COMMIT_ID
-__version__ = version = '0.4.0'
-__version_tuple__ = version_tuple = (0, 4, 0)
+__version__ = version = '0.4.0rc2'
+__version_tuple__ = version_tuple = (0, 4, 0, 'rc2')
 __commit_id__ = commit_id = None

data_designer/engine/column_generators/generators/llm_completion.py CHANGED Viewed

@@ -12,7 +12,7 @@ from data_designer.config.column_configs import (
     LLMStructuredColumnConfig,
     LLMTextColumnConfig,
 )
-from data_designer.config.utils.constants import TRACE_COLUMN_POSTFIX
+from data_designer.config.utils.constants import REASONING_TRACE_COLUMN_POSTFIX
 from data_designer.engine.column_generators.generators.base import ColumnGeneratorWithModel, GenerationStrategy
 from data_designer.engine.column_generators.utils.prompt_renderer import (
     PromptType,
@@ -66,7 +66,7 @@ class ColumnGeneratorWithModelChatCompletion(ColumnGeneratorWithModel[TaskConfig
             for context in self.config.multi_modal_context:
                 multi_modal_context.extend(context.get_contexts(deserialized_record))
-        response, trace = self.model.generate(
+        response, reasoning_trace = self.model.generate(
             prompt=self.prompt_renderer.render(
                 record=deserialized_record,
                 prompt_template=self.config.prompt,
@@ -87,11 +87,8 @@ class ColumnGeneratorWithModelChatCompletion(ColumnGeneratorWithModel[TaskConfig
         serialized_output = self.response_recipe.serialize_output(response)
         data[self.config.name] = self._process_serialized_output(serialized_output)
-        should_save_trace = (
-            self.config.with_trace or self.resource_provider.run_config.debug_override_save_all_column_traces
-        )
-        if should_save_trace:
-            data[self.config.name + TRACE_COLUMN_POSTFIX] = [message.to_dict() for message in trace]
+        if reasoning_trace:
+            data[self.config.name + REASONING_TRACE_COLUMN_POSTFIX] = reasoning_trace
         return data

data_designer/engine/dataset_builders/column_wise_builder.py CHANGED Viewed

@@ -34,7 +34,6 @@ from data_designer.engine.dataset_builders.multi_column_configs import MultiColu
 from data_designer.engine.dataset_builders.utils.concurrency import ConcurrentThreadExecutor
 from data_designer.engine.dataset_builders.utils.config_compiler import compile_dataset_builder_column_configs
 from data_designer.engine.dataset_builders.utils.dataset_batch_manager import DatasetBatchManager
-from data_designer.engine.dataset_builders.utils.progress_tracker import ProgressTracker
 from data_designer.engine.models.telemetry import InferenceEvent, NemoSourceEnum, TaskStatusEnum, TelemetryHandler
 from data_designer.engine.processing.processors.base import Processor
 from data_designer.engine.processing.processors.drop_columns import DropColumnsProcessor
@@ -222,18 +221,16 @@ class ColumnWiseDatasetBuilder:
                 "generator so concurrency through threads is not supported."
             )
-        progress_tracker = ProgressTracker(
-            total_records=self.batch_manager.num_records_batch,
-            label=f"{generator.config.column_type} column '{generator.config.name}'",
+        logger.info(
+            f"🐙 Processing {generator.config.column_type} column '{generator.config.name}' "
+            f"with {max_workers} concurrent workers"
         )
-        progress_tracker.log_start(max_workers)
         settings = self._resource_provider.run_config
         with ConcurrentThreadExecutor(
             max_workers=max_workers,
             column_name=generator.config.name,
-            result_callback=self._make_result_callback(progress_tracker),
-            error_callback=self._make_error_callback(progress_tracker),
+            result_callback=self._worker_result_callback,
+            error_callback=self._worker_error_callback,
             shutdown_error_rate=settings.shutdown_error_rate,
             shutdown_error_window=settings.shutdown_error_window,
             disable_early_shutdown=settings.disable_early_shutdown,
@@ -241,26 +238,10 @@ class ColumnWiseDatasetBuilder:
             for i, record in self.batch_manager.iter_current_batch():
                 executor.submit(lambda record: generator.generate(record), record, context={"index": i})
-        progress_tracker.log_final()
         if len(self._records_to_drop) > 0:
             self.batch_manager.drop_records(self._records_to_drop)
             self._records_to_drop.clear()
-    def _make_result_callback(self, progress_tracker: ProgressTracker) -> Callable[[dict], None]:
-        def callback(result: dict, *, context: dict | None = None) -> None:
-            self._worker_result_callback(result, context=context)
-            progress_tracker.record_success()
-        return callback
-    def _make_error_callback(self, progress_tracker: ProgressTracker) -> Callable[[Exception], None]:
-        def callback(exc: Exception, *, context: dict | None = None) -> None:
-            self._worker_error_callback(exc, context=context)
-            progress_tracker.record_failure()
-        return callback
     def _write_processed_batch(self, dataframe: pd.DataFrame) -> None:
         self.batch_manager.update_records(dataframe.to_dict(orient="records"))
         self.batch_manager.write()

data_designer/engine/models/facade.py CHANGED Viewed

@@ -18,7 +18,7 @@ from data_designer.engine.models.errors import (
 from data_designer.engine.models.litellm_overrides import CustomRouter, LiteLLMRouterDefaultKwargs
 from data_designer.engine.models.parsers.errors import ParserException
 from data_designer.engine.models.usage import ModelUsageStats, RequestUsageStats, TokenUsageStats
-from data_designer.engine.models.utils import ChatMessage, prompt_to_messages
+from data_designer.engine.models.utils import prompt_to_messages, str_to_message
 from data_designer.engine.secret_resolver import SecretResolver
 from data_designer.lazy_heavy_imports import litellm
@@ -67,17 +67,16 @@ class ModelFacade:
         return self._usage_stats
     def completion(
-        self, messages: list[ChatMessage], skip_usage_tracking: bool = False, **kwargs
+        self, messages: list[dict[str, str]], skip_usage_tracking: bool = False, **kwargs
     ) -> litellm.ModelResponse:
-        message_payloads = [message.to_dict() for message in messages]
         logger.debug(
             f"Prompting model {self.model_name!r}...",
-            extra={"model": self.model_name, "messages": message_payloads},
+            extra={"model": self.model_name, "messages": messages},
         )
         response = None
         kwargs = self.consolidate_kwargs(**kwargs)
         try:
-            response = self._router.completion(model=self.model_name, messages=message_payloads, **kwargs)
+            response = self._router.completion(model=self.model_name, messages=messages, **kwargs)
             logger.debug(
                 f"Received completion from model {self.model_name!r}",
                 extra={
@@ -150,7 +149,7 @@ class ModelFacade:
         skip_usage_tracking: bool = False,
         purpose: str | None = None,
         **kwargs,
-    ) -> tuple[Any, list[ChatMessage]]:
+    ) -> tuple[Any, str | None]:
         """Generate a parsed output with correction steps.
         This generation call will attempt to generate an output which is
@@ -183,12 +182,6 @@ class ModelFacade:
                 It is expected to be used by the @catch_llm_exceptions decorator.
             **kwargs: Additional arguments to pass to the model.
-        Returns:
-            A tuple containing:
-                - The parsed output object from the parser.
-                - The full trace of ChatMessage entries in the conversation, including any
-                  corrections and reasoning traces. Callers can decide whether to store this.
         Raises:
             GenerationValidationFailureError: If the maximum number of retries or
                 correction steps are met and the last response failures on
@@ -197,17 +190,29 @@ class ModelFacade:
         output_obj = None
         curr_num_correction_steps = 0
         curr_num_restarts = 0
+        curr_generation_attempt = 0
+        max_generation_attempts = (max_correction_steps + 1) * (max_conversation_restarts + 1)
         starting_messages = prompt_to_messages(
             user_prompt=prompt, system_prompt=system_prompt, multi_modal_context=multi_modal_context
         )
-        messages: list[ChatMessage] = deepcopy(starting_messages)
+        messages = deepcopy(starting_messages)
         while True:
+            curr_generation_attempt += 1
+            logger.debug(
+                f"Starting generation attempt {curr_generation_attempt} of {max_generation_attempts} attempts."
+            )
             completion_response = self.completion(messages, skip_usage_tracking=skip_usage_tracking, **kwargs)
             response = completion_response.choices[0].message.content or ""
             reasoning_trace = getattr(completion_response.choices[0].message, "reasoning_content", None)
-            messages.append(ChatMessage.as_assistant(content=response, reasoning_content=reasoning_trace or None))
+            if reasoning_trace:
+                ## There are generally some extra newlines with how these get parsed.
+                response = response.strip()
+                reasoning_trace = reasoning_trace.strip()
             curr_num_correction_steps += 1
             try:
@@ -218,23 +223,21 @@ class ModelFacade:
                     raise GenerationValidationFailureError(
                         "Unsuccessful generation attempt. No retries were attempted."
                     ) from exc
                 if curr_num_correction_steps <= max_correction_steps:
-                    # Add user message with error for correction
-                    messages.append(ChatMessage.as_user(content=str(get_exception_primary_cause(exc))))
+                    ## Add turns to loop-back errors for correction
+                    messages += [
+                        str_to_message(content=response, role="assistant"),
+                        str_to_message(content=str(get_exception_primary_cause(exc)), role="user"),
+                    ]
                 elif curr_num_restarts < max_conversation_restarts:
                     curr_num_correction_steps = 0
                     curr_num_restarts += 1
                     messages = deepcopy(starting_messages)
                 else:
                     raise GenerationValidationFailureError(
-                        f"Unsuccessful generation despite {max_correction_steps} correction steps "
-                        f"and {max_conversation_restarts} conversation restarts."
+                        f"Unsuccessful generation attempt despite {max_generation_attempts} attempts."
                     ) from exc
-        return output_obj, messages
+        return output_obj, reasoning_trace
     def _get_litellm_deployment(self, model_config: ModelConfig) -> litellm.DeploymentTypedDict:
         provider = self._model_provider_registry.get_provider(model_config.provider)

data_designer/engine/models/utils.py CHANGED Viewed

@@ -3,81 +3,7 @@
 from __future__ import annotations
-from dataclasses import dataclass, field
-from typing import Any, Literal
-@dataclass
-class ChatMessage:
-    """A chat message in an LLM conversation.
-    This dataclass represents messages exchanged in a conversation with an LLM,
-    supporting various message types including user prompts, assistant responses,
-    system instructions, and tool interactions.
-    Attributes:
-        role: The role of the message sender. One of 'user', 'assistant', 'system', or 'tool'.
-        content: The message content. Can be a string or a list of content blocks
-            for multimodal messages (e.g., text + images).
-        reasoning_content: Optional reasoning/thinking content from the assistant,
-            typically from extended thinking or chain-of-thought models.
-        tool_calls: Optional list of tool calls requested by the assistant.
-            Each tool call contains 'id', 'type', and 'function' keys.
-        tool_call_id: Optional ID linking a tool response to its corresponding
-            tool call. Required for messages with role='tool'.
-    """
-    role: Literal["user", "assistant", "system", "tool"]
-    content: str | list[dict[str, Any]] = ""
-    reasoning_content: str | None = None
-    tool_calls: list[dict[str, Any]] = field(default_factory=list)
-    tool_call_id: str | None = None
-    def to_dict(self) -> dict[str, Any]:
-        """Convert the message to a dictionary format for API calls.
-        Returns:
-            A dictionary containing the message fields. Only includes non-empty
-            optional fields to keep the output clean.
-        """
-        result: dict[str, Any] = {"role": self.role, "content": self.content}
-        if self.reasoning_content:
-            result["reasoning_content"] = self.reasoning_content
-        if self.tool_calls:
-            result["tool_calls"] = self.tool_calls
-        if self.tool_call_id:
-            result["tool_call_id"] = self.tool_call_id
-        return result
-    @classmethod
-    def as_user(cls, content: str | list[dict[str, Any]]) -> ChatMessage:
-        """Create a user message."""
-        return cls(role="user", content=content)
-    @classmethod
-    def as_assistant(
-        cls,
-        content: str = "",
-        reasoning_content: str | None = None,
-        tool_calls: list[dict[str, Any]] | None = None,
-    ) -> ChatMessage:
-        """Create an assistant message."""
-        return cls(
-            role="assistant",
-            content=content,
-            reasoning_content=reasoning_content,
-            tool_calls=tool_calls or [],
-        )
-    @classmethod
-    def as_system(cls, content: str) -> ChatMessage:
-        """Create a system message."""
-        return cls(role="system", content=content)
-    @classmethod
-    def as_tool(cls, content: str, tool_call_id: str) -> ChatMessage:
-        """Create a tool response message."""
-        return cls(role="tool", content=content, tool_call_id=tool_call_id)
+from typing import Any
 def prompt_to_messages(
@@ -85,17 +11,28 @@ def prompt_to_messages(
     user_prompt: str,
     system_prompt: str | None = None,
     multi_modal_context: list[dict[str, Any]] | None = None,
-) -> list[ChatMessage]:
-    """Convert a user and system prompt into ChatMessage list.
+) -> list[dict[str, str | list[dict]]]:
+    """Convert a user and system prompt into Messages format.
     Args:
         user_prompt (str): A user prompt.
         system_prompt (str, optional): An optional system prompt.
     """
-    user_content: str | list[dict[str, Any]] = user_prompt
-    if multi_modal_context:
-        user_content = [*multi_modal_context, {"type": "text", "text": user_prompt}]
-    if system_prompt:
-        return [ChatMessage.as_system(system_prompt), ChatMessage.as_user(user_content)]
-    return [ChatMessage.as_user(user_content)]
+    user_content = user_prompt
+    if multi_modal_context and len(multi_modal_context) > 0:
+        user_content = []
+        for context in multi_modal_context:
+            user_content.append(context)
+        user_content.append({"type": "text", "text": user_prompt})
+    return (
+        [
+            str_to_message(content=system_prompt, role="system"),
+            str_to_message(content=user_content, role="user"),
+        ]
+        if system_prompt
+        else [str_to_message(content=user_content, role="user")]
+    )
+def str_to_message(content: str | list[dict], role: str = "user") -> dict[str, str | list[dict]]:
+    return {"content": content, "role": role}

{data_designer_engine-0.4.0.dist-info → data_designer_engine-0.4.0rc2.dist-info}/METADATA RENAMED Viewed

@@ -1,6 +1,6 @@
 Metadata-Version: 2.4
 Name: data-designer-engine
-Version: 0.4.0
+Version: 0.4.0rc2
 Summary: Generation engine for DataDesigner synthetic data generation
 License-Expression: Apache-2.0
 Classifier: Development Status :: 4 - Beta

{data_designer_engine-0.4.0.dist-info → data_designer_engine-0.4.0rc2.dist-info}/RECORD RENAMED Viewed

@@ -1,5 +1,5 @@
 data_designer/engine/__init__.py,sha256=ObZ6NUPeEvvpGTJ5WIGKUyIrIjaI747OM6ErweRtHxQ,137
-data_designer/engine/_version.py,sha256=2_0GUP7yBCXRus-qiJKxQD62z172WSs1sQ6DVpPsbmM,704
+data_designer/engine/_version.py,sha256=FvItxCBzPigrdVpFPfL1gQeV1-km5r7nCNGUzrYebTU,714
 data_designer/engine/compiler.py,sha256=4QAeCJjINtH0afSXygdhiKMyq2KIfaDthK3ApZLgrQ0,4152
 data_designer/engine/configurable_task.py,sha256=6R4FPXPzIeK0lqNVSEXzRDtK14B3dFz38lplr-nkvRE,2539
 data_designer/engine/errors.py,sha256=YXI7ny83BQ16sOK43CpTm384hJTKuZkPTEAjlHlDIfA,1303
@@ -20,7 +20,7 @@ data_designer/engine/column_generators/generators/__init__.py,sha256=ObZ6NUPeEvv
 data_designer/engine/column_generators/generators/base.py,sha256=QElk5KsaUQ3EYwlv40NcZgQsw3HIkX3YQV_0S3erl7Q,4209
 data_designer/engine/column_generators/generators/embedding.py,sha256=uB0jgHlCgctgIUf9ZfMqG1YThbJ0g-GCX3VdNbdDSko,1407
 data_designer/engine/column_generators/generators/expression.py,sha256=BiQcfVTinvQl3OI9nkdhB9B7FGBueWiHJwxTA8uNVuY,2330
-data_designer/engine/column_generators/generators/llm_completion.py,sha256=gMOOdd0_BY-RLXrArx1u8GL7YJfVvKceTqn_Zg1xHPI,4897
+data_designer/engine/column_generators/generators/llm_completion.py,sha256=udYWE3lwaQhZqxRTHQc6w1kWGEvLAfIh2OUjX6vxMB0,4750
 data_designer/engine/column_generators/generators/samplers.py,sha256=gNzURmu9K8Zb5MHamKvZPIxmWlFgl2W4FIVgaFcy4f0,3371
 data_designer/engine/column_generators/generators/seed_dataset.py,sha256=CoQPbz4Ww7pBLaGw8-CYqIk1sjfkBaoRMKZQexdfgKY,6824
 data_designer/engine/column_generators/generators/validation.py,sha256=YfYbk-8_ZUye0No6_Q7hIqpZv_tunnEZ6HkLSMFXlDE,6659
@@ -29,7 +29,7 @@ data_designer/engine/column_generators/utils/generator_classification.py,sha256=
 data_designer/engine/column_generators/utils/judge_score_factory.py,sha256=gESiqMrQzbbcFpZas0sAAAkrH2DL0Z4Nq5ywBO-pQ6k,2141
 data_designer/engine/column_generators/utils/prompt_renderer.py,sha256=LATVAlDYwL7HyM7Nogd6n9XTTk-j9s64o4z0LpKHMhQ,4819
 data_designer/engine/dataset_builders/artifact_storage.py,sha256=CKpTBtJTde7OQvsFZQa1v1autVz5yUxlBHkIKeATFnE,10999
-data_designer/engine/dataset_builders/column_wise_builder.py,sha256=UAfl-iejVYqvmVx2anGmtPKfmqztM5o8nvyVzxYrM_0,16581
+data_designer/engine/dataset_builders/column_wise_builder.py,sha256=9n_UYWOulUVvSnqJE9cW9f4ObF4Xa9wRxHiabJvJW8c,15723
 data_designer/engine/dataset_builders/errors.py,sha256=gLXtPcGSMBG10PzQ85dOXskdA0mKbBQrHa_VtP9sbVY,400
 data_designer/engine/dataset_builders/multi_column_configs.py,sha256=U4Pg0ETCBq5phRhb2zt8IFa4fRx-aTMakomKOBnrs0U,1660
 data_designer/engine/dataset_builders/utils/__init__.py,sha256=ObZ6NUPeEvvpGTJ5WIGKUyIrIjaI747OM6ErweRtHxQ,137
@@ -38,16 +38,15 @@ data_designer/engine/dataset_builders/utils/config_compiler.py,sha256=NGI6U0vgG8
 data_designer/engine/dataset_builders/utils/dag.py,sha256=RIEI75OtiphkuDl1vfI_MQC1xMiiIg29s-0C_fNZkWQ,2613
 data_designer/engine/dataset_builders/utils/dataset_batch_manager.py,sha256=IfWd_HcfEzIPhgFp2dJaxNIKRlrPsHqYATFXauvCfaw,8133
 data_designer/engine/dataset_builders/utils/errors.py,sha256=G1MIkQDXguSqHK1EP-60FkG_bys7bJ1UgJnSvcNgtt8,411
-data_designer/engine/dataset_builders/utils/progress_tracker.py,sha256=3zSljzDHwhqgP9IqPUR3XbwC231JvLNWslpmhqKIbUg,4255
 data_designer/engine/models/__init__.py,sha256=ObZ6NUPeEvvpGTJ5WIGKUyIrIjaI747OM6ErweRtHxQ,137
 data_designer/engine/models/errors.py,sha256=k9oZnmk8DRD8U2SVKJJRLwrcdsCcVoJiOb_Q7ZyEdvg,12271
-data_designer/engine/models/facade.py,sha256=ckwFxcMHC23-qKU8bdBC0eWKYx6vfVjvp9-0AtCXMX0,12497
+data_designer/engine/models/facade.py,sha256=UBMpw_o2JcsWpJsPdpTPKfFZCh_i0eeG_oaWi1XeKds,12582
 data_designer/engine/models/factory.py,sha256=2NjI0iiGv8ayQ1c249lsJtha4pDmvmtSjdwvlvitRds,1581
 data_designer/engine/models/litellm_overrides.py,sha256=e9IZCFQ6BhNWlOTncm8ErL8w4rtE1_4USh2mtUYxCZI,6207
 data_designer/engine/models/registry.py,sha256=Bid7Mv_ebzbTrlfzN-1wbcFxp_qQwilL0h2iwN5UPJ0,7099
 data_designer/engine/models/telemetry.py,sha256=_VZR6Iatr6-5Hypw3bes5Jr4y7Y3VagxFEVAv36eHcE,12733
 data_designer/engine/models/usage.py,sha256=A0LV9Ycuj_7snOsaqnirs4mlkAjozv2mzj2om2FpDoU,2410
-data_designer/engine/models/utils.py,sha256=Szy3lOg_E14DRAx6U2Dpr3HXPg09xIr3VUnoREiZ1mw,3807
+data_designer/engine/models/utils.py,sha256=sLBs-STJSe7BGzDAngRGGxo6GwAvFmtimqUs54zZ6DU,1259
 data_designer/engine/models/parsers/__init__.py,sha256=ObZ6NUPeEvvpGTJ5WIGKUyIrIjaI747OM6ErweRtHxQ,137
 data_designer/engine/models/parsers/errors.py,sha256=ODcZ4TOsmZyH4-MoNkKXhjiMm_4gLWPsz90qKtNF9_Q,1053
 data_designer/engine/models/parsers/parser.py,sha256=XkdDt2WEnolvsv2bArq4hhujfJ3kLmG6G2jkRXMYA8c,9489
@@ -109,6 +108,6 @@ data_designer/engine/validators/local_callable.py,sha256=JaL-yOXrTFpubiO2QlSt4Qb
 data_designer/engine/validators/python.py,sha256=omXjwMaomQYiyq4g6XqKt2wexVuI_rWue9Dk-CYc-do,8039
 data_designer/engine/validators/remote.py,sha256=rythhIrH2GvqncMQeF3FiJa9Om0KZWeK3cWjW-ZubaM,3077
 data_designer/engine/validators/sql.py,sha256=AMaEdA-gj9j0zwVp809x3ycKltd51wVEhI8mMYGyxd4,2408
-data_designer_engine-0.4.0.dist-info/METADATA,sha256=hHuNlKxfNErQUPbmwmBkux0M2q9ebuFna97Xoe8y2lc,1873
-data_designer_engine-0.4.0.dist-info/WHEEL,sha256=WLgqFyCfm_KASv4WHyYy0P3pM_m7J5L9k2skdKLirC8,87
-data_designer_engine-0.4.0.dist-info/RECORD,,
+data_designer_engine-0.4.0rc2.dist-info/METADATA,sha256=ZChyQl5ksGCWVi_XE6wD-GXG9-wWHko1vBDnd9ecLqw,1876
+data_designer_engine-0.4.0rc2.dist-info/WHEEL,sha256=WLgqFyCfm_KASv4WHyYy0P3pM_m7J5L9k2skdKLirC8,87
+data_designer_engine-0.4.0rc2.dist-info/RECORD,,

data_designer/engine/dataset_builders/utils/progress_tracker.py DELETED Viewed

@@ -1,122 +0,0 @@
-# SPDX-FileCopyrightText: Copyright (c) 2026 NVIDIA CORPORATION & AFFILIATES. All rights reserved.
-# SPDX-License-Identifier: Apache-2.0
-from __future__ import annotations
-import logging
-import time
-from threading import Lock
-from data_designer.logging import RandomEmoji
-logger = logging.getLogger(__name__)
-class ProgressTracker:
-    """
-    Thread-safe progress tracker for monitoring concurrent task completion.
-    Tracks completed, successful, and failed task counts and logs progress
-    at configurable intervals. Designed for use with ConcurrentThreadExecutor
-    to provide visibility into long-running batch operations.
-    Example usage:
-        tracker = ProgressTracker(total_records=100, label="LLM_TEXT column 'response'")
-        tracker.log_start(max_workers=8)
-        # In callbacks from ConcurrentThreadExecutor:
-        tracker.record_success()  # or tracker.record_failure()
-        # After executor completes:
-        tracker.log_final()
-    """
-    def __init__(self, total_records: int, label: str, log_interval_percent: int = 10):
-        """
-        Initialize the progress tracker.
-        Args:
-            total_records: Total number of records to process.
-            label: Human-readable label for log messages (e.g., "LLM_TEXT column 'response'").
-            log_interval_percent: How often to log progress as a percentage (default 10%).
-        """
-        self.total_records = total_records
-        self.label = label
-        self.completed = 0
-        self.success = 0
-        self.failed = 0
-        interval_fraction = max(1, log_interval_percent) / 100.0
-        self.log_interval = max(1, int(total_records * interval_fraction)) if total_records > 0 else 1
-        self.next_log_at = self.log_interval
-        self.start_time = time.perf_counter()
-        self.lock = Lock()
-        self._random_emoji = RandomEmoji()
-    def log_start(self, max_workers: int) -> None:
-        """Log the start of processing with worker count and interval information."""
-        logger.info(
-            "🐙 Processing %s with %d concurrent workers",
-            self.label,
-            max_workers,
-        )
-        logger.info(
-            "🧭 %s will report progress every %d record(s).",
-            self.label,
-            self.log_interval,
-        )
-    def record_success(self) -> None:
-        """Record a successful task completion and log progress if at interval."""
-        self._record_completion(success=True)
-    def record_failure(self) -> None:
-        """Record a failed task completion and log progress if at interval."""
-        self._record_completion(success=False)
-    def log_final(self) -> None:
-        """Log final progress summary."""
-        with self.lock:
-            if self.completed > 0:
-                self._log_progress_unlocked()
-    def _record_completion(self, *, success: bool) -> None:
-        should_log = False
-        with self.lock:
-            self.completed += 1
-            if success:
-                self.success += 1
-            else:
-                self.failed += 1
-            if self.completed >= self.next_log_at and self.completed < self.total_records:
-                should_log = True
-                while self.next_log_at <= self.completed:
-                    self.next_log_at += self.log_interval
-        if should_log:
-            with self.lock:
-                self._log_progress_unlocked()
-    def _log_progress_unlocked(self) -> None:
-        """Log current progress. Must be called while holding the lock."""
-        elapsed = time.perf_counter() - self.start_time
-        rate = self.completed / elapsed if elapsed > 0 else 0.0
-        remaining = max(0, self.total_records - self.completed)
-        eta = f"{(remaining / rate):.1f}s" if rate > 0 else "unknown"
-        percent = (self.completed / self.total_records) * 100 if self.total_records else 100.0
-        logger.info(
-            "  |-- %s %s progress: %d/%d (%.0f%%) complete, %d ok, %d failed, %.2f rec/s, eta %s",
-            self._random_emoji.progress(percent),
-            self.label,
-            self.completed,
-            self.total_records,
-            percent,
-            self.success,
-            self.failed,
-            rate,
-            eta,
-        )

{data_designer_engine-0.4.0.dist-info → data_designer_engine-0.4.0rc2.dist-info}/WHEEL RENAMED Viewed

File without changes

data-designer-engine 0.4.0__py3-none-any.whl → 0.4.0rc2__py3-none-any.whl

data-designer-engine 0.4.0py3-none-any.whl → 0.4.0rc2py3-none-any.whl