PyPI - chalkpy - Versions diffs - 2.90.1__py3-none-any.whl → 2.95.3__py3-none-any.whl - Mend

chalkpy 2.90.1py3-none-any.whl → 2.95.3py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (202) hide show

chalk/__init__.py +2 -1
chalk/_gen/chalk/arrow/v1/arrow_pb2.py +7 -5
chalk/_gen/chalk/arrow/v1/arrow_pb2.pyi +6 -0
chalk/_gen/chalk/artifacts/v1/chart_pb2.py +16 -16
chalk/_gen/chalk/artifacts/v1/chart_pb2.pyi +4 -0
chalk/_gen/chalk/artifacts/v1/cron_query_pb2.py +8 -7
chalk/_gen/chalk/artifacts/v1/cron_query_pb2.pyi +5 -0
chalk/_gen/chalk/common/v1/offline_query_pb2.py +17 -15
chalk/_gen/chalk/common/v1/offline_query_pb2.pyi +25 -0
chalk/_gen/chalk/common/v1/script_task_pb2.py +3 -3
chalk/_gen/chalk/common/v1/script_task_pb2.pyi +2 -0
chalk/_gen/chalk/dataframe/__init__.py +0 -0
chalk/_gen/chalk/dataframe/v1/__init__.py +0 -0
chalk/_gen/chalk/dataframe/v1/dataframe_pb2.py +48 -0
chalk/_gen/chalk/dataframe/v1/dataframe_pb2.pyi +123 -0
chalk/_gen/chalk/dataframe/v1/dataframe_pb2_grpc.py +4 -0
chalk/_gen/chalk/dataframe/v1/dataframe_pb2_grpc.pyi +4 -0
chalk/_gen/chalk/graph/v1/graph_pb2.py +150 -149
chalk/_gen/chalk/graph/v1/graph_pb2.pyi +25 -0
chalk/_gen/chalk/graph/v1/sources_pb2.py +94 -84
chalk/_gen/chalk/graph/v1/sources_pb2.pyi +56 -0
chalk/_gen/chalk/kubernetes/v1/horizontalpodautoscaler_pb2.py +79 -0
chalk/_gen/chalk/kubernetes/v1/horizontalpodautoscaler_pb2.pyi +377 -0
chalk/_gen/chalk/kubernetes/v1/horizontalpodautoscaler_pb2_grpc.py +4 -0
chalk/_gen/chalk/kubernetes/v1/horizontalpodautoscaler_pb2_grpc.pyi +4 -0
chalk/_gen/chalk/kubernetes/v1/scaledobject_pb2.py +43 -7
chalk/_gen/chalk/kubernetes/v1/scaledobject_pb2.pyi +252 -2
chalk/_gen/chalk/protosql/v1/sql_service_pb2.py +54 -27
chalk/_gen/chalk/protosql/v1/sql_service_pb2.pyi +131 -3
chalk/_gen/chalk/protosql/v1/sql_service_pb2_grpc.py +45 -0
chalk/_gen/chalk/protosql/v1/sql_service_pb2_grpc.pyi +14 -0
chalk/_gen/chalk/python/v1/types_pb2.py +14 -14
chalk/_gen/chalk/python/v1/types_pb2.pyi +8 -0
chalk/_gen/chalk/server/v1/benchmark_pb2.py +76 -0
chalk/_gen/chalk/server/v1/benchmark_pb2.pyi +156 -0
chalk/_gen/chalk/server/v1/benchmark_pb2_grpc.py +258 -0
chalk/_gen/chalk/server/v1/benchmark_pb2_grpc.pyi +84 -0
chalk/_gen/chalk/server/v1/billing_pb2.py +40 -38
chalk/_gen/chalk/server/v1/billing_pb2.pyi +17 -1
chalk/_gen/chalk/server/v1/branches_pb2.py +45 -0
chalk/_gen/chalk/server/v1/branches_pb2.pyi +80 -0
chalk/_gen/chalk/server/v1/branches_pb2_grpc.pyi +36 -0
chalk/_gen/chalk/server/v1/builder_pb2.py +358 -288
chalk/_gen/chalk/server/v1/builder_pb2.pyi +360 -10
chalk/_gen/chalk/server/v1/builder_pb2_grpc.py +225 -0
chalk/_gen/chalk/server/v1/builder_pb2_grpc.pyi +60 -0
chalk/_gen/chalk/server/v1/chart_pb2.py +10 -10
chalk/_gen/chalk/server/v1/chart_pb2.pyi +18 -2
chalk/_gen/chalk/server/v1/clickhouse_pb2.py +42 -0
chalk/_gen/chalk/server/v1/clickhouse_pb2.pyi +17 -0
chalk/_gen/chalk/server/v1/clickhouse_pb2_grpc.py +78 -0
chalk/_gen/chalk/server/v1/clickhouse_pb2_grpc.pyi +38 -0
chalk/_gen/chalk/server/v1/cloud_components_pb2.py +141 -119
chalk/_gen/chalk/server/v1/cloud_components_pb2.pyi +106 -4
chalk/_gen/chalk/server/v1/cloud_components_pb2_grpc.py +45 -0
chalk/_gen/chalk/server/v1/cloud_components_pb2_grpc.pyi +12 -0
chalk/_gen/chalk/server/v1/cloud_credentials_pb2.py +11 -3
chalk/_gen/chalk/server/v1/cloud_credentials_pb2.pyi +20 -0
chalk/_gen/chalk/server/v1/cloud_credentials_pb2_grpc.py +45 -0
chalk/_gen/chalk/server/v1/cloud_credentials_pb2_grpc.pyi +12 -0
chalk/_gen/chalk/server/v1/dataplanejobqueue_pb2.py +52 -38
chalk/_gen/chalk/server/v1/dataplanejobqueue_pb2.pyi +62 -1
chalk/_gen/chalk/server/v1/dataplanejobqueue_pb2_grpc.py +90 -0
chalk/_gen/chalk/server/v1/dataplanejobqueue_pb2_grpc.pyi +24 -0
chalk/_gen/chalk/server/v1/dataplaneworkflows_pb2.py +90 -0
chalk/_gen/chalk/server/v1/dataplaneworkflows_pb2.pyi +264 -0
chalk/_gen/chalk/server/v1/dataplaneworkflows_pb2_grpc.py +170 -0
chalk/_gen/chalk/server/v1/dataplaneworkflows_pb2_grpc.pyi +62 -0
chalk/_gen/chalk/server/v1/deploy_pb2.py +9 -3
chalk/_gen/chalk/server/v1/deploy_pb2.pyi +12 -0
chalk/_gen/chalk/server/v1/deploy_pb2_grpc.py +45 -0
chalk/_gen/chalk/server/v1/deploy_pb2_grpc.pyi +12 -0
chalk/_gen/chalk/server/v1/deployment_pb2.py +6 -6
chalk/_gen/chalk/server/v1/deployment_pb2.pyi +20 -0
chalk/_gen/chalk/server/v1/environment_pb2.py +14 -12
chalk/_gen/chalk/server/v1/environment_pb2.pyi +19 -0
chalk/_gen/chalk/server/v1/eventbus_pb2.py +4 -2
chalk/_gen/chalk/server/v1/files_pb2.py +65 -0
chalk/_gen/chalk/server/v1/files_pb2.pyi +167 -0
chalk/_gen/chalk/server/v1/files_pb2_grpc.py +4 -0
chalk/_gen/chalk/server/v1/files_pb2_grpc.pyi +4 -0
chalk/_gen/chalk/server/v1/graph_pb2.py +38 -26
chalk/_gen/chalk/server/v1/graph_pb2.pyi +58 -0
chalk/_gen/chalk/server/v1/graph_pb2_grpc.py +47 -0
chalk/_gen/chalk/server/v1/graph_pb2_grpc.pyi +18 -0
chalk/_gen/chalk/server/v1/incident_pb2.py +23 -21
chalk/_gen/chalk/server/v1/incident_pb2.pyi +15 -1
chalk/_gen/chalk/server/v1/indexing_job_pb2.py +44 -0
chalk/_gen/chalk/server/v1/indexing_job_pb2.pyi +38 -0
chalk/_gen/chalk/server/v1/indexing_job_pb2_grpc.py +78 -0
chalk/_gen/chalk/server/v1/indexing_job_pb2_grpc.pyi +38 -0
chalk/_gen/chalk/server/v1/integrations_pb2.py +11 -9
chalk/_gen/chalk/server/v1/integrations_pb2.pyi +34 -2
chalk/_gen/chalk/server/v1/kube_pb2.py +29 -19
chalk/_gen/chalk/server/v1/kube_pb2.pyi +28 -0
chalk/_gen/chalk/server/v1/kube_pb2_grpc.py +45 -0
chalk/_gen/chalk/server/v1/kube_pb2_grpc.pyi +12 -0
chalk/_gen/chalk/server/v1/log_pb2.py +21 -3
chalk/_gen/chalk/server/v1/log_pb2.pyi +68 -0
chalk/_gen/chalk/server/v1/log_pb2_grpc.py +90 -0
chalk/_gen/chalk/server/v1/log_pb2_grpc.pyi +24 -0
chalk/_gen/chalk/server/v1/model_registry_pb2.py +10 -10
chalk/_gen/chalk/server/v1/model_registry_pb2.pyi +4 -1
chalk/_gen/chalk/server/v1/plandebug_pb2.py +53 -0
chalk/_gen/chalk/server/v1/plandebug_pb2.pyi +86 -0
chalk/_gen/chalk/server/v1/plandebug_pb2_grpc.py +168 -0
chalk/_gen/chalk/server/v1/plandebug_pb2_grpc.pyi +60 -0
chalk/_gen/chalk/server/v1/queries_pb2.py +66 -66
chalk/_gen/chalk/server/v1/queries_pb2.pyi +32 -2
chalk/_gen/chalk/server/v1/scheduled_query_run_pb2.py +12 -12
chalk/_gen/chalk/server/v1/scheduled_query_run_pb2.pyi +16 -3
chalk/_gen/chalk/server/v1/scheduler_pb2.py +24 -12
chalk/_gen/chalk/server/v1/scheduler_pb2.pyi +61 -1
chalk/_gen/chalk/server/v1/scheduler_pb2_grpc.py +90 -0
chalk/_gen/chalk/server/v1/scheduler_pb2_grpc.pyi +24 -0
chalk/_gen/chalk/server/v1/script_tasks_pb2.py +15 -3
chalk/_gen/chalk/server/v1/script_tasks_pb2.pyi +22 -0
chalk/_gen/chalk/server/v1/script_tasks_pb2_grpc.py +90 -0
chalk/_gen/chalk/server/v1/script_tasks_pb2_grpc.pyi +24 -0
chalk/_gen/chalk/server/v1/sql_interface_pb2.py +75 -0
chalk/_gen/chalk/server/v1/sql_interface_pb2.pyi +142 -0
chalk/_gen/chalk/server/v1/sql_interface_pb2_grpc.py +349 -0
chalk/_gen/chalk/server/v1/sql_interface_pb2_grpc.pyi +114 -0
chalk/_gen/chalk/server/v1/sql_queries_pb2.py +48 -0
chalk/_gen/chalk/server/v1/sql_queries_pb2.pyi +150 -0
chalk/_gen/chalk/server/v1/sql_queries_pb2_grpc.py +123 -0
chalk/_gen/chalk/server/v1/sql_queries_pb2_grpc.pyi +52 -0
chalk/_gen/chalk/server/v1/team_pb2.py +154 -141
chalk/_gen/chalk/server/v1/team_pb2.pyi +30 -2
chalk/_gen/chalk/server/v1/team_pb2_grpc.py +45 -0
chalk/_gen/chalk/server/v1/team_pb2_grpc.pyi +12 -0
chalk/_gen/chalk/server/v1/topic_pb2.py +5 -3
chalk/_gen/chalk/server/v1/topic_pb2.pyi +10 -1
chalk/_gen/chalk/server/v1/trace_pb2.py +44 -40
chalk/_gen/chalk/server/v1/trace_pb2.pyi +20 -0
chalk/_gen/chalk/streaming/v1/debug_service_pb2.py +62 -0
chalk/_gen/chalk/streaming/v1/debug_service_pb2.pyi +75 -0
chalk/_gen/chalk/streaming/v1/debug_service_pb2_grpc.py +221 -0
chalk/_gen/chalk/streaming/v1/debug_service_pb2_grpc.pyi +88 -0
chalk/_gen/chalk/streaming/v1/simple_streaming_service_pb2.py +16 -10
chalk/_gen/chalk/streaming/v1/simple_streaming_service_pb2.pyi +52 -1
chalk/_gen/chalk/streaming/v1/simple_streaming_service_pb2_grpc.py +48 -0
chalk/_gen/chalk/streaming/v1/simple_streaming_service_pb2_grpc.pyi +20 -0
chalk/_gen/chalk/utils/v1/field_change_pb2.py +32 -0
chalk/_gen/chalk/utils/v1/field_change_pb2.pyi +42 -0
chalk/_gen/chalk/utils/v1/field_change_pb2_grpc.py +4 -0
chalk/_gen/chalk/utils/v1/field_change_pb2_grpc.pyi +4 -0
chalk/_lsp/error_builder.py +11 -0
chalk/_version.py +1 -1
chalk/client/client.py +128 -43
chalk/client/client_async.py +149 -0
chalk/client/client_async_impl.py +22 -0
chalk/client/client_grpc.py +539 -104
chalk/client/client_impl.py +449 -122
chalk/client/dataset.py +7 -1
chalk/client/models.py +98 -0
chalk/client/serialization/model_serialization.py +92 -9
chalk/df/LazyFramePlaceholder.py +1154 -0
chalk/features/_class_property.py +7 -0
chalk/features/_embedding/embedding.py +1 -0
chalk/features/_encoding/converter.py +83 -2
chalk/features/feature_field.py +40 -30
chalk/features/feature_set_decorator.py +1 -0
chalk/features/feature_wrapper.py +42 -3
chalk/features/hooks.py +81 -10
chalk/features/inference.py +33 -31
chalk/features/resolver.py +224 -24
chalk/functions/__init__.py +65 -3
chalk/gitignore/gitignore_parser.py +5 -1
chalk/importer.py +142 -68
chalk/ml/__init__.py +2 -0
chalk/ml/model_hooks.py +194 -26
chalk/ml/model_reference.py +56 -8
chalk/ml/model_version.py +24 -15
chalk/ml/utils.py +20 -17
chalk/operators/_utils.py +10 -3
chalk/parsed/_proto/export.py +22 -0
chalk/parsed/duplicate_input_gql.py +3 -0
chalk/parsed/json_conversions.py +20 -14
chalk/parsed/to_proto.py +16 -4
chalk/parsed/user_types_to_json.py +31 -10
chalk/parsed/validation_from_registries.py +182 -0
chalk/queries/named_query.py +16 -6
chalk/queries/scheduled_query.py +9 -1
chalk/serialization/parsed_annotation.py +24 -11
chalk/sql/__init__.py +18 -0
chalk/sql/_internal/integrations/databricks.py +55 -17
chalk/sql/_internal/integrations/mssql.py +127 -62
chalk/sql/_internal/integrations/redshift.py +4 -0
chalk/sql/_internal/sql_file_resolver.py +53 -9
chalk/sql/_internal/sql_source.py +35 -2
chalk/streams/_kafka_source.py +5 -1
chalk/streams/_windows.py +15 -2
chalk/utils/_otel_version.py +13 -0
chalk/utils/async_helpers.py +2 -2
chalk/utils/missing_dependency.py +5 -4
chalk/utils/tracing.py +185 -95
{chalkpy-2.90.1.dist-info → chalkpy-2.95.3.dist-info}/METADATA +4 -6
{chalkpy-2.90.1.dist-info → chalkpy-2.95.3.dist-info}/RECORD +202 -146
{chalkpy-2.90.1.dist-info → chalkpy-2.95.3.dist-info}/WHEEL +0 -0
{chalkpy-2.90.1.dist-info → chalkpy-2.95.3.dist-info}/entry_points.txt +0 -0
{chalkpy-2.90.1.dist-info → chalkpy-2.95.3.dist-info}/top_level.txt +0 -0

chalk/client/client_impl.py CHANGED Viewed

@@ -99,10 +99,12 @@ from chalk.client.models import (
     GetRegisteredModelResponse,
     GetRegisteredModelVersionResponse,
     IngestDatasetRequest,
+    ManualTriggerScheduledQueryResponse,
     MultiUploadFeaturesRequest,
     MultiUploadFeaturesResponse,
     OfflineQueryContext,
     OfflineQueryInput,
+    OfflineQueryInputSql,
     OfflineQueryInputUri,
     OfflineQueryParquetUploadURLResponse,
     OnlineQuery,
@@ -124,6 +126,7 @@ from chalk.client.models import (
     ResolverReplayResponse,
     ResolverRunResponse,
     ResourceRequests,
+    ScheduledQueryRun,
     SetDatasetRevisionMetadataRequest,
     SetDatasetRevisionMetadataResponse,
     SetIncrementalProgressRequest,
@@ -173,7 +176,7 @@ from chalk.utils.log_with_context import get_logger
 from chalk.utils.missing_dependency import missing_dependency_exception
 from chalk.utils.notebook import parse_notebook_into_script
 from chalk.utils.string import s
-from chalk.utils.tracing import add_trace_headers
+from chalk.utils.tracing import add_trace_headers, safe_trace
 if TYPE_CHECKING:
     import ssl
@@ -743,6 +746,8 @@ class OnlineQueryResponseImpl(OnlineQueryResult):
         self.warnings = warnings
         self.meta = meta
+        print(self.data)
         for d in self.data:
             if d.value is not None:
                 try:
@@ -1872,78 +1877,82 @@ https://docs.chalk.ai/cli/apply
         trace: bool = False,
         value_metrics_tag_by_features: Sequence[FeatureReference] = (),
     ) -> OnlineQueryResponseImpl:
-        encoded_inputs, all_warnings = recursive_encode_inputs(input)
-        encoded_outputs = encode_outputs(output)
-        outputs = encoded_outputs.string_outputs
-        encoded_value_metrics_tag_by_features = encode_outputs(value_metrics_tag_by_features).string_outputs
-        if branch is ...:
-            branch = self._branch
-        now_str = None
-        if now is not None:
-            if now.tzinfo is None:
-                now = now.astimezone(tz=timezone.utc)
-            now_str = now.isoformat()
-        staleness_encoded = {}
-        if staleness is not None:
-            for k, v in staleness.items():
-                if isinstance(k, str):
-                    # It's a feature set
-                    staleness_encoded[k] = v
-                elif is_feature_set_class(k):
-                    staleness_encoded[k.namespace] = v
-                else:
-                    staleness_encoded[ensure_feature(k).root_fqn] = v
-        request = OnlineQueryRequest(
-            inputs=encoded_inputs,
-            outputs=outputs,
-            expression_outputs=encoded_outputs.feature_expressions_base64,
-            now=now_str,
-            staleness=staleness_encoded,
-            context=OnlineQueryContext(
-                environment=environment,
-                tags=tags,
-                required_resolver_tags=required_resolver_tags,
-            ),
-            deployment_id=preview_deployment_id,
-            branch_id=branch,
-            correlation_id=correlation_id,
-            query_name=query_name,
-            query_name_version=query_name_version,
-            meta=meta,
-            explain=explain,
-            include_meta=bool(include_meta or explain),
-            store_plan_stages=store_plan_stages,
-            encoding_options=encoding_options or FeatureEncodingOptions(),
-            planner_options=planner_options,
-            value_metrics_tag_by_features=tuple(encoded_value_metrics_tag_by_features),
-            query_context=_validate_context_dict(query_context),
-            overlay_graph=_get_overlay_graph_b64(),
-        )
+        with safe_trace("query"):
+            if branch is ...:
+                branch = self._branch
+            extra_headers = {"X-Chalk-Deployment-Type": "branch" if branch else "engine"}
+            if query_name is not None:
+                extra_headers["X-Chalk-Query-Name"] = query_name
+            if trace:
+                extra_headers = add_trace_headers(extra_headers)
+            if headers:
+                extra_headers.update(headers)
+            encoded_inputs, all_warnings = recursive_encode_inputs(input)
+            encoded_outputs = encode_outputs(output)
+            outputs = encoded_outputs.string_outputs
+            encoded_value_metrics_tag_by_features = encode_outputs(value_metrics_tag_by_features).string_outputs
+            now_str = None
+            if now is not None:
+                if now.tzinfo is None:
+                    now = now.astimezone(tz=timezone.utc)
+                now_str = now.isoformat()
+            staleness_encoded = {}
+            if staleness is not None:
+                for k, v in staleness.items():
+                    if isinstance(k, str):
+                        # It's a feature set
+                        staleness_encoded[k] = v
+                    elif is_feature_set_class(k):
+                        staleness_encoded[k.namespace] = v
+                    else:
+                        staleness_encoded[ensure_feature(k).root_fqn] = v
-        extra_headers = {"X-Chalk-Deployment-Type": "branch" if branch else "engine"}
-        if query_name is not None:
-            extra_headers["X-Chalk-Query-Name"] = query_name
-        if trace:
-            extra_headers = add_trace_headers(extra_headers)
-        if headers:
-            extra_headers.update(headers)
+            request = OnlineQueryRequest(
+                inputs=encoded_inputs,
+                outputs=outputs,
+                expression_outputs=encoded_outputs.feature_expressions_base64,
+                now=now_str,
+                staleness=staleness_encoded,
+                context=OnlineQueryContext(
+                    environment=environment,
+                    tags=tags,
+                    required_resolver_tags=required_resolver_tags,
+                ),
+                deployment_id=preview_deployment_id,
+                branch_id=branch,
+                correlation_id=correlation_id,
+                query_name=query_name,
+                query_name_version=query_name_version,
+                meta=meta,
+                explain=explain,
+                include_meta=bool(include_meta or explain),
+                store_plan_stages=store_plan_stages,
+                encoding_options=encoding_options or FeatureEncodingOptions(),
+                planner_options=planner_options,
+                value_metrics_tag_by_features=tuple(encoded_value_metrics_tag_by_features),
+                query_context=_validate_context_dict(query_context),
+                overlay_graph=_get_overlay_graph_b64(),
+            )
-        resp = self._request(
-            method="POST",
-            uri="/v1/query/online",
-            json=request,
-            response=OnlineQueryResponse,
-            environment_override=environment,
-            preview_deployment_id=preview_deployment_id,
-            branch=branch,
-            metadata_request=False,
-            extra_headers=extra_headers,
-            timeout=request_timeout,
-            connect_timeout=connect_timeout,
-        )
-        return OnlineQueryResponseImpl(data=resp.data, errors=resp.errors or [], warnings=all_warnings, meta=resp.meta)
+            resp = self._request(
+                method="POST",
+                uri="/v1/query/online",
+                json=request,
+                response=OnlineQueryResponse,
+                environment_override=environment,
+                preview_deployment_id=preview_deployment_id,
+                branch=branch,
+                metadata_request=False,
+                extra_headers=extra_headers,
+                timeout=request_timeout,
+                connect_timeout=connect_timeout,
+            )
+            return OnlineQueryResponseImpl(
+                data=resp.data, errors=resp.errors or [], warnings=all_warnings, meta=resp.meta
+            )
     def multi_query(
         self,
@@ -1959,13 +1968,15 @@ https://docs.chalk.ai/cli/apply
         use_feather: Optional[bool] = True,  # deprecated
         compression: Optional[str] = "uncompressed",
     ) -> BulkOnlineQueryResponse:
+        if branch is ...:
+            branch = self._branch
         extra_headers = {"X-Chalk-Deployment-Type": "branch" if branch else "engine"}
         if query_name is not None:
             extra_headers["X-Chalk-Query-Name"] = query_name
         buffer = BytesIO()
         buffer.write(MULTI_QUERY_MAGIC_STR)
-        if branch is ...:
-            branch = self._branch
         for query in queries:
             tags = query.tags
             encoded_inputs = {str(k): v for k, v in query.input.items()}
@@ -2068,13 +2079,13 @@ https://docs.chalk.ai/cli/apply
         headers: Mapping[str, str] | None = None,
         value_metrics_tag_by_features: Sequence[FeatureReference] = (),
     ) -> BulkOnlineQueryResponse:
+        if branch is ...:
+            branch = self._branch
         extra_headers = {"X-Chalk-Deployment-Type": "branch" if branch else "engine"}
         if query_name is not None:
             extra_headers["X-Chalk-Query-Name"] = query_name
         if headers:
             extra_headers.update(headers)
-        if branch is ...:
-            branch = self._branch
         now_str = None
         if now is not None:
@@ -2230,6 +2241,8 @@ https://docs.chalk.ai/cli/apply
         override_target_image_tag: Optional[str] = None,
         feature_for_lower_upper_bound: Optional[FeatureReference] = None,
         use_job_queue: bool = False,
+        *,
+        input_sql: str | None = None,
     ) -> DatasetImpl:
         run_asynchronously = (
             use_multiple_computers
@@ -2252,11 +2265,6 @@ https://docs.chalk.ai/cli/apply
         if query_name is None and query_name_version is not None:
             raise ValueError("Passed 'query_name_version' without 'query_name'.")
-        if max_samples is not None and input is not None:
-            raise ValueError(
-                "Cannot specify both 'max_samples' and 'input'. 'max_samples' is only valid when input is None."
-            )
         if isinstance(num_shards, int) and num_shards < 1:
             raise ValueError("num_shards must be greater than 0")
         if isinstance(num_workers, int) and num_workers < 1:
@@ -2277,48 +2285,70 @@ https://docs.chalk.ai/cli/apply
         context = OfflineQueryContext(environment=environment)
-        if input is None:
-            query_input = None
-        elif isinstance(input, OfflineQueryInputUri):
-            query_input = input
-        elif isinstance(input, str):
-            query_input = OfflineQueryInputUri(
-                parquet_uri=input,
-                start_row=None,
-                end_row=None,
-            )
-        else:
-            # by this point, should be
-            # Union[QueryInput, List[QueryInput], Tuple[QueryInput, ...]]
-            if isinstance(input, (list, tuple)):
-                input_times_tuple: Sequence[QueryInputTime] = (
-                    [None] * len(input)
-                    if input_times is None
-                    else [input_times for _ in input]
-                    if isinstance(input_times, datetime)
-                    else input_times
+        _check_exclusive_options(
+            {
+                "input": input,
+                "input_sql": input_sql,
+                "max_samples": max_samples,
+            }
+        )
+        if input_sql is not None:
+            if input_times is not None:
+                raise ValueError(
+                    f"Cannot specify `input_sql` and `input_times` together. Instead, the ChalkSQL query may output a `{TS_COL_NAME}` column"
                 )
-                run_asynchronously = True
-                multi_input = list(zip(input, input_times_tuple))
-            else:
-                # Just a QueryInput
-                multi_input = [(input, cast(None, input_times))]
+            if num_shards is not None:
+                raise ValueError("Cannot specify `input_sql` and `num_shards` together.")
+            if num_workers is not None:
+                raise ValueError("Cannot specify `input_sql` and `num_workers` together.")
-            # defaulting to uploading input as table if inputs are large
-            if upload_input_as_table or _offline_query_inputs_should_be_uploaded(input) or num_shards:
-                with ThreadPoolExecutor(thread_name_prefix="offline_query_upload_input") as upload_input_executor:
-                    query_input = self._upload_offline_query_input(
-                        multi_input,
-                        context=context,
-                        branch=branch,
-                        executor=upload_input_executor,
-                        num_shards=num_shards,
-                    )
-            elif run_asynchronously:
-                query_input = tuple(_to_offline_query_input(x, t) for x, t in multi_input)
+        # Set query_input
+        if input is not None:
+            # Set query_input from input
+            if isinstance(input, OfflineQueryInputUri):
+                query_input = input
+            elif isinstance(input, str):
+                query_input = OfflineQueryInputUri(
+                    parquet_uri=input,
+                    start_row=None,
+                    end_row=None,
+                )
             else:
-                assert len(multi_input) == 1, "We should default to running asynchronously if inputs is partitioned"
-                query_input = _to_offline_query_input(*multi_input[0])
+                # by this point, should be
+                # Union[QueryInput, List[QueryInput], Tuple[QueryInput, ...]]
+                if isinstance(input, (list, tuple)):
+                    input_times_tuple: Sequence[QueryInputTime] = (
+                        [None] * len(input)
+                        if input_times is None
+                        else [input_times for _ in input]
+                        if isinstance(input_times, datetime)
+                        else input_times
+                    )
+                    run_asynchronously = True
+                    multi_input = list(zip(input, input_times_tuple))
+                else:
+                    # Just a QueryInput
+                    multi_input = [(input, cast(None, input_times))]
+                # defaulting to uploading input as table if inputs are large
+                if upload_input_as_table or _offline_query_inputs_should_be_uploaded(input) or num_shards:
+                    with ThreadPoolExecutor(thread_name_prefix="offline_query_upload_input") as upload_input_executor:
+                        query_input = self._upload_offline_query_input(
+                            multi_input,
+                            context=context,
+                            branch=branch,
+                            executor=upload_input_executor,
+                            num_shards=num_shards,
+                        )
+                elif run_asynchronously:
+                    query_input = tuple(_to_offline_query_input(x, t) for x, t in multi_input)
+                else:
+                    assert len(multi_input) == 1, "We should default to running asynchronously if inputs is partitioned"
+                    query_input = _to_offline_query_input(*multi_input[0])
+        elif input_sql is not None:
+            query_input = OfflineQueryInputSql(input_sql=input_sql)
+        else:
+            query_input = None
         response = self._create_dataset_job(
             optional_output=optional_output_root_fqns,
@@ -2349,9 +2379,9 @@ https://docs.chalk.ai/cli/apply
             override_target_image_tag=override_target_image_tag,
             num_shards=num_shards,
             num_workers=num_workers,
-            feature_for_lower_upper_bound=str(feature_for_lower_upper_bound)
-            if feature_for_lower_upper_bound is not None
-            else None,
+            feature_for_lower_upper_bound=(
+                str(feature_for_lower_upper_bound) if feature_for_lower_upper_bound is not None else None
+            ),
             completion_deadline=completion_deadline,
             max_retries=max_retries,
             optional_output_expressions=optional_output_expressions,
@@ -2381,6 +2411,111 @@ https://docs.chalk.ai/cli/apply
         initialized_dataset.is_finished = True
         return initialized_dataset
+    def run_scheduled_query(
+        self,
+        name: str,
+        planner_options: Optional[Mapping[str, Any]] = None,
+        incremental_resolvers: Optional[Sequence[str]] = None,
+        max_samples: Optional[int] = None,
+        env_overrides: Optional[Mapping[str, str]] = None,
+    ) -> ManualTriggerScheduledQueryResponse:
+        """
+        Manually trigger a scheduled query request.
+        Parameters
+        ----------
+        name
+            The name of the scheduled query to be triggered.
+        incremental_resolvers
+            If set to None, Chalk will incrementalize resolvers in the query's root namespaces.
+            If set to a list of resolvers, this set will be used for incrementalization.
+            Incremental resolvers must return a feature time in its output, and must return a `DataFrame`.
+            Most commonly, this will be the name of a SQL file resolver. Chalk will ingest all new data
+            from these resolvers and propagate changes to values in the root namespace.
+        max_samples
+            The maximum number of samples to compute.
+        env_overrides:
+            A dictionary of environment values to override during this specific triggered query.
+        Other Parameters
+        ----------------
+        planner_options
+            A dictionary of options to pass to the planner.
+            These are typically provided by Chalk Support for specific use cases.
+        Returns
+        -------
+        ManualTriggerScheduledQueryResponse
+            A response message containing metadata around the triggered run.
+        Examples
+        --------
+        >>> from chalk.client.client_grpc import ChalkGRPCClient
+        >>> ChalkGRPCClient().run_scheduled_query(
+        ...     name="my_scheduled_query",
+        ... )
+        """
+        from chalk.client.client_grpc import ChalkGRPCClient
+        client_grpc = ChalkGRPCClient(
+            client_id=self._client_id,
+            client_secret=self._client_secret,
+            environment=self._primary_environment,
+            api_server=self._api_server,
+        )
+        resp = client_grpc.run_scheduled_query(
+            name=name,
+            planner_options=planner_options,
+            incremental_resolvers=incremental_resolvers,
+            max_samples=max_samples,
+            env_overrides=env_overrides,
+        )
+        return resp
+    def get_scheduled_query_run_history(
+        self,
+        name: str,
+        limit: int = 10,
+    ) -> List[ScheduledQueryRun]:
+        """
+        Get the run history for a scheduled query.
+        Parameters
+        ----------
+        name
+            The name of the scheduled query.
+        limit
+            The maximum number of runs to return. Defaults to 10.
+        Returns
+        -------
+        list[ScheduledQueryRun]
+            A response message containing the list of scheduled query runs.
+        Examples
+        --------
+        >>> from chalk.client import ChalkClient
+        >>> ChalkClient().get_scheduled_query_run_history(
+        ...     name="my_scheduled_query",
+        ...     limit=20,
+        ... )
+        """
+        from chalk.client.client_grpc import ChalkGRPCClient
+        client_grpc = ChalkGRPCClient(
+            client_id=self._client_id,
+            client_secret=self._client_secret,
+            environment=self._primary_environment,
+            api_server=self._api_server,
+        )
+        return client_grpc.get_scheduled_query_run_history(
+            name=name,
+            limit=limit,
+        )
     def prompt_evaluation(
         self,
         prompts: list[Prompt | str],
@@ -3442,6 +3577,7 @@ https://docs.chalk.ai/cli/apply
             Optional[OfflineQueryInput],
             UploadedParquetShardedOfflineQueryInput,
             OfflineQueryInputUri,
+            OfflineQueryInputSql,
         ],
         max_samples: Optional[int],
         dataset_name: Optional[str],
@@ -4355,6 +4491,187 @@ https://docs.chalk.ai/cli/apply
         )
         return resp
+    def _run_serialized_query(
+        self,
+        serialized_plan_bytes: bytes,
+        input: Union[Mapping[FeatureReference, Sequence[Any]], pa.Table],
+        output: Sequence[FeatureReference] = (),
+        staleness: Optional[Mapping[FeatureReference, str]] = None,
+        context: Optional[OnlineQueryContext] = None,
+        query_name: Optional[str] = None,
+        query_name_version: Optional[str] = None,
+        correlation_id: Optional[str] = None,
+        include_meta: bool = False,
+        explain: bool = False,
+        store_plan_stages: bool = False,
+        meta: Optional[Mapping[str, str]] = None,
+        headers: Mapping[str, str] | None = None,
+    ) -> BulkOnlineQueryResult:
+        """Run a query using a pre-serialized plan.
+        This is a protected method for internal use and testing.
+        Parameters
+        ----------
+        serialized_plan_bytes
+            The serialized BatchPlan protobuf bytes
+        input
+            The input data, either as a mapping of features to values or as a PyArrow table
+        output
+            The output features to compute
+        staleness
+            Maximum staleness overrides for features
+        context
+            Query context including environment and tags
+        query_name
+            The name of the query
+        query_name_version
+            The version of the query
+        correlation_id
+            Correlation ID for logging
+        include_meta
+            Whether to include metadata in the response
+        explain
+            Whether to include explain output
+        store_plan_stages
+            Whether to store plan stages
+        meta
+            Customer metadata tags
+        headers
+            Additional headers to provide with the request
+        Returns
+        -------
+        OnlineQueryResult
+            The query result
+        """
+        try:
+            import pyarrow as pa
+            import pyarrow.feather as feather
+        except ImportError:
+            raise missing_dependency_exception("chalkpy[runtime]")
+        # Convert input to PyArrow table if needed
+        if isinstance(input, Mapping):
+            # Convert mapping to PyArrow table
+            table_dict = {}
+            for feat_ref, values in input.items():
+                feat_name = str(feat_ref)
+                # Ensure values is a list
+                if not isinstance(values, list):
+                    values = [values]
+                table_dict[feat_name] = values
+            input_table = pa.Table.from_pydict(table_dict)
+        else:
+            input_table = input
+        # Encode outputs
+        outputs_encoded = encode_outputs(output).string_outputs if output else []
+        # Encode staleness
+        staleness_encoded = {}
+        if staleness is not None:
+            for k, v in staleness.items():
+                if is_feature_set_class(k):
+                    for f in k.features:
+                        staleness_encoded[f.root_fqn] = v
+                else:
+                    staleness_encoded[ensure_feature(k).root_fqn] = v
+        # Create FeatherRequestHeader
+        from chalk.client.models import OnlineQueryContext as OQC
+        header_dict = {
+            "outputs": outputs_encoded,
+            "expression_outputs": [],
+            "staleness": staleness_encoded if staleness_encoded else None,
+            "context": (context or OQC()).dict(),
+            "include_meta": include_meta,
+            "explain": explain,
+            "correlation_id": correlation_id,
+            "query_name": query_name,
+            "query_name_version": query_name_version,
+            "meta": meta,
+            "store_plan_stages": store_plan_stages,
+        }
+        header_json = json.dumps(header_dict).encode("utf-8")
+        # Serialize the input table to feather format
+        feather_buffer = BytesIO()
+        feather.write_feather(input_table, feather_buffer)
+        feather_bytes = feather_buffer.getvalue()
+        # Build the request body:
+        # 1. First 8 bytes: int64 (big-endian) - length of serialized plan
+        # 2. Next N bytes: serialized BatchPlan protobuf
+        # 3. Next 8 bytes: int64 (big-endian) - length of header JSON
+        # 4. Next M bytes: UTF-8 encoded JSON header (FeatherRequestHeader)
+        # 5. Next 8 bytes: int64 (big-endian) - length of feather data
+        # 6. Remaining bytes: feather-encoded input data
+        request_body = BytesIO()
+        request_body.write(len(serialized_plan_bytes).to_bytes(8, byteorder="big"))
+        request_body.write(serialized_plan_bytes)
+        request_body.write(len(header_json).to_bytes(8, byteorder="big"))
+        request_body.write(header_json)
+        request_body.write(len(feather_bytes).to_bytes(8, byteorder="big"))
+        request_body.write(feather_bytes)
+        # Make the HTTP request
+        response = self._request(
+            method="POST",
+            uri="/v1/query/run",
+            response=None,  # We'll handle the response manually
+            json=None,
+            data=request_body.getvalue(),
+            environment_override=None,
+            preview_deployment_id=None,
+            branch=None,
+            metadata_request=False,
+            extra_headers=headers,
+        )
+        if not isinstance(response, requests.Response):  # pyright: ignore[reportUnnecessaryIsInstance]
+            raise TypeError("Expected requests.Response")
+        if response.status_code != 200:
+            raise RuntimeError(f"Request failed with status {response.status_code}: {response.text}")
+        # Deserialize the response
+        result = OnlineQueryResultFeather.deserialize(response.content)
+        # Convert feather bytes back to a dataframe
+        scalars_df = None
+        if result.scalar_data:
+            scalars_table = feather.read_table(BytesIO(result.scalar_data))
+            scalars_df = pa_table_to_pl_df(scalars_table)
+        # Parse errors from JSON strings back to ChalkError objects
+        errors = []
+        if result.errors:
+            for error_json in result.errors:
+                try:
+                    error_dict = json.loads(error_json)
+                    errors.append(ChalkError(**error_dict))
+                except Exception:
+                    # If parsing fails, create a generic error
+                    errors.append(ChalkError.create(code=ErrorCode.PARSE_FAILED, message=str(error_json)))
+        # Parse meta if present
+        query_meta = None
+        if result.meta:
+            try:
+                query_meta = QueryMeta(**json.loads(result.meta))
+            except Exception:
+                pass
+        # Return as BulkOnlineQueryResult
+        return BulkOnlineQueryResult(
+            scalars_df=scalars_df,
+            groups_dfs=None,
+            errors=errors if errors else None,
+            meta=query_meta,
+        )
     def _to_value(self, x: FeatureResult):
         f: Feature = Feature.from_root_fqn(x.field)
@@ -4942,6 +5259,7 @@ https://docs.chalk.ai/cli/apply
         name: str,
         model_artifact_id: Optional[str] = None,
         run_id: Optional[str] = None,
+        run_name: Optional[str] = None,
         criterion: Optional[ModelRunCriterion] = None,
         aliases: Optional[List[str]] = None,
     ) -> RegisterModelVersionResponse:
@@ -4958,6 +5276,7 @@ https://docs.chalk.ai/cli/apply
             name=name,
             model_artifact_id=model_artifact_id,
             run_id=run_id,
+            run_name=run_name,
             criterion=criterion,
             aliases=aliases,
         )
@@ -5021,3 +5340,11 @@ https://docs.chalk.ai/cli/apply
         client_grpc.follow_model_training_job(operation_id=task_response.task_id)
         return CreateModelTrainingJobResponse(success=True)
+def _check_exclusive_options(options: dict[str, Any | None]):
+    filled_options = {k: v for k, v in options.items() if v is not None}
+    if len(filled_options) > 1:
+        raise ValueError(
+            f"Only one of the options: {', '.join(filled_options.keys())} can be specified (they are mutually exclusive options)."
+        )

chalkpy 2.90.1__py3-none-any.whl → 2.95.3__py3-none-any.whl

chalkpy 2.90.1py3-none-any.whl → 2.95.3py3-none-any.whl