npm - @octomil/browser - Versions diffs - 1.0.0 → 1.1.0 - Mend

@octomil/browser 1.0.0 → 1.1.0

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (415) hide show

package/README.md +168 -36
package/dist/_generated/accelerator_type.d.ts +8 -0
package/dist/_generated/accelerator_type.d.ts.map +1 -0
package/dist/_generated/accelerator_type.js +10 -0
package/dist/_generated/accelerator_type.js.map +1 -0
package/dist/_generated/activation_policy.d.ts +7 -0
package/dist/_generated/activation_policy.d.ts.map +1 -0
package/dist/_generated/activation_policy.js +9 -0
package/dist/_generated/activation_policy.js.map +1 -0
package/dist/_generated/adapter_activation_state.d.ts +13 -0
package/dist/_generated/adapter_activation_state.d.ts.map +1 -0
package/dist/_generated/adapter_activation_state.js +15 -0
package/dist/_generated/adapter_activation_state.js.map +1 -0
package/dist/_generated/artifact_format.d.ts +11 -0
package/dist/_generated/artifact_format.d.ts.map +1 -0
package/dist/_generated/artifact_format.js +13 -0
package/dist/_generated/artifact_format.js.map +1 -0
package/dist/_generated/artifact_resource_kind.d.ts +16 -0
package/dist/_generated/artifact_resource_kind.d.ts.map +1 -0
package/dist/_generated/artifact_resource_kind.js +18 -0
package/dist/_generated/artifact_resource_kind.js.map +1 -0
package/dist/_generated/artifact_status.d.ts +21 -0
package/dist/_generated/artifact_status.d.ts.map +1 -0
package/dist/_generated/artifact_status.js +23 -0
package/dist/_generated/artifact_status.js.map +1 -0
package/dist/_generated/auth_method.d.ts +10 -0
package/dist/_generated/auth_method.d.ts.map +1 -0
package/dist/_generated/auth_method.js +12 -0
package/dist/_generated/auth_method.js.map +1 -0
package/dist/_generated/auth_type.d.ts +7 -0
package/dist/_generated/auth_type.d.ts.map +1 -0
package/dist/_generated/auth_type.js +9 -0
package/dist/_generated/auth_type.js.map +1 -0
package/dist/_generated/billing_interval.d.ts +5 -0
package/dist/_generated/billing_interval.d.ts.map +1 -0
package/dist/_generated/billing_interval.js +7 -0
package/dist/_generated/billing_interval.js.map +1 -0
package/dist/_generated/billing_plan.d.ts +47 -0
package/dist/_generated/billing_plan.d.ts.map +1 -0
package/dist/_generated/billing_plan.js +41 -0
package/dist/_generated/billing_plan.js.map +1 -0
package/dist/_generated/cloud_provider.d.ts +12 -0
package/dist/_generated/cloud_provider.d.ts.map +1 -0
package/dist/_generated/cloud_provider.js +14 -0
package/dist/_generated/cloud_provider.js.map +1 -0
package/dist/_generated/compatibility_level.d.ts +7 -0
package/dist/_generated/compatibility_level.d.ts.map +1 -0
package/dist/_generated/compatibility_level.js +9 -0
package/dist/_generated/compatibility_level.js.map +1 -0
package/dist/_generated/content_part_type.d.ts +7 -0
package/dist/_generated/content_part_type.d.ts.map +1 -0
package/dist/_generated/content_part_type.js +9 -0
package/dist/_generated/content_part_type.js.map +1 -0
package/dist/_generated/delivery_mode.d.ts +6 -0
package/dist/_generated/delivery_mode.d.ts.map +1 -0
package/dist/_generated/delivery_mode.js +8 -0
package/dist/_generated/delivery_mode.js.map +1 -0
package/dist/_generated/device_class.d.ts +7 -0
package/dist/_generated/device_class.d.ts.map +1 -0
package/dist/_generated/device_class.js +9 -0
package/dist/_generated/device_class.js.map +1 -0
package/dist/_generated/device_connectivity_status.d.ts +8 -0
package/dist/_generated/device_connectivity_status.d.ts.map +1 -0
package/dist/_generated/device_connectivity_status.js +10 -0
package/dist/_generated/device_connectivity_status.js.map +1 -0
package/dist/_generated/device_model_status.d.ts +14 -0
package/dist/_generated/device_model_status.d.ts.map +1 -0
package/dist/_generated/device_model_status.js +16 -0
package/dist/_generated/device_model_status.js.map +1 -0
package/dist/_generated/device_platform.d.ts +9 -0
package/dist/_generated/device_platform.d.ts.map +1 -0
package/dist/_generated/device_platform.js +11 -0
package/dist/_generated/device_platform.js.map +1 -0
package/dist/_generated/email_provider.d.ts +8 -0
package/dist/_generated/email_provider.d.ts.map +1 -0
package/dist/_generated/email_provider.js +10 -0
package/dist/_generated/email_provider.js.map +1 -0
package/dist/_generated/email_template.d.ts +11 -0
package/dist/_generated/email_template.d.ts.map +1 -0
package/dist/_generated/email_template.js +13 -0
package/dist/_generated/email_template.js.map +1 -0
package/dist/_generated/error_code.d.ts +52 -0
package/dist/_generated/error_code.d.ts.map +1 -0
package/dist/_generated/error_code.js +85 -0
package/dist/_generated/error_code.js.map +1 -0
package/dist/_generated/federated_participation_state.d.ts +25 -0
package/dist/_generated/federated_participation_state.d.ts.map +1 -0
package/dist/_generated/federated_participation_state.js +27 -0
package/dist/_generated/federated_participation_state.js.map +1 -0
package/dist/_generated/federated_round_state.d.ts +17 -0
package/dist/_generated/federated_round_state.d.ts.map +1 -0
package/dist/_generated/federated_round_state.js +19 -0
package/dist/_generated/federated_round_state.js.map +1 -0
package/dist/_generated/finish_reason.d.ts +7 -0
package/dist/_generated/finish_reason.d.ts.map +1 -0
package/dist/_generated/finish_reason.js +9 -0
package/dist/_generated/finish_reason.js.map +1 -0
package/dist/_generated/index.d.ts +17 -0
package/dist/_generated/index.d.ts.map +1 -0
package/dist/_generated/index.js +17 -0
package/dist/_generated/index.js.map +1 -0
package/dist/_generated/input_modality.d.ts +7 -0
package/dist/_generated/input_modality.d.ts.map +1 -0
package/dist/_generated/input_modality.js +9 -0
package/dist/_generated/input_modality.js.map +1 -0
package/dist/_generated/message_role.d.ts +7 -0
package/dist/_generated/message_role.d.ts.map +1 -0
package/dist/_generated/message_role.js +9 -0
package/dist/_generated/message_role.js.map +1 -0
package/dist/_generated/metric_views.d.ts +18 -0
package/dist/_generated/metric_views.d.ts.map +1 -0
package/dist/_generated/metric_views.js +22 -0
package/dist/_generated/metric_views.js.map +1 -0
package/dist/_generated/modality.d.ts +7 -0
package/dist/_generated/modality.d.ts.map +1 -0
package/dist/_generated/modality.js +9 -0
package/dist/_generated/modality.js.map +1 -0
package/dist/_generated/model_capability.d.ts +10 -0
package/dist/_generated/model_capability.d.ts.map +1 -0
package/dist/_generated/model_capability.js +12 -0
package/dist/_generated/model_capability.js.map +1 -0
package/dist/_generated/model_feature.d.ts +7 -0
package/dist/_generated/model_feature.d.ts.map +1 -0
package/dist/_generated/model_feature.js +9 -0
package/dist/_generated/model_feature.js.map +1 -0
package/dist/_generated/model_lifecycle.d.ts +7 -0
package/dist/_generated/model_lifecycle.d.ts.map +1 -0
package/dist/_generated/model_lifecycle.js +9 -0
package/dist/_generated/model_lifecycle.js.map +1 -0
package/dist/_generated/model_source_format.d.ts +9 -0
package/dist/_generated/model_source_format.d.ts.map +1 -0
package/dist/_generated/model_source_format.js +11 -0
package/dist/_generated/model_source_format.js.map +1 -0
package/dist/_generated/model_status.d.ts +7 -0
package/dist/_generated/model_status.d.ts.map +1 -0
package/dist/_generated/model_status.js +9 -0
package/dist/_generated/model_status.js.map +1 -0
package/dist/_generated/network_type.d.ts +7 -0
package/dist/_generated/network_type.d.ts.map +1 -0
package/dist/_generated/network_type.js +9 -0
package/dist/_generated/network_type.js.map +1 -0
package/dist/_generated/oauth_provider.d.ts +8 -0
package/dist/_generated/oauth_provider.d.ts.map +1 -0
package/dist/_generated/oauth_provider.js +10 -0
package/dist/_generated/oauth_provider.js.map +1 -0
package/dist/_generated/operation_state.d.ts +9 -0
package/dist/_generated/operation_state.d.ts.map +1 -0
package/dist/_generated/operation_state.js +11 -0
package/dist/_generated/operation_state.js.map +1 -0
package/dist/_generated/otlp_resource_attributes.d.ts +16 -0
package/dist/_generated/otlp_resource_attributes.d.ts.map +1 -0
package/dist/_generated/otlp_resource_attributes.js +17 -0
package/dist/_generated/otlp_resource_attributes.js.map +1 -0
package/dist/_generated/principal_type.d.ts +7 -0
package/dist/_generated/principal_type.d.ts.map +1 -0
package/dist/_generated/principal_type.js +9 -0
package/dist/_generated/principal_type.js.map +1 -0
package/dist/_generated/query_routing_tier.d.ts +6 -0
package/dist/_generated/query_routing_tier.d.ts.map +1 -0
package/dist/_generated/query_routing_tier.js +8 -0
package/dist/_generated/query_routing_tier.js.map +1 -0
package/dist/_generated/routing_policy.d.ts +7 -0
package/dist/_generated/routing_policy.d.ts.map +1 -0
package/dist/_generated/routing_policy.js +9 -0
package/dist/_generated/routing_policy.js.map +1 -0
package/dist/_generated/runtime_executor.d.ts +18 -0
package/dist/_generated/runtime_executor.d.ts.map +1 -0
package/dist/_generated/runtime_executor.js +20 -0
package/dist/_generated/runtime_executor.js.map +1 -0
package/dist/_generated/scope.d.ts +16 -0
package/dist/_generated/scope.d.ts.map +1 -0
package/dist/_generated/scope.js +18 -0
package/dist/_generated/scope.js.map +1 -0
package/dist/_generated/span_attributes.d.ts +25 -0
package/dist/_generated/span_attributes.d.ts.map +1 -0
package/dist/_generated/span_attributes.js +34 -0
package/dist/_generated/span_attributes.js.map +1 -0
package/dist/_generated/span_event_attributes.d.ts +23 -0
package/dist/_generated/span_event_attributes.d.ts.map +1 -0
package/dist/_generated/span_event_attributes.js +36 -0
package/dist/_generated/span_event_attributes.js.map +1 -0
package/dist/_generated/span_event_names.d.ts +42 -0
package/dist/_generated/span_event_names.d.ts.map +1 -0
package/dist/_generated/span_event_names.js +82 -0
package/dist/_generated/span_event_names.js.map +1 -0
package/dist/_generated/span_names.d.ts +17 -0
package/dist/_generated/span_names.d.ts.map +1 -0
package/dist/_generated/span_names.js +18 -0
package/dist/_generated/span_names.js.map +1 -0
package/dist/_generated/span_status_mapping.d.ts +8 -0
package/dist/_generated/span_status_mapping.d.ts.map +1 -0
package/dist/_generated/span_status_mapping.js +17 -0
package/dist/_generated/span_status_mapping.js.map +1 -0
package/dist/_generated/subscription_status.d.ts +11 -0
package/dist/_generated/subscription_status.d.ts.map +1 -0
package/dist/_generated/subscription_status.js +13 -0
package/dist/_generated/subscription_status.js.map +1 -0
package/dist/_generated/support_tier.d.ts +7 -0
package/dist/_generated/support_tier.d.ts.map +1 -0
package/dist/_generated/support_tier.js +9 -0
package/dist/_generated/support_tier.js.map +1 -0
package/dist/_generated/telemetry_class.d.ts +6 -0
package/dist/_generated/telemetry_class.d.ts.map +1 -0
package/dist/_generated/telemetry_class.js +8 -0
package/dist/_generated/telemetry_class.js.map +1 -0
package/dist/_generated/telemetry_events.d.ts +10 -0
package/dist/_generated/telemetry_events.d.ts.map +1 -0
package/dist/_generated/telemetry_events.js +18 -0
package/dist/_generated/telemetry_events.js.map +1 -0
package/dist/_generated/thermal_state.d.ts +7 -0
package/dist/_generated/thermal_state.d.ts.map +1 -0
package/dist/_generated/thermal_state.js +9 -0
package/dist/_generated/thermal_state.js.map +1 -0
package/dist/_generated/tool_call_tier.d.ts +7 -0
package/dist/_generated/tool_call_tier.d.ts.map +1 -0
package/dist/_generated/tool_call_tier.js +9 -0
package/dist/_generated/tool_call_tier.js.map +1 -0
package/dist/_generated/training_job_state.d.ts +23 -0
package/dist/_generated/training_job_state.d.ts.map +1 -0
package/dist/_generated/training_job_state.js +25 -0
package/dist/_generated/training_job_state.js.map +1 -0
package/dist/_generated/work_class.d.ts +6 -0
package/dist/_generated/work_class.d.ts.map +1 -0
package/dist/_generated/work_class.js +8 -0
package/dist/_generated/work_class.js.map +1 -0
package/dist/artifacts.d.ts +16 -0
package/dist/artifacts.d.ts.map +1 -0
package/dist/artifacts.js +16 -0
package/dist/artifacts.js.map +1 -0
package/dist/audio/audio-transcriptions.d.ts +31 -0
package/dist/audio/audio-transcriptions.d.ts.map +1 -0
package/dist/audio/audio-transcriptions.js +73 -0
package/dist/audio/audio-transcriptions.js.map +1 -0
package/dist/audio/index.d.ts +5 -0
package/dist/audio/index.d.ts.map +1 -0
package/dist/audio/index.js +3 -0
package/dist/audio/index.js.map +1 -0
package/dist/audio/octomil-audio.d.ts +9 -0
package/dist/audio/octomil-audio.d.ts.map +1 -0
package/dist/audio/octomil-audio.js +11 -0
package/dist/audio/octomil-audio.js.map +1 -0
package/dist/audio/transcription-types.d.ts +17 -0
package/dist/audio/transcription-types.d.ts.map +1 -0
package/dist/audio/transcription-types.js +6 -0
package/dist/audio/transcription-types.js.map +1 -0
package/dist/cache.js +1 -1
package/dist/cache.js.map +1 -1
package/dist/capabilities.d.ts +26 -0
package/dist/capabilities.d.ts.map +1 -0
package/dist/capabilities.js +68 -0
package/dist/capabilities.js.map +1 -0
package/dist/chat.d.ts +109 -0
package/dist/chat.d.ts.map +1 -0
package/dist/chat.js +258 -0
package/dist/chat.js.map +1 -0
package/dist/configure.d.ts +18 -0
package/dist/configure.d.ts.map +1 -0
package/dist/configure.js +136 -0
package/dist/configure.js.map +1 -0
package/dist/control.d.ts +171 -0
package/dist/control.d.ts.map +1 -0
package/dist/control.js +317 -0
package/dist/control.js.map +1 -0
package/dist/device-auth.d.ts +1 -1
package/dist/device-auth.d.ts.map +1 -1
package/dist/device-auth.js +7 -7
package/dist/device-auth.js.map +1 -1
package/dist/device-context.d.ts +48 -0
package/dist/device-context.d.ts.map +1 -0
package/dist/device-context.js +92 -0
package/dist/device-context.js.map +1 -0
package/dist/devices.d.ts +17 -0
package/dist/devices.d.ts.map +1 -0
package/dist/devices.js +16 -0
package/dist/devices.js.map +1 -0
package/dist/embeddings.d.ts +19 -0
package/dist/embeddings.d.ts.map +1 -0
package/dist/embeddings.js +54 -0
package/dist/embeddings.js.map +1 -0
package/dist/experiments.d.ts +4 -3
package/dist/experiments.d.ts.map +1 -1
package/dist/experiments.js +5 -10
package/dist/experiments.js.map +1 -1
package/dist/federated-analytics.d.ts +65 -0
package/dist/federated-analytics.d.ts.map +1 -0
package/dist/federated-analytics.js +128 -0
package/dist/federated-analytics.js.map +1 -0
package/dist/federated.d.ts +10 -3
package/dist/federated.d.ts.map +1 -1
package/dist/federated.js +68 -15
package/dist/federated.js.map +1 -1
package/dist/gradient-cache.d.ts +21 -0
package/dist/gradient-cache.d.ts.map +1 -0
package/dist/gradient-cache.js +70 -0
package/dist/gradient-cache.js.map +1 -0
package/dist/index.cjs +43601 -709
package/dist/index.cjs.map +4 -4
package/dist/index.d.ts +64 -13
package/dist/index.d.ts.map +1 -1
package/dist/index.js +55 -13
package/dist/index.js.map +1 -1
package/dist/install-id.d.ts +32 -0
package/dist/install-id.d.ts.map +1 -0
package/dist/install-id.js +61 -0
package/dist/install-id.js.map +1 -0
package/dist/{model-loader.d.ts → model-manager.d.ts} +4 -4
package/dist/model-manager.d.ts.map +1 -0
package/dist/{model-loader.js → model-manager.js} +18 -14
package/dist/model-manager.js.map +1 -0
package/dist/models.d.ts +74 -0
package/dist/models.d.ts.map +1 -0
package/dist/models.js +113 -0
package/dist/models.js.map +1 -0
package/dist/monitoring-config.d.ts +8 -0
package/dist/monitoring-config.d.ts.map +1 -0
package/dist/monitoring-config.js +5 -0
package/dist/monitoring-config.js.map +1 -0
package/dist/monitoring.d.ts +10 -0
package/dist/monitoring.d.ts.map +1 -0
package/dist/monitoring.js +19 -0
package/dist/monitoring.js.map +1 -0
package/dist/octomil.d.ts +151 -16
package/dist/octomil.d.ts.map +1 -1
package/dist/octomil.js +456 -125
package/dist/octomil.js.map +1 -1
package/dist/octomil.min.js +47 -2844
package/dist/octomil.min.js.map +4 -4
package/dist/responses-runtime.d.ts +13 -0
package/dist/responses-runtime.d.ts.map +1 -0
package/dist/responses-runtime.js +2 -0
package/dist/responses-runtime.js.map +1 -0
package/dist/responses-tools.d.ts +18 -0
package/dist/responses-tools.d.ts.map +1 -0
package/dist/responses-tools.js +71 -0
package/dist/responses-tools.js.map +1 -0
package/dist/responses.d.ts +142 -0
package/dist/responses.d.ts.map +1 -0
package/dist/responses.js +549 -0
package/dist/responses.js.map +1 -0
package/dist/routing.d.ts +49 -0
package/dist/routing.d.ts.map +1 -0
package/dist/routing.js +221 -0
package/dist/routing.js.map +1 -0
package/dist/runtime/core/model-runtime.d.ts +19 -0
package/dist/runtime/core/model-runtime.d.ts.map +1 -0
package/dist/runtime/core/model-runtime.js +9 -0
package/dist/runtime/core/model-runtime.js.map +1 -0
package/dist/{inference.d.ts → runtime/engines/onnx-web/engine.d.ts} +7 -3
package/dist/runtime/engines/onnx-web/engine.d.ts.map +1 -0
package/dist/{inference.js → runtime/engines/onnx-web/engine.js} +21 -7
package/dist/runtime/engines/onnx-web/engine.js.map +1 -0
package/dist/runtime/engines/registry/engine-plugin.d.ts +11 -0
package/dist/runtime/engines/registry/engine-plugin.d.ts.map +1 -0
package/dist/runtime/engines/registry/engine-plugin.js +2 -0
package/dist/runtime/engines/registry/engine-plugin.js.map +1 -0
package/dist/runtime/engines/registry/engine-registry.d.ts +35 -0
package/dist/runtime/engines/registry/engine-registry.d.ts.map +1 -0
package/dist/runtime/engines/registry/engine-registry.js +74 -0
package/dist/runtime/engines/registry/engine-registry.js.map +1 -0
package/dist/runtime/index.d.ts +4 -0
package/dist/runtime/index.d.ts.map +1 -0
package/dist/runtime/index.js +2 -0
package/dist/runtime/index.js.map +1 -0
package/dist/secure-aggregation.d.ts.map +1 -1
package/dist/secure-aggregation.js +3 -2
package/dist/secure-aggregation.js.map +1 -1
package/dist/server-api.d.ts +17 -0
package/dist/server-api.d.ts.map +1 -0
package/dist/server-api.js +56 -0
package/dist/server-api.js.map +1 -0
package/dist/settings.d.ts +20 -0
package/dist/settings.d.ts.map +1 -0
package/dist/settings.js +49 -0
package/dist/settings.js.map +1 -0
package/dist/silent-auth-config.d.ts +33 -0
package/dist/silent-auth-config.d.ts.map +1 -0
package/dist/silent-auth-config.js +29 -0
package/dist/silent-auth-config.js.map +1 -0
package/dist/streaming.d.ts +4 -3
package/dist/streaming.d.ts.map +1 -1
package/dist/streaming.js +15 -25
package/dist/streaming.js.map +1 -1
package/dist/sync-manager.d.ts +103 -0
package/dist/sync-manager.d.ts.map +1 -0
package/dist/sync-manager.js +314 -0
package/dist/sync-manager.js.map +1 -0
package/dist/telemetry.d.ts +99 -4
package/dist/telemetry.d.ts.map +1 -1
package/dist/telemetry.js +251 -13
package/dist/telemetry.js.map +1 -1
package/dist/text/octomil-text.d.ts +18 -0
package/dist/text/octomil-text.d.ts.map +1 -0
package/dist/text/octomil-text.js +20 -0
package/dist/text/octomil-text.js.map +1 -0
package/dist/training.d.ts +15 -0
package/dist/training.d.ts.map +1 -0
package/dist/training.js +35 -0
package/dist/training.js.map +1 -0
package/dist/transformers-local-runtime.d.ts +17 -0
package/dist/transformers-local-runtime.d.ts.map +1 -0
package/dist/transformers-local-runtime.js +356 -0
package/dist/transformers-local-runtime.js.map +1 -0
package/dist/types.d.ts +353 -25
package/dist/types.d.ts.map +1 -1
package/dist/types.js +146 -0
package/dist/types.js.map +1 -1
package/package.json +7 -6
package/dist/inference.d.ts.map +0 -1
package/dist/inference.js.map +0 -1
package/dist/model-loader.d.ts.map +0 -1
package/dist/model-loader.js.map +0 -1
package/dist/rollouts.d.ts +0 -43
package/dist/rollouts.d.ts.map +0 -1
package/dist/rollouts.js +0 -114
package/dist/rollouts.js.map +0 -1

package/dist/octomil.js CHANGED Viewed

@@ -1,55 +1,106 @@
 /**
  * @octomil/browser — Main SDK entry point
  *
- * The `Octomil` class is the primary public interface.  It orchestrates
+ * The `OctomilClient` class is the primary public interface.  It orchestrates
  * model loading, caching, inference, and optional telemetry.
  *
  * @example
  * ```ts
- * import { Octomil } from '@octomil/browser';
+ * import { OctomilClient } from '@octomil/browser';
  *
- * const ml = new Octomil({
- *   model: 'https://models.octomil.io/sentiment-v1.onnx',
+ * const ml = new OctomilClient({
+ *   model: 'https://models.octomil.com/sentiment-v1.onnx',
  *   backend: 'webgpu',
  * });
  *
  * await ml.load();
  * const result = await ml.predict({ raw: inputData, dims: [1, 3, 224, 224] });
  * console.log(result.label, result.score);
- * ml.dispose();
+ * ml.close();
  * ```
  */
+import { OctomilAudio } from "./audio/octomil-audio.js";
+import { CapabilitiesClient } from "./capabilities.js";
 import { createModelCache } from "./cache.js";
-import { InferenceEngine } from "./inference.js";
-import { ModelLoader } from "./model-loader.js";
+import { ChatClient } from "./chat.js";
+import { getDeviceContext } from "./configure.js";
+import { ControlClient } from "./control.js";
+import { embed as embedFn } from "./embeddings.js";
+import { InferenceEngine } from "./runtime/engines/onnx-web/engine.js";
+import { ModelManager } from "./model-manager.js";
+import { ModelsClient } from "./models.js";
+import { ResponsesClient } from "./responses.js";
+import { RoutingClient, detectDeviceCapabilities } from "./routing.js";
 import { TelemetryReporter } from "./telemetry.js";
-import { StreamingInferenceEngine } from "./streaming.js";
+import { OctomilText } from "./text/octomil-text.js";
 import { OctomilError } from "./types.js";
 // ---------------------------------------------------------------------------
-// Octomil
+// OctomilClient
 // ---------------------------------------------------------------------------
-export class Octomil {
+export class OctomilClient {
     options;
     cache;
     loader;
     engine;
+    inferenceEngine;
+    routingClient = null;
+    deviceContext;
     telemetry = null;
+    deviceCaps = null;
+    _responses = null;
+    _chat = null;
+    _control = null;
+    _capabilities = null;
+    _models = null;
+    _audio = null;
+    _text = null;
     loaded = false;
-    disposed = false;
+    closed = false;
+    _warmedUp = false;
     constructor(options) {
+        // Extract serverUrl and apiKey from the auth config
+        const auth = options.auth;
+        const serverUrl = auth?.serverUrl;
+        const apiKey = auth?.type === "org_api_key"
+            ? auth.apiKey
+            : auth?.type === "device_token"
+                ? auth.bootstrapToken
+                : undefined;
+        const orgId = auth?.type === "org_api_key" ? auth.orgId : getDeviceContext()?.orgId ?? undefined;
+        this.deviceContext = getDeviceContext();
         this.options = {
             telemetry: false,
             cacheStrategy: "cache-api",
             ...options,
+            // Map auth fields into legacy locations for internal consumers
+            serverUrl,
+            apiKey,
         };
         this.cache = createModelCache(this.options.cacheStrategy);
-        this.loader = new ModelLoader(this.options, this.cache);
-        this.engine = new InferenceEngine();
+        this.loader = new ModelManager(this.options, this.cache);
+        const defaultEngine = options.runtime ? null : new InferenceEngine();
+        this.engine = options.runtime ?? defaultEngine;
+        this.inferenceEngine = defaultEngine;
+        // Routing is opt-in: only enabled when serverUrl + apiKey + routing are set.
+        if (serverUrl && apiKey && this.options.routing) {
+            this.routingClient = new RoutingClient({
+                serverUrl,
+                apiKey,
+                cacheTtlMs: this.options.routing.cacheTtlMs,
+                prefer: this.options.routing.prefer,
+            });
+        }
         if (this.options.telemetry) {
             this.telemetry = new TelemetryReporter({
                 url: this.options.telemetryUrl,
-                apiKey: this.options.apiKey,
+                apiKey,
+                authHeadersProvider: () => this.deviceContext?.authHeaders() ?? null,
+                orgId,
+                deviceId: this.deviceContext?.installationId,
             });
+            if (this.deviceContext) {
+                this.telemetry.updateResource(this.deviceContext.telemetryResource());
+            }
         }
     }
     // -----------------------------------------------------------------------
@@ -60,38 +111,56 @@ export class Octomil {
      * inference session.  Must be called before `predict()` or `chat()`.
      */
     async load() {
-        this.ensureNotDisposed();
+        this.ensureNotClosed();
         const start = performance.now();
-        const wasCached = await this.loader.isCached();
         const modelData = await this.loader.load();
         await this.engine.createSession(modelData, this.options.backend);
         this.loaded = true;
         const durationMs = performance.now() - start;
-        this.trackEvent({
-            type: "model_load",
-            model: this.options.model,
-            durationMs,
-            metadata: {
-                backend: this.engine.activeBackend,
-                cached: wasCached,
-                sizeBytes: modelData.byteLength,
-            },
-            timestamp: Date.now(),
-        });
-        if (wasCached) {
-            this.trackEvent({
-                type: "cache_hit",
-                model: this.options.model,
-                timestamp: Date.now(),
-            });
-        }
-        else {
-            this.trackEvent({
-                type: "cache_miss",
-                model: this.options.model,
-                timestamp: Date.now(),
-            });
+        this.telemetry?.reportDeployStarted(this.options.model, "latest");
+        this.telemetry?.reportDeployCompleted(this.options.model, "latest", durationMs);
+    }
+    /**
+     * Explicitly warm up the ONNX runtime by running a minimal dummy inference.
+     *
+     * This pre-allocates internal buffers, compiles GPU shaders, and triggers
+     * any lazy initialisation that would otherwise happen on the first real
+     * `predict()` call.  Useful for latency-sensitive applications that want
+     * predictable first-inference timing.
+     *
+     * Idempotent: calling `warmup()` after it has already completed is a no-op.
+     * Requires `load()` to have been called first.
+     */
+    async warmup() {
+        this.ensureReady();
+        if (this._warmedUp)
+            return;
+        // Build a minimal input tensor (1-element Float32) for the first input.
+        // The goal is to trigger ONNX runtime buffer allocation, not produce
+        // meaningful output.
+        const inputName = this.inferenceEngine
+            ? this.inferenceEngine.inputNames[0]
+            : undefined;
+        if (inputName) {
+            const dummyTensors = {
+                [inputName]: {
+                    data: new Float32Array([0]),
+                    dims: [1, 1],
+                },
+            };
+            try {
+                await this.engine.run(dummyTensors);
+            }
+            catch {
+                // Warmup failures are non-fatal. The runtime may reject the dummy
+                // shape, but the internal buffers will still have been allocated.
+            }
         }
+        this._warmedUp = true;
+    }
+    /** Whether `warmup()` has been called and completed successfully. */
+    get isWarmedUp() {
+        return this._warmedUp;
     }
     // -----------------------------------------------------------------------
     // Inference
@@ -104,14 +173,19 @@ export class Octomil {
      */
     async predict(input) {
         this.ensureReady();
+        // Attempt cloud routing if configured.
+        if (this.routingClient) {
+            const cloudResult = await this.tryCloudInference(input);
+            if (cloudResult)
+                return cloudResult;
+        }
+        // Local inference (default path).
         const tensors = this.prepareTensors(input);
+        this.telemetry?.reportInferenceStarted(this.options.model, { target: "device" });
         const result = await this.engine.run(tensors);
-        this.trackEvent({
-            type: "inference",
-            model: this.options.model,
-            durationMs: result.latencyMs,
-            metadata: { backend: this.engine.activeBackend },
-            timestamp: Date.now(),
+        this.telemetry?.reportInferenceCompleted(this.options.model, result.latencyMs, {
+            backend: this.inferenceEngine?.activeBackend ?? "unknown",
+            target: "device",
         });
         return result;
     }
@@ -130,95 +204,158 @@ export class Octomil {
             results.push(result);
         }
         const totalMs = performance.now() - start;
-        this.trackEvent({
-            type: "inference",
-            model: this.options.model,
-            durationMs: totalMs,
-            metadata: {
-                backend: this.engine.activeBackend,
-                batchSize: inputs.length,
-            },
-            timestamp: Date.now(),
+        this.telemetry?.reportInferenceCompleted(this.options.model, totalMs, {
+            backend: this.inferenceEngine?.activeBackend ?? "unknown",
+            batchSize: inputs.length,
         });
         return results;
     }
     /**
      * OpenAI-compatible chat completion.
-     * Requires a server with streaming endpoint. Uses StreamingInferenceEngine
-     * under the hood to collect the full response.
+     *
+     * @deprecated Use `client.chat.create()` instead. This method will be
+     * removed in the next major version.
      */
-    async chat(messages, options = {}) {
-        this.ensureReady();
-        if (!this.options.serverUrl) {
-            throw new OctomilError("INFERENCE_FAILED", "chat() requires serverUrl to be configured.");
+    async createChat(messages, options = {}) {
+        return this.chat.create(messages, options);
+    }
+    /**
+     * Streaming chat — yields chunks as they arrive.
+     *
+     * @deprecated Use `client.chat.stream()` instead. This method will be
+     * removed in the next major version.
+     */
+    async *createChatStream(messages, options = {}) {
+        yield* this.chat.stream(messages, options);
+    }
+    // -----------------------------------------------------------------------
+    // Cloud Streaming Inference (SSE)
+    // -----------------------------------------------------------------------
+    /**
+     * Stream tokens from the cloud inference endpoint via SSE.
+     *
+     * Consumes `POST /api/v1/inference/stream` and yields `StreamToken`
+     * objects as they arrive. Requires `serverUrl` and `apiKey` to be
+     * configured.
+     *
+     * @param modelId - Model identifier (e.g. `"phi-4-mini"`).
+     * @param input - Plain string prompt or chat-style messages.
+     * @param parameters - Generation parameters (temperature, max_tokens, etc.).
+     * @param signal - Optional AbortSignal for cancellation.
+     */
+    async *predictStream(modelId, input, parameters, signal) {
+        if (!this.options.serverUrl || !this.options.apiKey) {
+            throw new OctomilError("INFERENCE_FAILED", "predictStream() requires serverUrl and apiKey to be configured.");
         }
-        const streaming = new StreamingInferenceEngine({
-            serverUrl: this.options.serverUrl,
-            apiKey: this.options.apiKey,
-            onTelemetry: (e) => this.trackEvent(e),
-        });
-        const start = performance.now();
-        let content = "";
-        const generator = streaming.stream(this.options.model, {
-            messages,
-            temperature: options.temperature,
-            max_tokens: options.maxTokens,
-            top_p: options.topP,
-        }, { modality: "text", signal: options.signal });
-        for await (const chunk of generator) {
-            if (typeof chunk.data === "string") {
-                content += chunk.data;
-            }
+        const url = `${this.options.serverUrl.replace(/\/+$/, "")}/api/v1/inference/stream`;
+        const body = { model_id: modelId };
+        if (typeof input === "string") {
+            body.input_data = input;
         }
-        return {
-            message: { role: "assistant", content },
-            latencyMs: performance.now() - start,
+        else {
+            body.messages = input;
+        }
+        if (parameters) {
+            body.parameters = parameters;
+        }
+        const headers = {
+            "Content-Type": "application/json",
+            Accept: "text/event-stream",
+            Authorization: `Bearer ${this.options.apiKey}`,
         };
+        let response;
+        try {
+            response = await fetch(url, {
+                method: "POST",
+                headers,
+                body: JSON.stringify(body),
+                signal,
+            });
+        }
+        catch (err) {
+            throw new OctomilError("NETWORK_UNAVAILABLE", `predictStream request failed: ${String(err)}`, err);
+        }
+        if (!response.ok) {
+            throw new OctomilError("INFERENCE_FAILED", `predictStream failed: HTTP ${response.status}`);
+        }
+        if (!response.body) {
+            throw new OctomilError("INFERENCE_FAILED", "Server did not return a streaming body.");
+        }
+        const reader = response.body.getReader();
+        const decoder = new TextDecoder();
+        let buffer = "";
+        let chunkIndex = 0;
+        try {
+            while (true) {
+                const { done, value } = await reader.read();
+                if (done)
+                    break;
+                buffer += decoder.decode(value, { stream: true });
+                const lines = buffer.split("\n");
+                buffer = lines.pop() ?? "";
+                for (const line of lines) {
+                    if (!line.startsWith("data:"))
+                        continue;
+                    const data = line.slice(5).trim();
+                    if (!data)
+                        continue;
+                    let parsed;
+                    try {
+                        parsed = JSON.parse(data);
+                    }
+                    catch {
+                        continue;
+                    }
+                    this.telemetry?.reportChunkProduced(modelId, chunkIndex);
+                    chunkIndex++;
+                    yield {
+                        token: parsed.token ?? "",
+                        done: parsed.done ?? false,
+                        provider: parsed.provider,
+                        latencyMs: parsed.latency_ms,
+                        sessionId: parsed.session_id,
+                    };
+                }
+            }
+        }
+        finally {
+            reader.releaseLock();
+        }
     }
+    // -----------------------------------------------------------------------
+    // Embeddings
+    // -----------------------------------------------------------------------
     /**
-     * Streaming chat — yields chunks as they arrive.
+     * Generate embeddings via the Octomil cloud endpoint.
+     *
+     * Requires `serverUrl` and `apiKey` to be configured.
+     *
+     * @param modelId - Embedding model identifier (e.g. `"nomic-embed-text"`).
+     * @param input - A single string or array of strings to embed.
+     * @param signal - Optional AbortSignal for cancellation.
      */
-    async *chatStream(messages, options = {}) {
-        this.ensureReady();
-        if (!this.options.serverUrl) {
-            throw new OctomilError("INFERENCE_FAILED", "chatStream() requires serverUrl to be configured.");
-        }
-        const streaming = new StreamingInferenceEngine({
-            serverUrl: this.options.serverUrl,
-            apiKey: this.options.apiKey,
-            onTelemetry: (e) => this.trackEvent(e),
-        });
-        const generator = streaming.stream(this.options.model, {
-            messages,
-            temperature: options.temperature,
-            max_tokens: options.maxTokens,
-            top_p: options.topP,
-        }, { modality: "text", signal: options.signal });
-        for await (const chunk of generator) {
-            yield {
-                index: chunk.index,
-                content: typeof chunk.data === "string" ? chunk.data : JSON.stringify(chunk.data),
-                done: chunk.done,
-                role: "assistant",
-            };
+    async embed(modelId, input, signal) {
+        if (!this.options.serverUrl || !this.options.apiKey) {
+            throw new OctomilError("NETWORK_UNAVAILABLE", "embed() requires serverUrl and apiKey to be configured.");
         }
+        return embedFn(this.options.serverUrl, this.options.apiKey, modelId, input, signal);
     }
     // -----------------------------------------------------------------------
     // Cache
     // -----------------------------------------------------------------------
     /** Check whether the model binary is currently cached locally. */
     async isCached() {
-        this.ensureNotDisposed();
+        this.ensureNotClosed();
         return this.loader.isCached();
     }
     /** Remove the cached model binary. */
     async clearCache() {
-        this.ensureNotDisposed();
+        this.ensureNotClosed();
         return this.loader.clearCache();
     }
     /** Get cache metadata for the model. */
     async cacheInfo() {
-        this.ensureNotDisposed();
+        this.ensureNotClosed();
         return this.loader.getCacheInfo();
     }
     // -----------------------------------------------------------------------
@@ -226,47 +363,206 @@ export class Octomil {
     // -----------------------------------------------------------------------
     /** The inference backend currently in use (after `load()`). */
     get activeBackend() {
-        return this.engine.activeBackend;
+        return this.inferenceEngine?.activeBackend ?? null;
     }
     /** Input tensor names defined by the loaded model. */
     get inputNames() {
         this.ensureReady();
-        return this.engine.inputNames;
+        if (!this.inferenceEngine) {
+            throw new OctomilError("INVALID_INPUT", "inputNames not available with custom runtime");
+        }
+        return this.inferenceEngine.inputNames;
     }
     /** Output tensor names defined by the loaded model. */
     get outputNames() {
         this.ensureReady();
-        return this.engine.outputNames;
+        if (!this.inferenceEngine) {
+            throw new OctomilError("INVALID_INPUT", "outputNames not available with custom runtime");
+        }
+        return this.inferenceEngine.outputNames;
     }
     /** Whether `load()` has been called successfully. */
     get isLoaded() {
         return this.loaded;
     }
     // -----------------------------------------------------------------------
+    // Chat namespace (OpenAI-compatible chat completions)
+    // -----------------------------------------------------------------------
+    /**
+     * Lazily-created `ChatClient` providing `chat.create()` and
+     * `chat.stream()` methods for OpenAI-compatible chat completions.
+     *
+     * Uses a local responses runtime when configured, otherwise falls back to
+     * the configured server-backed responses client.
+     *
+     * @example
+     * ```ts
+     * const response = await client.chat.create([
+     *   { role: 'user', content: 'Hello!' },
+     * ]);
+     * ```
+     */
+    get chat() {
+        if (!this._chat) {
+            this._chat = new ChatClient({
+                model: this.options.model,
+                serverUrl: this.options.serverUrl,
+                apiKey: this.options.apiKey,
+                getResponses: () => this.responses,
+                ensureReady: () => this.ensureReady(),
+            });
+        }
+        return this._chat;
+    }
+    // -----------------------------------------------------------------------
+    // Responses namespace (Layer 2 — structured response API)
+    // -----------------------------------------------------------------------
+    /**
+     * Lazily-created `ResponsesClient` providing `responses.create()` and
+     * `responses.stream()` methods for the structured response API.
+     *
+     * Uses a configured local responses runtime when available; otherwise uses
+     * the server-backed responses API. `apiKey` is optional but recommended for
+     * server-backed usage.
+     */
+    get responses() {
+        if (!this._responses) {
+            this._responses = new ResponsesClient({
+                serverUrl: this.options.serverUrl,
+                apiKey: this.options.apiKey,
+                telemetry: this.telemetry,
+                deviceContext: this.deviceContext,
+                localRuntime: this.options.responsesRuntime,
+            });
+        }
+        return this._responses;
+    }
+    // -----------------------------------------------------------------------
+    // Control namespace (device registration + heartbeat)
+    // -----------------------------------------------------------------------
+    /**
+     * Lazily-created `ControlClient` providing `control.register()`,
+     * `control.heartbeat()`, and `control.refresh()` methods.
+     *
+     * Uses the configured `serverUrl`, `apiKey`, and any `orgId`
+     * inferred from the options.
+     */
+    get control() {
+        if (!this._control) {
+            this._control = new ControlClient({
+                serverUrl: this.options.serverUrl,
+                apiKey: this.options.apiKey,
+                orgId: this.options.auth?.type === "org_api_key" ? this.options.auth.orgId : undefined,
+                deviceContext: this.deviceContext,
+                telemetry: this.telemetry,
+            });
+        }
+        return this._control;
+    }
+    // -----------------------------------------------------------------------
+    // Capabilities namespace (device capability profiling)
+    // -----------------------------------------------------------------------
+    /**
+     * Lazily-created `CapabilitiesClient` providing `capabilities.current()`
+     * to detect the full device capability profile.
+     */
+    get capabilities() {
+        if (!this._capabilities) {
+            this._capabilities = new CapabilitiesClient();
+        }
+        return this._capabilities;
+    }
+    // -----------------------------------------------------------------------
+    // Models namespace (status / load / unload / list / clearCache)
+    // -----------------------------------------------------------------------
+    /**
+     * Lazily-created `ModelsClient` providing `models.status()`,
+     * `models.load()`, `models.unload()`, `models.list()`, and
+     * `models.clearCache()`.
+     */
+    get models() {
+        if (!this._models) {
+            this._models = new ModelsClient(this.options.model, this.loader, () => {
+                // When ModelsClient.load() succeeds, mark the engine as loaded
+                // so that predict()/chat() work without a separate load() call.
+                // Note: the engine session is NOT created here — callers should
+                // still use OctomilClient.load() for full setup.  This callback
+                // ensures the downloading→ready state transition is tracked.
+            });
+        }
+        return this._models;
+    }
+    // -----------------------------------------------------------------------
+    // Audio namespace (transcriptions)
+    // -----------------------------------------------------------------------
+    /**
+     * Lazily-created `OctomilAudio` providing
+     * `audio.transcriptions.create()` for speech-to-text.
+     *
+     * Requires `serverUrl` and `apiKey` to be configured.
+     *
+     * @example
+     * ```ts
+     * const result = await client.audio.transcriptions.create({
+     *   file: audioBlob,
+     *   model: 'whisper-large-v3',
+     * });
+     * console.log(result.text);
+     * ```
+     */
+    get audio() {
+        if (!this._audio) {
+            if (!this.options.serverUrl || !this.options.apiKey) {
+                throw new OctomilError("INVALID_INPUT", "audio requires serverUrl and apiKey to be configured.");
+            }
+            this._audio = new OctomilAudio(this.options.serverUrl, this.options.apiKey);
+        }
+        return this._audio;
+    }
+    /**
+     * Lazily-created `OctomilText` providing `text.predictions.create()`
+     * for browser-local text inference via the loaded model.
+     */
+    get text() {
+        if (!this._text) {
+            this._text = new OctomilText((input) => this.predict(input));
+        }
+        return this._text;
+    }
+    // -----------------------------------------------------------------------
     // Cleanup
     // -----------------------------------------------------------------------
     /** Release all resources (WASM memory, WebGPU device, telemetry). */
-    dispose() {
-        if (this.disposed)
+    close() {
+        if (this.closed)
             return;
-        this.disposed = true;
+        this.closed = true;
         this.loaded = false;
         this.engine.dispose();
-        this.telemetry?.dispose();
+        this.telemetry?.close();
         this.telemetry = null;
+        this._responses = null;
+        this._chat = null;
+        this._control?.stopHeartbeat();
+        this._control = null;
+        this._capabilities = null;
+        this._models = null;
+        this._audio = null;
+        this._text = null;
+        this._warmedUp = false;
     }
     // -----------------------------------------------------------------------
     // Private helpers
     // -----------------------------------------------------------------------
-    ensureNotDisposed() {
-        if (this.disposed) {
-            throw new OctomilError("SESSION_DISPOSED", "This Octomil instance has been disposed. Create a new one.");
+    ensureNotClosed() {
+        if (this.closed) {
+            throw new OctomilError("CANCELLED", "This OctomilClient instance has been closed. Create a new one.");
         }
     }
     ensureReady() {
-        this.ensureNotDisposed();
+        this.ensureNotClosed();
         if (!this.loaded) {
-            throw new OctomilError("NOT_LOADED", "Model not loaded. Call load() before predict() or chat().");
+            throw new OctomilError("MODEL_LOAD_FAILED", "Model not loaded. Call load() before predict() or chat().");
         }
     }
     /**
@@ -280,7 +576,7 @@ export class Octomil {
         }
         // { raw, dims } — wrap in the first input name.
         if ("raw" in input && "dims" in input) {
-            const name = this.engine.inputNames[0];
+            const name = this.inferenceEngine.inputNames[0];
             if (!name) {
                 throw new OctomilError("INVALID_INPUT", "Model has no input tensors defined.");
             }
@@ -290,7 +586,7 @@ export class Octomil {
         // Real tokenization would require a tokenizer; this is a minimal
         // placeholder that works for models expecting raw code-point inputs.
         if ("text" in input) {
-            const name = this.engine.inputNames[0];
+            const name = this.inferenceEngine.inputNames[0];
             if (!name) {
                 throw new OctomilError("INVALID_INPUT", "Model has no input tensors defined.");
             }
@@ -350,7 +646,7 @@ export class Octomil {
             float[pixels + i] = rgba[i * 4 + 1] / 255; // G
             float[2 * pixels + i] = rgba[i * 4 + 2] / 255; // B
         }
-        const name = this.engine.inputNames[0];
+        const name = this.inferenceEngine?.inputNames[0];
         if (!name) {
             throw new OctomilError("INVALID_INPUT", "Model has no input tensors defined.");
         }
@@ -361,8 +657,43 @@ export class Octomil {
             },
         };
     }
-    trackEvent(event) {
-        this.telemetry?.track(event);
+    /**
+     * Attempt routing + cloud inference. Returns a PredictOutput if the
+     * routing decision is "cloud" and the cloud call succeeds, or `null`
+     * to fall back to local inference.
+     */
+    async tryCloudInference(input) {
+        try {
+            if (!this.deviceCaps) {
+                this.deviceCaps = await detectDeviceCapabilities();
+            }
+            const routing = this.options.routing;
+            const decision = await this.routingClient.route(this.options.model, routing.modelParams ?? 0, routing.modelSizeMb ?? 0, this.deviceCaps);
+            if (!decision || decision.target !== "cloud") {
+                return null;
+            }
+            const start = performance.now();
+            const cloudResponse = await this.routingClient.cloudInfer(this.options.model, input);
+            const latencyMs = performance.now() - start;
+            this.telemetry?.reportInferenceCompleted(this.options.model, latencyMs, {
+                target: "cloud",
+                provider: cloudResponse.provider,
+                routingId: decision.id,
+            });
+            // Wrap the cloud output in PredictOutput shape.
+            return {
+                tensors: {},
+                latencyMs,
+                ...(typeof cloudResponse.output === "object" &&
+                    cloudResponse.output !== null
+                    ? cloudResponse.output
+                    : { label: String(cloudResponse.output) }),
+            };
+        }
+        catch {
+            // Any failure in routing/cloud → fall back to local inference silently.
+            return null;
+        }
     }
 }
 //# sourceMappingURL=octomil.js.map