RubyGems - easy_ml - Versions diffs - 0.1.4 → 0.2.0.pre.rc1 - Mend

easy_ml 0.1.4 → 0.2.0.pre.rc1

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (239) hide show

checksums.yaml +4 -4
data/README.md +234 -26
data/Rakefile +45 -0
data/app/controllers/easy_ml/application_controller.rb +67 -0
data/app/controllers/easy_ml/columns_controller.rb +38 -0
data/app/controllers/easy_ml/datasets_controller.rb +156 -0
data/app/controllers/easy_ml/datasources_controller.rb +88 -0
data/app/controllers/easy_ml/deploys_controller.rb +20 -0
data/app/controllers/easy_ml/models_controller.rb +151 -0
data/app/controllers/easy_ml/retraining_runs_controller.rb +19 -0
data/app/controllers/easy_ml/settings_controller.rb +59 -0
data/app/frontend/components/AlertProvider.tsx +108 -0
data/app/frontend/components/DatasetPreview.tsx +161 -0
data/app/frontend/components/EmptyState.tsx +28 -0
data/app/frontend/components/ModelCard.tsx +255 -0
data/app/frontend/components/ModelDetails.tsx +334 -0
data/app/frontend/components/ModelForm.tsx +384 -0
data/app/frontend/components/Navigation.tsx +300 -0
data/app/frontend/components/Pagination.tsx +72 -0
data/app/frontend/components/Popover.tsx +55 -0
data/app/frontend/components/PredictionStream.tsx +105 -0
data/app/frontend/components/ScheduleModal.tsx +726 -0
data/app/frontend/components/SearchInput.tsx +23 -0
data/app/frontend/components/SearchableSelect.tsx +132 -0
data/app/frontend/components/dataset/AutosaveIndicator.tsx +39 -0
data/app/frontend/components/dataset/ColumnConfigModal.tsx +431 -0
data/app/frontend/components/dataset/ColumnFilters.tsx +256 -0
data/app/frontend/components/dataset/ColumnList.tsx +101 -0
data/app/frontend/components/dataset/FeatureConfigPopover.tsx +57 -0
data/app/frontend/components/dataset/FeaturePicker.tsx +205 -0
data/app/frontend/components/dataset/PreprocessingConfig.tsx +704 -0
data/app/frontend/components/dataset/SplitConfigurator.tsx +120 -0
data/app/frontend/components/dataset/splitters/DateSplitter.tsx +58 -0
data/app/frontend/components/dataset/splitters/KFoldSplitter.tsx +68 -0
data/app/frontend/components/dataset/splitters/LeavePOutSplitter.tsx +29 -0
data/app/frontend/components/dataset/splitters/PredefinedSplitter.tsx +146 -0
data/app/frontend/components/dataset/splitters/RandomSplitter.tsx +85 -0
data/app/frontend/components/dataset/splitters/StratifiedSplitter.tsx +79 -0
data/app/frontend/components/dataset/splitters/constants.ts +77 -0
data/app/frontend/components/dataset/splitters/types.ts +168 -0
data/app/frontend/components/dataset/splitters/utils.ts +53 -0
data/app/frontend/components/features/CodeEditor.tsx +46 -0
data/app/frontend/components/features/DataPreview.tsx +150 -0
data/app/frontend/components/features/FeatureCard.tsx +88 -0
data/app/frontend/components/features/FeatureForm.tsx +235 -0
data/app/frontend/components/features/FeatureGroupCard.tsx +54 -0
data/app/frontend/components/settings/PluginSettings.tsx +81 -0
data/app/frontend/components/ui/badge.tsx +44 -0
data/app/frontend/components/ui/collapsible.tsx +9 -0
data/app/frontend/components/ui/scroll-area.tsx +46 -0
data/app/frontend/components/ui/separator.tsx +29 -0
data/app/frontend/entrypoints/App.tsx +40 -0
data/app/frontend/entrypoints/Application.tsx +24 -0
data/app/frontend/hooks/useAutosave.ts +61 -0
data/app/frontend/layouts/Layout.tsx +38 -0
data/app/frontend/lib/utils.ts +6 -0
data/app/frontend/mockData.ts +272 -0
data/app/frontend/pages/DatasetDetailsPage.tsx +103 -0
data/app/frontend/pages/DatasetsPage.tsx +261 -0
data/app/frontend/pages/DatasourceFormPage.tsx +147 -0
data/app/frontend/pages/DatasourcesPage.tsx +261 -0
data/app/frontend/pages/EditModelPage.tsx +45 -0
data/app/frontend/pages/EditTransformationPage.tsx +56 -0
data/app/frontend/pages/ModelsPage.tsx +115 -0
data/app/frontend/pages/NewDatasetPage.tsx +366 -0
data/app/frontend/pages/NewModelPage.tsx +45 -0
data/app/frontend/pages/NewTransformationPage.tsx +43 -0
data/app/frontend/pages/SettingsPage.tsx +272 -0
data/app/frontend/pages/ShowModelPage.tsx +30 -0
data/app/frontend/pages/TransformationsPage.tsx +95 -0
data/app/frontend/styles/application.css +100 -0
data/app/frontend/types/dataset.ts +146 -0
data/app/frontend/types/datasource.ts +33 -0
data/app/frontend/types/preprocessing.ts +1 -0
data/app/frontend/types.ts +113 -0
data/app/helpers/easy_ml/application_helper.rb +10 -0
data/app/jobs/easy_ml/application_job.rb +21 -0
data/app/jobs/easy_ml/batch_job.rb +46 -0
data/app/jobs/easy_ml/compute_feature_job.rb +19 -0
data/app/jobs/easy_ml/deploy_job.rb +13 -0
data/app/jobs/easy_ml/finalize_feature_job.rb +15 -0
data/app/jobs/easy_ml/refresh_dataset_job.rb +32 -0
data/app/jobs/easy_ml/schedule_retraining_job.rb +11 -0
data/app/jobs/easy_ml/sync_datasource_job.rb +17 -0
data/app/jobs/easy_ml/training_job.rb +62 -0
data/app/models/easy_ml/adapters/base_adapter.rb +45 -0
data/app/models/easy_ml/adapters/polars_adapter.rb +77 -0
data/app/models/easy_ml/cleaner.rb +82 -0
data/app/models/easy_ml/column.rb +124 -0
data/app/models/easy_ml/column_history.rb +30 -0
data/app/models/easy_ml/column_list.rb +122 -0
data/app/models/easy_ml/concerns/configurable.rb +61 -0
data/app/models/easy_ml/concerns/versionable.rb +19 -0
data/app/models/easy_ml/dataset.rb +767 -0
data/app/models/easy_ml/dataset_history.rb +56 -0
data/app/models/easy_ml/datasource.rb +182 -0
data/app/models/easy_ml/datasource_history.rb +24 -0
data/app/models/easy_ml/datasources/base_datasource.rb +54 -0
data/app/models/easy_ml/datasources/file_datasource.rb +58 -0
data/app/models/easy_ml/datasources/polars_datasource.rb +89 -0
data/app/models/easy_ml/datasources/s3_datasource.rb +97 -0
data/app/models/easy_ml/deploy.rb +114 -0
data/app/models/easy_ml/event.rb +79 -0
data/app/models/easy_ml/feature.rb +437 -0
data/app/models/easy_ml/feature_history.rb +38 -0
data/app/models/easy_ml/model.rb +575 -41
data/app/models/easy_ml/model_file.rb +133 -0
data/app/models/easy_ml/model_file_history.rb +24 -0
data/app/models/easy_ml/model_history.rb +51 -0
data/app/models/easy_ml/models/base_model.rb +58 -0
data/app/models/easy_ml/models/hyperparameters/base.rb +99 -0
data/app/models/easy_ml/models/hyperparameters/xgboost/dart.rb +82 -0
data/app/models/easy_ml/models/hyperparameters/xgboost/gblinear.rb +82 -0
data/app/models/easy_ml/models/hyperparameters/xgboost/gbtree.rb +97 -0
data/app/models/easy_ml/models/hyperparameters/xgboost.rb +71 -0
data/app/models/easy_ml/models/xgboost/evals_callback.rb +138 -0
data/app/models/easy_ml/models/xgboost/progress_callback.rb +39 -0
data/app/models/easy_ml/models/xgboost.rb +544 -5
data/app/models/easy_ml/prediction.rb +44 -0
data/app/models/easy_ml/retraining_job.rb +278 -0
data/app/models/easy_ml/retraining_run.rb +184 -0
data/app/models/easy_ml/settings.rb +37 -0
data/app/models/easy_ml/splitter.rb +90 -0
data/app/models/easy_ml/splitters/base_splitter.rb +28 -0
data/app/models/easy_ml/splitters/date_splitter.rb +91 -0
data/app/models/easy_ml/splitters/predefined_splitter.rb +74 -0
data/app/models/easy_ml/splitters/random_splitter.rb +82 -0
data/app/models/easy_ml/tuner_job.rb +56 -0
data/app/models/easy_ml/tuner_run.rb +31 -0
data/app/models/splitter_history.rb +6 -0
data/app/serializers/easy_ml/column_serializer.rb +27 -0
data/app/serializers/easy_ml/dataset_serializer.rb +73 -0
data/app/serializers/easy_ml/datasource_serializer.rb +64 -0
data/app/serializers/easy_ml/feature_serializer.rb +27 -0
data/app/serializers/easy_ml/model_serializer.rb +90 -0
data/app/serializers/easy_ml/retraining_job_serializer.rb +22 -0
data/app/serializers/easy_ml/retraining_run_serializer.rb +39 -0
data/app/serializers/easy_ml/settings_serializer.rb +9 -0
data/app/views/layouts/easy_ml/application.html.erb +15 -0
data/config/initializers/resque.rb +3 -0
data/config/resque-pool.yml +6 -0
data/config/routes.rb +39 -0
data/config/spring.rb +1 -0
data/config/vite.json +15 -0
data/lib/easy_ml/configuration.rb +64 -0
data/lib/easy_ml/core/evaluators/base_evaluator.rb +53 -0
data/lib/easy_ml/core/evaluators/classification_evaluators.rb +126 -0
data/lib/easy_ml/core/evaluators/regression_evaluators.rb +66 -0
data/lib/easy_ml/core/model_evaluator.rb +161 -89
data/lib/easy_ml/core/tuner/adapters/base_adapter.rb +28 -18
data/lib/easy_ml/core/tuner/adapters/xgboost_adapter.rb +4 -25
data/lib/easy_ml/core/tuner.rb +123 -62
data/lib/easy_ml/core.rb +0 -3
data/lib/easy_ml/core_ext/hash.rb +24 -0
data/lib/easy_ml/core_ext/pathname.rb +11 -5
data/lib/easy_ml/data/date_converter.rb +90 -0
data/lib/easy_ml/data/filter_extensions.rb +31 -0
data/lib/easy_ml/data/polars_column.rb +126 -0
data/lib/easy_ml/data/polars_reader.rb +297 -0
data/lib/easy_ml/data/preprocessor.rb +280 -142
data/lib/easy_ml/data/simple_imputer.rb +255 -0
data/lib/easy_ml/data/splits/file_split.rb +252 -0
data/lib/easy_ml/data/splits/in_memory_split.rb +54 -0
data/lib/easy_ml/data/splits/split.rb +95 -0
data/lib/easy_ml/data/splits.rb +9 -0
data/lib/easy_ml/data/statistics_learner.rb +93 -0
data/lib/easy_ml/data/synced_directory.rb +341 -0
data/lib/easy_ml/data.rb +6 -2
data/lib/easy_ml/engine.rb +105 -6
data/lib/easy_ml/feature_store.rb +227 -0
data/lib/easy_ml/features.rb +61 -0
data/lib/easy_ml/initializers/inflections.rb +17 -3
data/lib/easy_ml/logging.rb +2 -2
data/lib/easy_ml/predict.rb +74 -0
data/lib/easy_ml/railtie/generators/migration/migration_generator.rb +192 -36
data/lib/easy_ml/railtie/templates/migration/create_easy_ml_column_histories.rb.tt +9 -0
data/lib/easy_ml/railtie/templates/migration/create_easy_ml_columns.rb.tt +25 -0
data/lib/easy_ml/railtie/templates/migration/create_easy_ml_dataset_histories.rb.tt +9 -0
data/lib/easy_ml/railtie/templates/migration/create_easy_ml_datasets.rb.tt +31 -0
data/lib/easy_ml/railtie/templates/migration/create_easy_ml_datasource_histories.rb.tt +9 -0
data/lib/easy_ml/railtie/templates/migration/create_easy_ml_datasources.rb.tt +16 -0
data/lib/easy_ml/railtie/templates/migration/create_easy_ml_deploys.rb.tt +24 -0
data/lib/easy_ml/railtie/templates/migration/create_easy_ml_events.rb.tt +20 -0
data/lib/easy_ml/railtie/templates/migration/create_easy_ml_feature_histories.rb.tt +14 -0
data/lib/easy_ml/railtie/templates/migration/create_easy_ml_features.rb.tt +32 -0
data/lib/easy_ml/railtie/templates/migration/create_easy_ml_model_file_histories.rb.tt +9 -0
data/lib/easy_ml/railtie/templates/migration/create_easy_ml_model_files.rb.tt +17 -0
data/lib/easy_ml/railtie/templates/migration/create_easy_ml_model_histories.rb.tt +9 -0
data/lib/easy_ml/railtie/templates/migration/create_easy_ml_models.rb.tt +20 -9
data/lib/easy_ml/railtie/templates/migration/create_easy_ml_predictions.rb.tt +17 -0
data/lib/easy_ml/railtie/templates/migration/create_easy_ml_retraining_jobs.rb.tt +77 -0
data/lib/easy_ml/railtie/templates/migration/create_easy_ml_settings.rb.tt +9 -0
data/lib/easy_ml/railtie/templates/migration/create_easy_ml_splitter_histories.rb.tt +9 -0
data/lib/easy_ml/railtie/templates/migration/create_easy_ml_splitters.rb.tt +15 -0
data/lib/easy_ml/railtie/templates/migration/create_easy_ml_tuner_jobs.rb.tt +40 -0
data/lib/easy_ml/support/est.rb +5 -1
data/lib/easy_ml/support/file_rotate.rb +79 -15
data/lib/easy_ml/support/file_support.rb +9 -0
data/lib/easy_ml/support/local_file.rb +24 -0
data/lib/easy_ml/support/lockable.rb +62 -0
data/lib/easy_ml/support/synced_file.rb +103 -0
data/lib/easy_ml/support/utc.rb +5 -1
data/lib/easy_ml/support.rb +6 -3
data/lib/easy_ml/version.rb +4 -1
data/lib/easy_ml.rb +7 -2
metadata +355 -72
data/app/models/easy_ml/models.rb +0 -5
data/lib/easy_ml/core/model.rb +0 -30
data/lib/easy_ml/core/model_core.rb +0 -181
data/lib/easy_ml/core/models/hyperparameters/base.rb +0 -34
data/lib/easy_ml/core/models/hyperparameters/xgboost.rb +0 -19
data/lib/easy_ml/core/models/xgboost.rb +0 -10
data/lib/easy_ml/core/models/xgboost_core.rb +0 -220
data/lib/easy_ml/core/models.rb +0 -10
data/lib/easy_ml/core/uploaders/model_uploader.rb +0 -24
data/lib/easy_ml/core/uploaders.rb +0 -7
data/lib/easy_ml/data/dataloader.rb +0 -6
data/lib/easy_ml/data/dataset/data/preprocessor/statistics.json +0 -31
data/lib/easy_ml/data/dataset/data/sample_info.json +0 -1
data/lib/easy_ml/data/dataset/dataset/files/sample_info.json +0 -1
data/lib/easy_ml/data/dataset/splits/file_split.rb +0 -140
data/lib/easy_ml/data/dataset/splits/in_memory_split.rb +0 -49
data/lib/easy_ml/data/dataset/splits/split.rb +0 -98
data/lib/easy_ml/data/dataset/splits.rb +0 -11
data/lib/easy_ml/data/dataset/splitters/date_splitter.rb +0 -43
data/lib/easy_ml/data/dataset/splitters.rb +0 -9
data/lib/easy_ml/data/dataset.rb +0 -430
data/lib/easy_ml/data/datasource/datasource_factory.rb +0 -60
data/lib/easy_ml/data/datasource/file_datasource.rb +0 -40
data/lib/easy_ml/data/datasource/merged_datasource.rb +0 -64
data/lib/easy_ml/data/datasource/polars_datasource.rb +0 -41
data/lib/easy_ml/data/datasource/s3_datasource.rb +0 -89
data/lib/easy_ml/data/datasource.rb +0 -33
data/lib/easy_ml/data/preprocessor/preprocessor.rb +0 -205
data/lib/easy_ml/data/preprocessor/simple_imputer.rb +0 -402
data/lib/easy_ml/deployment.rb +0 -5
data/lib/easy_ml/support/synced_directory.rb +0 -134
data/lib/easy_ml/transforms.rb +0 -29
/data/{lib/easy_ml/core → app/models/easy_ml}/models/hyperparameters.rb +0 -0

data/app/models/easy_ml/model.rb CHANGED Viewed

@@ -1,68 +1,602 @@
-require_relative "../../../lib/easy_ml/core/model"
+# == Schema Information
+#
+# Table name: easy_ml_models
+#
+#  id              :bigint           not null, primary key
+#  name            :string           not null
+#  model_type      :string
+#  status          :string
+#  dataset_id      :bigint
+#  model_file_id   :bigint
+#  configuration   :json
+#  version         :string           not null
+#  root_dir        :string
+#  file            :json
+#  sha             :string
+#  last_trained_at :datetime
+#  is_training     :boolean
+#  created_at      :datetime         not null
+#  updated_at      :datetime         not null
+#
+require_relative "models/hyperparameters"
 module EasyML
   class Model < ActiveRecord::Base
-    if ActiveRecord::Base.connection.data_source_exists?("easy_ml_models")
-      include EasyML::Core::ModelCore
-      self.table_name = "easy_ml_models"
-    else
-      # Placeholder if the table doesn't exist (keeps the file quiet)
-      def self.table_ready?
-        false
+    self.table_name = "easy_ml_models"
+    include Historiographer::Silent
+    historiographer_mode :snapshot_only
+    include EasyML::Concerns::Configurable
+    include EasyML::Concerns::Versionable
+    self.filter_attributes += [:configuration]
+    MODEL_OPTIONS = {
+      "xgboost" => "EasyML::Models::XGBoost",
+    }
+    MODEL_TYPES = [
+      {
+        value: "xgboost",
+        label: "XGBoost",
+        description: "Extreme Gradient Boosting, a scalable and accurate implementation of gradient boosting machines",
+      },
+    ].freeze
+    MODEL_NAMES = MODEL_OPTIONS.keys.freeze
+    MODEL_CONSTANTS = MODEL_OPTIONS.values.map(&:constantize)
+    add_configuration_attributes :task, :objective, :hyperparameters, :evaluator, :callbacks, :metrics
+    MODEL_CONSTANTS.flat_map(&:configuration_attributes).each do |attribute|
+      add_configuration_attributes attribute
+    end
+    belongs_to :dataset
+    belongs_to :model_file, class_name: "EasyML::ModelFile", foreign_key: "model_file_id", optional: true
+    has_one :retraining_job, class_name: "EasyML::RetrainingJob"
+    accepts_nested_attributes_for :retraining_job
+    has_many :retraining_runs, class_name: "EasyML::RetrainingRun"
+    has_many :deploys, class_name: "EasyML::Deploy"
+    scope :deployed, -> { EasyML::ModelHistory.deployed }
+    def latest_deploy
+      deploys.order(id: :desc).limit(1).last
+    end
+    after_initialize :bump_version, if: -> { new_record? }
+    after_initialize :set_defaults, if: -> { new_record? }
+    before_save :save_model_file, if: -> { is_fit? && !is_history_class? && model_changed? && !@skip_save_model_file }
+    VALID_TASKS = %i[regression classification].freeze
+    TASK_TYPES = [
+      {
+        value: "classification",
+        label: "Classification",
+        description: "Predict categorical outcomes or class labels",
+      },
+      {
+        value: "regression",
+        label: "Regression",
+        description: "Predict continuous numerical values",
+      },
+    ].freeze
+    validates :name, presence: true
+    validates :name, uniqueness: { case_sensitive: false }
+    validates :task, presence: true
+    validates :task, inclusion: {
+                       in: VALID_TASKS.map { |t| [t, t.to_s] }.flatten,
+                       message: "must be one of: #{VALID_TASKS.join(", ")}",
+                     }
+    validates :model_type, inclusion: { in: MODEL_NAMES }
+    validates :dataset_id, presence: true
+    validate :validate_metrics_allowed
+    before_save :set_root_dir
+    delegate :prepare_data, :preprocess, to: :adapter
+    STATUSES = %w[development inference retired]
+    STATUSES.each do |status|
+      define_method "#{status}?" do
+        self.status.to_sym == status.to_sym
       end
+    end
-      Rails.logger.info("Skipping EasyML::Model definition as the 'easy_ml_models' table doesn't exist.")
+    def training?
+      is_training == true
     end
-    scope :live, -> { where(is_live: true) }
-    attribute :root_dir, :string
-    after_initialize :apply_defaults
+    def train(async: true)
+      pending_run # Ensure we update the pending job before enqueuing in background so UI updates properly
+      update(is_training: true)
+      if async
+        EasyML::TrainingJob.perform_later(id)
+      else
+        actually_train
+      end
+    end
-    validate :only_one_model_is_live?
-    def only_one_model_is_live?
-      return if @marking_live
+    def get_retraining_job
+      if retraining_job
+        self.evaluator = retraining_job.evaluator
+        evaluator = self.evaluator.symbolize_keys
+      else
+        default_eval = Core::ModelEvaluator.default_evaluator(task)
+        self.evaluator = default_eval
+        evaluator = default_eval
+      end
+      retraining_job || create_retraining_job(
+        model: self,
+        active: false,
+        evaluator: evaluator,
+        metric: evaluator[:metric],
+        direction: evaluator[:direction],
+        threshold: evaluator[:threshold],
+        frequency: "month",
+        at: { hour: 0, day_of_month: 1 },
+      )
+    end
-      if previous_versions.live.count > 1
-        raise "Multiple previous versions of #{name} are live! This should never happen. Update previous versions to is_live=false before proceeding"
+    def pending_run
+      job = get_retraining_job
+      job.retraining_runs.find_or_create_by(status: "pending", model: self)
+    end
+    def actually_train(&progress_block)
+      lock_model do
+        run = pending_run
+        run.wrap_training do
+          best_params = nil
+          if run.should_tune?
+            best_params = hyperparameter_search(&progress_block)
+          end
+          fit(&progress_block)
+          save
+          [self, best_params]
+        end
+        update(is_training: false)
+        run.reload
+      ensure
+        unlock!
+      end
+    end
+    def unlock!
+      Support::Lockable.unlock!(lock_key)
+    end
+    def lock_model
+      with_lock do |client|
+        yield
+      end
+    end
+    def with_lock
+      EasyML::Support::Lockable.with_lock(lock_key, stale_timeout: 60, resources: 1) do |client|
+        yield client
+      end
+    end
+    def lock_key
+      "training:#{self.name}:#{self.id}"
+    end
+    def hyperparameter_search(&progress_block)
+      tuner = retraining_job.tuner_config.symbolize_keys
+      extra_params = {
+        evaluator: evaluator,
+        model: self,
+        dataset: dataset,
+      }.compact
+      tuner.merge!(extra_params)
+      tuner_instance = EasyML::Core::Tuner.new(tuner)
+      tuner_instance.tune(&progress_block).tap do |best_params|
+        best_params.each do |key, value|
+          self.hyperparameters.send("#{key}=", value)
+        end
       end
+    end
+    def deployment_status
+      status
+    end
+    def formatted_model_type
+      adapter.class.name.split("::").last
+    end
+    def formatted_version
+      return nil unless version
+      Time.strptime(version, "%Y%m%d%H%M%S").strftime("%B %-d, %Y at %-l:%M %p")
+    end
-      return unless previous_versions.live.any? && is_live
+    def last_run_at
+      last_run&.created_at
+    end
+    def last_run
+      retraining_runs.order(id: :desc).limit(1).last
+    end
+    def inference_version
+      latest_deploy&.model_version
+    end
+    alias_method :current_version, :inference_version
+    alias_method :latest_version, :inference_version
+    alias_method :deployed, :inference_version
-      errors.add(:is_live,
-                 "cannot mark model live when previous version is live. Explicitly use the mark_live method to mark this as the live version")
+    def hyperparameters
+      @hypers ||= adapter.build_hyperparameters(@hyperparameters)
     end
-    def mark_live
-      transaction do
-        self.class.where(name: name).where.not(id: id).update_all(is_live: false)
-        self.class.where(id: id).update_all(is_live: true)
+    def callbacks
+      @cbs ||= adapter.build_callbacks(@callbacks)
+    end
+    def predict(xs)
+      load_model!
+      adapter.predict(xs)
+    end
+    def save_model_file
+      raise "No trained model! Need to train model before saving (call model.fit)" unless is_fit?
+      return unless adapter.loaded?
+      model_file = get_model_file
+      bump_version(force: true)
+      path = model_file.full_path(version)
+      full_path = adapter.save_model_file(path)
+      model_file.upload(full_path)
+      model_file.save
+      self.model_file = model_file
+      cleanup
+    end
+    def feature_names
+      adapter.feature_names
+    end
+    def cleanup!
+      get_model_file&.cleanup!
+    end
+    def cleanup
+      get_model_file&.cleanup(files_to_keep)
+    end
+    def loaded?
+      model_file = get_model_file
+      return false if model_file.persisted? && !File.exist?(model_file.full_path.to_s)
+      file_exists = true
+      if model_file.present? && model_file.persisted? && model_file.full_path.present?
+        file_exists = File.exist?(model_file.full_path)
       end
+      loaded = adapter.loaded?
+      load_model_file unless loaded
+      file_exists && adapter.loaded?
     end
-    def previous_versions
-      EasyML::Model.where(name: name).order(id: :desc)
+    def model_changed?
+      return false unless is_fit?
+      return true if inference_version.nil?
+      return true if model_file.present? && !model_file.persisted?
+      return true if model_file.present? && model_file.fit? && inference_version.nil?
+      adapter.model_changed?(inference_version.sha)
+    end
+    def feature_importances
+      adapter.feature_importances
+    end
+    def fit_in_batches?
+      retraining_job.present? && retraining_job.batch_mode == true
+    end
+    def fit(tuning: false, x_train: nil, y_train: nil, x_valid: nil, y_valid: nil, &progress_block)
+      return fit_in_batches(**batch_args.merge!(tuning: tuning), &progress_block) if fit_in_batches?
+      dataset.refresh
+      adapter.fit(tuning: tuning, x_train: x_train, y_train: y_train, x_valid: x_valid, y_valid: y_valid, &progress_block)
+      @is_fit = true
+    end
+    def batch_args
+      defaults = {
+        batch_size: 1024,
+        batch_overlap: 3,
+        batch_key: nil,
+      }
+      overrides = { batch_size: retraining_job&.batch_size, batch_overlap: retraining_job&.batch_overlap, batch_key: retraining_job&.batch_key }.compact
+      defaults.merge!(overrides)
+    end
+    def batch_mode
+      retraining_job&.batch_mode || false
+    end
+    def prepare_callbacks(tune_started_at)
+      adapter.prepare_callbacks(tune_started_at)
+    end
+    def after_tuning
+      adapter.after_tuning
+    end
+    def fit_in_batches(tuning: false, batch_size: nil, batch_overlap: nil, batch_key: nil, checkpoint_dir: Rails.root.join("tmp", "xgboost_checkpoints"), &progress_block)
+      adapter.fit_in_batches(tuning: tuning, batch_size: batch_size, batch_overlap: batch_overlap, batch_key: batch_key, checkpoint_dir: checkpoint_dir, &progress_block)
+      @is_fit = true
+    end
+    attr_accessor :is_fit
+    def is_fit?
+      model_file = get_model_file
+      return true if model_file.present? && model_file.fit?
+      adapter.is_fit?
+    end
+    def deployable?
+      cannot_deploy_reasons.none?
+    end
+    def decode_labels(ys, col: nil)
+      dataset.decode_labels(ys, col: col)
+    end
+    def evaluate(y_pred: nil, y_true: nil, x_true: nil, evaluator: nil)
+      evaluator ||= self.evaluator
+      if y_pred.nil?
+        inputs = default_evaluation_inputs
+        y_pred = inputs[:y_pred]
+        y_true = inputs[:y_true]
+        x_true = inputs[:x_true]
+      end
+      EasyML::Core::ModelEvaluator.evaluate(model: self, y_pred: y_pred, y_true: y_true, x_true: x_true, evaluator: evaluator)
+    end
+    def evaluator
+      instance_variable_get(:@evaluator) || default_evaluator
+    end
+    def default_evaluator
+      return nil unless task.present?
+      EasyML::Core::ModelEvaluator.default_evaluator(task)
+    end
+    def get_params
+      @hyperparameters.to_h
+    end
+    def evals
+      last_run&.metrics || {}
+    end
+    def metric_accessor(metric)
+      metrics = last_run.metrics.symbolize_keys
+      metrics.dig(metric.to_sym)
+    end
+    EasyML::Core::ModelEvaluator.metrics.each do |metric_name|
+      define_method metric_name do
+        metric_accessor(metric_name)
+      end
+    end
+    EasyML::Core::ModelEvaluator.callbacks = lambda do |metric_name|
+      EasyML::Model.define_method metric_name do
+        metric_accessor(metric_name)
+      end
+    end
+    def allowed_metrics
+      EasyML::Core::ModelEvaluator.metrics(task).map(&:to_s)
+    end
+    def default_metrics
+      return [] unless task.present?
+      case task.to_sym
+      when :regression
+        %w[mean_absolute_error mean_squared_error root_mean_squared_error r2_score]
+      when :classification
+        %w[accuracy_score precision_score recall_score f1_score]
+      else
+        []
+      end
+    end
+    def self.constants
+      {
+        objectives: objectives_by_model_type,
+        metrics: metrics_by_task,
+        tasks: TASK_TYPES,
+        timezone: EasyML::Configuration.timezone_label,
+        retraining_job_constants: EasyML::RetrainingJob.constants,
+        tuner_job_constants: EasyML::TunerJob.constants,
+      }
+    end
+    def self.metrics_by_task
+      EasyML::Core::ModelEvaluator.metrics_by_task
+    end
+    def self.objectives_by_model_type
+      MODEL_OPTIONS.inject({}) do |h, (k, v)|
+        h.tap do
+          h[k] = v.constantize.const_get(:OBJECTIVES_FRONTEND)
+        end
+      end.deep_symbolize_keys
+    end
+    def attributes
+      super.merge!(
+        hyperparameters: hyperparameters.to_h,
+      )
+    end
+    class CannotdeployError < StandardError
+    end
+    def deploy(async: true)
+      last_run.deploy(async: async)
+    end
+    def actually_deploy
+      raise CannotdeployError, cannot_deploy_reasons.first if cannot_deploy_reasons.any?
+      # Prepare the inference model by freezing + saving the model, dataset, and datasource
+      # (This creates ModelHistory, DatasetHistory, etc)
+      save_model_file
+      self.sha = model_file.sha
+      save
+      dataset.upload_remote_files
+      snapshot.tap do
+        # Prepare the model to be retrained (reset values so they don't conflict with our snapshotted version)
+        bump_version(force: true)
+        dataset.bump_versions(version)
+        self.model_file = new_model_file!
+        save
+      end
+    end
+    def cannot_deploy_reasons
+      [
+        is_fit? ? nil : "Model has not been trained",
+        dataset.target.present? ? nil : "Dataset has no target",
+        !dataset.datasource.in_memory? ? nil : "Cannot perform inference using an in-memory datasource",
+      ].compact
+    end
+    def root_dir=(value)
+      raise "Cannot override value of root_dir!" unless value.to_s == root_dir.to_s
+      write_attribute(:root_dir, value)
+    end
+    def set_root_dir
+      write_attribute(:root_dir, root_dir)
+    end
+    def root_dir
+      EasyML::Engine.root_dir.join("models").join(underscored_name).to_s
+    end
+    def load_model(force: false)
+      download_model_file(force: force)
+      load_model_file
+    end
+    def metrics=(value)
+      value = [value] unless value.is_a?(Array)
+      value = value.map(&:to_s)
+      value = value.uniq
+      @metrics = value
+    end
+    def adapter
+      @adapter ||= begin
+          adapter_class = MODEL_OPTIONS[model_type]
+          raise "Don't know how to use model adapter #{model_type}!" unless adapter_class.present?
+          adapter_class.constantize.new(self)
+        end
     end
     private
+    def default_evaluation_inputs
+      x_true, y_true = dataset.test(split_ys: true)
+      y_pred = predict(x_true)
+      {
+        x_true: x_true,
+        y_true: y_true,
+        y_pred: y_pred,
+      }
+    end
+    def underscored_name
+      name.gsub(/\s{2,}/, " ").gsub(/\s/, "_").downcase
+    end
+    def get_model_file
+      model_file || new_model_file!
+    end
+    def new_model_file!
+      build_model_file(
+        root_dir: root_dir,
+        model: self,
+        s3_bucket: EasyML::Configuration.s3_bucket,
+        s3_region: EasyML::Configuration.s3_region,
+        s3_access_key_id: EasyML::Configuration.s3_access_key_id,
+        s3_secret_access_key: EasyML::Configuration.s3_secret_access_key,
+        s3_prefix: prefix,
+      )
+    end
+    def prefix
+      s3_prefix = EasyML::Configuration.s3_prefix
+      s3_prefix.present? ? File.join(s3_prefix, name) : name
+    end
+    def load_model!
+      load_model(force: true)
+      load_dataset
+    end
+    def load_dataset
+      dataset.load_dataset
+    end
+    def load_model_file
+      return unless model_file&.full_path && File.exist?(model_file.full_path)
+      adapter.load_model_file(model_file.full_path)
+    end
+    def download_model_file(force: false)
+      return unless persisted?
+      return if loaded? && !force
+      get_model_file.download
+    end
     def files_to_keep
-      live_models = self.class.live
+      inference_models = EasyML::ModelHistory.deployed
+      training_models = EasyML::Model.all
-      recent_copies = live_models.flat_map do |live|
-        # Fetch all models with the same name
-        self.class.where(name: live.name).where(is_live: false).order(created_at: :desc).limit(live.name == name ? 4 : 5)
-      end
+      ([self] + training_models + inference_models).compact.map(&:model_file).compact.map(&:full_path).uniq
+    end
-      recent_versions = self.class
-                            .where.not(
-                              "EXISTS (SELECT 1 FROM easy_ml_models e2 WHERE e2.name = easy_ml_models.name AND e2.is_live = true)"
-                            )
-                            .where("created_at >= ?", 2.days.ago)
-                            .order(created_at: :desc)
-                            .group_by(&:name)
-                            .flat_map { |_, models| models.take(5) }
+    def underscored_name
+      name = self.name || self.class.name.split("::").last
+      name.gsub(/\s{2,}/, " ").gsub(/\s/, "_").downcase
+    end
-      ([self] + recent_versions + recent_copies + live_models).compact.map(&:file).map(&:path).uniq
+    def set_defaults
+      self.model_type ||= "xgboost"
+      self.status ||= :training
+      self.metrics ||= default_metrics
+    end
+    def validate_metrics_allowed
+      unknown_metrics = metrics.select { |metric| allowed_metrics.exclude?(metric) }
+      return unless unknown_metrics.any?
+      errors.add(:metrics,
+                 "don't know how to handle #{"metrics".pluralize(unknown_metrics)} #{unknown_metrics.join(", ")}, use EasyML::Core::ModelEvaluator.register(:name, Evaluator, :regression|:classification)")
     end
   end
 end
+require_relative "models/xgboost"