RubyGems - red-candle - Versions diffs - 1.8.0.pre3-aarch64-linux - Mend

red-candle 1.8.0.pre3-aarch64-linux

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (76) hide show

checksums.yaml +7 -0
data/Cargo.lock +5021 -0
data/Cargo.toml +6 -0
data/Gemfile +3 -0
data/LICENSE +22 -0
data/README.md +1171 -0
data/Rakefile +167 -0
data/bin/console +11 -0
data/bin/setup +17 -0
data/ext/candle/Cargo.toml +38 -0
data/ext/candle/build.rs +117 -0
data/ext/candle/extconf.rb +79 -0
data/ext/candle/rustfmt.toml +63 -0
data/ext/candle/src/gvl.rs +58 -0
data/ext/candle/src/lib.rs +59 -0
data/ext/candle/src/llm/constrained_generation_test.rs +395 -0
data/ext/candle/src/llm/gemma.rs +313 -0
data/ext/candle/src/llm/generation_config.rs +63 -0
data/ext/candle/src/llm/glm4.rs +236 -0
data/ext/candle/src/llm/granite.rs +308 -0
data/ext/candle/src/llm/granitemoehybrid.rs +315 -0
data/ext/candle/src/llm/llama.rs +396 -0
data/ext/candle/src/llm/mistral.rs +309 -0
data/ext/candle/src/llm/mod.rs +49 -0
data/ext/candle/src/llm/phi.rs +369 -0
data/ext/candle/src/llm/quantized_gguf.rs +734 -0
data/ext/candle/src/llm/qwen.rs +261 -0
data/ext/candle/src/llm/qwen3.rs +257 -0
data/ext/candle/src/llm/text_generation.rs +284 -0
data/ext/candle/src/ruby/device.rs +234 -0
data/ext/candle/src/ruby/dtype.rs +39 -0
data/ext/candle/src/ruby/embedding_model.rs +477 -0
data/ext/candle/src/ruby/errors.rs +16 -0
data/ext/candle/src/ruby/llm.rs +730 -0
data/ext/candle/src/ruby/mod.rs +24 -0
data/ext/candle/src/ruby/ner.rs +444 -0
data/ext/candle/src/ruby/reranker.rs +488 -0
data/ext/candle/src/ruby/result.rs +3 -0
data/ext/candle/src/ruby/structured.rs +92 -0
data/ext/candle/src/ruby/tensor.rs +731 -0
data/ext/candle/src/ruby/tokenizer.rs +343 -0
data/ext/candle/src/ruby/utils.rs +96 -0
data/ext/candle/src/ruby/vlm.rs +330 -0
data/ext/candle/src/structured/integration_test.rs +130 -0
data/ext/candle/src/structured/mod.rs +31 -0
data/ext/candle/src/structured/schema_processor.rs +215 -0
data/ext/candle/src/structured/vocabulary_adapter.rs +152 -0
data/ext/candle/src/structured/vocabulary_adapter_real_test.rs +66 -0
data/ext/candle/src/structured/vocabulary_adapter_simple_test.rs +70 -0
data/ext/candle/src/tokenizer/loader.rs +108 -0
data/ext/candle/src/tokenizer/mod.rs +104 -0
data/ext/candle/tests/device_tests.rs +43 -0
data/ext/candle/tests/tensor_tests.rs +162 -0
data/lib/candle/3.1/candle.so +0 -0
data/lib/candle/3.2/candle.so +0 -0
data/lib/candle/3.3/candle.so +0 -0
data/lib/candle/3.4/candle.so +0 -0
data/lib/candle/4.0/candle.so +0 -0
data/lib/candle/agent.rb +68 -0
data/lib/candle/build_info.rb +67 -0
data/lib/candle/device_utils.rb +10 -0
data/lib/candle/embedding_model.rb +75 -0
data/lib/candle/embedding_model_type.rb +31 -0
data/lib/candle/llm.rb +595 -0
data/lib/candle/logger.rb +149 -0
data/lib/candle/ner.rb +368 -0
data/lib/candle/reranker.rb +45 -0
data/lib/candle/tensor.rb +99 -0
data/lib/candle/tokenizer.rb +139 -0
data/lib/candle/tool.rb +47 -0
data/lib/candle/tool_call_parser.rb +57 -0
data/lib/candle/version.rb +5 -0
data/lib/candle/vlm.rb +31 -0
data/lib/candle.rb +29 -0
data/lib/red-candle.rb +1 -0
metadata +309 -0

data/ext/candle/src/ruby/tokenizer.rs ADDED Viewed

@@ -0,0 +1,343 @@
+use magnus::{function, method, prelude::*, Error, Module, RArray, RHash, RModule, Ruby, TryConvert};
+use crate::tokenizer::{TokenizerWrapper as InnerTokenizer, loader::TokenizerLoader};
+use crate::ruby::Result;
+#[derive(Clone, Debug)]
+#[magnus::wrap(class = "Candle::Tokenizer", free_immediately, size)]
+pub struct Tokenizer(pub InnerTokenizer);
+impl Tokenizer {
+    /// Create a new tokenizer from a file path
+    pub fn from_file(path: String) -> Result<Self> {
+        let ruby = Ruby::get().unwrap();
+        let tokenizer = TokenizerLoader::from_file(&path)
+            .map_err(|e| Error::new(ruby.exception_runtime_error(), e.to_string()))?;
+        Ok(Self(InnerTokenizer::new(tokenizer)))
+    }
+    /// Create a new tokenizer from HuggingFace model ID
+    pub fn from_pretrained(model_id: String) -> Result<Self> {
+        let ruby = Ruby::get().unwrap();
+        let runtime_error = ruby.exception_runtime_error();
+        // Use tokio runtime for async operations
+        let rt = tokio::runtime::Runtime::new()
+            .map_err(|e| Error::new(runtime_error, format!("Failed to create runtime: {}", e)))?;
+        let tokenizer = rt.block_on(async {
+            TokenizerLoader::from_hf_hub(&model_id, None).await
+        })
+        .map_err(|e| Error::new(runtime_error, e.to_string()))?;
+        Ok(Self(InnerTokenizer::new(tokenizer)))
+    }
+    /// Encode text into token IDs
+    pub fn encode(&self, text: String, add_special_tokens: Option<bool>) -> Result<RArray> {
+        let ruby = Ruby::get().unwrap();
+        let add_special = add_special_tokens.unwrap_or(true);
+        let token_ids = self.0.encode(&text, add_special)
+            .map_err(|e| Error::new(ruby.exception_runtime_error(), e.to_string()))?;
+        Ok(ruby.ary_from_vec(token_ids.into_iter().map(|id| id as i64).collect()))
+    }
+    /// Encode text into token strings (words/subwords)
+    pub fn encode_to_tokens(&self, text: String, add_special_tokens: Option<bool>) -> Result<RArray> {
+        let ruby = Ruby::get().unwrap();
+        let runtime_error = ruby.exception_runtime_error();
+        let add_special = add_special_tokens.unwrap_or(true);
+        let token_ids = self.0.encode(&text, add_special)
+            .map_err(|e| Error::new(runtime_error, e.to_string()))?;
+        let mut tokens = Vec::new();
+        for id in token_ids {
+            let token = self.0.token_to_piece(id)
+                .map_err(|e| Error::new(runtime_error, e.to_string()))?;
+            tokens.push(token);
+        }
+        Ok(ruby.ary_from_vec(tokens))
+    }
+    /// Encode multiple texts in batch
+    pub fn encode_batch(&self, texts: RArray, add_special_tokens: Option<bool>) -> Result<RArray> {
+        let ruby = Ruby::get().unwrap();
+        let runtime_error = ruby.exception_runtime_error();
+        let texts: Vec<String> = texts.to_vec()?;
+        let add_special = add_special_tokens.unwrap_or(true);
+        let token_ids_batch = self.0.encode_batch(texts, add_special)
+            .map_err(|e| Error::new(runtime_error, e.to_string()))?;
+        let result = ruby.ary_new();
+        for token_ids in token_ids_batch {
+            result.push(ruby.ary_from_vec(token_ids.into_iter().map(|id| id as i64).collect()))?;
+        }
+        Ok(result)
+    }
+    /// Encode multiple texts in batch, returning token strings
+    pub fn encode_batch_to_tokens(&self, texts: RArray, add_special_tokens: Option<bool>) -> Result<RArray> {
+        let ruby = Ruby::get().unwrap();
+        let runtime_error = ruby.exception_runtime_error();
+        let texts: Vec<String> = texts.to_vec()?;
+        let add_special = add_special_tokens.unwrap_or(true);
+        let token_ids_batch = self.0.encode_batch(texts, add_special)
+            .map_err(|e| Error::new(runtime_error, e.to_string()))?;
+        let result = ruby.ary_new();
+        for token_ids in token_ids_batch {
+            let mut tokens = Vec::new();
+            for id in token_ids {
+                let token = self.0.token_to_piece(id)
+                    .map_err(|e| Error::new(runtime_error, e.to_string()))?;
+                tokens.push(token);
+            }
+            result.push(ruby.ary_from_vec(tokens))?;
+        }
+        Ok(result)
+    }
+    /// Encode text and return both token IDs and token strings
+    pub fn encode_with_tokens(&self, text: String, add_special_tokens: Option<bool>) -> Result<RHash> {
+        let ruby = Ruby::get().unwrap();
+        let runtime_error = ruby.exception_runtime_error();
+        let add_special = add_special_tokens.unwrap_or(true);
+        let token_ids = self.0.encode(&text, add_special)
+            .map_err(|e| Error::new(runtime_error, e.to_string()))?;
+        let mut tokens = Vec::new();
+        for &id in &token_ids {
+            let token = self.0.token_to_piece(id)
+                .map_err(|e| Error::new(runtime_error, e.to_string()))?;
+            tokens.push(token);
+        }
+        let hash = ruby.hash_new();
+        hash.aset(ruby.to_symbol("ids"), ruby.ary_from_vec(token_ids.into_iter().map(|id| id as i64).collect()))?;
+        hash.aset(ruby.to_symbol("tokens"), ruby.ary_from_vec(tokens))?;
+        Ok(hash)
+    }
+    /// Decode token IDs back to text
+    pub fn decode(&self, token_ids: RArray, skip_special_tokens: Option<bool>) -> Result<String> {
+        let ruby = Ruby::get().unwrap();
+        let token_ids: Vec<i64> = token_ids.to_vec()?;
+        let token_ids: Vec<u32> = token_ids.into_iter()
+            .map(|id| id as u32)
+            .collect();
+        let skip_special = skip_special_tokens.unwrap_or(true);
+        self.0.decode(&token_ids, skip_special)
+            .map_err(|e| Error::new(ruby.exception_runtime_error(), e.to_string()))
+    }
+    /// Get the string representation of a single token ID
+    pub fn id_to_token(&self, token_id: i64) -> Result<String> {
+        let ruby = Ruby::get().unwrap();
+        self.0.token_to_piece(token_id as u32)
+            .map_err(|e| Error::new(ruby.exception_runtime_error(), e.to_string()))
+    }
+    /// Get the vocabulary as a hash of token string to ID
+    pub fn get_vocab(&self, with_added_tokens: Option<bool>) -> Result<RHash> {
+        let ruby = Ruby::get().unwrap();
+        let with_added = with_added_tokens.unwrap_or(true);
+        let vocab = self.0.inner().get_vocab(with_added);
+        let hash = ruby.hash_new();
+        for (token, id) in vocab {
+            hash.aset(token, id as i64)?;
+        }
+        Ok(hash)
+    }
+    /// Get vocabulary size
+    pub fn vocab_size(&self, with_added_tokens: Option<bool>) -> usize {
+        let with_added = with_added_tokens.unwrap_or(true);
+        self.0.inner().get_vocab_size(with_added)
+    }
+    /// Enable padding - returns a new tokenizer with padding enabled
+    pub fn with_padding(&self, kwargs: RHash) -> Result<Self> {
+        use tokenizers::{PaddingParams, PaddingStrategy, PaddingDirection};
+        let ruby = Ruby::get().unwrap();
+        let mut params = PaddingParams::default();
+        // Extract parameters from kwargs
+        if let Some(length) = kwargs.get(ruby.to_symbol("length")) {
+            if let Ok(len) = usize::try_convert(length) {
+                params.strategy = PaddingStrategy::Fixed(len);
+            }
+        }
+        if let Some(max_length) = kwargs.get(ruby.to_symbol("max_length")) {
+            if let Ok(_) = usize::try_convert(max_length) {
+                params.strategy = PaddingStrategy::BatchLongest;
+            }
+        }
+        if let Some(direction) = kwargs.get(ruby.to_symbol("direction")) {
+            if let Ok(dir) = String::try_convert(direction) {
+                params.direction = match dir.as_str() {
+                    "right" => PaddingDirection::Right,
+                    "left" => PaddingDirection::Left,
+                    _ => PaddingDirection::Right,
+                };
+            }
+        }
+        if let Some(pad_id) = kwargs.get(ruby.to_symbol("pad_id")) {
+            if let Ok(id) = u32::try_convert(pad_id) {
+                params.pad_id = id;
+            }
+        }
+        if let Some(pad_token) = kwargs.get(ruby.to_symbol("pad_token")) {
+            if let Ok(token) = String::try_convert(pad_token) {
+                params.pad_token = token;
+            }
+        }
+        let mut new_tokenizer = self.0.clone();
+        let _ = new_tokenizer.inner_mut().with_padding(Some(params));
+        Ok(Self(new_tokenizer))
+    }
+    /// Enable truncation - returns a new tokenizer with truncation enabled
+    pub fn with_truncation(&self, max_length: usize) -> Result<Self> {
+        use tokenizers::{TruncationParams, TruncationStrategy, TruncationDirection};
+        let params = TruncationParams {
+            max_length,
+            strategy: TruncationStrategy::LongestFirst,
+            stride: 0,
+            direction: TruncationDirection::Right,
+        };
+        let mut new_tokenizer = self.0.clone();
+        let _ = new_tokenizer.inner_mut().with_truncation(Some(params));
+        Ok(Self(new_tokenizer))
+    }
+    /// Get special tokens information
+    pub fn get_special_tokens(&self) -> Result<RHash> {
+        let ruby = Ruby::get().unwrap();
+        let hash = ruby.hash_new();
+        // Common special tokens
+        let special_tokens = vec![
+            ("[CLS]", "cls_token"),
+            ("[SEP]", "sep_token"),
+            ("[PAD]", "pad_token"),
+            ("[UNK]", "unk_token"),
+            ("[MASK]", "mask_token"),
+            ("<s>", "bos_token"),
+            ("</s>", "eos_token"),
+        ];
+        let vocab = self.0.inner().get_vocab(true);
+        for (token, name) in special_tokens {
+            if let Some(id) = vocab.get(token) {
+                hash.aset(name, *id as i64)?;
+            }
+        }
+        Ok(hash)
+    }
+    /// Get tokenizer options as a hash
+    pub fn options(&self) -> Result<RHash> {
+        let ruby = Ruby::get().unwrap();
+        let hash = ruby.hash_new();
+        // Get vocab size
+        hash.aset("vocab_size", self.vocab_size(Some(true)))?;
+        hash.aset("vocab_size_base", self.vocab_size(Some(false)))?;
+        // Get special tokens info
+        let special_tokens = self.get_special_tokens()?;
+        hash.aset("special_tokens", special_tokens)?;
+        // Get padding/truncation info if available
+        let inner_tokenizer = self.0.inner();
+        // Check if padding is enabled
+        if let Some(_padding) = inner_tokenizer.get_padding() {
+            let padding_info = ruby.hash_new();
+            padding_info.aset("enabled", true)?;
+            hash.aset("padding", padding_info)?;
+        }
+        // Check if truncation is enabled
+        if let Some(truncation) = inner_tokenizer.get_truncation() {
+            let truncation_info = ruby.hash_new();
+            truncation_info.aset("enabled", true)?;
+            truncation_info.aset("max_length", truncation.max_length)?;
+            hash.aset("truncation", truncation_info)?;
+        }
+        Ok(hash)
+    }
+    /// String representation
+    pub fn inspect(&self) -> String {
+        let vocab_size = self.vocab_size(Some(true));
+        let special_tokens = self.get_special_tokens()
+            .ok()
+            .map(|h| h.len())
+            .unwrap_or(0);
+        let mut parts = vec![format!("#<Candle::Tokenizer vocab_size={}", vocab_size)];
+        if special_tokens > 0 {
+            parts.push(format!("special_tokens={}", special_tokens));
+        }
+        // Check for padding/truncation
+        let inner_tokenizer = self.0.inner();
+        if inner_tokenizer.get_padding().is_some() {
+            parts.push("padding=enabled".to_string());
+        }
+        if let Some(truncation) = inner_tokenizer.get_truncation() {
+            parts.push(format!("truncation={}", truncation.max_length));
+        }
+        parts.join(" ") + ">"
+    }
+}
+pub fn init(rb_candle: RModule) -> Result<()> {
+    let ruby = Ruby::get().unwrap();
+    let tokenizer_class = rb_candle.define_class("Tokenizer", ruby.class_object())?;
+    // Class methods
+    tokenizer_class.define_singleton_method("from_file", function!(Tokenizer::from_file, 1))?;
+    tokenizer_class.define_singleton_method("from_pretrained", function!(Tokenizer::from_pretrained, 1))?;
+    // Instance methods
+    tokenizer_class.define_method("encode", method!(Tokenizer::encode, 2))?;
+    tokenizer_class.define_method("encode_to_tokens", method!(Tokenizer::encode_to_tokens, 2))?;
+    tokenizer_class.define_method("encode_with_tokens", method!(Tokenizer::encode_with_tokens, 2))?;
+    tokenizer_class.define_method("encode_batch", method!(Tokenizer::encode_batch, 2))?;
+    tokenizer_class.define_method("encode_batch_to_tokens", method!(Tokenizer::encode_batch_to_tokens, 2))?;
+    tokenizer_class.define_method("decode", method!(Tokenizer::decode, 2))?;
+    tokenizer_class.define_method("id_to_token", method!(Tokenizer::id_to_token, 1))?;
+    tokenizer_class.define_method("get_vocab", method!(Tokenizer::get_vocab, 1))?;
+    tokenizer_class.define_method("vocab_size", method!(Tokenizer::vocab_size, 1))?;
+    tokenizer_class.define_method("with_padding", method!(Tokenizer::with_padding, 1))?;
+    tokenizer_class.define_method("with_truncation", method!(Tokenizer::with_truncation, 1))?;
+    tokenizer_class.define_method("get_special_tokens", method!(Tokenizer::get_special_tokens, 0))?;
+    tokenizer_class.define_method("options", method!(Tokenizer::options, 0))?;
+    tokenizer_class.define_method("inspect", method!(Tokenizer::inspect, 0))?;
+    tokenizer_class.define_method("to_s", method!(Tokenizer::inspect, 0))?;
+    Ok(())
+}

data/ext/candle/src/ruby/utils.rs ADDED Viewed

@@ -0,0 +1,96 @@
+use magnus::{function, Module, Object};
+use ::candle_core::Tensor as CoreTensor;
+use crate::ruby::Result;
+/// Ensures the HuggingFace cache directory exists before Api::new() is called.
+///
+/// The hf_hub crate stores downloaded models in a "hub" subdirectory under the
+/// cache root. When the parent directory doesn't exist, hf_hub may fail to
+/// create the full path or silently produce an empty cache. This function
+/// pre-creates the directory tree to avoid the race condition described in
+/// issue #72.
+///
+/// Resolution order for the cache root:
+///   1. $HF_HOME (if set)
+///   2. $XDG_CACHE_HOME/huggingface (if XDG_CACHE_HOME is set)
+///   3. ~/.cache/huggingface
+pub fn ensure_hf_cache_dir() {
+    let cache_root = if let Ok(hf_home) = std::env::var("HF_HOME") {
+        std::path::PathBuf::from(hf_home)
+    } else if let Ok(xdg) = std::env::var("XDG_CACHE_HOME") {
+        std::path::PathBuf::from(xdg).join("huggingface")
+    } else if let Ok(home) = std::env::var("HOME") {
+        std::path::PathBuf::from(home).join(".cache").join("huggingface")
+    } else {
+        return;
+    };
+    let hub_dir = cache_root.join("hub");
+    let _ = std::fs::create_dir_all(hub_dir);
+}
+pub fn actual_index(t: &CoreTensor, dim: usize, index: i64) -> candle_core::Result<usize> {
+    let dim = t.dim(dim)?;
+    if 0 <= index {
+        let index = index as usize;
+        if dim <= index {
+            candle_core::bail!("index {index} is too large for tensor dimension {dim}")
+        }
+        Ok(index)
+    } else {
+        if (dim as i64) < -index {
+            candle_core::bail!("index {index} is too low for tensor dimension {dim}")
+        }
+        Ok((dim as i64 + index) as usize)
+    }
+}
+pub fn actual_dim(t: &CoreTensor, dim: i64) -> candle_core::Result<usize> {
+    let rank = t.rank();
+    if 0 <= dim {
+        let dim = dim as usize;
+        if rank <= dim {
+            candle_core::bail!("dimension index {dim} is too large for tensor rank {rank}")
+        }
+        Ok(dim)
+    } else {
+        if (rank as i64) < -dim {
+            candle_core::bail!("dimension index {dim} is too low for tensor rank {rank}")
+        }
+        Ok((rank as i64 + dim) as usize)
+    }
+}
+/// Returns true if the 'cuda' backend is available.
+/// &RETURNS&: bool
+fn cuda_is_available() -> bool {
+    candle_core::utils::cuda_is_available()
+}
+/// Returns true if candle was compiled with 'accelerate' support.
+/// &RETURNS&: bool
+fn has_accelerate() -> bool {
+    candle_core::utils::has_accelerate()
+}
+/// Returns true if candle was compiled with MKL support.
+/// &RETURNS&: bool
+fn has_mkl() -> bool {
+    candle_core::utils::has_mkl()
+}
+/// Returns the number of threads used by the candle.
+/// &RETURNS&: int
+fn get_num_threads() -> usize {
+    candle_core::utils::get_num_threads()
+}
+pub fn candle_utils(rb_candle: magnus::RModule) -> Result<()> {
+    let rb_utils = rb_candle.define_module("Utils")?;
+    rb_utils.define_singleton_method("cuda_is_available", function!(cuda_is_available, 0))?;
+    rb_utils.define_singleton_method("get_num_threads", function!(get_num_threads, 0))?;
+    rb_utils.define_singleton_method("has_accelerate", function!(has_accelerate, 0))?;
+    rb_utils.define_singleton_method("has_mkl", function!(has_mkl, 0))?;
+    Ok(())
+}