RubyGems - patchwork_csv_utils - Versions diffs - 0.1.7-x86_64-darwin → 0.1.9-x86_64-darwin - Mend

patchwork_csv_utils 0.1.7-x86_64-darwin → 0.1.9-x86_64-darwin

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (11) hide show

checksums.yaml +4 -4
data/Gemfile.lock +2 -2
data/ext/csv_utils/src/utils/csv.rs +31 -10
data/ext/csv_utils/src/utils/mod.rs +4 -0
data/ext/csv_utils/src/utils/xls.rs +9 -2
data/lib/csv_utils/2.7/csv_utils.bundle +0 -0
data/lib/csv_utils/3.0/csv_utils.bundle +0 -0
data/lib/csv_utils/3.1/csv_utils.bundle +0 -0
data/lib/csv_utils/3.2/csv_utils.bundle +0 -0
data/lib/csv_utils/version.rb +1 -1
metadata +2 -2

checksums.yaml CHANGED Viewed

@@ -1,7 +1,7 @@
 ---
 SHA256:
-  metadata.gz: 6716d509dcd08fa0114772079eb4ee4c910d9fcba2e239292661f7394ae20579
-  data.tar.gz: 97b20c9b75784359b32bf352156827c62f1d63d29cb00833ce826ae9db1ba08a
+  metadata.gz: 2e212bd3e73eeacfee9ebfcb560843920d212939254bfff6ffef90ca3a36fe42
+  data.tar.gz: a22f483c32e99467a020e3ff9a64809fbf7d9946974da06f565f27dc27b46c9b
 SHA512:
-  metadata.gz: 4cb36630ed56de19331bc54206aaed38cfe1901b68ca4b4822c16d5141d8f0a7e374fa1c508b951dbf9182bcef3ffa5f2e0c8fa116b4ed63b148f6ebbddbf076
-  data.tar.gz: 5cc6c6c1a0edf9ef86b42fab23aaa2937b1a80fcad5518a1f15fd3fe22d0ace8d3a534bac85f46a83a25a1dadc6328d210806f616f561dc9fb5bbe712e2f5a8b
+  metadata.gz: 2d731b4b50a025bee35941e48a5f5bdc4f57c0a829c69daa66610f08b354370a52502f12a2c28aab85260dc05b02d74d421a48f8d661a0cc9914546f9ed01d86
+  data.tar.gz: b46e0f9280ee98c6f4439dff004c0e9716ae61cbae2d615e1d0b81adb4bdd3b489b460af42cf4b436c315dfd8347dfb5069bafbb43117c678343002123165a0f

data/Gemfile.lock CHANGED Viewed

@@ -1,7 +1,7 @@
 PATH
   remote: .
   specs:
-    patchwork_csv_utils (0.1.7)
+    patchwork_csv_utils (0.1.9)
 GEM
   remote: https://rubygems.org/
@@ -67,4 +67,4 @@ DEPENDENCIES
   rubocop (~> 1.21)
 BUNDLED WITH
-   2.4.4
+   2.4.10

data/ext/csv_utils/src/utils/csv.rs CHANGED Viewed

@@ -3,9 +3,9 @@ use std::fs::File;
 use chrono::{NaiveDate, NaiveDateTime, NaiveTime, Utc};
 use csv::{StringRecord, Writer};
-use magnus::{RArray, Ruby};
+use magnus::{Error, RArray, Ruby};
-use crate::utils::{FileExtension, magnus_err, missing_header};
+use crate::utils::{FileExtension, magnus_err, missing_header, to_datetime_error};
 pub fn transform_csv(ruby: &Ruby, csv_path: String, target_path: String, exclusions: RArray) -> magnus::error::Result<()> {
     if !csv_path.has_extension(&["csv"]) {
@@ -19,6 +19,7 @@ pub fn transform_csv(ruby: &Ruby, csv_path: String, target_path: String, exclusi
     let mut wtr = Writer::from_path(target_path).map_err(|e| magnus_err(ruby, e, "target_path"))?;
     let headers = csv.headers().map_err(|e| magnus_err(ruby, e, "csv_path headers"))?;
     let header_map: HashMap<String, usize> = headers.iter().enumerate().map(|(i, h)| (h.to_string(), i)).collect();
+    let inverse_header_map: HashMap<usize, String> = headers.iter().enumerate().map(|(i, h)| (i, h.to_string())).collect();
     wtr.write_byte_record(headers.as_byte_record()).map_err(|e| magnus_err(ruby, e, "write_byte_record"))?;
@@ -41,13 +42,13 @@ pub fn transform_csv(ruby: &Ruby, csv_path: String, target_path: String, exclusi
         let record = record.iter().enumerate().map(|(i, c)| {
             let c = c.trim_end();
             if i == *date {
-                let current = string_to_datetime(c).ok_or(to_datetime_error(ruby, c, ri, i))?;
+                let current = string_to_datetime(c).ok_or(to_datetime_error(ruby, c, ri, "Date"))?;
                 date_value = current;
                 Ok(current.to_string())
             } else if i == *start || i == *end || i == *actual_start || i == *actual_end {
-                let current_time = string_to_time(c).ok_or(to_datetime_error(ruby, c, ri, i))?;
-                let datetime = transform_time_to_datetime(date_value, current_time);
-                Ok(datetime.to_string())
+                if c.is_empty() { return Ok(c.to_string()); }
+                let column_name = get_column_name(&inverse_header_map, &i);
+                process_datetime(ruby, ri, date_value, c, &column_name)
             } else {
                 Ok(c.to_string())
             }
@@ -62,15 +63,39 @@ pub fn transform_csv(ruby: &Ruby, csv_path: String, target_path: String, exclusi
     Ok(())
 }
+fn process_datetime(ruby: &Ruby, ri: usize, date_value: NaiveDateTime, c: &str, column_name: &String) -> magnus::error::Result<String> {
+    let maybe_correct = correct_datetime(c);
+    if let Some(correct) = maybe_correct {
+        return Ok(correct.to_string());
+    }
+    let current_time = string_to_time(c).ok_or(to_datetime_error(ruby, c, ri, column_name))?;
+    let datetime = transform_time_to_datetime(date_value, current_time);
+    Ok(datetime.to_string())
+}
+fn get_column_name(inverse_header_map: &HashMap<usize, String>, i: &usize) -> String {
+    let unknown = "Unknown".to_string();
+    let column_name = inverse_header_map.get(&i).unwrap_or(&unknown);
+    column_name.to_string()
+}
 fn skip_excluded_rows(request_id: &usize, r: &StringRecord, exclusions: &Vec<String>) -> bool {
     let value = r.get(*request_id).unwrap_or_default();
     exclusions.contains(&value.to_string())
 }
 fn string_to_datetime(s: &str) -> Option<NaiveDateTime> {
+    let maybe_correct = correct_datetime(s);
+    if maybe_correct.is_some() { return maybe_correct; }
     NaiveDate::parse_from_str(s, "%d-%b-%y").ok().map(|d| d.and_hms_opt(0, 0, 0)).flatten()
 }
+fn correct_datetime(s: &str) -> Option<NaiveDateTime> {
+    NaiveDateTime::parse_from_str(s, "%Y-%m-%d %H:%M:%S").ok()
+}
 fn string_to_time(s: &str) -> Option<NaiveTime> {
     NaiveTime::parse_from_str(s, "%H:%M").ok()
 }
@@ -79,10 +104,6 @@ fn transform_time_to_datetime(t1: NaiveDateTime, t2: NaiveTime) -> NaiveDateTime
     NaiveDateTime::new(t1.date(), t2)
 }
-fn to_datetime_error(ruby: &Ruby, value: &str, row: usize, col: usize) -> magnus::Error {
-    magnus::Error::new(ruby.exception_standard_error(), format!("Could not parse datetime '{}', row: {}, col: {}", value, row, col))
-}
 fn has_empty_first_col_skip_row(record: &StringRecord) -> bool {
     record[0].is_empty()
 }

data/ext/csv_utils/src/utils/mod.rs CHANGED Viewed

@@ -15,6 +15,10 @@ fn magnus_err<E: Error>(ruby: &Ruby, e: E, msg: &str) -> magnus::Error {
     magnus::Error::new(ruby.exception_standard_error(), format!("{}: {}", msg, e.to_string()))
 }
+fn to_datetime_error(ruby: &Ruby, value: &str, row: usize, col: &str) -> magnus::Error {
+    magnus::Error::new(ruby.exception_standard_error(), format!("Could not parse datetime '{}', row: {}, col: {}", value, row, col))
+}
 pub trait FileExtension {
     fn has_extension<S: AsRef<str>>(&self, extensions: &[S]) -> bool;
 }

data/ext/csv_utils/src/utils/xls.rs CHANGED Viewed

@@ -6,7 +6,7 @@ use calamine::{Data, open_workbook, Range, Reader, Xls};
 use chrono::{NaiveDateTime, Utc};
 use magnus::{RArray, Ruby};
-use crate::utils::{FileExtension, magnus_err, missing_header};
+use crate::utils::{FileExtension, magnus_err, missing_header, to_datetime_error};
 pub fn to_csv(ruby: &Ruby, xls_path: String, target_path: String, exclusions: RArray) -> magnus::error::Result<()> {
     if !xls_path.has_extension(&["xls"]) {
@@ -44,6 +44,9 @@ fn write_csv<W: Write>(ruby: &Ruby, dest: &mut W, range: &Range<Data>, header_ma
         if skip_excluded_rows(&request_id, r, &exclusions) { continue; }
         if skip_empty_rows(r) { continue; }
         if skip_rows_with_no_request_id(&request_id, r) { continue; }
+        if date_value_is_not_present(&date, r) {
+            return Err(magnus::Error::new(ruby.exception_standard_error(), format!("Date value is not present in row: {}", ri)));
+        }
         for (i, c) in r.iter().enumerate() {
             match *c {
@@ -53,7 +56,7 @@ fn write_csv<W: Write>(ruby: &Ruby, dest: &mut W, range: &Range<Data>, header_ma
                 }
                 Data::Float(ref f) => write!(dest, "{}", f),
                 Data::DateTime(ref d) => {
-                    let mut current = d.as_datetime().unwrap_or_default();
+                    let mut current = d.as_datetime().ok_or(to_datetime_error(ruby, &d.to_string(), ri, "Date"))?;
                     if i == *date {
                         date_value = current;
                     } else if i == *start || i == *end || i == *actual_start || i == *actual_end {
@@ -74,6 +77,10 @@ fn write_csv<W: Write>(ruby: &Ruby, dest: &mut W, range: &Range<Data>, header_ma
     Ok(())
 }
+fn date_value_is_not_present(date: &usize, r: &[Data]) -> bool {
+    r[*date] == Data::Empty
+}
 fn skip_excluded_rows(request_id: &usize, r: &[Data], exclusions: &Vec<String>) -> bool {
     let value = r[*request_id].to_string();
     exclusions.contains(&value.to_string())

data/lib/csv_utils/2.7/csv_utils.bundle CHANGED Viewed

Binary file

data/lib/csv_utils/3.0/csv_utils.bundle CHANGED Viewed

Binary file

data/lib/csv_utils/3.1/csv_utils.bundle CHANGED Viewed

Binary file

data/lib/csv_utils/3.2/csv_utils.bundle CHANGED Viewed

Binary file

data/lib/csv_utils/version.rb CHANGED Viewed

@@ -1,5 +1,5 @@
 # frozen_string_literal: true
 module CsvUtils
-  VERSION = '0.1.7'
+  VERSION = '0.1.9'
 end

metadata CHANGED Viewed

@@ -1,14 +1,14 @@
 --- !ruby/object:Gem::Specification
 name: patchwork_csv_utils
 version: !ruby/object:Gem::Version
-  version: 0.1.7
+  version: 0.1.9
 platform: x86_64-darwin
 authors:
 - kingsley.hendrickse
 autorequire:
 bindir: exe
 cert_chain: []
-date: 2024-08-07 00:00:00.000000000 Z
+date: 2024-08-08 00:00:00.000000000 Z
 dependencies: []
 description: Deduplication of CSV files and XLS to CSV conversion.
 email: