RubyGems - red-datasets - Versions diffs - 0.1.0 → 0.1.4 - Mend

red-datasets 0.1.0 → 0.1.4

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (30) hide show

checksums.yaml +4 -4
data/README.md +6 -0
data/doc/text/news.md +48 -0
data/lib/datasets.rb +7 -0
data/lib/datasets/cifar.rb +4 -12
data/lib/datasets/cldr-plurals.rb +385 -0
data/lib/datasets/communities.rb +198 -0
data/lib/datasets/dataset.rb +8 -1
data/lib/datasets/downloader.rb +53 -27
data/lib/datasets/e-stat-japan.rb +320 -0
data/lib/datasets/error.rb +4 -0
data/lib/datasets/mnist.rb +6 -4
data/lib/datasets/penguins.rb +146 -0
data/lib/datasets/rdatasets.rb +95 -0
data/lib/datasets/seaborn-data.rb +49 -0
data/lib/datasets/sudachi-synonym-dictionary.rb +171 -0
data/lib/datasets/tar-gz-readable.rb +14 -0
data/lib/datasets/version.rb +1 -1
data/red-datasets.gemspec +1 -0
data/test/run-test.rb +2 -0
data/test/test-cldr-plurals.rb +180 -0
data/test/test-communities.rb +290 -0
data/test/test-dataset.rb +27 -0
data/test/test-downloader.rb +29 -0
data/test/test-e-stat-japan.rb +383 -0
data/test/test-penguins.rb +251 -0
data/test/test-rdatasets.rb +136 -0
data/test/test-seaborn-data.rb +97 -0
data/test/test-sudachi-synonym-dictionary.rb +48 -0
metadata +55 -15

data/test/test-rdatasets.rb ADDED Viewed

@@ -0,0 +1,136 @@
+class RdatasetsTest < Test::Unit::TestCase
+  sub_test_case("RdatasetsList") do
+    def setup
+      @dataset = Datasets::RdatasetsList.new
+    end
+    sub_test_case("#each") do
+      test("with package_name") do
+        records = @dataset.filter(package: "datasets").to_a
+        assert_equal([
+                       84,
+                       {
+                         package: "datasets",
+                         dataset: "ability.cov",
+                         title: "Ability and Intelligence Tests",
+                         rows: 6,
+                         cols: 8,
+                         n_binary: 0,
+                         n_character: 0,
+                         n_factor: 0,
+                         n_logical: 0,
+                         n_numeric: 8,
+                         csv: "https://vincentarelbundock.github.io/Rdatasets/csv/datasets/ability.cov.csv",
+                         doc: "https://vincentarelbundock.github.io/Rdatasets/doc/datasets/ability.cov.html"
+                       },
+                       {
+                         package: "datasets",
+                         dataset: "WWWusage",
+                         title: "Internet Usage per Minute",
+                         rows: 100,
+                         cols: 2,
+                         n_binary: 0,
+                         n_character: 0,
+                         n_factor: 0,
+                         n_logical: 0,
+                         n_numeric: 2,
+                         csv: "https://vincentarelbundock.github.io/Rdatasets/csv/datasets/WWWusage.csv",
+                         doc: "https://vincentarelbundock.github.io/Rdatasets/doc/datasets/WWWusage.html"
+                       }
+                     ],
+                     [
+                       records.size,
+                       records[0].to_h,
+                       records[-1].to_h
+                     ])
+      end
+      test("without package_name") do
+        records = @dataset.each.to_a
+        assert_equal([
+                       1714,
+                       {
+                         package: "AER",
+                         dataset: "Affairs",
+                         title: "Fair's Extramarital Affairs Data",
+                         rows: 601,
+                         cols: 9,
+                         n_binary: 2,
+                         n_character: 0,
+                         n_factor: 2,
+                         n_logical: 0,
+                         n_numeric: 7,
+                         csv: "https://vincentarelbundock.github.io/Rdatasets/csv/AER/Affairs.csv",
+                         doc: "https://vincentarelbundock.github.io/Rdatasets/doc/AER/Affairs.html"
+                       },
+                       {
+                         package: "vcd",
+                         dataset: "WomenQueue",
+                         title: "Women in Queues",
+                         rows: 11,
+                         cols: 2,
+                         n_binary: 0,
+                         n_character: 0,
+                         n_factor: 1,
+                         n_logical: 0,
+                         n_numeric: 1,
+                         csv: "https://vincentarelbundock.github.io/Rdatasets/csv/vcd/WomenQueue.csv",
+                         doc: "https://vincentarelbundock.github.io/Rdatasets/doc/vcd/WomenQueue.html"
+                       },
+                     ],
+                     [
+                       records.size,
+                       records[0].to_h,
+                       records[-1].to_h
+                     ])
+      end
+    end
+  end
+  sub_test_case("Rdatasets") do
+    sub_test_case("datasets") do
+      sub_test_case("AirPassengers") do
+        def setup
+          @dataset = Datasets::Rdatasets.new("datasets", "AirPassengers")
+        end
+        test("#each") do
+          records = @dataset.each.to_a
+          assert_equal([
+                         144,
+                         { time: 1949,             value: 112 },
+                         { time: 1960.91666666667, value: 432 },
+                       ],
+                       [
+                         records.size,
+                         records[0],
+                         records[-1]
+                       ])
+        end
+        test("#metadata.id") do
+          assert_equal("rdatasets-datasets-AirPassengers", @dataset.metadata.id)
+        end
+        test("#metadata.description") do
+          description = @dataset.metadata.description
+          assert do
+            description.include?("Monthly Airline Passenger Numbers 1949-1960")
+          end
+        end
+      end
+      test("invalid dataset name") do
+        assert_raise(ArgumentError) do
+          Datasets::Rdatasets.new("datasets", "invalid datasets name")
+        end
+      end
+    end
+    test("invalid package name") do
+      assert_raise(ArgumentError) do
+        Datasets::Rdatasets.new("invalid package name", "AirPassengers")
+      end
+    end
+  end
+end

data/test/test-seaborn-data.rb ADDED Viewed

@@ -0,0 +1,97 @@
+class SeabornDataTest < Test::Unit::TestCase
+  sub_test_case("fmri") do
+    def setup
+      @dataset = Datasets::SeabornData.new("fmri")
+    end
+    def test_each
+      records = @dataset.each.to_a
+      assert_equal([
+                     1064,
+                     {
+                       subject: "s5",
+                       timepoint: 14,
+                       event: "stim",
+                       region: "parietal",
+                       signal: -0.0808829319505
+                     },
+                     {
+                       subject: "s0",
+                       timepoint: 0,
+                       event: "cue",
+                       region: "parietal",
+                       signal: -0.00689923478092
+                     }
+                   ],
+                   [
+                     records.size,
+                     records[1].to_h,
+                     records[-1].to_h
+                   ])
+    end
+  end
+  sub_test_case("flights") do
+    def setup
+      @dataset = Datasets::SeabornData.new("flights")
+    end
+    def test_each
+      records = @dataset.each.to_a
+      assert_equal([
+                     144,
+                     {
+                       year: 1949,
+                       month: "Feb",
+                       passengers: 118
+                     },
+                     {
+                       year: 1960,
+                       month: "Dec",
+                       passengers: 432
+                     }
+                   ],
+                   [
+                     records.size,
+                     records[1].to_h,
+                     records[-1].to_h
+                   ])
+    end
+  end
+  sub_test_case("penguins") do
+    def setup
+      @dataset = Datasets::SeabornData.new("penguins")
+    end
+    def test_each
+      records = @dataset.each.to_a
+      assert_equal([
+                     344,
+                     {
+                       species: "Adelie",
+                       island: "Torgersen",
+                       bill_length_mm: 39.5,
+                       bill_depth_mm: 17.4,
+                       flipper_length_mm: 186,
+                       body_mass_g: 3800,
+                       sex: "Female"
+                     },
+                     {
+                       species: "Gentoo",
+                       island: "Biscoe",
+                       bill_length_mm: 49.9,
+                       bill_depth_mm: 16.1,
+                       flipper_length_mm: 213,
+                       body_mass_g: 5400,
+                       sex: "Male"
+                     }
+                   ],
+                   [
+                     records.size,
+                     records[1].to_h,
+                     records[-1].to_h
+                   ])
+    end
+  end
+end

data/test/test-sudachi-synonym-dictionary.rb ADDED Viewed

@@ -0,0 +1,48 @@
+class SudachiSynonymDictionaryTest < Test::Unit::TestCase
+  def setup
+    @dataset = Datasets::SudachiSynonymDictionary.new
+  end
+  test('#each') do
+    records = @dataset.each.to_a
+    assert_equal([
+                   61335,
+                   {
+                     group_id: "000001",
+                     is_noun: true,
+                     expansion_type: :always,
+                     lexeme_id: 1,
+                     form_type: :typical,
+                     acronym_type: :typical,
+                     variant_type: :typical,
+                     categories: [],
+                     notation: "曖昧",
+                   },
+                   {
+                     group_id: "023705",
+                     is_noun: true,
+                     expansion_type: :always,
+                     lexeme_id: 1,
+                     form_type: :typical,
+                     acronym_type: :alphabet,
+                     variant_type: :typical,
+                     categories: ["単位"],
+                     notation: "GB",
+                   },
+                 ],
+                 [
+                   records.size,
+                   records[0].to_h,
+                   records[-1].to_h,
+                 ])
+  end
+  sub_test_case('#metadata') do
+    test('#description') do
+      description = @dataset.metadata.description
+      assert do
+        description.start_with?('# Sudachi 同義語辞書')
+      end
+    end
+  end
+end

metadata CHANGED Viewed

@@ -1,7 +1,7 @@
 --- !ruby/object:Gem::Specification
 name: red-datasets
 version: !ruby/object:Gem::Version
-  version: 0.1.0
+  version: 0.1.4
 platform: ruby
 authors:
 - tomisuker
@@ -9,7 +9,7 @@ authors:
 autorequire:
 bindir: bin
 cert_chain: []
-date: 2020-02-04 00:00:00.000000000 Z
+date: 2021-07-13 00:00:00.000000000 Z
 dependencies:
 - !ruby/object:Gem::Dependency
   name: csv
@@ -25,6 +25,20 @@ dependencies:
     - - ">="
       - !ruby/object:Gem::Version
         version: 3.0.5
+- !ruby/object:Gem::Dependency
+  name: rexml
+  requirement: !ruby/object:Gem::Requirement
+    requirements:
+    - - ">="
+      - !ruby/object:Gem::Version
+        version: '0'
+  type: :runtime
+  prerelease: false
+  version_requirements: !ruby/object:Gem::Requirement
+    requirements:
+    - - ">="
+      - !ruby/object:Gem::Version
+        version: '0'
 - !ruby/object:Gem::Dependency
   name: rubyzip
   requirement: !ruby/object:Gem::Requirement
@@ -129,9 +143,13 @@ files:
 - lib/datasets.rb
 - lib/datasets/adult.rb
 - lib/datasets/cifar.rb
+- lib/datasets/cldr-plurals.rb
+- lib/datasets/communities.rb
 - lib/datasets/dataset.rb
 - lib/datasets/dictionary.rb
 - lib/datasets/downloader.rb
+- lib/datasets/e-stat-japan.rb
+- lib/datasets/error.rb
 - lib/datasets/fashion-mnist.rb
 - lib/datasets/hepatitis.rb
 - lib/datasets/iris.rb
@@ -140,9 +158,14 @@ files:
 - lib/datasets/metadata.rb
 - lib/datasets/mnist.rb
 - lib/datasets/mushroom.rb
+- lib/datasets/penguins.rb
 - lib/datasets/penn-treebank.rb
 - lib/datasets/postal-code-japan.rb
+- lib/datasets/rdatasets.rb
+- lib/datasets/seaborn-data.rb
+- lib/datasets/sudachi-synonym-dictionary.rb
 - lib/datasets/table.rb
+- lib/datasets/tar-gz-readable.rb
 - lib/datasets/version.rb
 - lib/datasets/wikipedia.rb
 - lib/datasets/wine.rb
@@ -151,7 +174,12 @@ files:
 - test/run-test.rb
 - test/test-adult.rb
 - test/test-cifar.rb
+- test/test-cldr-plurals.rb
+- test/test-communities.rb
+- test/test-dataset.rb
 - test/test-dictionary.rb
+- test/test-downloader.rb
+- test/test-e-stat-japan.rb
 - test/test-fashion-mnist.rb
 - test/test-hepatitis.rb
 - test/test-iris.rb
@@ -159,8 +187,12 @@ files:
 - test/test-libsvm.rb
 - test/test-mnist.rb
 - test/test-mushroom.rb
+- test/test-penguins.rb
 - test/test-penn-treebank.rb
 - test/test-postal-code-japan.rb
+- test/test-rdatasets.rb
+- test/test-seaborn-data.rb
+- test/test-sudachi-synonym-dictionary.rb
 - test/test-table.rb
 - test/test-wikipedia.rb
 - test/test-wine.rb
@@ -183,26 +215,34 @@ required_rubygems_version: !ruby/object:Gem::Requirement
     - !ruby/object:Gem::Version
       version: '0'
 requirements: []
-rubyforge_project:
-rubygems_version: 2.7.6.2
+rubygems_version: 3.3.0.dev
 signing_key:
 specification_version: 4
 summary: Red Datasets provides classes that provide common datasets such as iris dataset.
 test_files:
-- test/test-wine.rb
-- test/test-iris.rb
-- test/test-wikipedia.rb
-- test/test-mnist.rb
 - test/helper.rb
-- test/test-penn-treebank.rb
 - test/run-test.rb
-- test/test-table.rb
-- test/test-fashion-mnist.rb
+- test/test-adult.rb
 - test/test-cifar.rb
+- test/test-cldr-plurals.rb
+- test/test-communities.rb
+- test/test-dataset.rb
 - test/test-dictionary.rb
-- test/test-mushroom.rb
-- test/test-libsvm-dataset-list.rb
+- test/test-downloader.rb
+- test/test-e-stat-japan.rb
+- test/test-fashion-mnist.rb
 - test/test-hepatitis.rb
-- test/test-adult.rb
-- test/test-postal-code-japan.rb
+- test/test-iris.rb
+- test/test-libsvm-dataset-list.rb
 - test/test-libsvm.rb
+- test/test-mnist.rb
+- test/test-mushroom.rb
+- test/test-penguins.rb
+- test/test-penn-treebank.rb
+- test/test-postal-code-japan.rb
+- test/test-rdatasets.rb
+- test/test-seaborn-data.rb
+- test/test-sudachi-synonym-dictionary.rb
+- test/test-table.rb
+- test/test-wikipedia.rb
+- test/test-wine.rb