RubyGems - briard - Versions diffs - 2.4.2 → 2.6.0 - Mend

briard 2.4.2 → 2.6.0

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (81) hide show

checksums.yaml +4 -4
data/.github/workflows/codeql-analysis.yml +72 -0
data/.github/workflows/rubocop.yml +50 -0
data/.rubocop.yml +144 -620
data/.rubocop_todo.yml +76 -0
data/CHANGELOG.md +18 -0
data/Gemfile +2 -0
data/Gemfile.lock +40 -6
data/Rakefile +1 -1
data/{bolognese.gemspec → briard.gemspec} +46 -39
data/lib/briard/array.rb +2 -2
data/lib/briard/author_utils.rb +79 -71
data/lib/briard/cli.rb +12 -13
data/lib/briard/crossref_utils.rb +73 -61
data/lib/briard/datacite_utils.rb +132 -106
data/lib/briard/doi_utils.rb +10 -10
data/lib/briard/metadata.rb +96 -106
data/lib/briard/metadata_utils.rb +87 -78
data/lib/briard/readers/bibtex_reader.rb +65 -65
data/lib/briard/readers/cff_reader.rb +88 -70
data/lib/briard/readers/citeproc_reader.rb +90 -84
data/lib/briard/readers/codemeta_reader.rb +68 -50
data/lib/briard/readers/crosscite_reader.rb +2 -2
data/lib/briard/readers/crossref_reader.rb +249 -210
data/lib/briard/readers/datacite_json_reader.rb +3 -3
data/lib/briard/readers/datacite_reader.rb +225 -189
data/lib/briard/readers/npm_reader.rb +49 -42
data/lib/briard/readers/ris_reader.rb +82 -80
data/lib/briard/readers/schema_org_reader.rb +182 -159
data/lib/briard/string.rb +1 -1
data/lib/briard/utils.rb +4 -4
data/lib/briard/version.rb +3 -1
data/lib/briard/whitelist_scrubber.rb +11 -4
data/lib/briard/writers/bibtex_writer.rb +14 -8
data/lib/briard/writers/cff_writer.rb +33 -26
data/lib/briard/writers/codemeta_writer.rb +19 -15
data/lib/briard/writers/csv_writer.rb +6 -4
data/lib/briard/writers/datacite_json_writer.rb +8 -2
data/lib/briard/writers/jats_writer.rb +33 -28
data/lib/briard/writers/rdf_xml_writer.rb +1 -1
data/lib/briard/writers/ris_writer.rb +30 -18
data/lib/briard/writers/turtle_writer.rb +1 -1
data/lib/briard.rb +6 -6
data/rubocop.sarif +0 -0
data/spec/array_spec.rb +5 -5
data/spec/author_utils_spec.rb +151 -132
data/spec/datacite_utils_spec.rb +135 -83
data/spec/doi_utils_spec.rb +168 -164
data/spec/find_from_format_spec.rb +69 -69
data/spec/fixtures/vcr_cassettes/Briard_Metadata/sanitize/onlies_keep_specific_tags.yml +65 -0
data/spec/fixtures/vcr_cassettes/Briard_Metadata/sanitize/removes_a_tags.yml +65 -0
data/spec/metadata_spec.rb +91 -90
data/spec/readers/bibtex_reader_spec.rb +43 -38
data/spec/readers/cff_reader_spec.rb +165 -153
data/spec/readers/citeproc_reader_spec.rb +45 -40
data/spec/readers/codemeta_reader_spec.rb +128 -115
data/spec/readers/crosscite_reader_spec.rb +34 -24
data/spec/readers/crossref_reader_spec.rb +1098 -939
data/spec/readers/datacite_json_reader_spec.rb +53 -40
data/spec/readers/datacite_reader_spec.rb +1541 -1337
data/spec/readers/npm_reader_spec.rb +48 -43
data/spec/readers/ris_reader_spec.rb +53 -47
data/spec/readers/schema_org_reader_spec.rb +329 -267
data/spec/spec_helper.rb +6 -5
data/spec/utils_spec.rb +371 -347
data/spec/writers/bibtex_writer_spec.rb +143 -143
data/spec/writers/cff_writer_spec.rb +96 -90
data/spec/writers/citation_writer_spec.rb +34 -33
data/spec/writers/citeproc_writer_spec.rb +226 -224
data/spec/writers/codemeta_writer_spec.rb +18 -16
data/spec/writers/crosscite_writer_spec.rb +91 -73
data/spec/writers/crossref_writer_spec.rb +99 -91
data/spec/writers/csv_writer_spec.rb +70 -70
data/spec/writers/datacite_json_writer_spec.rb +78 -68
data/spec/writers/datacite_writer_spec.rb +417 -322
data/spec/writers/jats_writer_spec.rb +177 -161
data/spec/writers/rdf_xml_writer_spec.rb +68 -63
data/spec/writers/ris_writer_spec.rb +162 -162
data/spec/writers/turtle_writer_spec.rb +47 -47
metadata +242 -166
data/.github/workflows/release.yml +0 -47

data/spec/writers/jats_writer_spec.rb CHANGED Viewed

@@ -3,192 +3,208 @@
 require 'spec_helper'
 describe Briard::Metadata, vcr: true do
-  context "write metadata as jats xml" do
-    it "with data citation" do
-      input = "10.7554/eLife.01567"
-      subject = Briard::Metadata.new(input: input, from: "crossref")
-      jats = Maremma.from_xml(subject.jats).fetch("element_citation", {})
-      expect(jats.dig("publication_type")).to eq("journal")
-      expect(jats.dig("article_title")).to eq("Automated quantitative histology reveals vascular morphodynamics during Arabidopsis hypocotyl secondary growth")
-      expect(jats.dig("source")).to eq("eLife")
-      expect(jats.dig("person_group", "name").length).to eq(5)
-      expect(jats.dig("person_group", "name").first).to eq("surname"=>"Sankar", "given_names"=>"Martial")
-      expect(jats.dig("year")).to eq("iso_8601_date"=>"2014-02-11", "__content__"=>"2014")
-      expect(jats.dig("month")).to eq("02")
-      expect(jats.dig("day")).to eq("11")
+  context 'write metadata as jats xml' do
+    it 'with data citation' do
+      input = '10.7554/eLife.01567'
+      subject = described_class.new(input: input, from: 'crossref')
+      jats = Maremma.from_xml(subject.jats).fetch('element_citation', {})
+      expect(jats['publication_type']).to eq('journal')
+      expect(jats['article_title']).to eq('Automated quantitative histology reveals vascular morphodynamics during Arabidopsis hypocotyl secondary growth')
+      expect(jats['source']).to eq('eLife')
+      expect(jats.dig('person_group', 'name').length).to eq(5)
+      expect(jats.dig('person_group',
+                      'name').first).to eq('surname' => 'Sankar', 'given_names' => 'Martial')
+      expect(jats['year']).to eq('iso_8601_date' => '2014-02-11', '__content__' => '2014')
+      expect(jats['month']).to eq('02')
+      expect(jats['day']).to eq('11')
     end
-    it "with ORCID ID" do
-      input = "https://doi.org/10.1155/2012/291294"
-      subject = Briard::Metadata.new(input: input, from: "crossref")
-      jats = Maremma.from_xml(subject.jats).fetch("element_citation", {})
-      expect(jats.dig("publication_type")).to eq("journal")
-      expect(jats.dig("article_title")).to eq("Delineating a Retesting Zone Using Receiver Operating Characteristic Analysis on Serial QuantiFERON Tuberculosis Test Results in US Healthcare Workers")
-      expect(jats.dig("source")).to eq("Pulmonary Medicine")
-      expect(jats.dig("person_group", "name").length).to eq(7)
-      expect(jats.dig("person_group", "name").first).to eq("surname"=>"Thanassi", "given_names"=>"Wendy")
-      expect(jats.dig("year")).to eq("iso_8601_date"=>"2012", "__content__"=>"2012")
+    it 'with ORCID ID' do
+      input = 'https://doi.org/10.1155/2012/291294'
+      subject = described_class.new(input: input, from: 'crossref')
+      jats = Maremma.from_xml(subject.jats).fetch('element_citation', {})
+      expect(jats['publication_type']).to eq('journal')
+      expect(jats['article_title']).to eq('Delineating a Retesting Zone Using Receiver Operating Characteristic Analysis on Serial QuantiFERON Tuberculosis Test Results in US Healthcare Workers')
+      expect(jats['source']).to eq('Pulmonary Medicine')
+      expect(jats.dig('person_group', 'name').length).to eq(7)
+      expect(jats.dig('person_group',
+                      'name').first).to eq('surname' => 'Thanassi', 'given_names' => 'Wendy')
+      expect(jats['year']).to eq('iso_8601_date' => '2012', '__content__' => '2012')
     end
-    it "with editor" do
-      input = "https://doi.org/10.1371/journal.pone.0000030"
-      subject = Briard::Metadata.new(input: input, from: "crossref")
-      jats = Maremma.from_xml(subject.jats).fetch("element_citation", {})
-      expect(jats.dig("publication_type")).to eq("journal")
-      expect(jats.dig("article_title")).to eq("Triose Phosphate Isomerase Deficiency Is Caused by Altered Dimerization???Not Catalytic Inactivity???of the Mutant Enzymes")
-      expect(jats.dig("source")).to eq("PLoS ONE")
-      expect(jats.dig("person_group", 0, "name").length).to eq(5)
-      expect(jats.dig("person_group", 0, "name").first).to eq("surname"=>"Ralser", "given_names"=>"Markus")
-      expect(jats.dig("person_group", 1, "name")).to eq("surname"=>"Janbon", "given_names"=>"Guilhem")
-      expect(jats.dig("year")).to eq("iso_8601_date"=>"2006-12-20", "__content__"=>"2006")
-      expect(jats.dig("month")).to eq("12")
-      expect(jats.dig("day")).to eq("20")
-      expect(jats.dig("fpage")).to eq("e30")
-      expect(jats.dig("pub_id")).to eq("pub_id_type"=>"doi", "__content__"=>"10.1371/journal.pone.0000030")
+    it 'with editor' do
+      input = 'https://doi.org/10.1371/journal.pone.0000030'
+      subject = described_class.new(input: input, from: 'crossref')
+      jats = Maremma.from_xml(subject.jats).fetch('element_citation', {})
+      expect(jats['publication_type']).to eq('journal')
+      expect(jats['article_title']).to eq('Triose Phosphate Isomerase Deficiency Is Caused by Altered Dimerization???Not Catalytic Inactivity???of the Mutant Enzymes')
+      expect(jats['source']).to eq('PLoS ONE')
+      expect(jats.dig('person_group', 0, 'name').length).to eq(5)
+      expect(jats.dig('person_group', 0,
+                      'name').first).to eq('surname' => 'Ralser', 'given_names' => 'Markus')
+      expect(jats.dig('person_group', 1,
+                      'name')).to eq('surname' => 'Janbon', 'given_names' => 'Guilhem')
+      expect(jats['year']).to eq('iso_8601_date' => '2006-12-20', '__content__' => '2006')
+      expect(jats['month']).to eq('12')
+      expect(jats['day']).to eq('20')
+      expect(jats['fpage']).to eq('e30')
+      expect(jats['pub_id']).to eq('pub_id_type' => 'doi',
+                                   '__content__' => '10.1371/journal.pone.0000030')
     end
-    it "book chapter" do
-      input = "https://doi.org/10.5005/jp/books/12414_3"
-      subject = Briard::Metadata.new(input: input, from: "crossref")
-      jats = Maremma.from_xml(subject.jats).fetch("element_citation", {})
-      expect(jats.dig("publication_type")).to eq("chapter")
-      expect(jats.dig("chapter_title")).to eq("Physical Examinations")
-      expect(jats.dig("source")).to eq("Jaypee Brothers Medical Publishing")
-      expect(jats.dig("person_group", "name")).to eq("surname"=>"Saha", "given_names"=>"Ashis")
-      expect(jats.dig("year")).to eq("iso_8601_date"=>"2015", "__content__"=>"2015")
-      expect(jats.dig("fpage")).to eq("27")
-      expect(jats.dig("lpage")).to eq("27")
-      expect(jats.dig("pub_id")).to eq("pub_id_type"=>"doi", "__content__"=>"10.5005/jp/books/12414_3")
+    it 'book chapter' do
+      input = 'https://doi.org/10.5005/jp/books/12414_3'
+      subject = described_class.new(input: input, from: 'crossref')
+      jats = Maremma.from_xml(subject.jats).fetch('element_citation', {})
+      expect(jats['publication_type']).to eq('chapter')
+      expect(jats['chapter_title']).to eq('Physical Examinations')
+      expect(jats['source']).to eq('Jaypee Brothers Medical Publishing')
+      expect(jats.dig('person_group', 'name')).to eq('surname' => 'Saha', 'given_names' => 'Ashis')
+      expect(jats['year']).to eq('iso_8601_date' => '2015', '__content__' => '2015')
+      expect(jats['fpage']).to eq('27')
+      expect(jats['lpage']).to eq('27')
+      expect(jats['pub_id']).to eq('pub_id_type' => 'doi',
+                                   '__content__' => '10.5005/jp/books/12414_3')
     end
-    it "Crossref DOI" do
-      input = fixture_path + "crossref.bib"
-      subject = Briard::Metadata.new(input: input, from: "bibtex")
-      jats = Maremma.from_xml(subject.jats).fetch("element_citation", {})
-      expect(jats.dig("publication_type")).to eq("journal")
-      expect(jats.dig("article_title")).to eq("Automated quantitative histology reveals vascular morphodynamics during Arabidopsis hypocotyl secondary growth")
-      expect(jats.dig("source")).to eq("eLife")
-      expect(jats.dig("person_group", "name").length).to eq(5)
-      expect(jats.dig("person_group", "name").first).to eq("surname"=>"Sankar", "given_names"=>"Martial")
-      expect(jats.dig("year")).to eq("iso_8601_date"=>"2014", "__content__"=>"2014")
-      expect(jats.dig("month")).to be_nil
-      expect(jats.dig("pub_id")).to eq("pub_id_type"=>"doi", "__content__"=>"10.7554/elife.01567")
+    it 'Crossref DOI' do
+      input = "#{fixture_path}crossref.bib"
+      subject = described_class.new(input: input, from: 'bibtex')
+      jats = Maremma.from_xml(subject.jats).fetch('element_citation', {})
+      expect(jats['publication_type']).to eq('journal')
+      expect(jats['article_title']).to eq('Automated quantitative histology reveals vascular morphodynamics during Arabidopsis hypocotyl secondary growth')
+      expect(jats['source']).to eq('eLife')
+      expect(jats.dig('person_group', 'name').length).to eq(5)
+      expect(jats.dig('person_group',
+                      'name').first).to eq('surname' => 'Sankar', 'given_names' => 'Martial')
+      expect(jats['year']).to eq('iso_8601_date' => '2014', '__content__' => '2014')
+      expect(jats['month'].nil?).to be(true)
+      expect(jats['pub_id']).to eq('pub_id_type' => 'doi', '__content__' => '10.7554/elife.01567')
     end
-    it "BlogPosting Citeproc JSON" do
-      input = fixture_path + "citeproc.json"
-      subject = Briard::Metadata.new(input: input, from: "citeproc")
-      jats = Maremma.from_xml(subject.jats).fetch("element_citation", {})
-      expect(jats.dig("publication_type")).to be_nil
-      expect(jats.dig("source")).to eq("Eating your own Dog Food")
-      expect(jats.dig("publisher_name")).to eq("DataCite")
-      expect(jats.dig("person_group", "name")).to eq("surname"=>"Fenner", "given_names"=>"Martin")
-      expect(jats.dig("year")).to eq("iso_8601_date"=>"2016-12-20", "__content__"=>"2016")
-      expect(jats.dig("month")).to eq("12")
-      expect(jats.dig("day")).to eq("20")
-      expect(jats.dig("pub_id")).to eq("pub_id_type"=>"doi", "__content__"=>"10.5438/4k3m-nyvg")
+    it 'BlogPosting Citeproc JSON' do
+      input = "#{fixture_path}citeproc.json"
+      subject = described_class.new(input: input, from: 'citeproc')
+      jats = Maremma.from_xml(subject.jats).fetch('element_citation', {})
+      expect(jats['publication_type'].nil?).to be(true)
+      expect(jats['source']).to eq('Eating your own Dog Food')
+      expect(jats['publisher_name']).to eq('DataCite')
+      expect(jats.dig('person_group',
+                      'name')).to eq('surname' => 'Fenner', 'given_names' => 'Martin')
+      expect(jats['year']).to eq('iso_8601_date' => '2016-12-20', '__content__' => '2016')
+      expect(jats['month']).to eq('12')
+      expect(jats['day']).to eq('20')
+      expect(jats['pub_id']).to eq('pub_id_type' => 'doi', '__content__' => '10.5438/4k3m-nyvg')
     end
-    it "rdataone" do
-      input = fixture_path + 'codemeta.json'
-      subject = Briard::Metadata.new(input: input, from: "codemeta")
-      jats = Maremma.from_xml(subject.jats).fetch("element_citation", {})
-      expect(jats.dig("publication_type")).to eq("software")
-      expect(jats.dig("source")).to eq("R Interface to the DataONE REST API")
-      expect(jats.dig("publisher_name")).to eq("https://cran.r-project.org")
-      expect(jats.dig("person_group", "name").length).to eq(3)
-      expect(jats.dig("person_group", "name").first).to eq("surname"=>"Jones", "given_names"=>"Matt")
-      expect(jats.dig("year")).to eq("iso_8601_date"=>"2016-05-27", "__content__"=>"2016")
-      expect(jats.dig("month")).to eq("05")
-      expect(jats.dig("day")).to eq("27")
-      expect(jats.dig("version")).to eq("2.0.0")
-      expect(jats.dig("pub_id")).to eq("pub_id_type"=>"doi", "__content__"=>"10.5063/f1m61h5x")
+    it 'rdataone' do
+      input = "#{fixture_path}codemeta.json"
+      subject = described_class.new(input: input, from: 'codemeta')
+      jats = Maremma.from_xml(subject.jats).fetch('element_citation', {})
+      expect(jats['publication_type']).to eq('software')
+      expect(jats['source']).to eq('R Interface to the DataONE REST API')
+      expect(jats['publisher_name']).to eq('https://cran.r-project.org')
+      expect(jats.dig('person_group', 'name').length).to eq(3)
+      expect(jats.dig('person_group',
+                      'name').first).to eq('surname' => 'Jones', 'given_names' => 'Matt')
+      expect(jats['year']).to eq('iso_8601_date' => '2016-05-27', '__content__' => '2016')
+      expect(jats['month']).to eq('05')
+      expect(jats['day']).to eq('27')
+      expect(jats['version']).to eq('2.0.0')
+      expect(jats['pub_id']).to eq('pub_id_type' => 'doi', '__content__' => '10.5063/f1m61h5x')
     end
-    it "maremma" do
-      input = "https://github.com/datacite/maremma"
-      subject = Briard::Metadata.new(input: input, from: "codemeta")
-      jats = Maremma.from_xml(subject.jats).fetch("element_citation", {})
-      expect(jats.dig("publication_type")).to eq("software")
-      expect(jats.dig("source")).to eq("Maremma: a Ruby library for simplified network calls")
-      expect(jats.dig("publisher_name")).to eq("DataCite")
-      expect(jats.dig("person_group", "name")).to eq("surname"=>"Fenner", "given_names"=>"Martin")
-      expect(jats.dig("year")).to eq("iso_8601_date"=>"2017-02-24", "__content__"=>"2017")
-      expect(jats.dig("month")).to eq("02")
-      expect(jats.dig("day")).to eq("24")
-      expect(jats.dig("pub_id")).to eq("pub_id_type"=>"doi", "__content__"=>"10.5438/qeg0-3gm3")
+    it 'maremma' do
+      input = 'https://github.com/datacite/maremma'
+      subject = described_class.new(input: input, from: 'codemeta')
+      jats = Maremma.from_xml(subject.jats).fetch('element_citation', {})
+      expect(jats['publication_type']).to eq('software')
+      expect(jats['source']).to eq('Maremma: a Ruby library for simplified network calls')
+      expect(jats['publisher_name']).to eq('DataCite')
+      expect(jats.dig('person_group',
+                      'name')).to eq('surname' => 'Fenner', 'given_names' => 'Martin')
+      expect(jats['year']).to eq('iso_8601_date' => '2017-02-24', '__content__' => '2017')
+      expect(jats['month']).to eq('02')
+      expect(jats['day']).to eq('24')
+      expect(jats['pub_id']).to eq('pub_id_type' => 'doi', '__content__' => '10.5438/qeg0-3gm3')
     end
-    it "Text pass-thru" do
-      input = "https://doi.org/10.23640/07243.5153971"
-      subject = Briard::Metadata.new(input: input, from: "datacite")
-      jats = Maremma.from_xml(subject.jats).fetch("element_citation", {})
-      expect(jats.dig("publication_type")).to eq("journal")
-      expect(jats.dig("article_title")).to eq("Recommendation of: ORCID Works Metadata Working Group")
-      expect(jats.dig("source")).to eq("Figshare")
-      expect(jats.dig("person_group", "name").length).to eq(20)
-      expect(jats.dig("person_group", "name").first).to eq("surname"=>"Paglione", "given_names"=>"Laura")
-      expect(jats.dig("year")).to eq("iso_8601_date"=>"2017", "__content__"=>"2017")
-      expect(jats.dig("pub_id")).to eq("pub_id_type"=>"doi", "__content__"=>"10.23640/07243.5153971")
+    it 'Text pass-thru' do
+      input = 'https://doi.org/10.23640/07243.5153971'
+      subject = described_class.new(input: input, from: 'datacite')
+      jats = Maremma.from_xml(subject.jats).fetch('element_citation', {})
+      expect(jats['publication_type']).to eq('journal')
+      expect(jats['article_title']).to eq('Recommendation of: ORCID Works Metadata Working Group')
+      expect(jats['source']).to eq('Figshare')
+      expect(jats.dig('person_group', 'name').length).to eq(20)
+      expect(jats.dig('person_group',
+                      'name').first).to eq('surname' => 'Paglione', 'given_names' => 'Laura')
+      expect(jats['year']).to eq('iso_8601_date' => '2017', '__content__' => '2017')
+      expect(jats['pub_id']).to eq('pub_id_type' => 'doi',
+                                   '__content__' => '10.23640/07243.5153971')
     end
-    it "Dataset in schema 4.0" do
-      input = "https://doi.org/10.5061/DRYAD.8515"
-      subject = Briard::Metadata.new(input: input, from: "datacite", regenerate: true)
-      jats = Maremma.from_xml(subject.jats).fetch("element_citation", {})
-      expect(jats.dig("publication_type")).to eq("data")
-      expect(jats.dig("data_title")).to eq("Data from: A new malaria agent in African hominids.")
-      expect(jats.dig("source")).to eq("Dryad")
-      expect(jats.dig("person_group", "name").length).to eq(8)
-      expect(jats.dig("person_group", "name").first).to eq("surname"=>"Ollomo", "given_names"=>"Benjamin")
-      expect(jats.dig("year")).to eq("iso_8601_date"=>"2011", "__content__"=>"2011")
-      expect(jats.dig("pub_id")).to eq("pub_id_type"=>"doi", "__content__"=>"10.5061/dryad.8515")
+    it 'Dataset in schema 4.0' do
+      input = 'https://doi.org/10.5061/DRYAD.8515'
+      subject = described_class.new(input: input, from: 'datacite', regenerate: true)
+      jats = Maremma.from_xml(subject.jats).fetch('element_citation', {})
+      expect(jats['publication_type']).to eq('data')
+      expect(jats['data_title']).to eq('Data from: A new malaria agent in African hominids.')
+      expect(jats['source']).to eq('Dryad')
+      expect(jats.dig('person_group', 'name').length).to eq(8)
+      expect(jats.dig('person_group',
+                      'name').first).to eq('surname' => 'Ollomo', 'given_names' => 'Benjamin')
+      expect(jats['year']).to eq('iso_8601_date' => '2011', '__content__' => '2011')
+      expect(jats['pub_id']).to eq('pub_id_type' => 'doi', '__content__' => '10.5061/dryad.8515')
     end
-    it "from schema_org" do
-      input = "https://blog.front-matter.io/posts/eating-your-own-dog-food/"
-      subject = Briard::Metadata.new(input: input, from: "schema_org")
-      jats = Maremma.from_xml(subject.jats).fetch("element_citation", {})
-      expect(jats.dig("publication_type")).to eq("journal")
-      expect(jats.dig("article_title")).to eq("Eating your own Dog Food")
-      expect(jats.dig("source")).to eq("Front Matter")
-      expect(jats.dig("publisher_name")).to eq("Front Matter")
-      expect(jats.dig("person_group", "name")).to eq("surname"=>"Fenner", "given_names"=>"Martin")
-      expect(jats.dig("year")).to eq("iso_8601_date"=>"2016-12-20T00:00:00Z", "__content__"=>"2016")
-      expect(jats.dig("month")).to eq("12")
-      expect(jats.dig("day")).to eq("20")
-      expect(jats.dig("pub_id")).to eq("pub_id_type"=>"doi", "__content__"=>"10.53731/r79vxn1-97aq74v-ag58n")
+    it 'from schema_org' do
+      input = 'https://blog.front-matter.io/posts/eating-your-own-dog-food/'
+      subject = described_class.new(input: input, from: 'schema_org')
+      jats = Maremma.from_xml(subject.jats).fetch('element_citation', {})
+      expect(jats['publication_type']).to eq('journal')
+      expect(jats['article_title']).to eq('Eating your own Dog Food')
+      expect(jats['source']).to eq('Front Matter')
+      expect(jats['publisher_name']).to eq('Front Matter')
+      expect(jats.dig('person_group',
+                      'name')).to eq('surname' => 'Fenner', 'given_names' => 'Martin')
+      expect(jats['year']).to eq('iso_8601_date' => '2016-12-20T00:00:00Z', '__content__' => '2016')
+      expect(jats['month']).to eq('12')
+      expect(jats['day']).to eq('20')
+      expect(jats['pub_id']).to eq('pub_id_type' => 'doi',
+                                   '__content__' => '10.53731/r79vxn1-97aq74v-ag58n')
     end
-    it "interactive resource without dates" do
-      input = "https://doi.org/10.34747/g6yb-3412"
-      subject = Briard::Metadata.new(input: input, from: "datacite")
-      jats = Maremma.from_xml(subject.jats).fetch("element_citation", {})
-      expect(jats.dig("publication_type")).to be_nil
-      expect(jats.dig("source")).to eq("Exploring the \"Many analysts, one dataset\" project from COS")
-      expect(jats.dig("publisher_name")).to eq("Gigantum, Inc.")
-      expect(jats.dig("person_group", "name")).to eq("given_names"=>"Dav", "surname"=>"Clark")
-      expect(jats.dig("year")).to eq("__content__"=>"2019", "iso_8601_date"=>"2019")
-      expect(jats.dig("month")).to be_nil
-      expect(jats.dig("day")).to be_nil
-      expect(jats.dig("pub_id")).to eq("pub_id_type"=>"doi", "__content__"=>"10.34747/g6yb-3412")
+    it 'interactive resource without dates' do
+      input = 'https://doi.org/10.34747/g6yb-3412'
+      subject = described_class.new(input: input, from: 'datacite')
+      jats = Maremma.from_xml(subject.jats).fetch('element_citation', {})
+      expect(jats['publication_type'].nil?).to be(true)
+      expect(jats['source']).to eq('Exploring the "Many analysts, one dataset" project from COS')
+      expect(jats['publisher_name']).to eq('Gigantum, Inc.')
+      expect(jats.dig('person_group', 'name')).to eq('given_names' => 'Dav', 'surname' => 'Clark')
+      expect(jats['year']).to eq('__content__' => '2019', 'iso_8601_date' => '2019')
+      expect(jats['month'].nil?).to be(true)
+      expect(jats['day'].nil?).to be(true)
+      expect(jats['pub_id']).to eq('pub_id_type' => 'doi', '__content__' => '10.34747/g6yb-3412')
     end
   end
-  context "change metadata as datacite xml" do
-    it "with data citation" do
-      input = "10.7554/eLife.01567"
-      subject = Briard::Metadata.new(input: input, from: "crossref")
-      jats = Maremma.from_xml(subject.jats).fetch("element_citation", {})
-      expect(jats.dig("publication_type")).to eq("journal")
-      expect(jats.dig("article_title")).to eq("Automated quantitative histology reveals vascular morphodynamics during Arabidopsis hypocotyl secondary growth")
-      expect(jats.dig("source")).to eq("eLife")
-      expect(jats.dig("person_group", "name").length).to eq(5)
-      expect(jats.dig("person_group", "name").first).to eq("surname"=>"Sankar", "given_names"=>"Martial")
-      expect(jats.dig("year")).to eq("iso_8601_date"=>"2014-02-11", "__content__"=>"2014")
-      expect(jats.dig("month")).to eq("02")
-      expect(jats.dig("day")).to eq("11")
-      expect(jats.dig("pub_id")).to eq("pub_id_type"=>"doi", "__content__"=>"10.7554/elife.01567")
+  context 'change metadata as datacite xml' do
+    it 'with data citation' do
+      input = '10.7554/eLife.01567'
+      subject = described_class.new(input: input, from: 'crossref')
+      jats = Maremma.from_xml(subject.jats).fetch('element_citation', {})
+      expect(jats['publication_type']).to eq('journal')
+      expect(jats['article_title']).to eq('Automated quantitative histology reveals vascular morphodynamics during Arabidopsis hypocotyl secondary growth')
+      expect(jats['source']).to eq('eLife')
+      expect(jats.dig('person_group', 'name').length).to eq(5)
+      expect(jats.dig('person_group',
+                      'name').first).to eq('surname' => 'Sankar', 'given_names' => 'Martial')
+      expect(jats['year']).to eq('iso_8601_date' => '2014-02-11', '__content__' => '2014')
+      expect(jats['month']).to eq('02')
+      expect(jats['day']).to eq('11')
+      expect(jats['pub_id']).to eq('pub_id_type' => 'doi', '__content__' => '10.7554/elife.01567')
     end
   end
 end

data/spec/writers/rdf_xml_writer_spec.rb CHANGED Viewed

@@ -3,84 +3,89 @@
 require 'spec_helper'
 describe Briard::Metadata, vcr: true do
-  context "write metadata as rdf xml" do
-    it "journal article" do
-      input = "10.7554/eLife.01567"
-      subject = Briard::Metadata.new(input: input, from: "crossref")
+  context 'write metadata as rdf xml' do
+    it 'journal article' do
+      input = '10.7554/eLife.01567'
+      subject = described_class.new(input: input, from: 'crossref')
       expect(subject.valid?).to be true
-      rdf_xml = Maremma.from_xml(subject.rdf_xml).fetch("RDF", {})
-      expect(rdf_xml.dig("ScholarlyArticle", "rdf:about")).to eq("https://doi.org/10.7554/elife.01567")
-      expect(rdf_xml.dig("ScholarlyArticle", "name")).to eq("Automated quantitative histology reveals vascular morphodynamics during Arabidopsis hypocotyl secondary growth")
-      expect(rdf_xml.dig("ScholarlyArticle", "datePublished", "__content__")).to eq("2014-02-11")
+      rdf_xml = Maremma.from_xml(subject.rdf_xml).fetch('RDF', {})
+      expect(rdf_xml.dig('ScholarlyArticle', 'rdf:about')).to eq('https://doi.org/10.7554/elife.01567')
+      expect(rdf_xml.dig('ScholarlyArticle',
+                         'name')).to eq('Automated quantitative histology reveals vascular morphodynamics during Arabidopsis hypocotyl secondary growth')
+      expect(rdf_xml.dig('ScholarlyArticle', 'datePublished', '__content__')).to eq('2014-02-11')
     end
-    it "with pages" do
-      input = "https://doi.org/10.1155/2012/291294"
-      subject = Briard::Metadata.new(input: input, from: "crossref")
+    it 'with pages' do
+      input = 'https://doi.org/10.1155/2012/291294'
+      subject = described_class.new(input: input, from: 'crossref')
       expect(subject.valid?).to be true
-      rdf_xml = Maremma.from_xml(subject.rdf_xml).fetch("RDF", {})
-      expect(rdf_xml.dig("ScholarlyArticle", "rdf:about")).to eq("https://doi.org/10.1155/2012/291294")
-      expect(rdf_xml.dig("ScholarlyArticle", "name")).to eq("Delineating a Retesting Zone Using Receiver Operating Characteristic Analysis on Serial QuantiFERON Tuberculosis Test Results in US Healthcare Workers")
-      expect(rdf_xml.dig("ScholarlyArticle", "datePublished", "__content__")).to eq("2012")
-      expect(rdf_xml.dig("ScholarlyArticle", "pageStart")).to eq("1")
-      expect(rdf_xml.dig("ScholarlyArticle", "pageEnd")).to eq("7")
+      rdf_xml = Maremma.from_xml(subject.rdf_xml).fetch('RDF', {})
+      expect(rdf_xml.dig('ScholarlyArticle', 'rdf:about')).to eq('https://doi.org/10.1155/2012/291294')
+      expect(rdf_xml.dig('ScholarlyArticle',
+                         'name')).to eq('Delineating a Retesting Zone Using Receiver Operating Characteristic Analysis on Serial QuantiFERON Tuberculosis Test Results in US Healthcare Workers')
+      expect(rdf_xml.dig('ScholarlyArticle', 'datePublished', '__content__')).to eq('2012')
+      expect(rdf_xml.dig('ScholarlyArticle', 'pageStart')).to eq('1')
+      expect(rdf_xml.dig('ScholarlyArticle', 'pageEnd')).to eq('7')
     end
-    it "Crossref DOI" do
-      input = fixture_path + "crossref.bib"
-      subject = Briard::Metadata.new(input: input, from: "bibtex")
+    it 'Crossref DOI' do
+      input = "#{fixture_path}crossref.bib"
+      subject = described_class.new(input: input, from: 'bibtex')
       expect(subject.valid?).to be true
-      rdf_xml = Maremma.from_xml(subject.rdf_xml).fetch("RDF", {})
+      rdf_xml = Maremma.from_xml(subject.rdf_xml).fetch('RDF', {})
-      expect(rdf_xml.dig("ScholarlyArticle", "rdf:about")).to eq("https://doi.org/10.7554/elife.01567")
-      expect(rdf_xml.dig("ScholarlyArticle", "name")).to eq("Automated quantitative histology reveals vascular morphodynamics during Arabidopsis hypocotyl secondary growth")
-      expect(rdf_xml.dig("ScholarlyArticle", "datePublished", "__content__")).to eq("2014")
-      expect(rdf_xml.dig("ScholarlyArticle", "periodical", "Journal", "name")).to eq("eLife")
+      expect(rdf_xml.dig('ScholarlyArticle', 'rdf:about')).to eq('https://doi.org/10.7554/elife.01567')
+      expect(rdf_xml.dig('ScholarlyArticle',
+                         'name')).to eq('Automated quantitative histology reveals vascular morphodynamics during Arabidopsis hypocotyl secondary growth')
+      expect(rdf_xml.dig('ScholarlyArticle', 'datePublished', '__content__')).to eq('2014')
+      expect(rdf_xml.dig('ScholarlyArticle', 'periodical', 'Journal', 'name')).to eq('eLife')
     end
-    it "BlogPosting" do
-      input = "https://doi.org/10.5438/4K3M-NYVG"
-      subject = Briard::Metadata.new(input: input, from: "datacite")
+    it 'BlogPosting' do
+      input = 'https://doi.org/10.5438/4K3M-NYVG'
+      subject = described_class.new(input: input, from: 'datacite')
       expect(subject.valid?).to be true
-      rdf_xml = Maremma.from_xml(subject.rdf_xml).fetch("RDF", {})
-      expect(rdf_xml.dig("ScholarlyArticle", "rdf:about")).to eq("https://doi.org/10.5438/4k3m-nyvg")
-      expect(rdf_xml.dig("ScholarlyArticle", "name")).to eq("Eating your own Dog Food")
-      expect(rdf_xml.dig("ScholarlyArticle", "keywords")).to eq("datacite, doi, metadata, FOS: Computer and information sciences")
-      expect(rdf_xml.dig("ScholarlyArticle", "datePublished", "__content__")).to eq("2016-12-20")
+      rdf_xml = Maremma.from_xml(subject.rdf_xml).fetch('RDF', {})
+      expect(rdf_xml.dig('ScholarlyArticle', 'rdf:about')).to eq('https://doi.org/10.5438/4k3m-nyvg')
+      expect(rdf_xml.dig('ScholarlyArticle', 'name')).to eq('Eating your own Dog Food')
+      expect(rdf_xml.dig('ScholarlyArticle',
+                         'keywords')).to eq('datacite, doi, metadata, FOS: Computer and information sciences')
+      expect(rdf_xml.dig('ScholarlyArticle', 'datePublished', '__content__')).to eq('2016-12-20')
     end
-    it "BlogPosting Citeproc JSON" do
-      input = fixture_path + "citeproc.json"
-      subject = Briard::Metadata.new(input: input, from: "citeproc")
-      rdf_xml = Maremma.from_xml(subject.rdf_xml).fetch("RDF", {})
-      expect(rdf_xml.dig("BlogPosting", "rdf:about")).to eq("https://doi.org/10.5438/4k3m-nyvg")
-      expect(rdf_xml.dig("BlogPosting", "name")).to eq("Eating your own Dog Food")
-      expect(rdf_xml.dig("BlogPosting", "datePublished", "__content__")).to eq("2016-12-20")
+    it 'BlogPosting Citeproc JSON' do
+      input = "#{fixture_path}citeproc.json"
+      subject = described_class.new(input: input, from: 'citeproc')
+      rdf_xml = Maremma.from_xml(subject.rdf_xml).fetch('RDF', {})
+      expect(rdf_xml.dig('BlogPosting', 'rdf:about')).to eq('https://doi.org/10.5438/4k3m-nyvg')
+      expect(rdf_xml.dig('BlogPosting', 'name')).to eq('Eating your own Dog Food')
+      expect(rdf_xml.dig('BlogPosting', 'datePublished', '__content__')).to eq('2016-12-20')
     end
-    it "maremma" do
-      input = "https://github.com/datacite/maremma"
-      subject = Briard::Metadata.new(input: input, from: "codemeta")
-      rdf_xml = Maremma.from_xml(subject.rdf_xml).fetch("RDF", {})
-      expect(rdf_xml.dig("SoftwareSourceCode", "rdf:about")).to eq("https://doi.org/10.5438/qeg0-3gm3")
-      expect(rdf_xml.dig("SoftwareSourceCode", "author", "Person", "rdf:about")).to eq("https://orcid.org/0000-0003-0077-4738")
-      expect(rdf_xml.dig("SoftwareSourceCode", "author", "Person", "name")).to eq("Martin Fenner")
-      expect(rdf_xml.dig("SoftwareSourceCode", "name")).to eq("Maremma: a Ruby library for simplified network calls")
-      expect(rdf_xml.dig("SoftwareSourceCode", "keywords")).to eq("faraday, excon, net/http")
-      expect(rdf_xml.dig("SoftwareSourceCode", "datePublished", "__content__")).to eq("2017-02-24")
+    it 'maremma' do
+      input = 'https://github.com/datacite/maremma'
+      subject = described_class.new(input: input, from: 'codemeta')
+      rdf_xml = Maremma.from_xml(subject.rdf_xml).fetch('RDF', {})
+      expect(rdf_xml.dig('SoftwareSourceCode', 'rdf:about')).to eq('https://doi.org/10.5438/qeg0-3gm3')
+      expect(rdf_xml.dig('SoftwareSourceCode', 'author', 'Person', 'rdf:about')).to eq('https://orcid.org/0000-0003-0077-4738')
+      expect(rdf_xml.dig('SoftwareSourceCode', 'author', 'Person', 'name')).to eq('Martin Fenner')
+      expect(rdf_xml.dig('SoftwareSourceCode',
+                         'name')).to eq('Maremma: a Ruby library for simplified network calls')
+      expect(rdf_xml.dig('SoftwareSourceCode', 'keywords')).to eq('faraday, excon, net/http')
+      expect(rdf_xml.dig('SoftwareSourceCode', 'datePublished', '__content__')).to eq('2017-02-24')
     end
-    it "BlogPosting schema.org" do
-      input = "https://blog.front-matter.io/posts/eating-your-own-dog-food/"
-      subject = Briard::Metadata.new(input: input, from: "schema_org")
+    it 'BlogPosting schema.org' do
+      input = 'https://blog.front-matter.io/posts/eating-your-own-dog-food/'
+      subject = described_class.new(input: input, from: 'schema_org')
       expect(subject.valid?).to be true
-      rdf_xml = Maremma.from_xml(subject.rdf_xml).fetch("RDF", {})
-      expect(rdf_xml.dig("Article", "rdf:about")).to eq("https://doi.org/10.53731/r79vxn1-97aq74v-ag58n")
-      expect(rdf_xml.dig("Article", "author", "Person", "rdf:about")).to eq("https://orcid.org/0000-0003-1419-2405")
-      expect(rdf_xml.dig("Article", "author", "Person", "name")).to eq("Martin Fenner")
-      expect(rdf_xml.dig("Article", "name")).to eq("Eating your own Dog Food")
-      expect(rdf_xml.dig("Article", "keywords")).to eq("feature")
-      expect(rdf_xml.dig("Article", "datePublished", "__content__")).to eq("2016-12-20T00:00:00Z")
+      rdf_xml = Maremma.from_xml(subject.rdf_xml).fetch('RDF', {})
+      expect(rdf_xml.dig('Article', 'rdf:about')).to eq('https://doi.org/10.53731/r79vxn1-97aq74v-ag58n')
+      expect(rdf_xml.dig('Article', 'author', 'Person', 'rdf:about')).to eq('https://orcid.org/0000-0003-1419-2405')
+      expect(rdf_xml.dig('Article', 'author', 'Person', 'name')).to eq('Martin Fenner')
+      expect(rdf_xml.dig('Article', 'name')).to eq('Eating your own Dog Food')
+      expect(rdf_xml.dig('Article', 'keywords')).to eq('feature')
+      expect(rdf_xml.dig('Article', 'datePublished', '__content__')).to eq('2016-12-20T00:00:00Z')
     end
   end
 end