RubyGems - briard - Versions diffs - 2.4.2 → 2.6.1 - Mend

briard 2.4.2 → 2.6.1

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (83) hide show

checksums.yaml +4 -4
data/.github/workflows/codeql-analysis.yml +72 -0
data/.github/workflows/rubocop.yml +50 -0
data/.gitignore +1 -0
data/.rubocop.yml +144 -620
data/.rubocop_todo.yml +76 -0
data/CHANGELOG.md +18 -0
data/Gemfile +2 -0
data/Gemfile.lock +43 -9
data/Rakefile +1 -1
data/{bolognese.gemspec → briard.gemspec} +46 -39
data/lib/briard/array.rb +2 -2
data/lib/briard/author_utils.rb +79 -71
data/lib/briard/cli.rb +12 -13
data/lib/briard/crossref_utils.rb +73 -61
data/lib/briard/datacite_utils.rb +132 -106
data/lib/briard/doi_utils.rb +10 -10
data/lib/briard/metadata.rb +96 -106
data/lib/briard/metadata_utils.rb +87 -78
data/lib/briard/readers/bibtex_reader.rb +65 -65
data/lib/briard/readers/cff_reader.rb +88 -70
data/lib/briard/readers/citeproc_reader.rb +90 -84
data/lib/briard/readers/codemeta_reader.rb +68 -50
data/lib/briard/readers/crosscite_reader.rb +2 -2
data/lib/briard/readers/crossref_reader.rb +249 -210
data/lib/briard/readers/datacite_json_reader.rb +3 -3
data/lib/briard/readers/datacite_reader.rb +225 -189
data/lib/briard/readers/npm_reader.rb +49 -42
data/lib/briard/readers/ris_reader.rb +82 -80
data/lib/briard/readers/schema_org_reader.rb +182 -159
data/lib/briard/string.rb +1 -1
data/lib/briard/utils.rb +4 -4
data/lib/briard/version.rb +3 -1
data/lib/briard/whitelist_scrubber.rb +11 -4
data/lib/briard/writers/bibtex_writer.rb +14 -8
data/lib/briard/writers/cff_writer.rb +33 -26
data/lib/briard/writers/codemeta_writer.rb +19 -15
data/lib/briard/writers/csv_writer.rb +6 -4
data/lib/briard/writers/datacite_json_writer.rb +8 -2
data/lib/briard/writers/jats_writer.rb +33 -28
data/lib/briard/writers/rdf_xml_writer.rb +1 -1
data/lib/briard/writers/ris_writer.rb +30 -18
data/lib/briard/writers/turtle_writer.rb +1 -1
data/lib/briard.rb +6 -6
data/rubocop.sarif +0 -0
data/spec/array_spec.rb +5 -5
data/spec/author_utils_spec.rb +151 -132
data/spec/datacite_utils_spec.rb +135 -83
data/spec/doi_utils_spec.rb +168 -164
data/spec/find_from_format_spec.rb +69 -69
data/spec/fixtures/vcr_cassettes/Briard_Metadata/sanitize/onlies_keep_specific_tags.yml +65 -0
data/spec/fixtures/vcr_cassettes/Briard_Metadata/sanitize/removes_a_tags.yml +65 -0
data/spec/metadata_spec.rb +91 -90
data/spec/readers/bibtex_reader_spec.rb +43 -38
data/spec/readers/cff_reader_spec.rb +165 -153
data/spec/readers/citeproc_reader_spec.rb +45 -40
data/spec/readers/codemeta_reader_spec.rb +128 -115
data/spec/readers/crosscite_reader_spec.rb +34 -24
data/spec/readers/crossref_reader_spec.rb +1098 -939
data/spec/readers/datacite_json_reader_spec.rb +53 -40
data/spec/readers/datacite_reader_spec.rb +1541 -1337
data/spec/readers/npm_reader_spec.rb +48 -43
data/spec/readers/ris_reader_spec.rb +53 -47
data/spec/readers/schema_org_reader_spec.rb +329 -267
data/spec/spec_helper.rb +6 -5
data/spec/utils_spec.rb +371 -347
data/spec/writers/bibtex_writer_spec.rb +143 -143
data/spec/writers/cff_writer_spec.rb +96 -90
data/spec/writers/citation_writer_spec.rb +34 -33
data/spec/writers/citeproc_writer_spec.rb +226 -224
data/spec/writers/codemeta_writer_spec.rb +18 -16
data/spec/writers/crosscite_writer_spec.rb +91 -73
data/spec/writers/crossref_writer_spec.rb +99 -91
data/spec/writers/csv_writer_spec.rb +70 -70
data/spec/writers/datacite_json_writer_spec.rb +78 -68
data/spec/writers/datacite_writer_spec.rb +417 -322
data/spec/writers/jats_writer_spec.rb +177 -161
data/spec/writers/rdf_xml_writer_spec.rb +68 -63
data/spec/writers/ris_writer_spec.rb +162 -162
data/spec/writers/schema_org_writer_spec.rb +329 -294
data/spec/writers/turtle_writer_spec.rb +47 -47
metadata +242 -166
data/.github/workflows/release.yml +0 -47

data/spec/datacite_utils_spec.rb CHANGED Viewed

@@ -3,41 +3,54 @@
 require 'spec_helper'
 describe Briard::Metadata, vcr: true do
-  let(:input) { "https://doi.org/10.5061/DRYAD.8515" }
+  subject { described_class.new(input: input, from: 'datacite') }
-  subject { Briard::Metadata.new(input: input, from: "datacite") }
+  let(:input) { 'https://doi.org/10.5061/DRYAD.8515' }
-  context "insert_identifier" do
-    it "doi" do
-      xml = Nokogiri::XML::Builder.new(:encoding => 'UTF-8') { |xml| subject.insert_identifier(xml) }.to_xml
+  context 'insert_identifier' do
+    it 'doi' do
+      xml = Nokogiri::XML::Builder.new(encoding: 'UTF-8') do |xml|
+        subject.insert_identifier(xml)
+      end.to_xml
       response = Maremma.from_xml(xml)
-      expect(response["identifier"]).to eq("identifierType"=>"DOI", "__content__"=>"10.5061/dryad.8515")
+      expect(response['identifier']).to eq('identifierType' => 'DOI',
+                                           '__content__' => '10.5061/dryad.8515')
     end
   end
-  context "insert_creators" do
-    it "insert" do
-      xml = Nokogiri::XML::Builder.new(:encoding => 'UTF-8') { |xml| subject.insert_creators(xml) }.to_xml
+  context 'insert_creators' do
+    it 'insert' do
+      xml = Nokogiri::XML::Builder.new(encoding: 'UTF-8') do |xml|
+        subject.insert_creators(xml)
+      end.to_xml
       response = Maremma.from_xml(xml)
-      expect(response.dig("creators", "creator").first).to eq("affiliation" => {"__content__"=>"Centre International de Recherches Médicales de Franceville", "affiliationIdentifier"=>"https://ror.org/01wyqb997", "affiliationIdentifierScheme"=>"ROR"}, "creatorName"=>{"__content__"=>"Ollomo, Benjamin", "nameType"=>"Personal"}, "familyName"=>"Ollomo", "givenName"=>"Benjamin")
+      expect(response.dig('creators',
+                          'creator').first).to eq(
+                            'affiliation' => { '__content__' => 'Centre International de Recherches Médicales de Franceville',
+                                               'affiliationIdentifier' => 'https://ror.org/01wyqb997', 'affiliationIdentifierScheme' => 'ROR' }, 'creatorName' => { '__content__' => 'Ollomo, Benjamin', 'nameType' => 'Personal' }, 'familyName' => 'Ollomo', 'givenName' => 'Benjamin'
+                          )
     end
   end
-  context "insert_contributors" do
-    it "none" do
-      xml = Nokogiri::XML::Builder.new(:encoding => 'UTF-8') { |xml| subject.insert_contributors(xml) }.to_xml
+  context 'insert_contributors' do
+    it 'none' do
+      xml = Nokogiri::XML::Builder.new(encoding: 'UTF-8') do |xml|
+        subject.insert_contributors(xml)
+      end.to_xml
       response = Maremma.from_xml(xml)
-      expect(response).to be_nil
+      expect(response.nil?).to be(true)
     end
   end
-  context "insert_person" do
-    it "creator only name" do
-      person = { "name" => "Carberry, Josiah" }
-      type = "creator"
-      xml = Nokogiri::XML::Builder.new(:encoding => 'UTF-8') { |xml| subject.insert_person(xml, person, type) }.to_xml
+  context 'insert_person' do
+    it 'creator only name' do
+      person = { 'name' => 'Carberry, Josiah' }
+      type = 'creator'
+      xml = Nokogiri::XML::Builder.new(encoding: 'UTF-8') do |xml|
+        subject.insert_person(xml, person, type)
+      end.to_xml
       response = Maremma.from_xml(xml)
-      expect(response).to eq("creatorName"=>"Carberry, Josiah")
+      expect(response).to eq('creatorName' => 'Carberry, Josiah')
     end
     # it "creator given and family name" do
@@ -49,35 +62,45 @@ describe Briard::Metadata, vcr: true do
     # end
   end
-  context "insert_titles" do
-    it "insert" do
-      xml = Nokogiri::XML::Builder.new(:encoding => 'UTF-8') { |xml| subject.insert_titles(xml) }.to_xml
+  context 'insert_titles' do
+    it 'insert' do
+      xml = Nokogiri::XML::Builder.new(encoding: 'UTF-8') do |xml|
+        subject.insert_titles(xml)
+      end.to_xml
       response = Maremma.from_xml(xml)
-      expect(response.dig("titles", "title")).to eq("Data from: A new malaria agent in African hominids.")
+      expect(response.dig('titles',
+                          'title')).to eq('Data from: A new malaria agent in African hominids.')
     end
   end
-  context "insert_publisher" do
-    it "insert" do
-      xml = Nokogiri::XML::Builder.new(:encoding => 'UTF-8') { |xml| subject.insert_publisher(xml) }.to_xml
+  context 'insert_publisher' do
+    it 'insert' do
+      xml = Nokogiri::XML::Builder.new(encoding: 'UTF-8') do |xml|
+        subject.insert_publisher(xml)
+      end.to_xml
       response = Maremma.from_xml(xml)
-      expect(response["publisher"]).to eq("Dryad")
+      expect(response['publisher']).to eq('Dryad')
     end
   end
-  context "insert_publication_year" do
-    it "insert" do
-      xml = Nokogiri::XML::Builder.new(:encoding => 'UTF-8') { |xml| subject.insert_publication_year(xml) }.to_xml
+  context 'insert_publication_year' do
+    it 'insert' do
+      xml = Nokogiri::XML::Builder.new(encoding: 'UTF-8') do |xml|
+        subject.insert_publication_year(xml)
+      end.to_xml
       response = Maremma.from_xml(xml)
-      expect(response["publicationYear"]).to eq("2011")
+      expect(response['publicationYear']).to eq('2011')
     end
   end
-  context "insert_resource_type" do
-    it "insert" do
-      xml = Nokogiri::XML::Builder.new(:encoding => 'UTF-8') { |xml| subject.insert_resource_type(xml) }.to_xml
+  context 'insert_resource_type' do
+    it 'insert' do
+      xml = Nokogiri::XML::Builder.new(encoding: 'UTF-8') do |xml|
+        subject.insert_resource_type(xml)
+      end.to_xml
       response = Maremma.from_xml(xml)
-      expect(response["resourceType"]).to eq("resourceTypeGeneral"=>"Dataset", "__content__"=>"dataset")
+      expect(response['resourceType']).to eq('resourceTypeGeneral' => 'Dataset',
+                                             '__content__' => 'dataset')
     end
   end
@@ -89,90 +112,119 @@ describe Briard::Metadata, vcr: true do
   #   end
   # end
-  context "insert_dates" do
-    it "insert" do
-      xml = Nokogiri::XML::Builder.new(:encoding => 'UTF-8') { |xml| subject.insert_dates(xml) }.to_xml
+  context 'insert_dates' do
+    it 'insert' do
+      xml = Nokogiri::XML::Builder.new(encoding: 'UTF-8') do |xml|
+        subject.insert_dates(xml)
+      end.to_xml
       response = Maremma.from_xml(xml)
-      expect(response.dig("dates", "date")).to eq([{"__content__"=>"2011-02-01T17:22:41Z", "dateType"=>"Available"}, {"__content__"=>"2011", "dateType"=>"Issued"}])
+      expect(response.dig('dates',
+                          'date')).to eq([{ '__content__' => '2011-02-01T17:22:41Z', 'dateType' => 'Available' },
+                                          { '__content__' => '2011', 'dateType' => 'Issued' }])
     end
   end
-  context "insert_subjects" do
-    it "insert" do
-      xml = Nokogiri::XML::Builder.new(:encoding => 'UTF-8') { |xml| subject.insert_subjects(xml) }.to_xml
+  context 'insert_subjects' do
+    it 'insert' do
+      xml = Nokogiri::XML::Builder.new(encoding: 'UTF-8') do |xml|
+        subject.insert_subjects(xml)
+      end.to_xml
       response = Maremma.from_xml(xml)
-      expect(response.dig("subjects", "subject")).to eq(["plasmodium", "malaria", "mitochondrial genome", "parasites"])
+      expect(response.dig('subjects',
+                          'subject')).to eq(['plasmodium', 'malaria', 'mitochondrial genome',
+                                             'parasites'])
     end
   end
-  context "insert_version" do
-    it "insert" do
-      xml = Nokogiri::XML::Builder.new(:encoding => 'UTF-8') { |xml| subject.insert_version(xml) }.to_xml
+  context 'insert_version' do
+    it 'insert' do
+      xml = Nokogiri::XML::Builder.new(encoding: 'UTF-8') do |xml|
+        subject.insert_version(xml)
+      end.to_xml
       response = Maremma.from_xml(xml)
-      expect(response.fetch("version", nil)).to eq("1")
+      expect(response.fetch('version', nil)).to eq('1')
     end
   end
-  context "insert_sizes" do
-    it "insert" do
-      xml = Nokogiri::XML::Builder.new(:encoding => 'UTF-8') { |xml| subject.insert_sizes(xml) }.to_xml
+  context 'insert_sizes' do
+    it 'insert' do
+      xml = Nokogiri::XML::Builder.new(encoding: 'UTF-8') do |xml|
+        subject.insert_sizes(xml)
+      end.to_xml
       response = Maremma.from_xml(xml)
-      expect(response.fetch("sizes", nil)).to eq("size"=>"107328 bytes")
+      expect(response.fetch('sizes', nil)).to eq('size' => '107328 bytes')
     end
   end
-  context "insert_formats" do
-    let(:input) { IO.read(fixture_path + 'datacite-empty-sizes.xml') }
-    subject { Briard::Metadata.new(input: input, from: "datacite") }
+  context 'insert_formats' do
+    subject { described_class.new(input: input, from: 'datacite') }
-    it "insert" do
-      xml = Nokogiri::XML::Builder.new(:encoding => 'UTF-8') { |xml| subject.insert_formats(xml) }.to_xml
+    let(:input) { File.read("#{fixture_path}datacite-empty-sizes.xml") }
+    it 'insert' do
+      xml = Nokogiri::XML::Builder.new(encoding: 'UTF-8') do |xml|
+        subject.insert_formats(xml)
+      end.to_xml
       response = Maremma.from_xml(xml)
-      expect(response.fetch("formats", nil)).to eq("format" => "text")
+      expect(response.fetch('formats', nil)).to eq('format' => 'text')
     end
   end
-  context "insert_language" do
-    it "insert" do
-      xml = Nokogiri::XML::Builder.new(:encoding => 'UTF-8') { |xml| subject.insert_language(xml) }.to_xml
+  context 'insert_language' do
+    it 'insert' do
+      xml = Nokogiri::XML::Builder.new(encoding: 'UTF-8') do |xml|
+        subject.insert_language(xml)
+      end.to_xml
       response = Maremma.from_xml(xml)
-      expect(response.fetch("language", nil)).to eq("en")
+      expect(response.fetch('language', nil)).to eq('en')
     end
   end
-  context "insert_related_identifiers" do
-    it "related_identifier" do
+  context 'insert_related_identifiers' do
+    it 'related_identifier' do
       expect(subject.related_identifiers.length).to eq(1)
-      expect(subject.related_identifiers.first).to eq("relatedIdentifier"=>"10.1371/journal.ppat.1000446", "relatedIdentifierType"=>"DOI", "relationType"=>"IsCitedBy")
+      expect(subject.related_identifiers.first).to eq(
+        'relatedIdentifier' => '10.1371/journal.ppat.1000446', 'relatedIdentifierType' => 'DOI', 'relationType' => 'IsCitedBy'
+      )
     end
-    it "insert" do
-      xml = Nokogiri::XML::Builder.new(:encoding => 'UTF-8') { |xml| subject.insert_related_identifiers(xml) }.to_xml
+    it 'insert' do
+      xml = Nokogiri::XML::Builder.new(encoding: 'UTF-8') do |xml|
+        subject.insert_related_identifiers(xml)
+      end.to_xml
       response = Maremma.from_xml(xml)
-      expect(response.dig("relatedIdentifiers", "relatedIdentifier")).to eq("__content__"=>"10.1371/journal.ppat.1000446", "relatedIdentifierType"=>"DOI", "relationType"=>"IsCitedBy")
+      expect(response.dig('relatedIdentifiers',
+                          'relatedIdentifier')).to eq('__content__' => '10.1371/journal.ppat.1000446',
+                                                      'relatedIdentifierType' => 'DOI', 'relationType' => 'IsCitedBy')
     end
   end
-  context "insert_rights_list" do
-    it "insert" do
-      xml = Nokogiri::XML::Builder.new(:encoding => 'UTF-8') { |xml| subject.insert_rights_list(xml) }.to_xml
+  context 'insert_rights_list' do
+    it 'insert' do
+      xml = Nokogiri::XML::Builder.new(encoding: 'UTF-8') do |xml|
+        subject.insert_rights_list(xml)
+      end.to_xml
       response = Maremma.from_xml(xml)
-      expect(response.dig("rightsList", "rights")).to eq("__content__" => "Creative Commons Zero v1.0 Universal",
-        "rightsIdentifier" => "cc0-1.0",
-        "rightsIdentifierScheme" => "SPDX",
-        "rightsURI" => "https://creativecommons.org/publicdomain/zero/1.0/legalcode",
-        "schemeURI" => "https://spdx.org/licenses/")
+      expect(response.dig('rightsList',
+                          'rights')).to eq('__content__' => 'Creative Commons Zero v1.0 Universal',
+                                           'rightsIdentifier' => 'cc0-1.0',
+                                           'rightsIdentifierScheme' => 'SPDX',
+                                           'rightsURI' => 'https://creativecommons.org/publicdomain/zero/1.0/legalcode',
+                                           'schemeURI' => 'https://spdx.org/licenses/')
     end
   end
-  context "insert_descriptions" do
-    it "insert" do
-      input = "https://doi.org/10.5438/4K3M-NYVG"
-      subject = Briard::Metadata.new(input: input, from: "datacite")
-      xml = Nokogiri::XML::Builder.new(:encoding => 'UTF-8') { |xml| subject.insert_descriptions(xml) }.to_xml
+  context 'insert_descriptions' do
+    it 'insert' do
+      input = 'https://doi.org/10.5438/4K3M-NYVG'
+      subject = described_class.new(input: input, from: 'datacite')
+      xml = Nokogiri::XML::Builder.new(encoding: 'UTF-8') do |xml|
+        subject.insert_descriptions(xml)
+      end.to_xml
       response = Maremma.from_xml(xml)
-      expect(response.dig("descriptions", "description")).to eq("descriptionType" => "Abstract", "__content__" => "Eating your own dog food is a slang term to describe that an organization should itself use the products and services it provides. For DataCite this means that we should use DOIs with appropriate metadata and strategies for long-term preservation for...")
+      expect(response.dig('descriptions',
+                          'description')).to eq('descriptionType' => 'Abstract',
+                                                '__content__' => 'Eating your own dog food is a slang term to describe that an organization should itself use the products and services it provides. For DataCite this means that we should use DOIs with appropriate metadata and strategies for long-term preservation for...')
     end
   end
 end