RubyGems - stanford-mods - Versions diffs - 0.0.2 → 0.0.3 - Mend

stanford-mods 0.0.2 → 0.0.3

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (8) hide show

data/README.rdoc +11 -0
data/lib/stanford-mods/searchworks.rb +55 -0
data/lib/stanford-mods/searchworks_languages.rb +519 -0
data/lib/stanford-mods/version.rb +1 -1
data/lib/stanford-mods.rb +1 -6
data/spec/spec_helper.rb +21 -0
data/spec/values_for_req_sw_spec.rb +119 -0
metadata +11 -5

data/README.rdoc CHANGED Viewed

@@ -39,6 +39,16 @@ Or install it yourself as:
   in foo!
   => nil
+Example Using SearchWorks Mixins:
+  > require 'stanford-mods/searchworks'
+	> m = Stanford::Mods::Record.new
+	> m.from_str('<mods><language><languageTerm authority="iso639-2b" type="code">dut</languageTerm></language></mods>')
+	> m.language_facet    <-- from Searchworks mixin
+	=> ['Dutch']
+	> m.languages         <-- from mods gem
+	=> ['Dutch; Flemish']
 ## Contributing
 1. Fork it
@@ -50,5 +60,6 @@ Or install it yourself as:
 == Releases
+0.0.3 began SearchWorks mixins
 0.0.2 add usage instructions to readme
 0.0.1 Initial commit - grab name

data/lib/stanford-mods/searchworks.rb ADDED Viewed

@@ -0,0 +1,55 @@
+require 'stanford-mods/searchworks_languages'
+# # SearchWorks specific wranglings of MODS metadata as an extension of the Mods::Record object
+module Stanford
+  module Mods
+    class Record < ::Mods::Record
+      # if it's coming from DOR, then it is available online
+      def access_facet
+        ['Online']
+      end
+      # include langagues known to SearchWorks; try to error correct when possible (e.g. when ISO-639 disagrees with MARC standard)
+      def language_facet
+        result = []
+        @mods_ng_xml.language.each { |n|
+          # get languageTerm codes and add their translations to the result
+          n.code_term.each { |ct|
+            if ct.authority.match(/^iso639/)
+              begin
+                vals = ct.text.split(/[,|\ ]/).reject {|x| x.strip.length == 0 }
+                vals.each do |v|
+                  iso639_val = ISO_639.find(v.strip).english_name
+                  if SEARCHWORKS_LANGUAGES.has_value?(iso639_val)
+                    result << iso639_val
+                  else
+                    result << SEARCHWORKS_LANGUAGES[v.strip]
+                  end
+                end
+              rescue => e
+                p "Couldn't find english name for #{ct.text}"
+                result << SEARCHWORKS_LANGUAGES[v.strip]
+              end
+            else
+              result << SEARCHWORKS_LANGUAGES[v.strip]
+            end
+          }
+          # add languageTerm text values
+          n.text_term.each { |tt|
+            val = tt.text.strip
+            result << val if val.length > 0 && SEARCHWORKS_LANGUAGES.has_value?(val)
+          }
+          # add language values that aren't in languageTerm subelement
+          if n.languageTerm.size == 0
+            result << n.text if SEARCHWORKS_LANGUAGES.has_value?(n.text)
+          end
+        }
+        result.uniq
+      end
+    end
+  end
+end

data/lib/stanford-mods/searchworks_languages.rb ADDED Viewed

@@ -0,0 +1,519 @@
+# Language Values used by SearchWorks
+# From  https://github.com/solrmarc/stanford-solr-marc/blob/master/stanford-sw/translation_maps/language_map.properties
+SEARCHWORKS_LANGUAGES = {
+  'aaa' => 'Afar',
+  'abk' => 'Abkhaz',
+  'ace' => 'Achinese',
+  'ach' => 'Acoli',
+  'ada' => 'Adangme',
+  'ady' => 'Adygei',
+  'afa' => 'Afroasiatic (Other)',
+  'afh' => 'Afrihili (Artificial language)',
+  'afr' => 'Afrikaans',
+  'ain' => 'Ainu',
+  'ajm' => 'Aljamia',
+  'aka' => 'Akan',
+  'akk' => 'Akkadian',
+  'alb' => 'Albanian',
+  'ale' => 'Aleut',
+  'alg' => 'Algonquian (Other)',
+  'alt' => 'Altai',
+  'amh' => 'Amharic',
+  'ang' => 'English, Old (ca. 450-1100)',
+  'anp' => 'Angika',
+  'apa' => 'Apache languages',
+  'ara' => 'Arabic',
+  'arc' => 'Aramaic',
+  'arg' => 'Aragonese Spanish',
+  'arm' => 'Armenian',
+  'arn' => 'Mapuche',
+  'arp' => 'Arapaho',
+  'art' => 'Artificial (Other)',
+  'arw' => 'Arawak',
+  'asm' => 'Assamese',
+  'ast' => 'Bable',
+  'ath' => 'Athapascan (Other)',
+  'aus' => 'Australian languages',
+  'ava' => 'Avaric',
+  'ave' => 'Avestan',
+  'awa' => 'Awadhi',
+  'aym' => 'Aymara',
+  'aze' => 'Azerbaijani',
+  'bad' => 'Banda',
+  'bai' => 'Bamileke languages',
+  'bak' => 'Bashkir',
+  'bal' => 'Baluchi',
+  'bam' => 'Bambara',
+  'ban' => 'Balinese',
+  'baq' => 'Basque',
+  'bas' => 'Basa',
+  'bat' => 'Baltic (Other)',
+  'bej' => 'Beja',
+  'bel' => 'Belarusian',
+  'bem' => 'Bemba',
+  'ben' => 'Bengali',
+  'ber' => 'Berber (Other)',
+  'bho' => 'Bhojpuri',
+  'bih' => 'Bihari',
+  'bik' => 'Bikol',
+  'bin' => 'Edo',
+  'bis' => 'Bislama',
+  'bla' => 'Siksika',
+  'bnt' => 'Bantu (Other)',
+  'bos' => 'Bosnian',
+  'bra' => 'Braj',
+  'bre' => 'Breton',
+  'btk' => 'Batak',
+  'bua' => 'Buriat',
+  'bug' => 'Bugis',
+  'bul' => 'Bulgarian',
+  'bur' => 'Burmese',
+  'byn' => 'Bilin',
+  'cad' => 'Caddo',
+  'cai' => 'Central American Indian (Other)',
+  'cam' => 'Khmer',
+  'car' => 'Carib',
+  'cat' => 'Catalan',
+  'cau' => 'Caucasian (Other)',
+  'ceb' => 'Cebuano',
+  'cel' => 'Celtic (Other)',
+  'cha' => 'Chamorro',
+  'chb' => 'Chibcha',
+  'che' => 'Chechen',
+  'chg' => 'Chagatai',
+  'chi' => 'Chinese',
+  'chk' => 'Truk',
+  'chm' => 'Mari',
+  'chn' => 'Chinook jargon',
+  'cho' => 'Choctaw',
+  'chp' => 'Chipewyan',
+  'chr' => 'Cherokee',
+  'chu' => 'Church Slavic',
+  'chv' => 'Chuvash',
+  'chy' => 'Cheyenne',
+  'cmc' => 'Chamic languages',
+  'cop' => 'Coptic',
+  'cor' => 'Cornish',
+  'cos' => 'Corsican',
+  'cpe' => 'Creoles and Pidgins, English-based (Other)',
+  'cpf' => 'Creoles and Pidgins, French-based (Other)',
+  'cpp' => 'Creoles and Pidgins, Portuguese-based (Other)',
+  'cre' => 'Cree',
+  'crh' => 'Crimean Tatar',
+  'crp' => 'Creoles and Pidgins (Other)',
+  'csb' => 'Kashubian',
+  'cus' => 'Cushitic (Other)',
+  'cze' => 'Czech',
+  'dak' => 'Dakota',
+  'dan' => 'Danish',
+  'dar' => 'Dargwa',
+  'day' => 'Dayak',
+  'del' => 'Delaware',
+  'den' => 'Slave',
+  'dgr' => 'Dogrib',
+  'din' => 'Dinka',
+  'div' => 'Divehi',
+  'doi' => 'Dogri',
+  'dra' => 'Dravidian (Other)',
+  'dsb' => 'Lower Sorbian',
+  'dua' => 'Duala',
+  'dum' => 'Dutch, Middle (ca. 1050-1350)',
+  'dut' => 'Dutch',
+  'dyu' => 'Dyula',
+  'dzo' => 'Dzongkha',
+  'efi' => 'Efik',
+  'egy' => 'Egyptian',
+  'eka' => 'Ekajuk',
+  'elx' => 'Elamite',
+  'eng' => 'English',
+  'enm' => 'English, Middle (1100-1500)',
+  'epo' => 'Esperanto',
+  'esk' => 'Eskimo languages',
+  'esp' => 'Esperanto',
+  'est' => 'Estonian',
+  'eth' => 'Ethiopic',
+  'ewe' => 'Ewe',
+  'ewo' => 'Ewondo',
+  'fan' => 'Fang',
+  'fao' => 'Faroese',
+  'far' => 'Faroese',
+  'fat' => 'Fanti',
+  'fij' => 'Fijian',
+  'fil' => 'Filipino',
+  'fin' => 'Finnish',
+  'fiu' => 'Finno-Ugrian (Other)',
+  'fon' => 'Fon',
+  'fre' => 'French',
+  'fri' => 'Frisian',
+  'frm' => 'French, Middle (ca. 1400-1600)',
+  'fro' => 'French, Old (ca. 842-1400)',
+  'frr' => 'North Frisian',
+  'frs' => 'East Frisian',
+  'fry' => 'Frisian',
+  'ful' => 'Fula',
+  'fur' => 'Friulian',
+  'gaa' => 'Ga',
+  'gae' => 'Scottish Gaelic',
+  'gag' => 'Galician',
+  'gal' => 'Oromo',
+  'gay' => 'Gayo',
+  'gba' => 'Gbaya',
+  'gem' => 'Germanic (Other)',
+  'geo' => 'Georgian',
+  'ger' => 'German',
+  'gez' => 'Ethiopic',
+  'gil' => 'Gilbertese',
+  'gla' => 'Scottish Gaelic',
+  'gle' => 'Irish',
+  'glg' => 'Galician',
+  'glv' => 'Manx',
+  'gmh' => 'German, Middle High (ca. 1050-1500)',
+  'goh' => 'German, Old High (ca. 750-1050)',
+  'gon' => 'Gondi',
+  'gor' => 'Gorontalo',
+  'got' => 'Gothic',
+  'grb' => 'Grebo',
+  'grc' => 'Greek, Ancient (to 1453)',
+  'gre' => 'Greek, Modern (1453- )',
+  'grn' => 'Guarani',
+  'gsw' => 'Swiss German',
+  'gua' => 'Guarani',
+  'guj' => 'Gujarati',
+  'gwi' => "Gwich'in ",
+  'hai' => 'Haida',
+  'hat' => 'Haitian French Creole',
+  'hau' => 'Hausa',
+  'haw' => 'Hawaiian',
+  'heb' => 'Hebrew',
+  'her' => 'Herero',
+  'hil' => 'Hiligaynon',
+  'him' => 'Himachali',
+  'hin' => 'Hindi',
+  'hit' => 'Hittite',
+  'hmn' => 'Hmong',
+  'hmo' => 'Hiri Motu',
+  'hrv' => 'Croatian',
+  'hsb' => 'Upper Sorbian',
+  'hun' => 'Hungarian',
+  'hup' => 'Hupa',
+  'iba' => 'Iban',
+  'ibo' => 'Igbo',
+  'ice' => 'Icelandic',
+  'ido' => 'Ido',
+  'iii' => 'Sichuan Yi',
+  'ijo' => 'Ijo',
+  'iku' => 'Inuktitut',
+  'ile' => 'Interlingue',
+  'ilo' => 'Iloko',
+  'ina' => 'Interlingua (International Auxiliary Language Association)',
+  'inc' => 'Indic (Other)',
+  'ind' => 'Indonesian',
+  'ine' => 'Indo-European (Other)',
+  'inh' => 'Ingush',
+  'int' => 'Interlingua (International Auxiliary Language Association)',
+  'ipk' => 'Inupiaq',
+  'ira' => 'Iranian (Other)',
+  'iri' => 'Irish',
+  'iro' => 'Iroquoian (Other)',
+  'ita' => 'Italian',
+  'jav' => 'Javanese',
+  'jbo' => 'Lojban (Artificial language)',
+  'jpn' => 'Japanese',
+  'jpr' => 'Judeo-Persian',
+  'jrb' => 'Judeo-Arabic',
+  'kaa' => 'Kara-Kalpak',
+  'kab' => 'Kabyle',
+  'kac' => 'Kachin',
+  'kal' => 'Kalatdlisut',
+  'kam' => 'Kamba',
+  'kan' => 'Kannada',
+  'kar' => 'Karen',
+  'kas' => 'Kashmiri',
+  'kau' => 'Kanuri',
+  'kaw' => 'Kawi',
+  'kaz' => 'Kazakh',
+  'kbd' => 'Kabardian',
+  'kha' => 'Khasi',
+  'khi' => 'Khoisan (Other)',
+  'khm' => 'Khmer',
+  'kho' => 'Khotanese',
+  'kik' => 'Kikuyu',
+  'kin' => 'Kinyarwanda',
+  'kir' => 'Kyrgyz',
+  'kmb' => 'Kimbundu',
+  'kok' => 'Konkani',
+  'kom' => 'Komi',
+  'kon' => 'Kongo',
+  'kor' => 'Korean',
+  'kos' => 'Kusaie',
+  'kpe' => 'Kpelle',
+  'krc' => 'Karachay-Balkar',
+  'krl' => 'Karelian',
+  'kro' => 'Kru',
+  'kru' => 'Kurukh',
+  'kua' => 'Kuanyama',
+  'kum' => 'Kumyk',
+  'kur' => 'Kurdish',
+  'kus' => 'Kusaie',
+  'kut' => 'Kutenai',
+  'lad' => 'Ladino',
+  'lah' => 'Lahnda',
+  'lam' => 'Lamba',
+  'lan' => 'Occitan (post-1500)',
+  'lao' => 'Lao',
+  'lap' => 'Sami',
+  'lat' => 'Latin',
+  'lav' => 'Latvian',
+  'lez' => 'Lezgian',
+  'lim' => 'Limburgish',
+  'lin' => 'Lingala',
+  'lit' => 'Lithuanian',
+  'lol' => 'Mongo-Nkundu',
+  'loz' => 'Lozi',
+  'ltz' => 'Letzeburgesch',
+  'lua' => 'Luba-Lulua',
+  'lub' => 'Luba-Katanga',
+  'lug' => 'Ganda',
+  'lui' => 'Luiseno',
+  'lun' => 'Lunda',
+  'luo' => 'Luo (Kenya and Tanzania)',
+  'lus' => 'Lushai',
+  'mac' => 'Macedonian',
+  'mad' => 'Madurese',
+  'mag' => 'Magahi',
+  'mah' => 'Marshallese',
+  'mai' => 'Maithili',
+  'mak' => 'Makasar',
+  'mal' => 'Malayalam',
+  'man' => 'Mandingo',
+  'mao' => 'Maori',
+  'map' => 'Austronesian (Other)',
+  'mar' => 'Marathi',
+  'mas' => 'Masai',
+  'max' => 'Manx',
+  'may' => 'Malay',
+  'mdf' => 'Moksha',
+  'mdr' => 'Mandar',
+  'men' => 'Mende',
+  'mga' => 'Irish, Middle (ca. 1100-1550)',
+  'mic' => 'Micmac',
+  'min' => 'Minangkabau',
+  '#mis' => 'Miscellaneous languages',
+  'mkh' => 'Mon-Khmer (Other)',
+  'mla' => 'Malagasy',
+  'mlg' => 'Malagasy',
+  'mlt' => 'Maltese',
+  'mnc' => 'Manchu',
+  'mni' => 'Manipuri',
+  'mno' => 'Manobo languages',
+  'moh' => 'Mohawk',
+  'mol' => 'Moldavian',
+  'mon' => 'Mongolian',
+  'mos' => 'Moore',
+  '#mul' => 'Multiple languages',
+  'mun' => 'Munda (Other)',
+  'mus' => 'Creek',
+  'mwl' => 'Mirandese',
+  'mwr' => 'Marwari',
+  'myn' => 'Mayan languages',
+  'myv' => 'Erzya',
+  'nah' => 'Nahuatl',
+  'nai' => 'North American Indian (Other)',
+  'nap' => 'Neapolitan Italian',
+  'nau' => 'Nauru',
+  'nav' => 'Navajo',
+  'nbl' => 'Ndebele (South Africa)',
+  'nde' => 'Ndebele (Zimbabwe)',
+  'ndo' => 'Ndonga',
+  'nds' => 'Low German',
+  'nep' => 'Nepali',
+  'new' => 'Newari',
+  'nia' => 'Nias',
+  'nic' => 'Niger-Kordofanian (Other)',
+  'niu' => 'Niuean',
+  'nno' => 'Norwegian (Nynorsk)',
+  'nob' => 'Norwegian (Bokmal)',
+  'nog' => 'Nogai',
+  'non' => 'Old Norse',
+  'nor' => 'Norwegian',
+  'nqo' => "N'Ko",
+  'nso' => 'Northern Sotho',
+  'nub' => 'Nubian languages',
+  'nwc' => 'Newari, Old',
+  'nya' => 'Nyanja',
+  'nym' => 'Nyamwezi',
+  'nyn' => 'Nyankole',
+  'nyo' => 'Nyoro',
+  'nzi' => 'Nzima',
+  'oci' => 'Occitan (post-1500)',
+  'oji' => 'Ojibwa',
+  'ori' => 'Oriya',
+  'orm' => 'Oromo',
+  'osa' => 'Osage',
+  'oss' => 'Ossetic',
+  'ota' => 'Turkish, Ottoman',
+  'oto' => 'Otomian languages',
+  'paa' => 'Papuan (Other)',
+  'pag' => 'Pangasinan',
+  'pal' => 'Pahlavi',
+  'pam' => 'Pampanga',
+  'pan' => 'Panjabi',
+  'pap' => 'Papiamento',
+  'pau' => 'Palauan',
+  'peo' => 'Old Persian (ca. 600-400 B.C.)',
+  'per' => 'Persian',
+  'phi' => 'Philippine (Other)',
+  'phn' => 'Phoenician',
+  'pli' => 'Pali',
+  'pol' => 'Polish',
+  'pon' => 'Ponape',
+  'por' => 'Portuguese',
+  'pra' => 'Prakrit languages',
+  'pro' => 'Provencal (to 1500)',
+  'pus' => 'Pushto',
+  'que' => 'Quechua',
+  'raj' => 'Rajasthani',
+  'rap' => 'Rapanui',
+  'rar' => 'Rarotongan',
+  'roa' => 'Romance (Other)',
+  'roh' => 'Raeto-Romance',
+  'rom' => 'Romani',
+  'rum' => 'Romanian',
+  'run' => 'Rundi',
+  'rup' => 'Aromanian',
+  'rus' => 'Russian',
+  'sad' => 'Sandawe',
+  'sag' => 'Sango (Ubangi Creole)',
+  'sah' => 'Yakut',
+  'sai' => 'South American Indian (Other)',
+  'sal' => 'Salishan languages',
+  'sam' => 'Samaritan Aramaic',
+  'san' => 'Sanskrit',
+  'sao' => 'Samoan',
+  'sas' => 'Sasak',
+  'sat' => 'Santali',
+  'scc' => 'Serbian',
+  'scn' => 'Sicilian Italian',
+  'sco' => 'Scots',
+  'scr' => 'Croatian',
+  'sel' => 'Selkup',
+  'sem' => 'Semitic (Other)',
+  'sga' => 'Irish, Old (to 1100)',
+  'sgn' => 'Sign languages',
+  'shn' => 'Shan',
+  'sho' => 'Shona',
+  'sid' => 'Sidamo',
+  'sin' => 'Sinhalese',
+  'sio' => 'Siouan (Other)',
+  'sit' => 'Sino-Tibetan (Other)',
+  'sla' => 'Slavic (Other)',
+  'slo' => 'Slovak',
+  'slv' => 'Slovenian',
+  'sma' => 'Southern Sami',
+  'sme' => 'Northern Sami',
+  'smi' => 'Sami',
+  'smj' => 'Lule Sami',
+  'smn' => 'Inari Sami',
+  'smo' => 'Samoan',
+  'sms' => 'Skolt Sami',
+  'sna' => 'Shona',
+  'snd' => 'Sindhi',
+  'snh' => 'Sinhalese',
+  'snk' => 'Soninke',
+  'sog' => 'Sogdian',
+  'som' => 'Somali',
+  'son' => 'Songhai',
+  'sot' => 'Sotho',
+  'spa' => 'Spanish',
+  'srd' => 'Sardinian',
+  'srn' => 'Sranan',
+  'srp' => 'Serbian',
+  'srr' => 'Serer',
+  'ssa' => 'Nilo-Saharan (Other)',
+  'sso' => 'Sotho',
+  'ssw' => 'Swazi',
+  'suk' => 'Sukuma',
+  'sun' => 'Sundanese',
+  'sus' => 'Susu',
+  'sux' => 'Sumerian',
+  'swa' => 'Swahili',
+  'swe' => 'Swedish',
+  'swz' => 'Swazi',
+  'syc' => 'Syriac',
+  'syr' => 'Syriac, Modern',
+  'tag' => 'Tagalog',
+  'tah' => 'Tahitian',
+  'tai' => 'Tai (Other)',
+  'taj' => 'Tajik',
+  'tam' => 'Tamil',
+  'tar' => 'Tatar',
+  'tat' => 'Tatar',
+  'tel' => 'Telugu',
+  'tem' => 'Temne',
+  'ter' => 'Terena',
+  'tet' => 'Tetum',
+  'tgk' => 'Tajik',
+  'tgl' => 'Tagalog',
+  'tha' => 'Thai',
+  'tib' => 'Tibetan',
+  'tig' => 'Tigre',
+  'tir' => 'Tigrinya',
+  'tiv' => 'Tiv',
+  'tkl' => 'Tokelauan',
+  'tlh' => 'Klingon (Artificial language)',
+  'tli' => 'Tlingit',
+  'tmh' => 'Tamashek',
+  'tog' => 'Tonga (Nyasa)',
+  'ton' => 'Tongan',
+  'tpi' => 'Tok Pisin',
+  'tru' => 'Truk',
+  'tsi' => 'Tsimshian',
+  'tsn' => 'Tswana',
+  'tso' => 'Tsonga',
+  'tsw' => 'Tswana',
+  'tuk' => 'Turkmen',
+  'tum' => 'Tumbuka',
+  'tup' => 'Tupi languages',
+  'tur' => 'Turkish',
+  'tut' => 'Altaic (Other)',
+  'tvl' => 'Tuvaluan',
+  'twi' => 'Twi',
+  'tyv' => 'Tuvinian',
+  'udm' => 'Udmurt',
+  'uga' => 'Ugaritic',
+  'uig' => 'Uighur',
+  'ukr' => 'Ukrainian',
+  'umb' => 'Umbundu',
+  #'und' => 'Undetermined',
+  'urd' => 'Urdu',
+  'uzb' => 'Uzbek',
+  'vai' => 'Vai',
+  'ven' => 'Venda',
+  'vie' => 'Vietnamese',
+  'vol' => 'Volapuk',
+  'vot' => 'Votic',
+  'wak' => 'Wakashan languages',
+  'wal' => 'Walamo',
+  'war' => 'Waray',
+  'was' => 'Washo',
+  'wel' => 'Welsh',
+  'wen' => 'Sorbian languages',
+  'wln' => 'Walloon',
+  'wol' => 'Wolof',
+  'xal' => 'Kalmyk',
+  'xho' => 'Xhosa',
+  'yao' => 'Yao (Africa)',
+  'yap' => 'Yapese',
+  'yid' => 'Yiddish',
+  'yor' => 'Yoruba',
+  'ypk' => 'Yupik languages',
+  'zap' => 'Zapotec',
+  'zbl' => 'Blissymbolics',
+  'zen' => 'Zenaga',
+  'zha' => 'Zhuang',
+  'znd' => 'Zande',
+  'zul' => 'Zulu',
+  'zun' => 'Zuni',
+  #'zxx' => 'null',
+  'zza' => 'Zaza'
+}

data/lib/stanford-mods/version.rb CHANGED Viewed

@@ -1,5 +1,5 @@
 module Stanford
   module Mods
-    VERSION = "0.0.2"
+    VERSION = "0.0.3"
   end
 end

data/lib/stanford-mods.rb CHANGED Viewed

@@ -7,12 +7,7 @@ module Stanford
   module Mods
     class Record < ::Mods::Record
-      # proof of concept method
-      def to_be_removed
-        puts "in to_be_removed!"
-      end
     end
   end
 end

data/spec/spec_helper.rb ADDED Viewed

@@ -0,0 +1,21 @@
+# for test coverage
+require 'simplecov'
+require 'simplecov-rcov'
+class SimpleCov::Formatter::MergedFormatter
+  def format(result)
+     SimpleCov::Formatter::HTMLFormatter.new.format(result)
+     SimpleCov::Formatter::RcovFormatter.new.format(result)
+  end
+end
+SimpleCov.formatter = SimpleCov::Formatter::MergedFormatter
+SimpleCov.start do
+  add_filter "/spec/"
+end
+$LOAD_PATH.unshift(File.join(File.dirname(__FILE__), '..', 'lib'))
+$LOAD_PATH.unshift(File.dirname(__FILE__))
+require 'stanford-mods'
+#RSpec.configure do |config|
+#end

data/spec/values_for_req_sw_spec.rb ADDED Viewed

@@ -0,0 +1,119 @@
+require 'spec_helper'
+require 'stanford-mods/searchworks'
+describe "Values for SearchWorks Solr" do
+  # from  https://consul.stanford.edu/display/NGDE/Required+and+Recommended+Solr+Fields+for+SearchWorks+documents
+  context "required fields" do
+    context "DOR specific" do
+      it "druid" do
+        pending "to be implemented in harvestdor"
+      end
+      it "url_fulltext" do
+        pending "to be implemented"
+      end
+      it "mods_xml" do
+        pending "to be implemented"
+      end
+      it "parent_coll_ckey if item object" do
+        pending "to be implemented in harvestdor"
+      end
+    end
+    it "id" do
+      pending "to be implemented in harvestdor"
+    end
+    it "all_search" do
+      pending "to be implemented"
+    end
+    it "format" do
+      pending "to be implemented, using SearchWorks controlled vocab"
+    end
+    # FIXME:  update per gryphDOR code / searcworks code / new schema
+    it "collection" do
+      pending "to be implemented, using controlled vocab, in harvestdor"
+    end
+    it "display_type" do
+      pending "to be implemented, using controlled vocab"
+    end
+  end
+  context "strongly recommended fields" do
+    it "access_facet" do
+      Stanford::Mods::Record.new.access_facet.should == ['Online']
+    end
+    context "title fields" do
+      context "for display" do
+        it "short title" do
+          pending "to be implemented"
+        end
+        it "full title" do
+          pending "to be implemented"
+        end
+      end
+      context "for searching" do
+        it "short title" do
+          pending "to be implemented"
+        end
+        it "full title" do
+          pending "to be implemented"
+        end
+      end
+      it "sortable title" do
+        pending "to be implemented"
+      end
+    end
+  end
+  context "recommended fields" do
+    context "publication date" do
+      it "for searching and facet" do
+        pending "to be implemented"
+      end
+      it "for sorting" do
+        pending "to be implemented"
+      end
+      it "for pub date grouping (hierarchical / date slider?)" do
+        pending "to be implemented"
+      end
+    end
+    context "language" do
+      it "should use the SearchWorks controlled vocabulary" do
+        m = '<mods><language><languageTerm authority="iso639-2b" type="code">per ara, dut</languageTerm></language></mods>'
+        r = Stanford::Mods::Record.new
+        r.from_str(m)
+        r.language_facet.size.should == 3
+        r.language_facet.should include("Persian")
+        r.language_facet.should include("Arabic")
+        r.language_facet.should include("Dutch")
+        r.language_facet.should_not include("Dutch; Flemish")
+      end
+      it "should not have duplicates" do
+        m = '<mods><language><languageTerm type="code" authority="iso639-2b">eng</languageTerm><languageTerm type="text">English</languageTerm></language></mods>'
+        r = Stanford::Mods::Record.new
+        r.from_str(m)
+        r.language_facet.size.should == 1
+        r.language_facet.should include("English")
+      end
+    end
+    context "authors" do
+      it "main author" do
+        pending "to be implemented"
+      end
+      it "additional authors" do
+        pending "to be implemented"
+      end
+      it "author sort" do
+        pending "to be implemented"
+      end
+    end
+  end
+end

metadata CHANGED Viewed

@@ -1,7 +1,7 @@
 --- !ruby/object:Gem::Specification
 name: stanford-mods
 version: !ruby/object:Gem::Version
-  version: 0.0.2
+  version: 0.0.3
   prerelease:
 platform: ruby
 authors:
@@ -10,7 +10,7 @@ authors:
 autorequire:
 bindir: bin
 cert_chain: []
-date: 2012-11-12 00:00:00.000000000 Z
+date: 2012-11-13 00:00:00.000000000 Z
 dependencies:
 - !ruby/object:Gem::Dependency
   name: mods
@@ -146,7 +146,11 @@ files:
 - config/mappings_hash.rb
 - lib/stanford-mods.rb
 - lib/stanford-mods/mappings.rb
+- lib/stanford-mods/searchworks.rb
+- lib/stanford-mods/searchworks_languages.rb
 - lib/stanford-mods/version.rb
+- spec/spec_helper.rb
+- spec/values_for_req_sw_spec.rb
 - stanford-mods.gemspec
 homepage: https://github.com/sul-dlss/stanford-mods
 licenses: []
@@ -162,7 +166,7 @@ required_ruby_version: !ruby/object:Gem::Requirement
       version: '0'
       segments:
       - 0
-      hash: 893390290114598282
+      hash: -3428048468669990853
 required_rubygems_version: !ruby/object:Gem::Requirement
   none: false
   requirements:
@@ -171,12 +175,14 @@ required_rubygems_version: !ruby/object:Gem::Requirement
       version: '0'
       segments:
       - 0
-      hash: 893390290114598282
+      hash: -3428048468669990853
 requirements: []
 rubyforge_project:
 rubygems_version: 1.8.24
 signing_key:
 specification_version: 3
 summary: Stanford specific wrangling of MODS metadata
-test_files: []
+test_files:
+- spec/spec_helper.rb
+- spec/values_for_req_sw_spec.rb
 has_rdoc: