RubyGems - exhibits_solr_conf - Versions diffs - 0.0.1 - Mend

exhibits_solr_conf 0.0.1

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (26) hide show

checksums.yaml +7 -0
data/.gitignore +12 -0
data/.hound.yml +2 -0
data/.rspec +1 -0
data/.rubocop.yml +8 -0
data/.rubocop_todo.yml +24 -0
data/.travis.yml +11 -0
data/Gemfile +4 -0
data/LICENSE +13 -0
data/README.md +78 -0
data/Rakefile +17 -0
data/bin/console +14 -0
data/bin/setup +7 -0
data/exhibits_solr_conf.gemspec +29 -0
data/lib/exhibits_solr_conf/tasks/configure_solr.rake +11 -0
data/lib/exhibits_solr_conf/version.rb +3 -0
data/lib/exhibits_solr_conf.rb +6 -0
data/solr_conf_4_testing/_rest_managed.json +3 -0
data/solr_conf_4_testing/schema.xml +529 -0
data/solr_conf_4_testing/solrconfig.xml +881 -0
data/solr_conf_4_testing/stopwords_punctuation.txt +22 -0
data/solr_conf_4_testing/synonyms.txt +73 -0
data/solr_conf_4_testing/synonyms_both_anchors.txt +47 -0
data/solr_conf_4_testing/synonyms_left_anchor.txt +45 -0
data/solr_conf_4_testing/synonyms_right_anchor.txt +47 -0
metadata +168 -0

data/solr_conf_4_testing/stopwords_punctuation.txt ADDED Viewed

@@ -0,0 +1,22 @@
+# Punctuation characters we want to ignore as terms (i.e., when surrounded
+# by whitespace in a query, like 'fred : the puppy') in queries
+# ONLY FOR SINGLE TOKEN ANALYZED FIELDS
+#   see https://issues.apache.org/jira/browse/SOLR-3085
+# Note that hyphens, plusses, and double hyphens are not treated as terms
+#   per debugQuery
+:
+;
+&
+/
+=
+>
+<
+,
+.
+(
+)
+…
+»
+§
+•
+·

data/solr_conf_4_testing/synonyms.txt ADDED Viewed

@@ -0,0 +1,73 @@
+# http://wiki.apache.org/solr/AnalyzersTokenizersTokenFilters#solr.SynonymFilterFactory
+# A synonym file for Solr SynonymFilterFactory.
+# Needs to be included at both index and query time
+#  AFTER the case folding
+#  BEFORE the WordDelimiterFilterFactory that removes punctuation
+# e.g.
+# <analyzer>
+#   <tokenizer class="solr.WhitespaceTokenizerFactory" />
+#   <filter class="solr.ICUFoldingFilterFactory"/>  <!-- NFKC, case folding, diacritics removed -->
+#   <filter class="solr.SynonymFilterFactory" synonyms="synonyms.txt" ignoreCase="true" expand="false"/>
+#   <filter class="solr.WordDelimiterFilterFactory" ...
+#   ...
+#
+# !!!
+# !!! IMPORTANT:   see also   synonyms_both_anchors.txt, synonyms_left_anchor.txt  and  synonyms_right_anchor.txt
+# !!!
+# Explicit mappings match any token sequence on the LHS of "=>"
+#   and replace with all alternatives on the RHS.  These types of mappings
+#   ignore the expand parameter in the schema.
+# Equivalent synonyms may be separated with commas and give
+#   no explicit mapping.  In this case the mapping behavior will
+#   be taken from the expand parameter in the schema.
+#  If expand==true, "ipod, i-pod, i pod" is equivalent to the explicit mapping:
+#   ipod, i-pod, i pod => ipod, i-pod, i pod
+#  If expand==false, "ipod, i-pod, i pod" is equivalent to the explicit mapping:
+#   ipod, i-pod, i pod => ipod
+# set expand to true for index time and false for query time
+# See SW-845
+#  "Dept." will change to "Department"
+#  "Koran" will change to "Qur'an"
+#  "violoncello" will change to "cello"
+#  "O.T." and "N.T." will change to "Old Testament" and "New Testament"
+# note that mapping TO the abbreviation improves recall but reduces precision:
+#  O.T. can mean Old Testament or overtime;   dept could be a word in some
+#  language.
+department => dept
+qurʼan, qur'an, quran, qorʼan, qor'an, qoran => koran
+violoncello, violincello => cello
+# multi-token synonyms, and synonyms with punctuation, can be problematic
+#old testament => o.t.
+#new testament => n.t.
+# The below is inspired by Jonathan Rochkind at Johns Hopkins University, 2013-04-15
+# punctuation-including terms we want to whitelist protect and make searchable.
+# We do this by mapping them to unique tokens that do not include punctuation
+# computer languages
+#  these are explicit mappings so when WDF drops the non-letter chars, c++ is not equivalent to c
+c++  => cplusplus
+j#, j♯ => jsssharp
+# c# and f# are music keys as well as computer languages
+# musical keys
+#  these are explicit mappings so when WDF drops the non-letter chars, c# is not equivalent to c
+# We map from number-sign (#), musical sharp (♯)
+a#, a♯, a-sharp => a sharp
+b#, b♯, b-sharp => b sharp
+c#, c♯, c-sharp => c sharp
+d#, d♯, d-sharp => d sharp
+e#, e♯, e-sharp => e sharp
+f#, f♯, f-sharp => f sharp
+g#, g♯, g-sharp => g sharp
+# We map both from lowercase b and musical flat (♭)
+ab, a♭, a-flat => a flat
+bb, b♭, b-flat => b flat
+cb, c♭, c-flat => c flat
+db, d♭, d-flat => d flat
+eb, e♭, e-flat => e flat
+fb, f♭, f-flat => f flat
+gb, g♭, g-flat => g flat

data/solr_conf_4_testing/synonyms_both_anchors.txt ADDED Viewed

@@ -0,0 +1,47 @@
+# Include in analysis with both left anchor of 'aaaaaa' and right anchor of 'zzzzzz'
+#  for query or field comprised solely of token meant to be a synonym
+#
+# http://wiki.apache.org/solr/AnalyzersTokenizersTokenFilters#solr.SynonymFilterFactory
+# A synonym file for Solr SynonymFilterFactory.
+# Needs to be included at both index and query time
+#  AFTER the case folding
+#  BEFORE the WordDelimiterFilterFactory that removes punctuation
+# e.g.
+# <analyzer>
+#   <!-- put beginning and ending anchors on field value, removing trailing chars -->
+#   <charFilter class="solr.PatternReplaceCharFilterFactory" pattern="^\s*(.*[^\s\.\:\;\/\[\]])[\s\.\:\;\/\[\]]*$" replacement="aaaaaa$1zzzzzz"/>
+#   <tokenizer class="solr.WhitespaceTokenizerFactory" />
+#   <filter class="solr.ICUFoldingFilterFactory"/>  <!-- NFKC, case folding, diacritics removed -->
+#   <filter class="solr.SynonymFilterFactory" synonyms="synonyms.txt" ignoreCase="true" expand="false"/>
+#   <filter class="solr.SynonymFilterFactory" synonyms="synonyms_both_anchors.txt" ignoreCase="true" expand="false"/>
+#   <filter class="solr.SynonymFilterFactory" synonyms="synonyms_left_anchor.txt" ignoreCase="true" expand="false"/>
+#   <filter class="solr.SynonymFilterFactory" synonyms="synonyms_right_anchor.txt" ignoreCase="true" expand="false"/>
+#   <filter class="solr.WordDelimiterFilterFactory" ...
+#   ...
+#
+aaaaaadepartmentzzzzzz => aaaaaadeptzzzzzz
+aaaaaaqurʼanzzzzzz, aaaaaaqur'anzzzzzz, aaaaaaquranzzzzzz, aaaaaaqorʼanzzzzzz, aaaaaaqor'anzzzzzz, aaaaaaqoranzzzzzz => aaaaaakoranzzzzzz
+aaaaaavioloncellozzzzzz, aaaaaaviolincellozzzzzz => aaaaaacellozzzzzz
+# computer languages
+aaaaaac++zzzzzz => aaaaaacpluspluszzzzzz
+aaaaaaj#zzzzzz, aaaaaaj♯zzzzzz => aaaaaajsssharpzzzzzz
+# musical keys
+# We map from number-sign (#), musical sharp (♯)
+aaaaaaa#zzzzzz, aaaaaaa♯zzzzzz, aaaaaaa-sharpzzzzzz => aaaaaaa sharpzzzzzz
+aaaaaab#zzzzzz, aaaaaab♯zzzzzz, aaaaaab-sharpzzzzzz => aaaaaab sharpzzzzzz
+aaaaaac#zzzzzz, aaaaaac♯zzzzzz, aaaaaac-sharpzzzzzz => aaaaaac sharpzzzzzz
+aaaaaad#zzzzzz, aaaaaad♯zzzzzz, aaaaaad-sharpzzzzzz => aaaaaad sharpzzzzzz
+aaaaaae#zzzzzz, aaaaaae♯zzzzzz, aaaaaae-sharpzzzzzz => aaaaaae sharpzzzzzz
+aaaaaaf#zzzzzz, aaaaaaf♯zzzzzz, aaaaaaf-sharpzzzzzz => aaaaaaf sharpzzzzzz
+aaaaaag#zzzzzz, aaaaaag♯zzzzzz, aaaaaag-sharpzzzzzz => aaaaaag sharpzzzzzz
+# We map both from lowercase b and musical flat (♭)
+aaaaaaabzzzzzz, aaaaaaa♭zzzzzz, aaaaaaa-flatzzzzzz => aaaaaaa flatzzzzzz
+aaaaaabbzzzzzz, aaaaaab♭zzzzzz, aaaaaab-flatzzzzzz => aaaaaab flatzzzzzz
+aaaaaacbzzzzzz, aaaaaac♭zzzzzz, aaaaaac-flatzzzzzz => aaaaaac flatzzzzzz
+aaaaaadbzzzzzz, aaaaaad♭zzzzzz, aaaaaad-flatzzzzzz => aaaaaad flatzzzzzz
+aaaaaaebzzzzzz, aaaaaae♭zzzzzz, aaaaaae-flatzzzzzz => aaaaaae flatzzzzzz
+aaaaaafbzzzzzz, aaaaaaf♭zzzzzz, aaaaaaf-flatzzzzzz => aaaaaaf flatzzzzzz
+aaaaaagbzzzzzz, aaaaaag♭zzzzzz, aaaaaag-flatzzzzzz => aaaaaag flatzzzzzz

data/solr_conf_4_testing/synonyms_left_anchor.txt ADDED Viewed

@@ -0,0 +1,45 @@
+# Include in analysis with left anchor of 'aaaaaa'
+#  for query or field beginning with token meant to be a synonym
+#
+# http://wiki.apache.org/solr/AnalyzersTokenizersTokenFilters#solr.SynonymFilterFactory
+# A synonym file for Solr SynonymFilterFactory.
+# Needs to be included at both index and query time
+#  AFTER the case folding
+#  BEFORE the WordDelimiterFilterFactory that removes punctuation
+# e.g.
+# <analyzer>
+#   <!-- put beginning anchor on field value, assume first non-whitespace char is unicode letter or number or symbol -->
+#   <charFilter class="solr.PatternReplaceCharFilterFactory" pattern="^\s*([\p{L}\p{N}\p{S}]{1})" replacement="aaaaaa$1"/>
+#   <tokenizer class="solr.WhitespaceTokenizerFactory" />
+#   <filter class="solr.ICUFoldingFilterFactory"/>  <!-- NFKC, case folding, diacritics removed -->
+#   <filter class="solr.SynonymFilterFactory" synonyms="synonyms.txt" ignoreCase="true" expand="false"/>
+#   <filter class="solr.SynonymFilterFactory" synonyms="synonyms_left_anchor.txt" ignoreCase="true" expand="false"/>
+#   <filter class="solr.WordDelimiterFilterFactory" ...
+#   ...
+#
+aaaaaadepartment => aaaaaadept
+aaaaaaqurʼan, aaaaaaqur'an, aaaaaaquran, aaaaaaqorʼan, aaaaaaqor'an, aaaaaaqoran => aaaaaakoran
+aaaaaavioloncello, aaaaaaviolincello => aaaaaacello
+# computer languages
+aaaaaac++ => aaaaaacplusplus
+aaaaaaj#, aaaaaaj♯ => aaaaaajsssharp
+# musical keys
+# We map from number-sign (#), musical sharp (♯)
+aaaaaaa#, aaaaaaa♯, aaaaaaa-sharp => aaaaaaa sharp
+aaaaaab#, aaaaaab♯, aaaaaab-sharp => aaaaaab sharp
+aaaaaac#, aaaaaac♯, aaaaaac-sharp => aaaaaac sharp
+aaaaaad#, aaaaaad♯, aaaaaad-sharp => aaaaaad sharp
+aaaaaae#, aaaaaae♯, aaaaaae-sharp => aaaaaae sharp
+aaaaaaf#, aaaaaaf♯, aaaaaaf-sharp => aaaaaaf sharp
+aaaaaag#, aaaaaag♯, aaaaaag-sharp => aaaaaag sharp
+# We map both from lowercase b and musical flat (♭)
+aaaaaaab, aaaaaaa♭, aaaaaaa-flat => aaaaaaa flat
+aaaaaabb, aaaaaab♭, aaaaaab-flat => aaaaaab flat
+aaaaaacb, aaaaaac♭, aaaaaac-flat => aaaaaac flat
+aaaaaadb, aaaaaad♭, aaaaaad-flat => aaaaaad flat
+aaaaaaeb, aaaaaae♭, aaaaaae-flat => aaaaaae flat
+aaaaaafb, aaaaaaf♭, aaaaaaf-flat => aaaaaaf flat
+aaaaaagb, aaaaaag♭, aaaaaag-flat => aaaaaag flat

data/solr_conf_4_testing/synonyms_right_anchor.txt ADDED Viewed

@@ -0,0 +1,47 @@
+# Include in analysis with right anchor of 'zzzzzz'
+#  for query or field ending with token meant to be a synonym
+#
+# http://wiki.apache.org/solr/AnalyzersTokenizersTokenFilters#solr.SynonymFilterFactory
+# A synonym file for Solr SynonymFilterFactory.
+# Needs to be included at both index and query time
+#  AFTER the case folding
+#  BEFORE the WordDelimiterFilterFactory that removes punctuation
+# e.g.
+# <analyzer>
+#   <!-- put beginning and ending anchors on field value, removing trailing chars -->
+#   <charFilter class="solr.PatternReplaceCharFilterFactory" pattern="^\s*(.*[^\s\.\:\;\/\[\]])[\s\.\:\;\/\[\]]*$" replacement="aaaaaa$1zzzzzz"/>
+#   <tokenizer class="solr.WhitespaceTokenizerFactory" />
+#   <filter class="solr.ICUFoldingFilterFactory"/>  <!-- NFKC, case folding, diacritics removed -->
+#   <filter class="solr.SynonymFilterFactory" synonyms="synonyms.txt" ignoreCase="true" expand="false"/>
+#   <filter class="solr.SynonymFilterFactory" synonyms="synonyms_both_anchors.txt" ignoreCase="true" expand="false"/>
+#   <filter class="solr.SynonymFilterFactory" synonyms="synonyms_left_anchor.txt" ignoreCase="true" expand="false"/>
+#   <filter class="solr.SynonymFilterFactory" synonyms="synonyms_right_anchor.txt" ignoreCase="true" expand="false"/>
+#   <filter class="solr.WordDelimiterFilterFactory" ...
+#   ...
+#
+departmentzzzzzz => deptzzzzzz
+qurʼanzzzzzz, qur'anzzzzzz, quranzzzzzz, qorʼanzzzzzz, qor'anzzzzzz, qoranzzzzzz => koranzzzzzz
+violoncellozzzzzz, violincellozzzzzz => cellozzzzzz
+# computer languages
+c++zzzzzz => cpluspluszzzzzz
+j#zzzzzz, j♯zzzzzz => jsssharpzzzzzz
+# musical keys
+# We map from number-sign (#), musical sharp (♯)
+a#zzzzzz, a♯zzzzzz, a-sharpzzzzzz => a sharpzzzzzz
+b#zzzzzz, b♯zzzzzz, b-sharpzzzzzz => b sharpzzzzzz
+c#zzzzzz, c♯zzzzzz, c-sharpzzzzzz => c sharpzzzzzz
+d#zzzzzz, d♯zzzzzz, d-sharpzzzzzz => d sharpzzzzzz
+e#zzzzzz, e♯zzzzzz, e-sharpzzzzzz => e sharpzzzzzz
+f#zzzzzz, f♯zzzzzz, f-sharpzzzzzz => f sharpzzzzzz
+g#zzzzzz, g♯zzzzzz, g-sharpzzzzzz => g sharpzzzzzz
+# We map both from lowercase b and musical flat (♭)
+abzzzzzz, a♭zzzzzz, a-flatzzzzzz => a flatzzzzzz
+bbzzzzzz, b♭zzzzzz, b-flatzzzzzz => b flatzzzzzz
+cbzzzzzz, c♭zzzzzz, c-flatzzzzzz => c flatzzzzzz
+dbzzzzzz, d♭zzzzzz, d-flatzzzzzz => d flatzzzzzz
+ebzzzzzz, e♭zzzzzz, e-flatzzzzzz => e flatzzzzzz
+fbzzzzzz, f♭zzzzzz, f-flatzzzzzz => f flatzzzzzz
+gbzzzzzz, g♭zzzzzz, g-flatzzzzzz => g flatzzzzzz

metadata ADDED Viewed

@@ -0,0 +1,168 @@
+--- !ruby/object:Gem::Specification
+name: exhibits_solr_conf
+version: !ruby/object:Gem::Version
+  version: 0.0.1
+platform: ruby
+authors:
+- Naomi Dushay
+autorequire:
+bindir: exe
+cert_chain: []
+date: 2015-11-11 00:00:00.000000000 Z
+dependencies:
+- !ruby/object:Gem::Dependency
+  name: bundler
+  requirement: !ruby/object:Gem::Requirement
+    requirements:
+    - - "~>"
+      - !ruby/object:Gem::Version
+        version: '1.10'
+  type: :development
+  prerelease: false
+  version_requirements: !ruby/object:Gem::Requirement
+    requirements:
+    - - "~>"
+      - !ruby/object:Gem::Version
+        version: '1.10'
+- !ruby/object:Gem::Dependency
+  name: rake
+  requirement: !ruby/object:Gem::Requirement
+    requirements:
+    - - "~>"
+      - !ruby/object:Gem::Version
+        version: '10.0'
+  type: :development
+  prerelease: false
+  version_requirements: !ruby/object:Gem::Requirement
+    requirements:
+    - - "~>"
+      - !ruby/object:Gem::Version
+        version: '10.0'
+- !ruby/object:Gem::Dependency
+  name: rspec
+  requirement: !ruby/object:Gem::Requirement
+    requirements:
+    - - ">="
+      - !ruby/object:Gem::Version
+        version: '0'
+  type: :development
+  prerelease: false
+  version_requirements: !ruby/object:Gem::Requirement
+    requirements:
+    - - ">="
+      - !ruby/object:Gem::Version
+        version: '0'
+- !ruby/object:Gem::Dependency
+  name: jettywrapper
+  requirement: !ruby/object:Gem::Requirement
+    requirements:
+    - - ">="
+      - !ruby/object:Gem::Version
+        version: '0'
+  type: :development
+  prerelease: false
+  version_requirements: !ruby/object:Gem::Requirement
+    requirements:
+    - - ">="
+      - !ruby/object:Gem::Version
+        version: '0'
+- !ruby/object:Gem::Dependency
+  name: hurley
+  requirement: !ruby/object:Gem::Requirement
+    requirements:
+    - - ">="
+      - !ruby/object:Gem::Version
+        version: '0'
+  type: :development
+  prerelease: false
+  version_requirements: !ruby/object:Gem::Requirement
+    requirements:
+    - - ">="
+      - !ruby/object:Gem::Version
+        version: '0'
+- !ruby/object:Gem::Dependency
+  name: rubocop
+  requirement: !ruby/object:Gem::Requirement
+    requirements:
+    - - ">="
+      - !ruby/object:Gem::Version
+        version: '0'
+  type: :development
+  prerelease: false
+  version_requirements: !ruby/object:Gem::Requirement
+    requirements:
+    - - ">="
+      - !ruby/object:Gem::Version
+        version: '0'
+- !ruby/object:Gem::Dependency
+  name: rubocop-rspec
+  requirement: !ruby/object:Gem::Requirement
+    requirements:
+    - - ">="
+      - !ruby/object:Gem::Version
+        version: '0'
+  type: :development
+  prerelease: false
+  version_requirements: !ruby/object:Gem::Requirement
+    requirements:
+    - - ">="
+      - !ruby/object:Gem::Version
+        version: '0'
+description: A set of Solr config files and a rake task for testing sul-dlss exhibit
+  and spotlight git repos (sul-exhibits-templates, spotlight-dor-resources, exhibits-requests
+email:
+- ndushay@stanford.edu
+executables: []
+extensions: []
+extra_rdoc_files: []
+files:
+- ".gitignore"
+- ".hound.yml"
+- ".rspec"
+- ".rubocop.yml"
+- ".rubocop_todo.yml"
+- ".travis.yml"
+- Gemfile
+- LICENSE
+- README.md
+- Rakefile
+- bin/console
+- bin/setup
+- exhibits_solr_conf.gemspec
+- lib/exhibits_solr_conf.rb
+- lib/exhibits_solr_conf/tasks/configure_solr.rake
+- lib/exhibits_solr_conf/version.rb
+- solr_conf_4_testing/_rest_managed.json
+- solr_conf_4_testing/schema.xml
+- solr_conf_4_testing/solrconfig.xml
+- solr_conf_4_testing/stopwords_punctuation.txt
+- solr_conf_4_testing/synonyms.txt
+- solr_conf_4_testing/synonyms_both_anchors.txt
+- solr_conf_4_testing/synonyms_left_anchor.txt
+- solr_conf_4_testing/synonyms_right_anchor.txt
+homepage: https://github.com/sul-dlss/exhibits_solr_conf
+licenses:
+- Apache-2.0
+metadata: {}
+post_install_message:
+rdoc_options: []
+require_paths:
+- lib
+required_ruby_version: !ruby/object:Gem::Requirement
+  requirements:
+  - - ">="
+    - !ruby/object:Gem::Version
+      version: '0'
+required_rubygems_version: !ruby/object:Gem::Requirement
+  requirements:
+  - - ">="
+    - !ruby/object:Gem::Version
+      version: '0'
+requirements: []
+rubyforge_project:
+rubygems_version: 2.4.8
+signing_key:
+specification_version: 4
+summary: Solr config files for testing sul-dlss exhibit and spotlight git repos.
+test_files: []
+has_rdoc: