simple_solr_client 0.1.0

Sign up to get free protection for your applications and to get access to all the features.
Files changed (136) hide show
  1. checksums.yaml +7 -0
  2. data/Gemfile +4 -0
  3. data/LICENSE.txt +22 -0
  4. data/README.md +349 -0
  5. data/Rakefile +11 -0
  6. data/lib/simple_solr.rb +42 -0
  7. data/lib/simple_solr/client.rb +139 -0
  8. data/lib/simple_solr/client/core_admin.rb +0 -0
  9. data/lib/simple_solr/core.rb +50 -0
  10. data/lib/simple_solr/core/admin.rb +47 -0
  11. data/lib/simple_solr/core/core_data.rb +51 -0
  12. data/lib/simple_solr/core/index.rb +25 -0
  13. data/lib/simple_solr/core/search.rb +21 -0
  14. data/lib/simple_solr/response/document.rb +45 -0
  15. data/lib/simple_solr/response/generic_response.rb +19 -0
  16. data/lib/simple_solr/response/query_response.rb +54 -0
  17. data/lib/simple_solr/schema.rb +261 -0
  18. data/lib/simple_solr/schema/analysis.rb +58 -0
  19. data/lib/simple_solr/schema/copyfield.rb +42 -0
  20. data/lib/simple_solr/schema/dynamic_field.rb +23 -0
  21. data/lib/simple_solr/schema/field.rb +35 -0
  22. data/lib/simple_solr/schema/field_or_type.rb +112 -0
  23. data/lib/simple_solr/schema/field_type.rb +62 -0
  24. data/lib/simple_solr/schema/matcher.rb +16 -0
  25. data/lib/simple_solr/version.rb +3 -0
  26. data/simple_solr_client.gemspec +39 -0
  27. data/solr_sample_core/conf/_schema_analysis_stopwords_english.json +38 -0
  28. data/solr_sample_core/conf/_schema_analysis_synonyms_english.json +11 -0
  29. data/solr_sample_core/conf/admin-extra.html +24 -0
  30. data/solr_sample_core/conf/admin-extra.menu-bottom.html +25 -0
  31. data/solr_sample_core/conf/admin-extra.menu-top.html +25 -0
  32. data/solr_sample_core/conf/clustering/carrot2/kmeans-attributes.xml +19 -0
  33. data/solr_sample_core/conf/clustering/carrot2/lingo-attributes.xml +24 -0
  34. data/solr_sample_core/conf/clustering/carrot2/stc-attributes.xml +19 -0
  35. data/solr_sample_core/conf/currency.xml +67 -0
  36. data/solr_sample_core/conf/elevate.xml +38 -0
  37. data/solr_sample_core/conf/lang/contractions_ca.txt +8 -0
  38. data/solr_sample_core/conf/lang/contractions_fr.txt +15 -0
  39. data/solr_sample_core/conf/lang/contractions_ga.txt +5 -0
  40. data/solr_sample_core/conf/lang/contractions_it.txt +23 -0
  41. data/solr_sample_core/conf/lang/hyphenations_ga.txt +5 -0
  42. data/solr_sample_core/conf/lang/stemdict_nl.txt +6 -0
  43. data/solr_sample_core/conf/lang/stoptags_ja.txt +420 -0
  44. data/solr_sample_core/conf/lang/stopwords_ar.txt +125 -0
  45. data/solr_sample_core/conf/lang/stopwords_bg.txt +193 -0
  46. data/solr_sample_core/conf/lang/stopwords_ca.txt +220 -0
  47. data/solr_sample_core/conf/lang/stopwords_ckb.txt +136 -0
  48. data/solr_sample_core/conf/lang/stopwords_cz.txt +172 -0
  49. data/solr_sample_core/conf/lang/stopwords_da.txt +110 -0
  50. data/solr_sample_core/conf/lang/stopwords_de.txt +294 -0
  51. data/solr_sample_core/conf/lang/stopwords_el.txt +78 -0
  52. data/solr_sample_core/conf/lang/stopwords_en.txt +54 -0
  53. data/solr_sample_core/conf/lang/stopwords_es.txt +356 -0
  54. data/solr_sample_core/conf/lang/stopwords_eu.txt +99 -0
  55. data/solr_sample_core/conf/lang/stopwords_fa.txt +313 -0
  56. data/solr_sample_core/conf/lang/stopwords_fi.txt +97 -0
  57. data/solr_sample_core/conf/lang/stopwords_fr.txt +186 -0
  58. data/solr_sample_core/conf/lang/stopwords_ga.txt +110 -0
  59. data/solr_sample_core/conf/lang/stopwords_gl.txt +161 -0
  60. data/solr_sample_core/conf/lang/stopwords_hi.txt +235 -0
  61. data/solr_sample_core/conf/lang/stopwords_hu.txt +211 -0
  62. data/solr_sample_core/conf/lang/stopwords_hy.txt +46 -0
  63. data/solr_sample_core/conf/lang/stopwords_id.txt +359 -0
  64. data/solr_sample_core/conf/lang/stopwords_it.txt +303 -0
  65. data/solr_sample_core/conf/lang/stopwords_ja.txt +127 -0
  66. data/solr_sample_core/conf/lang/stopwords_lv.txt +172 -0
  67. data/solr_sample_core/conf/lang/stopwords_nl.txt +119 -0
  68. data/solr_sample_core/conf/lang/stopwords_no.txt +194 -0
  69. data/solr_sample_core/conf/lang/stopwords_pt.txt +253 -0
  70. data/solr_sample_core/conf/lang/stopwords_ro.txt +233 -0
  71. data/solr_sample_core/conf/lang/stopwords_ru.txt +243 -0
  72. data/solr_sample_core/conf/lang/stopwords_sv.txt +133 -0
  73. data/solr_sample_core/conf/lang/stopwords_th.txt +119 -0
  74. data/solr_sample_core/conf/lang/stopwords_tr.txt +212 -0
  75. data/solr_sample_core/conf/lang/userdict_ja.txt +29 -0
  76. data/solr_sample_core/conf/mapping-FoldToASCII.txt +3813 -0
  77. data/solr_sample_core/conf/mapping-ISOLatin1Accent.txt +246 -0
  78. data/solr_sample_core/conf/protwords.txt +21 -0
  79. data/solr_sample_core/conf/schema.xml +62 -0
  80. data/solr_sample_core/conf/scripts.conf +24 -0
  81. data/solr_sample_core/conf/solrconfig.xml +1702 -0
  82. data/solr_sample_core/conf/spellings.txt +2 -0
  83. data/solr_sample_core/conf/stopwords.txt +14 -0
  84. data/solr_sample_core/conf/syn.txt +0 -0
  85. data/solr_sample_core/conf/synonyms.txt +29 -0
  86. data/solr_sample_core/conf/token_fixing_charfilter.txt +110 -0
  87. data/solr_sample_core/conf/update-script.js +53 -0
  88. data/solr_sample_core/conf/velocity/README.txt +101 -0
  89. data/solr_sample_core/conf/velocity/VM_global_library.vm +175 -0
  90. data/solr_sample_core/conf/velocity/browse.vm +33 -0
  91. data/solr_sample_core/conf/velocity/cluster.vm +19 -0
  92. data/solr_sample_core/conf/velocity/cluster_results.vm +31 -0
  93. data/solr_sample_core/conf/velocity/debug.vm +28 -0
  94. data/solr_sample_core/conf/velocity/did_you_mean.vm +9 -0
  95. data/solr_sample_core/conf/velocity/error.vm +11 -0
  96. data/solr_sample_core/conf/velocity/facet_fields.vm +23 -0
  97. data/solr_sample_core/conf/velocity/facet_pivot.vm +12 -0
  98. data/solr_sample_core/conf/velocity/facet_queries.vm +12 -0
  99. data/solr_sample_core/conf/velocity/facet_ranges.vm +23 -0
  100. data/solr_sample_core/conf/velocity/facets.vm +10 -0
  101. data/solr_sample_core/conf/velocity/footer.vm +43 -0
  102. data/solr_sample_core/conf/velocity/head.vm +35 -0
  103. data/solr_sample_core/conf/velocity/header.vm +7 -0
  104. data/solr_sample_core/conf/velocity/hit.vm +25 -0
  105. data/solr_sample_core/conf/velocity/hit_grouped.vm +43 -0
  106. data/solr_sample_core/conf/velocity/hit_plain.vm +25 -0
  107. data/solr_sample_core/conf/velocity/join_doc.vm +20 -0
  108. data/solr_sample_core/conf/velocity/jquery.autocomplete.css +48 -0
  109. data/solr_sample_core/conf/velocity/jquery.autocomplete.js +763 -0
  110. data/solr_sample_core/conf/velocity/layout.vm +24 -0
  111. data/solr_sample_core/conf/velocity/main.css +230 -0
  112. data/solr_sample_core/conf/velocity/mime_type_lists.vm +68 -0
  113. data/solr_sample_core/conf/velocity/pagination_bottom.vm +22 -0
  114. data/solr_sample_core/conf/velocity/pagination_top.vm +29 -0
  115. data/solr_sample_core/conf/velocity/product_doc.vm +32 -0
  116. data/solr_sample_core/conf/velocity/query.vm +42 -0
  117. data/solr_sample_core/conf/velocity/query_form.vm +64 -0
  118. data/solr_sample_core/conf/velocity/query_group.vm +43 -0
  119. data/solr_sample_core/conf/velocity/query_spatial.vm +75 -0
  120. data/solr_sample_core/conf/velocity/results_list.vm +22 -0
  121. data/solr_sample_core/conf/velocity/richtext_doc.vm +153 -0
  122. data/solr_sample_core/conf/velocity/suggest.vm +8 -0
  123. data/solr_sample_core/conf/velocity/tabs.vm +50 -0
  124. data/solr_sample_core/conf/xslt/example.xsl +132 -0
  125. data/solr_sample_core/conf/xslt/example_atom.xsl +67 -0
  126. data/solr_sample_core/conf/xslt/example_rss.xsl +66 -0
  127. data/solr_sample_core/conf/xslt/luke.xsl +337 -0
  128. data/solr_sample_core/conf/xslt/updateXml.xsl +70 -0
  129. data/spec/client_basics_spec.rb +26 -0
  130. data/spec/connect_spec.rb +25 -0
  131. data/spec/core_basics.rb +21 -0
  132. data/spec/index_spec.rb +31 -0
  133. data/spec/load_spec.rb +7 -0
  134. data/spec/minitest_helper.rb +36 -0
  135. data/spec/schema_spec.rb +113 -0
  136. metadata +284 -0
@@ -0,0 +1,243 @@
1
+ | From svn.tartarus.org/snowball/trunk/website/algorithms/russian/stop.txt
2
+ | This file is distributed under the BSD License.
3
+ | See http://snowball.tartarus.org/license.php
4
+ | Also see http://www.opensource.org/licenses/bsd-license.html
5
+ | - Encoding was converted to UTF-8.
6
+ | - This notice was added.
7
+ |
8
+ | NOTE: To use this file with StopFilterFactory, you must specify format="snowball"
9
+
10
+ | a russian stop word list. comments begin with vertical bar. each stop
11
+ | word is at the start of a line.
12
+
13
+ | this is a ranked list (commonest to rarest) of stopwords derived from
14
+ | a large text sample.
15
+
16
+ | letter `ё' is translated to `е'.
17
+
18
+ и | and
19
+ в | in/into
20
+ во | alternative form
21
+ не | not
22
+ что | what/that
23
+ он | he
24
+ на | on/onto
25
+ я | i
26
+ с | from
27
+ со | alternative form
28
+ как | how
29
+ а | milder form of `no' (but)
30
+ то | conjunction and form of `that'
31
+ все | all
32
+ она | she
33
+ так | so, thus
34
+ его | him
35
+ но | but
36
+ да | yes/and
37
+ ты | thou
38
+ к | towards, by
39
+ у | around, chez
40
+ же | intensifier particle
41
+ вы | you
42
+ за | beyond, behind
43
+ бы | conditional/subj. particle
44
+ по | up to, along
45
+ только | only
46
+ ее | her
47
+ мне | to me
48
+ было | it was
49
+ вот | here is/are, particle
50
+ от | away from
51
+ меня | me
52
+ еще | still, yet, more
53
+ нет | no, there isnt/arent
54
+ о | about
55
+ из | out of
56
+ ему | to him
57
+ теперь | now
58
+ когда | when
59
+ даже | even
60
+ ну | so, well
61
+ вдруг | suddenly
62
+ ли | interrogative particle
63
+ если | if
64
+ уже | already, but homonym of `narrower'
65
+ или | or
66
+ ни | neither
67
+ быть | to be
68
+ был | he was
69
+ него | prepositional form of его
70
+ до | up to
71
+ вас | you accusative
72
+ нибудь | indef. suffix preceded by hyphen
73
+ опять | again
74
+ уж | already, but homonym of `adder'
75
+ вам | to you
76
+ сказал | he said
77
+ ведь | particle `after all'
78
+ там | there
79
+ потом | then
80
+ себя | oneself
81
+ ничего | nothing
82
+ ей | to her
83
+ может | usually with `быть' as `maybe'
84
+ они | they
85
+ тут | here
86
+ где | where
87
+ есть | there is/are
88
+ надо | got to, must
89
+ ней | prepositional form of ей
90
+ для | for
91
+ мы | we
92
+ тебя | thee
93
+ их | them, their
94
+ чем | than
95
+ была | she was
96
+ сам | self
97
+ чтоб | in order to
98
+ без | without
99
+ будто | as if
100
+ человек | man, person, one
101
+ чего | genitive form of `what'
102
+ раз | once
103
+ тоже | also
104
+ себе | to oneself
105
+ под | beneath
106
+ жизнь | life
107
+ будет | will be
108
+ ж | short form of intensifer particle `же'
109
+ тогда | then
110
+ кто | who
111
+ этот | this
112
+ говорил | was saying
113
+ того | genitive form of `that'
114
+ потому | for that reason
115
+ этого | genitive form of `this'
116
+ какой | which
117
+ совсем | altogether
118
+ ним | prepositional form of `его', `они'
119
+ здесь | here
120
+ этом | prepositional form of `этот'
121
+ один | one
122
+ почти | almost
123
+ мой | my
124
+ тем | instrumental/dative plural of `тот', `то'
125
+ чтобы | full form of `in order that'
126
+ нее | her (acc.)
127
+ кажется | it seems
128
+ сейчас | now
129
+ были | they were
130
+ куда | where to
131
+ зачем | why
132
+ сказать | to say
133
+ всех | all (acc., gen. preposn. plural)
134
+ никогда | never
135
+ сегодня | today
136
+ можно | possible, one can
137
+ при | by
138
+ наконец | finally
139
+ два | two
140
+ об | alternative form of `о', about
141
+ другой | another
142
+ хоть | even
143
+ после | after
144
+ над | above
145
+ больше | more
146
+ тот | that one (masc.)
147
+ через | across, in
148
+ эти | these
149
+ нас | us
150
+ про | about
151
+ всего | in all, only, of all
152
+ них | prepositional form of `они' (they)
153
+ какая | which, feminine
154
+ много | lots
155
+ разве | interrogative particle
156
+ сказала | she said
157
+ три | three
158
+ эту | this, acc. fem. sing.
159
+ моя | my, feminine
160
+ впрочем | moreover, besides
161
+ хорошо | good
162
+ свою | ones own, acc. fem. sing.
163
+ этой | oblique form of `эта', fem. `this'
164
+ перед | in front of
165
+ иногда | sometimes
166
+ лучше | better
167
+ чуть | a little
168
+ том | preposn. form of `that one'
169
+ нельзя | one must not
170
+ такой | such a one
171
+ им | to them
172
+ более | more
173
+ всегда | always
174
+ конечно | of course
175
+ всю | acc. fem. sing of `all'
176
+ между | between
177
+
178
+
179
+ | b: some paradigms
180
+ |
181
+ | personal pronouns
182
+ |
183
+ | я меня мне мной [мною]
184
+ | ты тебя тебе тобой [тобою]
185
+ | он его ему им [него, нему, ним]
186
+ | она ее эи ею [нее, нэи, нею]
187
+ | оно его ему им [него, нему, ним]
188
+ |
189
+ | мы нас нам нами
190
+ | вы вас вам вами
191
+ | они их им ими [них, ним, ними]
192
+ |
193
+ | себя себе собой [собою]
194
+ |
195
+ | demonstrative pronouns: этот (this), тот (that)
196
+ |
197
+ | этот эта это эти
198
+ | этого эты это эти
199
+ | этого этой этого этих
200
+ | этому этой этому этим
201
+ | этим этой этим [этою] этими
202
+ | этом этой этом этих
203
+ |
204
+ | тот та то те
205
+ | того ту то те
206
+ | того той того тех
207
+ | тому той тому тем
208
+ | тем той тем [тою] теми
209
+ | том той том тех
210
+ |
211
+ | determinative pronouns
212
+ |
213
+ | (a) весь (all)
214
+ |
215
+ | весь вся все все
216
+ | всего всю все все
217
+ | всего всей всего всех
218
+ | всему всей всему всем
219
+ | всем всей всем [всею] всеми
220
+ | всем всей всем всех
221
+ |
222
+ | (b) сам (himself etc)
223
+ |
224
+ | сам сама само сами
225
+ | самого саму само самих
226
+ | самого самой самого самих
227
+ | самому самой самому самим
228
+ | самим самой самим [самою] самими
229
+ | самом самой самом самих
230
+ |
231
+ | stems of verbs `to be', `to have', `to do' and modal
232
+ |
233
+ | быть бы буд быв есть суть
234
+ | име
235
+ | дел
236
+ | мог мож мочь
237
+ | уме
238
+ | хоч хот
239
+ | долж
240
+ | можн
241
+ | нужн
242
+ | нельзя
243
+
@@ -0,0 +1,133 @@
1
+ | From svn.tartarus.org/snowball/trunk/website/algorithms/swedish/stop.txt
2
+ | This file is distributed under the BSD License.
3
+ | See http://snowball.tartarus.org/license.php
4
+ | Also see http://www.opensource.org/licenses/bsd-license.html
5
+ | - Encoding was converted to UTF-8.
6
+ | - This notice was added.
7
+ |
8
+ | NOTE: To use this file with StopFilterFactory, you must specify format="snowball"
9
+
10
+ | A Swedish stop word list. Comments begin with vertical bar. Each stop
11
+ | word is at the start of a line.
12
+
13
+ | This is a ranked list (commonest to rarest) of stopwords derived from
14
+ | a large text sample.
15
+
16
+ | Swedish stop words occasionally exhibit homonym clashes. For example
17
+ | så = so, but also seed. These are indicated clearly below.
18
+
19
+ och | and
20
+ det | it, this/that
21
+ att | to (with infinitive)
22
+ i | in, at
23
+ en | a
24
+ jag | I
25
+ hon | she
26
+ som | who, that
27
+ han | he
28
+ på | on
29
+ den | it, this/that
30
+ med | with
31
+ var | where, each
32
+ sig | him(self) etc
33
+ för | for
34
+ så | so (also: seed)
35
+ till | to
36
+ är | is
37
+ men | but
38
+ ett | a
39
+ om | if; around, about
40
+ hade | had
41
+ de | they, these/those
42
+ av | of
43
+ icke | not, no
44
+ mig | me
45
+ du | you
46
+ henne | her
47
+ då | then, when
48
+ sin | his
49
+ nu | now
50
+ har | have
51
+ inte | inte någon = no one
52
+ hans | his
53
+ honom | him
54
+ skulle | 'sake'
55
+ hennes | her
56
+ där | there
57
+ min | my
58
+ man | one (pronoun)
59
+ ej | nor
60
+ vid | at, by, on (also: vast)
61
+ kunde | could
62
+ något | some etc
63
+ från | from, off
64
+ ut | out
65
+ när | when
66
+ efter | after, behind
67
+ upp | up
68
+ vi | we
69
+ dem | them
70
+ vara | be
71
+ vad | what
72
+ över | over
73
+ än | than
74
+ dig | you
75
+ kan | can
76
+ sina | his
77
+ här | here
78
+ ha | have
79
+ mot | towards
80
+ alla | all
81
+ under | under (also: wonder)
82
+ någon | some etc
83
+ eller | or (else)
84
+ allt | all
85
+ mycket | much
86
+ sedan | since
87
+ ju | why
88
+ denna | this/that
89
+ själv | myself, yourself etc
90
+ detta | this/that
91
+ åt | to
92
+ utan | without
93
+ varit | was
94
+ hur | how
95
+ ingen | no
96
+ mitt | my
97
+ ni | you
98
+ bli | to be, become
99
+ blev | from bli
100
+ oss | us
101
+ din | thy
102
+ dessa | these/those
103
+ några | some etc
104
+ deras | their
105
+ blir | from bli
106
+ mina | my
107
+ samma | (the) same
108
+ vilken | who, that
109
+ er | you, your
110
+ sådan | such a
111
+ vår | our
112
+ blivit | from bli
113
+ dess | its
114
+ inom | within
115
+ mellan | between
116
+ sådant | such a
117
+ varför | why
118
+ varje | each
119
+ vilka | who, that
120
+ ditt | thy
121
+ vem | who
122
+ vilket | who, that
123
+ sitta | his
124
+ sådana | such a
125
+ vart | each
126
+ dina | thy
127
+ vars | whose
128
+ vårt | our
129
+ våra | our
130
+ ert | your
131
+ era | your
132
+ vilkas | whose
133
+
@@ -0,0 +1,119 @@
1
+ # Thai stopwords from:
2
+ # "Opinion Detection in Thai Political News Columns
3
+ # Based on Subjectivity Analysis"
4
+ # Khampol Sukhum, Supot Nitsuwat, and Choochart Haruechaiyasak
5
+ ไว้
6
+ ไม่
7
+ ไป
8
+ ได้
9
+ ให้
10
+ ใน
11
+ โดย
12
+ แห่ง
13
+ แล้ว
14
+ และ
15
+ แรก
16
+ แบบ
17
+ แต่
18
+ เอง
19
+ เห็น
20
+ เลย
21
+ เริ่ม
22
+ เรา
23
+ เมื่อ
24
+ เพื่อ
25
+ เพราะ
26
+ เป็นการ
27
+ เป็น
28
+ เปิดเผย
29
+ เปิด
30
+ เนื่องจาก
31
+ เดียวกัน
32
+ เดียว
33
+ เช่น
34
+ เฉพาะ
35
+ เคย
36
+ เข้า
37
+ เขา
38
+ อีก
39
+ อาจ
40
+ อะไร
41
+ ออก
42
+ อย่าง
43
+ อยู่
44
+ อยาก
45
+ หาก
46
+ หลาย
47
+ หลังจาก
48
+ หลัง
49
+ หรือ
50
+ หนึ่ง
51
+ ส่วน
52
+ ส่ง
53
+ สุด
54
+ สําหรับ
55
+ ว่า
56
+ วัน
57
+ ลง
58
+ ร่วม
59
+ ราย
60
+ รับ
61
+ ระหว่าง
62
+ รวม
63
+ ยัง
64
+ มี
65
+ มาก
66
+ มา
67
+ พร้อม
68
+ พบ
69
+ ผ่าน
70
+ ผล
71
+ บาง
72
+ น่า
73
+ นี้
74
+ นํา
75
+ นั้น
76
+ นัก
77
+ นอกจาก
78
+ ทุก
79
+ ที่สุด
80
+ ที่
81
+ ทําให้
82
+ ทํา
83
+ ทาง
84
+ ทั้งนี้
85
+ ทั้ง
86
+ ถ้า
87
+ ถูก
88
+ ถึง
89
+ ต้อง
90
+ ต่างๆ
91
+ ต่าง
92
+ ต่อ
93
+ ตาม
94
+ ตั้งแต่
95
+ ตั้ง
96
+ ด้าน
97
+ ด้วย
98
+ ดัง
99
+ ซึ่ง
100
+ ช่วง
101
+ จึง
102
+ จาก
103
+ จัด
104
+ จะ
105
+ คือ
106
+ ความ
107
+ ครั้ง
108
+ คง
109
+ ขึ้น
110
+ ของ
111
+ ขอ
112
+ ขณะ
113
+ ก่อน
114
+ ก็
115
+ การ
116
+ กับ
117
+ กัน
118
+ กว่า
119
+ กล่าว