RubyGems - ferret - Versions diffs - 0.9.6 → 0.10.0 - Mend

ferret 0.9.6 → 0.10.0

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (295) hide show

data/MIT-LICENSE +1 -1
data/README +12 -24
data/Rakefile +38 -54
data/TODO +14 -17
data/ext/analysis.c +982 -823
data/ext/analysis.h +133 -76
data/ext/array.c +96 -58
data/ext/array.h +40 -13
data/ext/bitvector.c +476 -118
data/ext/bitvector.h +264 -22
data/ext/compound_io.c +217 -229
data/ext/defines.h +49 -0
data/ext/document.c +107 -317
data/ext/document.h +31 -65
data/ext/except.c +81 -36
data/ext/except.h +117 -55
data/ext/extconf.rb +2 -9
data/ext/ferret.c +211 -104
data/ext/ferret.h +22 -11
data/ext/filter.c +97 -82
data/ext/fs_store.c +348 -367
data/ext/global.c +226 -188
data/ext/global.h +44 -26
data/ext/hash.c +474 -391
data/ext/hash.h +441 -68
data/ext/hashset.c +124 -96
data/ext/hashset.h +169 -20
data/ext/helper.c +56 -5
data/ext/helper.h +7 -0
data/ext/inc/lang.h +29 -49
data/ext/inc/threading.h +31 -0
data/ext/ind.c +288 -278
data/ext/ind.h +68 -0
data/ext/index.c +5688 -0
data/ext/index.h +663 -616
data/ext/lang.h +29 -49
data/ext/libstemmer.c +3 -3
data/ext/mem_pool.c +84 -0
data/ext/mem_pool.h +35 -0
data/ext/posh.c +1006 -0
data/ext/posh.h +1007 -0
data/ext/priorityqueue.c +117 -194
data/ext/priorityqueue.h +135 -39
data/ext/q_boolean.c +1305 -1108
data/ext/q_const_score.c +106 -93
data/ext/q_filtered_query.c +138 -135
data/ext/q_fuzzy.c +206 -242
data/ext/q_match_all.c +94 -80
data/ext/q_multi_term.c +663 -0
data/ext/q_parser.c +667 -593
data/ext/q_phrase.c +992 -555
data/ext/q_prefix.c +72 -61
data/ext/q_range.c +235 -210
data/ext/q_span.c +1480 -1166
data/ext/q_term.c +273 -246
data/ext/q_wildcard.c +127 -114
data/ext/r_analysis.c +1720 -711
data/ext/r_index.c +3049 -0
data/ext/r_qparser.c +433 -146
data/ext/r_search.c +2934 -1993
data/ext/r_store.c +372 -143
data/ext/r_utils.c +941 -0
data/ext/ram_store.c +330 -326
data/ext/search.c +1291 -668
data/ext/search.h +403 -702
data/ext/similarity.c +91 -113
data/ext/similarity.h +45 -30
data/ext/sort.c +721 -484
data/ext/stopwords.c +361 -273
data/ext/store.c +556 -58
data/ext/store.h +706 -126
data/ext/tags +3578 -2780
data/ext/term_vectors.c +352 -0
data/ext/threading.h +31 -0
data/ext/win32.h +54 -0
data/lib/ferret.rb +5 -17
data/lib/ferret/document.rb +130 -2
data/lib/ferret/index.rb +577 -26
data/lib/ferret/number_tools.rb +157 -0
data/lib/ferret_version.rb +3 -0
data/test/test_helper.rb +5 -13
data/test/unit/analysis/tc_analyzer.rb +513 -1
data/test/unit/analysis/{ctc_tokenstream.rb → tc_token_stream.rb} +23 -0
data/test/unit/index/tc_index.rb +183 -240
data/test/unit/index/tc_index_reader.rb +312 -479
data/test/unit/index/tc_index_writer.rb +397 -13
data/test/unit/index/th_doc.rb +269 -206
data/test/unit/query_parser/tc_query_parser.rb +40 -33
data/test/unit/search/tc_filter.rb +59 -71
data/test/unit/search/tc_fuzzy_query.rb +24 -16
data/test/unit/search/tc_index_searcher.rb +23 -201
data/test/unit/search/tc_multi_searcher.rb +78 -226
data/test/unit/search/tc_search_and_sort.rb +93 -81
data/test/unit/search/tc_sort.rb +23 -23
data/test/unit/search/tc_sort_field.rb +7 -7
data/test/unit/search/tc_spans.rb +51 -47
data/test/unit/search/tm_searcher.rb +339 -0
data/test/unit/store/tc_fs_store.rb +1 -1
data/test/unit/store/tm_store_lock.rb +3 -3
data/test/unit/tc_document.rb +81 -0
data/test/unit/ts_analysis.rb +1 -1
data/test/unit/ts_utils.rb +1 -1
data/test/unit/utils/tc_bit_vector.rb +288 -0
data/test/unit/utils/tc_number_tools.rb +117 -0
data/test/unit/utils/tc_priority_queue.rb +106 -0
metadata +140 -301
data/CHANGELOG +0 -9
data/ext/dummy.exe +0 -0
data/ext/field.c +0 -408
data/ext/frtio.h +0 -13
data/ext/inc/except.h +0 -90
data/ext/index_io.c +0 -382
data/ext/index_rw.c +0 -2658
data/ext/lang.c +0 -41
data/ext/nix_io.c +0 -134
data/ext/q_multi_phrase.c +0 -380
data/ext/r_doc.c +0 -582
data/ext/r_index_io.c +0 -1021
data/ext/r_term.c +0 -219
data/ext/term.c +0 -820
data/ext/termdocs.c +0 -611
data/ext/vector.c +0 -637
data/ext/w32_io.c +0 -150
data/lib/ferret/analysis.rb +0 -11
data/lib/ferret/analysis/analyzers.rb +0 -112
data/lib/ferret/analysis/standard_tokenizer.rb +0 -71
data/lib/ferret/analysis/token.rb +0 -100
data/lib/ferret/analysis/token_filters.rb +0 -86
data/lib/ferret/analysis/token_stream.rb +0 -26
data/lib/ferret/analysis/tokenizers.rb +0 -112
data/lib/ferret/analysis/word_list_loader.rb +0 -27
data/lib/ferret/document/document.rb +0 -152
data/lib/ferret/document/field.rb +0 -312
data/lib/ferret/index/compound_file_io.rb +0 -338
data/lib/ferret/index/document_writer.rb +0 -289
data/lib/ferret/index/field_infos.rb +0 -279
data/lib/ferret/index/fields_io.rb +0 -181
data/lib/ferret/index/index.rb +0 -675
data/lib/ferret/index/index_file_names.rb +0 -33
data/lib/ferret/index/index_reader.rb +0 -503
data/lib/ferret/index/index_writer.rb +0 -534
data/lib/ferret/index/multi_reader.rb +0 -377
data/lib/ferret/index/multiple_term_doc_pos_enum.rb +0 -98
data/lib/ferret/index/segment_infos.rb +0 -130
data/lib/ferret/index/segment_merge_info.rb +0 -49
data/lib/ferret/index/segment_merge_queue.rb +0 -16
data/lib/ferret/index/segment_merger.rb +0 -358
data/lib/ferret/index/segment_reader.rb +0 -412
data/lib/ferret/index/segment_term_enum.rb +0 -169
data/lib/ferret/index/segment_term_vector.rb +0 -58
data/lib/ferret/index/term.rb +0 -53
data/lib/ferret/index/term_buffer.rb +0 -83
data/lib/ferret/index/term_doc_enum.rb +0 -291
data/lib/ferret/index/term_enum.rb +0 -52
data/lib/ferret/index/term_info.rb +0 -37
data/lib/ferret/index/term_infos_io.rb +0 -321
data/lib/ferret/index/term_vector_offset_info.rb +0 -20
data/lib/ferret/index/term_vectors_io.rb +0 -553
data/lib/ferret/query_parser.rb +0 -312
data/lib/ferret/query_parser/query_parser.tab.rb +0 -928
data/lib/ferret/search.rb +0 -50
data/lib/ferret/search/boolean_clause.rb +0 -100
data/lib/ferret/search/boolean_query.rb +0 -299
data/lib/ferret/search/boolean_scorer.rb +0 -294
data/lib/ferret/search/caching_wrapper_filter.rb +0 -40
data/lib/ferret/search/conjunction_scorer.rb +0 -99
data/lib/ferret/search/disjunction_sum_scorer.rb +0 -205
data/lib/ferret/search/exact_phrase_scorer.rb +0 -32
data/lib/ferret/search/explanation.rb +0 -41
data/lib/ferret/search/field_cache.rb +0 -215
data/lib/ferret/search/field_doc.rb +0 -31
data/lib/ferret/search/field_sorted_hit_queue.rb +0 -184
data/lib/ferret/search/filter.rb +0 -11
data/lib/ferret/search/filtered_query.rb +0 -130
data/lib/ferret/search/filtered_term_enum.rb +0 -79
data/lib/ferret/search/fuzzy_query.rb +0 -154
data/lib/ferret/search/fuzzy_term_enum.rb +0 -247
data/lib/ferret/search/hit_collector.rb +0 -34
data/lib/ferret/search/hit_queue.rb +0 -11
data/lib/ferret/search/index_searcher.rb +0 -200
data/lib/ferret/search/match_all_query.rb +0 -104
data/lib/ferret/search/multi_phrase_query.rb +0 -216
data/lib/ferret/search/multi_searcher.rb +0 -261
data/lib/ferret/search/multi_term_query.rb +0 -65
data/lib/ferret/search/non_matching_scorer.rb +0 -22
data/lib/ferret/search/phrase_positions.rb +0 -55
data/lib/ferret/search/phrase_query.rb +0 -214
data/lib/ferret/search/phrase_scorer.rb +0 -152
data/lib/ferret/search/prefix_query.rb +0 -54
data/lib/ferret/search/query.rb +0 -140
data/lib/ferret/search/query_filter.rb +0 -51
data/lib/ferret/search/range_filter.rb +0 -103
data/lib/ferret/search/range_query.rb +0 -139
data/lib/ferret/search/req_excl_scorer.rb +0 -125
data/lib/ferret/search/req_opt_sum_scorer.rb +0 -70
data/lib/ferret/search/score_doc.rb +0 -38
data/lib/ferret/search/score_doc_comparator.rb +0 -114
data/lib/ferret/search/scorer.rb +0 -91
data/lib/ferret/search/similarity.rb +0 -278
data/lib/ferret/search/sloppy_phrase_scorer.rb +0 -47
data/lib/ferret/search/sort.rb +0 -112
data/lib/ferret/search/sort_comparator.rb +0 -60
data/lib/ferret/search/sort_field.rb +0 -91
data/lib/ferret/search/spans.rb +0 -12
data/lib/ferret/search/spans/near_spans_enum.rb +0 -304
data/lib/ferret/search/spans/span_first_query.rb +0 -79
data/lib/ferret/search/spans/span_near_query.rb +0 -108
data/lib/ferret/search/spans/span_not_query.rb +0 -130
data/lib/ferret/search/spans/span_or_query.rb +0 -176
data/lib/ferret/search/spans/span_query.rb +0 -25
data/lib/ferret/search/spans/span_scorer.rb +0 -74
data/lib/ferret/search/spans/span_term_query.rb +0 -105
data/lib/ferret/search/spans/span_weight.rb +0 -84
data/lib/ferret/search/spans/spans_enum.rb +0 -44
data/lib/ferret/search/term_query.rb +0 -128
data/lib/ferret/search/term_scorer.rb +0 -183
data/lib/ferret/search/top_docs.rb +0 -36
data/lib/ferret/search/top_field_docs.rb +0 -17
data/lib/ferret/search/weight.rb +0 -54
data/lib/ferret/search/wildcard_query.rb +0 -26
data/lib/ferret/search/wildcard_term_enum.rb +0 -61
data/lib/ferret/stemmers.rb +0 -1
data/lib/ferret/stemmers/porter_stemmer.rb +0 -218
data/lib/ferret/store.rb +0 -5
data/lib/ferret/store/buffered_index_io.rb +0 -190
data/lib/ferret/store/directory.rb +0 -141
data/lib/ferret/store/fs_store.rb +0 -381
data/lib/ferret/store/index_io.rb +0 -245
data/lib/ferret/store/ram_store.rb +0 -286
data/lib/ferret/utils.rb +0 -8
data/lib/ferret/utils/bit_vector.rb +0 -123
data/lib/ferret/utils/date_tools.rb +0 -138
data/lib/ferret/utils/number_tools.rb +0 -91
data/lib/ferret/utils/parameter.rb +0 -41
data/lib/ferret/utils/priority_queue.rb +0 -120
data/lib/ferret/utils/string_helper.rb +0 -47
data/lib/ferret/utils/thread_local.rb +0 -28
data/lib/ferret/utils/weak_key_hash.rb +0 -60
data/lib/rferret.rb +0 -37
data/rake_utils/code_statistics.rb +0 -106
data/test/benchmark/tb_ram_store.rb +0 -76
data/test/benchmark/tb_rw_vint.rb +0 -26
data/test/functional/thread_safety_index_test.rb +0 -81
data/test/functional/thread_safety_test.rb +0 -137
data/test/longrunning/tc_numbertools.rb +0 -60
data/test/longrunning/tm_store.rb +0 -19
data/test/unit/analysis/ctc_analyzer.rb +0 -532
data/test/unit/analysis/data/wordfile +0 -6
data/test/unit/analysis/rtc_letter_tokenizer.rb +0 -20
data/test/unit/analysis/rtc_lower_case_filter.rb +0 -20
data/test/unit/analysis/rtc_lower_case_tokenizer.rb +0 -27
data/test/unit/analysis/rtc_per_field_analyzer_wrapper.rb +0 -39
data/test/unit/analysis/rtc_porter_stem_filter.rb +0 -16
data/test/unit/analysis/rtc_standard_analyzer.rb +0 -20
data/test/unit/analysis/rtc_standard_tokenizer.rb +0 -20
data/test/unit/analysis/rtc_stop_analyzer.rb +0 -20
data/test/unit/analysis/rtc_stop_filter.rb +0 -14
data/test/unit/analysis/rtc_white_space_analyzer.rb +0 -21
data/test/unit/analysis/rtc_white_space_tokenizer.rb +0 -20
data/test/unit/analysis/rtc_word_list_loader.rb +0 -32
data/test/unit/analysis/tc_token.rb +0 -25
data/test/unit/document/rtc_field.rb +0 -28
data/test/unit/document/tc_document.rb +0 -47
data/test/unit/document/tc_field.rb +0 -98
data/test/unit/index/rtc_compound_file_io.rb +0 -107
data/test/unit/index/rtc_field_infos.rb +0 -127
data/test/unit/index/rtc_fields_io.rb +0 -167
data/test/unit/index/rtc_multiple_term_doc_pos_enum.rb +0 -83
data/test/unit/index/rtc_segment_infos.rb +0 -74
data/test/unit/index/rtc_segment_term_docs.rb +0 -17
data/test/unit/index/rtc_segment_term_enum.rb +0 -60
data/test/unit/index/rtc_segment_term_vector.rb +0 -71
data/test/unit/index/rtc_term_buffer.rb +0 -57
data/test/unit/index/rtc_term_info.rb +0 -19
data/test/unit/index/rtc_term_infos_io.rb +0 -192
data/test/unit/index/rtc_term_vectors_io.rb +0 -108
data/test/unit/index/tc_term.rb +0 -27
data/test/unit/index/tc_term_voi.rb +0 -18
data/test/unit/search/rtc_similarity.rb +0 -37
data/test/unit/search/rtc_sort_field.rb +0 -14
data/test/unit/search/tc_multi_searcher2.rb +0 -126
data/test/unit/store/rtc_fs_store.rb +0 -62
data/test/unit/store/rtc_ram_store.rb +0 -15
data/test/unit/store/rtm_store.rb +0 -150
data/test/unit/store/rtm_store_lock.rb +0 -2
data/test/unit/ts_document.rb +0 -2
data/test/unit/utils/rtc_bit_vector.rb +0 -73
data/test/unit/utils/rtc_date_tools.rb +0 -50
data/test/unit/utils/rtc_number_tools.rb +0 -59
data/test/unit/utils/rtc_parameter.rb +0 -40
data/test/unit/utils/rtc_priority_queue.rb +0 -62
data/test/unit/utils/rtc_string_helper.rb +0 -21
data/test/unit/utils/rtc_thread.rb +0 -61
data/test/unit/utils/rtc_weak_key_hash.rb +0 -25
data/test/utils/number_to_spoken.rb +0 -132

data/test/unit/index/rtc_term_vectors_io.rb DELETED Viewed

@@ -1,108 +0,0 @@
-require File.dirname(__FILE__) + "/../../test_helper"
-class TermVectorsIOTest < Test::Unit::TestCase
-  include Ferret::Index
-  def setup()
-    @dir = Ferret::Store::RAMDirectory.new
-    @fis = FieldInfos.new
-    @fis.add("field1", true, true, true, true)
-    @fis.add("field2", true, true)
-  end
-  def tear_down()
-    @dir.close()
-  end
-  def test_tv_io_add_fields()
-    tv_w = TermVectorsWriter.new(@dir, "_test", @fis)
-    tv_w.open_document
-    assert(tv_w.document_open?)
-    tv_w.open_field("field1")
-    tv_w.add_term("text1", 1, [1], [t(0,4)])
-    tv_w.add_term("text2", 2, [3,4], [t(5,10), t(11,16)])
-    tv_w.close_field()
-    tv_w.close_document()
-    tv_w.close()
-    tv_r = TermVectorsReader.new(@dir, "_test", @fis)
-    assert_equal(1, tv_r.size)
-    tv = tv_r.get_field_tv(0, "field1")
-    assert_equal(2, tv.size)
-    assert_equal("text1", tv.terms[0])
-    assert_equal(1, tv.freqs[0])
-    assert_equal(1, tv.positions[0][0])
-    assert_equal(t(0,4), tv.offsets[0][0])
-    assert_equal("text2", tv.terms[1])
-    assert_equal(2, tv.freqs[1])
-    assert_equal(3, tv.positions[1][0])
-    assert_equal(t(5,10), tv.offsets[1][0])
-    assert_equal(4, tv.positions[1][1])
-    assert_equal(t(11,16), tv.offsets[1][1])
-    tv_r.close
-  end
-  def test_tv_io_add_documents()
-    tvs1 = []
-    tvs2 = []
-    tv = SegmentTermVector.new("field1",
-           ["word1", "word2"],
-           [3, 2],
-           [[1, 5, 8], [2, 9]],
-           [[t(0,5), t(34,39), t(45,50)],[t(6,11), t(51,56)]])
-    tvs1 << tv
-    tv = SegmentTermVector.new("field2",
-           ["word3", "word4"],
-           [1, 5],
-           [[8], [2, 9, 11, 34, 56]],
-           [[t(45,50)], [t(6,10), t(51,56), t(64,69), t(103,108), t(183,188)]])
-    tvs1 << tv
-    tv_w = TermVectorsWriter.new(@dir, "_test", @fis)
-    tv = SegmentTermVector.new("field1",
-           ["word1", "word2"],
-           [3, 2],
-           [[1, 5, 8], [2, 9]],
-           [[t(0,5), t(34,39), t(45,50)],[t(6,11), t(51,56)]])
-    tvs2 << tv
-    tv_w.add_all_doc_vectors(tvs1)
-    tv_w.add_all_doc_vectors(tvs2)
-    tv_w.close
-    tv_r = TermVectorsReader.new(@dir, "_test", @fis)
-    assert_equal(2, tv_r.size)
-    tv = tv_r.get_field_tv(0, "field1")
-    assert_equal(2, tv.size)
-    assert_equal("word1", tv.terms[0])
-    assert_equal(3, tv.freqs[0])
-    assert_equal(1, tv.positions[0][0])
-    assert_equal(5, tv.positions[0][1])
-    assert_equal(8, tv.positions[0][2])
-    assert_equal(t(0,5), tv.offsets[0][0])
-    assert_equal(t(34,39), tv.offsets[0][1])
-    assert_equal(t(45,50), tv.offsets[0][2])
-    assert_equal("word2", tv.terms[1])
-    assert_equal(2, tv.freqs[1])
-    assert_equal(2, tv.positions[1][0])
-    assert_equal(9, tv.positions[1][1])
-    assert_equal(t(6,11), tv.offsets[1][0])
-    assert_equal(t(51,56), tv.offsets[1][1])
-    tv = tv_r.get_field_tv(0, "field2")
-    assert_equal(2, tv.size)
-    assert_equal("word3", tv.terms[0])
-    tv = tv_r.get_field_tv(1, "field1")
-    assert_equal(2, tv.size)
-    assert_equal("word1", tv.terms[0])
-  end
-  private
-    def t(start, finish)
-      return TermVectorOffsetInfo.new(start, finish)
-    end
-end

data/test/unit/index/tc_term.rb DELETED Viewed

@@ -1,27 +0,0 @@
-require File.dirname(__FILE__) + "/../../test_helper"
-class TermTest < Test::Unit::TestCase
-  include Ferret::Index
-  def test_term()
-    term1 = Term.new("bfield1", "athis is text1")
-    assert_equal(term1.field, "bfield1")
-    assert_equal(term1.text, "athis is text1")
-    term2 = Term.new("afield2", "athis is text1")
-    term3 = Term.new("bfield1", "bthis is text2")
-    term4 = Term.new("bfield1", "athis is text1")
-    assert(term1 > term2)
-    assert(term1 < term3)
-    assert(term1.between?(term2, term3))
-    assert(term1 == term4)
-    assert(term1.eql?(term4))
-    term4.set!("field3", "text3")
-    assert_not_equal(term1, term4)
-  end
-  def test_non_strings()
-    t = Term.new(2345, 3)
-    t = Term.new(:symbol, :symbol)
-    t.set!(:symbol, :symbol)
-    t.set!(234, 23462346)
-  end
-end

data/test/unit/index/tc_term_voi.rb DELETED Viewed

@@ -1,18 +0,0 @@
-require File.dirname(__FILE__) + "/../../test_helper"
-class TermVectorOffsetInfoTest < Test::Unit::TestCase
-  include Ferret::Index
-  def test_tvoi()
-    t1 = TermVectorOffsetInfo.new(1, 3)
-    assert_equal(t1.start, 1)
-    assert_equal(t1.end, 3)
-    t2 = TermVectorOffsetInfo.new(1, 3)
-    assert(t1 == t2)
-    t2.start = 2
-    assert(t1 != t2)
-    t2.start = 1
-    t2.end = 1
-    assert(t1 != t2)
-  end
-end

data/test/unit/search/rtc_similarity.rb DELETED Viewed

@@ -1,37 +0,0 @@
-require File.dirname(__FILE__) + "/../../test_helper"
-class SimilarityTest < Test::Unit::TestCase
-  include Ferret::Search
-  include Ferret::Index
-  def test_byte_float_conversion()
-    256.times do |i|
-      assert_equal(i, Similarity.float_to_byte(Similarity.byte_to_float(i)))
-      assert_equal(Similarity.byte_to_float(i), Similarity::NORM_TABLE[i])
-      assert_equal(i, Similarity.encode_norm(Similarity.decode_norm(i)))
-    end
-  end
-  def test_default_similarity
-    dsim = DefaultSimilarity.new()
-    assert_equal(1.0/4, dsim.length_norm("field", 16))
-    assert_equal(1.0/4, dsim.query_norm(16))
-    assert_equal(3.0, dsim.tf(9))
-    assert_equal(1.0/10, dsim.sloppy_freq(9))
-    assert_equal(1.0, dsim.idf(9, 10))
-    assert_equal(4.0, dsim.coord(12, 3))
-    searcher = Object.new
-    def searcher.doc_freq(term) 9 end
-    def searcher.max_doc() 10 end
-    term = Term.new("field", "text")
-    assert_equal(1.0, dsim.idf_term(term, searcher))
-    terms = [
-      Term.new("field1", "text1"),
-      Term.new("field1", "text2"),
-      Term.new("field2", "text3"),
-      Term.new("field2", "text4")
-    ]
-    assert_equal(4.0, dsim.idf_phrase(terms, searcher))
-  end
-end

data/test/unit/search/rtc_sort_field.rb DELETED Viewed

@@ -1,14 +0,0 @@
-require File.dirname(__FILE__) + "/../../test_helper"
-class SortFieldTest < Test::Unit::TestCase
-  include Ferret::Search
-  def test_params()
-    assert_equal("SCORE",   SortField::SortType::SCORE.to_s)
-    assert_equal("DOC",     SortField::SortType::DOC.to_s)
-    assert_equal("auto",    SortField::SortType::AUTO.to_s)
-    assert_equal("string",  SortField::SortType::STRING.to_s)
-    assert_equal("integer", SortField::SortType::INTEGER.to_s)
-    assert_equal("float",   SortField::SortType::FLOAT.to_s)
-  end
-end

data/test/unit/search/tc_multi_searcher2.rb DELETED Viewed

@@ -1,126 +0,0 @@
-require File.dirname(__FILE__) + "/../../test_helper"
-# Tests the multisearcher by comparing it's results
-# with those returned by an IndexSearcher.
-# Taken from TestMultiSearcherRanking.java of Lucene
-class MultiSearcher2Test < Test::Unit::TestCase
-  include Ferret::Document
-  include Ferret::Search
-  include Ferret::Store
-  include Ferret::Analysis
-  include Ferret::Index
-  FIELD_NAME = 'body'
-  def test_one_Term_query
-    check_query 'three'
-  end
-  def test_two_term_query
-    check_query 'three foo'
-    # as of 2006/03/11 these fail in Java Lucene as
-    # well, hits are returned in slightly different order.
-    #check_query '+pizza +blue*', :body
-    #check_query '+pizza blue*', :body
-    #check_query 'pizza blue*', :body
-  end
-  def test_prefix_query
-    check_query 'multi*'
-  end
-  def test_fuzzy_query
-    check_query 'multiThree~'
-  end
-  def test_range_query
-    check_query '{multiA multiP}'
-  end
-  # fails (query parse error)
-  #def test_multi_phrase_query
-  #  check_query '"blueberry pi*"'
-  #end
-  def test_nomatch_query
-    check_query '+three +nomatch'
-  end
-  # this yields differing scores, but doesn't work in
-  # Java Lucene either
-  #def test_term_repeated_query
-  #  check_query 'multi* multi* foo'
-  #end
-  def check_query(query_str, debug_field=nil)
-    @parser ||= Ferret::QueryParser.new(FIELD_NAME, :analyzer => @analyzer)
-    query = @parser.parse(query_str)
-    puts "Query: #{query}" if debug_field
-    IndexTestHelper.explain(query, @multi, debug_field) if debug_field
-    IndexTestHelper.explain(query, @single, debug_field) if debug_field
-    multi_hits = @multi.search(query)
-    single_hits = @single.search(query)
-    assert_equal single_hits.size, multi_hits.size, "hit count differs"
-    multi_hits.score_docs.each_with_index { |multi_sd, i|
-      single_sd = single_hits.score_docs[i]
-      doc_multi = @multi.doc(multi_sd.doc)
-      doc_single = @single.doc(single_sd.doc)
-      assert_equal single_sd.score, multi_sd.score, "score differs in result #{i}"
-      assert_equal doc_single[FIELD_NAME], doc_multi[FIELD_NAME], "field values differ in result #{i}"
-    }
-  end
-  def setup()
-    @analyzer = WhiteSpaceAnalyzer.new()
-    # create MultiSearcher from two seperate searchers
-    d1 = RAMDirectory.new()
-    iw1 = IndexWriter.new(d1, :analyzer => @analyzer, :create => true)
-    add_collection1(iw1)
-    iw1.close()
-    d2 = RAMDirectory.new()
-    iw2 = IndexWriter.new(d2, :analyzer => @analyzer, :create => true)
-    add_collection2(iw2)
-    iw2.close()
-    @multi = MultiSearcher.new([IndexSearcher.new(d1), IndexSearcher.new(d2)])
-    # create IndexSearcher which contains all documents
-    d = RAMDirectory.new()
-    iw = IndexWriter.new(d, :analyzer => @analyzer, :create => true)
-    add_collection1(iw)
-    add_collection2(iw)
-    iw.close()
-    @single = IndexSearcher.new(d)
-  end
-  def tear_down()
-    @multi.close
-    @single.close
-  end
-  def add(value, iw)
-    d = Document.new
-    d << Field.new(FIELD_NAME, value, Field::Store::YES, Field::Index::TOKENIZED)
-    iw << d
-  end
-  def add_collection1(iw)
-    add("one blah three", iw)
-    add("one foo three multiOne", iw)
-    add("one foobar three multiThree", iw)
-    add("blueberry pie", iw)
-    add("blueberry strudel", iw)
-    add("blueberry pizza", iw)
-  end
-  def add_collection2(iw)
-    add("two blah three", iw)
-    add("two foo xxx multiTwo", iw)
-    add("two foobar xxx multiThreee", iw)
-    add("blueberry chewing gum", iw)
-    add("bluebird pizza", iw)
-    add("bluebird foobar pizza", iw)
-    add("piccadilly circus", iw)
-  end
-end

data/test/unit/store/rtc_fs_store.rb DELETED Viewed

@@ -1,62 +0,0 @@
-require File.dirname(__FILE__) + "/../../test_helper"
-require File.dirname(__FILE__) + "/rtm_store"
-require File.dirname(__FILE__) + "/rtm_store_lock"
-module Ferret::Store
-  class FSDirectory
-    def FSDirectory.directory_cache
-      @@Directories
-    end
-    def ref_count
-      @ref_count
-    end
-    def get_lock_prefix
-      lock_prefix
-    end
-  end
-end
-class FSStoreTest < Test::Unit::TestCase
-  include Ferret::Store
-  include StoreTest
-  include StoreLockTest
-  def setup
-    @dpath = File.join(File.dirname(__FILE__),
-                       '../../temp/fsdir')
-    @dir = FSDirectory.new(@dpath, true)
-  end
-  def teardown
-    @dir.refresh()
-    @dir.close()
-  end
-  def test_cache
-    dir_path = File.join(File.dirname(__FILE__),
-                         '/../../temp/cachetest')
-    assert(! FSDirectory.directory_cache[dir_path],
-           "this directory should not be cached yet")
-    @dir1 = FSDirectory.new(dir_path, true)
-    assert(FSDirectory.directory_cache[dir_path],
-           "this directory should now be cached")
-    assert_equal(@dir1.ref_count, 1,
-                 "There is one reference so the refcount should now be 1")
-    @dir2 = FSDirectory.new(dir_path, true)
-    assert(@dir1 === @dir2,
-           "The directory should be cached so the same directory object should have been returned")
-    assert_equal(@dir1.ref_count, 2,
-                 "There are two references so the refcount should now be 2")
-    @dir1.close
-    assert(FSDirectory.directory_cache[dir_path],
-           "this directory shouldn't have been removed yet")
-    assert_equal(@dir2.ref_count, 1,
-                 "There is one reference so the refcount should now be 1")
-    @dir2.close
-    assert(! FSDirectory.directory_cache[dir_path],
-           "this directory should have been removed from the cache")
-  end
-end

data/test/unit/store/rtc_ram_store.rb DELETED Viewed

@@ -1,15 +0,0 @@
-require File.dirname(__FILE__) + "/../../test_helper"
-require File.dirname(__FILE__) + "/rtm_store"
-require File.dirname(__FILE__) + "/rtm_store_lock"
-class RAMStoreTest < Test::Unit::TestCase
-  include StoreTest
-  include StoreLockTest
-  def setup
-    @dir = Ferret::Store::RAMDirectory.new
-  end
-  def teardown
-    @dir.close()
-  end
-end

data/test/unit/store/rtm_store.rb DELETED Viewed

@@ -1,150 +0,0 @@
-module StoreTest
-  # declare dir so inheritors can access it.
-  @dir = nil
-  def test_modified
-    # difficult to test this one but as file mtime is only stored to the nearest second.
-    # we can assume this test will happen in less than a few seconds. (I hope)
-    time = Time.new.to_i
-    @dir.touch('mtime.test')
-    time_before = @dir.modified('mtime.test').to_i
-    assert(time_before - time <= 3,
-           "test that mtime is approximately equal to the system time when the file was touched")
-  end
-  def test_rw_bytes
-    bytes = [0x34, 0x87, 0xF9, 0xEA, 0x00, 0xFF]
-    rw_test(bytes, "byte", 6)
-  end
-  def test_rw_ints
-    ints = [-2147483648, 2147483647, -1, 0]
-    rw_test(ints, "int", 16)
-  end
-  def test_rw_longs
-    longs = [-9223372036854775808, 9223372036854775807, -1, 0]
-    rw_test(longs, "long", 32)
-  end
-  def test_rw_uints
-    uints = [0xffffffff, 100000, 0]
-    rw_test(uints, "uint", 12)
-  end
-  def test_rw_ulongs
-    ulongs = [0xffffffffffffffff, 100000000000000, 0]
-    rw_test(ulongs, "ulong", 24)
-  end
-  def test_rw_vints
-    vints = [ 9223372036854775807,
-              0x00,
-              0xFFFFFFFFFFFFFFFF]
-    rw_test(vints, "vint", 20)
-  end
-  def test_rw_vlongs
-    vlongs = [ 9223372036854775807,
-               0x00,
-               0xFFFFFFFFFFFFFFFF]
-    rw_test(vlongs, "vlong", 20)
-  end
-  def test_rw_strings
-    text = 'This is a ruby ferret test string ~!@#$%^&*()`123456790-=\)_+|'
-    ostream = @dir.create_output("rw_strings.test")
-    ostream.write_string(text)
-    ostream.write_string(text*100)
-    ostream.close
-    istream = @dir.open_input("rw_strings.test")
-    assert_equal(text, istream.read_string, "Short string test failed")
-    assert_equal(text*100, istream.read_string, "Short string test failed")
-    istream.close
-    assert_equal(6265, @dir.length('rw_strings.test'))
-  end
-  def test_rw_utf8_strings
-    text = '³³ ÄÄÄÄÄÄ 道德經'
-    ostream = @dir.create_output("rw_utf8_strings.test")
-    ostream.write_string(text)
-    ostream.write_string(text*100)
-    ostream.close
-    istream = @dir.open_input("rw_utf8_strings.test")
-    assert_equal(text, x = istream.read_string, "Short string test failed")
-    assert_equal(text*100, istream.read_string, "Short string test failed")
-    istream.close
-  end
-  # this test fills up the output stream so that the buffer will have to be
-  # written a few times. It then uses seek to make sure that it works
-  # correctly
-  def test_buffer_seek
-    ostream = @dir.create_output("rw_seek.test")
-    text = 'This is another long test string !@#$%#$%&%$*%^&*()(_'
-    1000.times {|i| ostream.write_long(i); ostream.write_string(text) }
-    ostream.seek(987)
-    assert_equal(987, ostream.pos)
-    ostream.write_vint(555)
-    ostream.seek(56)
-    assert_equal(56, ostream.pos)
-    ostream.write_vint(1234567890)
-    ostream.seek(4000)
-    assert_equal(4000, ostream.pos)
-    ostream.write_vint(9876543210)
-    ostream.close()
-    istream = @dir.open_input("rw_seek.test")
-    istream.seek(56)
-    assert_equal(56, istream.pos)
-    assert_equal(1234567890, istream.read_vint())
-    istream.seek(4000)
-    assert_equal(4000, istream.pos)
-    assert_equal(9876543210, istream.read_vint())
-    istream.seek(987)
-    assert_equal(987, istream.pos)
-    assert_equal(555, istream.read_vint())
-    istream.close()
-  end
-  def test_clone
-    ostream = @dir.create_output("clone_test")
-    10.times {|i| ostream.write_long(i) }
-    ostream.close
-    istream = @dir.open_input("clone_test")
-    istream.seek(24)
-    alt_istream = istream.clone
-    assert_equal(istream.pos, alt_istream.pos)
-    (3...10).each {|i| assert_equal(i, alt_istream.read_long) }
-    assert_equal(80, alt_istream.pos)
-    assert_equal(24, istream.pos)
-    alt_istream.close
-    (3...10).each {|i| assert_equal(i, istream.read_long) }
-    istream.close
-  end
-  def test_read_bytes
-    str = "0000000000"
-    ostream = @dir.create_output("rw_read_bytes")
-    ostream.write_bytes("how are you doing?", 18)
-    ostream.close
-    istream = @dir.open_input("rw_read_bytes")
-    istream.read_bytes(str, 2, 4)
-    assert_equal("00how 0000", str)
-    istream.read_bytes(str, 1, 8)
-    assert_equal("0are you 0", str)
-    istream.close
-  end
-  private
-  def rw_test(values, type, expected_length)
-    ostream = @dir.create_output("rw_#{type}.test")
-    values.each { |b| ostream.__send__("write_" + type, b) }
-    ostream.close
-    istream = @dir.open_input("rw_#{type}.test")
-    values.each { |b| assert_equal(b, istream.__send__("read_" + type), "#{type} should be equal") }
-    istream.close
-    assert_equal(expected_length, @dir.length("rw_#{type}.test"))
-  end
-end