RubyGems - sdsykes-ferret - Versions diffs - 0.11.6.19 - Mend

sdsykes-ferret 0.11.6.19

Files changed (195) hide show

data/CHANGELOG +24 -0
data/MIT-LICENSE +20 -0
data/README +102 -0
data/Rakefile +338 -0
data/TODO +17 -0
data/TUTORIAL +231 -0
data/bin/ferret-browser +79 -0
data/ext/analysis.c +1555 -0
data/ext/analysis.h +219 -0
data/ext/api.c +69 -0
data/ext/api.h +27 -0
data/ext/array.c +123 -0
data/ext/array.h +53 -0
data/ext/bitvector.c +540 -0
data/ext/bitvector.h +272 -0
data/ext/compound_io.c +383 -0
data/ext/config.h +42 -0
data/ext/document.c +156 -0
data/ext/document.h +53 -0
data/ext/except.c +120 -0
data/ext/except.h +168 -0
data/ext/extconf.rb +14 -0
data/ext/ferret.c +402 -0
data/ext/ferret.h +91 -0
data/ext/filter.c +156 -0
data/ext/fs_store.c +483 -0
data/ext/global.c +418 -0
data/ext/global.h +117 -0
data/ext/hash.c +567 -0
data/ext/hash.h +473 -0
data/ext/hashset.c +170 -0
data/ext/hashset.h +187 -0
data/ext/header.h +58 -0
data/ext/helper.c +62 -0
data/ext/helper.h +13 -0
data/ext/inc/lang.h +48 -0
data/ext/inc/threading.h +31 -0
data/ext/index.c +6425 -0
data/ext/index.h +961 -0
data/ext/lang.h +66 -0
data/ext/libstemmer.c +92 -0
data/ext/libstemmer.h +79 -0
data/ext/mempool.c +87 -0
data/ext/mempool.h +35 -0
data/ext/modules.h +162 -0
data/ext/multimapper.c +310 -0
data/ext/multimapper.h +51 -0
data/ext/posh.c +1006 -0
data/ext/posh.h +1007 -0
data/ext/priorityqueue.c +151 -0
data/ext/priorityqueue.h +143 -0
data/ext/q_boolean.c +1608 -0
data/ext/q_const_score.c +161 -0
data/ext/q_filtered_query.c +209 -0
data/ext/q_fuzzy.c +268 -0
data/ext/q_match_all.c +148 -0
data/ext/q_multi_term.c +677 -0
data/ext/q_parser.c +2825 -0
data/ext/q_phrase.c +1126 -0
data/ext/q_prefix.c +100 -0
data/ext/q_range.c +350 -0
data/ext/q_span.c +2402 -0
data/ext/q_term.c +337 -0
data/ext/q_wildcard.c +171 -0
data/ext/r_analysis.c +2575 -0
data/ext/r_index.c +3472 -0
data/ext/r_qparser.c +585 -0
data/ext/r_search.c +4105 -0
data/ext/r_store.c +513 -0
data/ext/r_utils.c +963 -0
data/ext/ram_store.c +471 -0
data/ext/search.c +1741 -0
data/ext/search.h +885 -0
data/ext/similarity.c +150 -0
data/ext/similarity.h +82 -0
data/ext/sort.c +983 -0
data/ext/stem_ISO_8859_1_danish.c +338 -0
data/ext/stem_ISO_8859_1_danish.h +16 -0
data/ext/stem_ISO_8859_1_dutch.c +635 -0
data/ext/stem_ISO_8859_1_dutch.h +16 -0
data/ext/stem_ISO_8859_1_english.c +1156 -0
data/ext/stem_ISO_8859_1_english.h +16 -0
data/ext/stem_ISO_8859_1_finnish.c +792 -0
data/ext/stem_ISO_8859_1_finnish.h +16 -0
data/ext/stem_ISO_8859_1_french.c +1276 -0
data/ext/stem_ISO_8859_1_french.h +16 -0
data/ext/stem_ISO_8859_1_german.c +512 -0
data/ext/stem_ISO_8859_1_german.h +16 -0
data/ext/stem_ISO_8859_1_italian.c +1091 -0
data/ext/stem_ISO_8859_1_italian.h +16 -0
data/ext/stem_ISO_8859_1_norwegian.c +296 -0
data/ext/stem_ISO_8859_1_norwegian.h +16 -0
data/ext/stem_ISO_8859_1_porter.c +776 -0
data/ext/stem_ISO_8859_1_porter.h +16 -0
data/ext/stem_ISO_8859_1_portuguese.c +1035 -0
data/ext/stem_ISO_8859_1_portuguese.h +16 -0
data/ext/stem_ISO_8859_1_spanish.c +1119 -0
data/ext/stem_ISO_8859_1_spanish.h +16 -0
data/ext/stem_ISO_8859_1_swedish.c +307 -0
data/ext/stem_ISO_8859_1_swedish.h +16 -0
data/ext/stem_KOI8_R_russian.c +701 -0
data/ext/stem_KOI8_R_russian.h +16 -0
data/ext/stem_UTF_8_danish.c +344 -0
data/ext/stem_UTF_8_danish.h +16 -0
data/ext/stem_UTF_8_dutch.c +653 -0
data/ext/stem_UTF_8_dutch.h +16 -0
data/ext/stem_UTF_8_english.c +1176 -0
data/ext/stem_UTF_8_english.h +16 -0
data/ext/stem_UTF_8_finnish.c +808 -0
data/ext/stem_UTF_8_finnish.h +16 -0
data/ext/stem_UTF_8_french.c +1296 -0
data/ext/stem_UTF_8_french.h +16 -0
data/ext/stem_UTF_8_german.c +526 -0
data/ext/stem_UTF_8_german.h +16 -0
data/ext/stem_UTF_8_italian.c +1113 -0
data/ext/stem_UTF_8_italian.h +16 -0
data/ext/stem_UTF_8_norwegian.c +302 -0
data/ext/stem_UTF_8_norwegian.h +16 -0
data/ext/stem_UTF_8_porter.c +794 -0
data/ext/stem_UTF_8_porter.h +16 -0
data/ext/stem_UTF_8_portuguese.c +1055 -0
data/ext/stem_UTF_8_portuguese.h +16 -0
data/ext/stem_UTF_8_russian.c +709 -0
data/ext/stem_UTF_8_russian.h +16 -0
data/ext/stem_UTF_8_spanish.c +1137 -0
data/ext/stem_UTF_8_spanish.h +16 -0
data/ext/stem_UTF_8_swedish.c +313 -0
data/ext/stem_UTF_8_swedish.h +16 -0
data/ext/stopwords.c +401 -0
data/ext/store.c +692 -0
data/ext/store.h +777 -0
data/ext/term_vectors.c +352 -0
data/ext/threading.h +31 -0
data/ext/utilities.c +446 -0
data/ext/win32.h +54 -0
data/lib/ferret.rb +29 -0
data/lib/ferret/browser.rb +246 -0
data/lib/ferret/browser/s/global.js +192 -0
data/lib/ferret/browser/s/style.css +148 -0
data/lib/ferret/browser/views/document/list.rhtml +49 -0
data/lib/ferret/browser/views/document/show.rhtml +27 -0
data/lib/ferret/browser/views/error/index.rhtml +7 -0
data/lib/ferret/browser/views/help/index.rhtml +8 -0
data/lib/ferret/browser/views/home/index.rhtml +29 -0
data/lib/ferret/browser/views/layout.rhtml +22 -0
data/lib/ferret/browser/views/term-vector/index.rhtml +4 -0
data/lib/ferret/browser/views/term/index.rhtml +199 -0
data/lib/ferret/browser/views/term/termdocs.rhtml +1 -0
data/lib/ferret/browser/webrick.rb +14 -0
data/lib/ferret/document.rb +130 -0
data/lib/ferret/field_infos.rb +44 -0
data/lib/ferret/index.rb +786 -0
data/lib/ferret/number_tools.rb +157 -0
data/lib/ferret_version.rb +3 -0
data/setup.rb +1555 -0
data/test/test_all.rb +5 -0
data/test/test_helper.rb +24 -0
data/test/threading/number_to_spoken.rb +132 -0
data/test/threading/thread_safety_index_test.rb +79 -0
data/test/threading/thread_safety_read_write_test.rb +76 -0
data/test/threading/thread_safety_test.rb +133 -0
data/test/unit/analysis/tc_analyzer.rb +548 -0
data/test/unit/analysis/tc_token_stream.rb +646 -0
data/test/unit/index/tc_index.rb +762 -0
data/test/unit/index/tc_index_reader.rb +699 -0
data/test/unit/index/tc_index_writer.rb +437 -0
data/test/unit/index/th_doc.rb +315 -0
data/test/unit/largefile/tc_largefile.rb +46 -0
data/test/unit/query_parser/tc_query_parser.rb +238 -0
data/test/unit/search/tc_filter.rb +135 -0
data/test/unit/search/tc_fuzzy_query.rb +147 -0
data/test/unit/search/tc_index_searcher.rb +61 -0
data/test/unit/search/tc_multi_searcher.rb +128 -0
data/test/unit/search/tc_multiple_search_requests.rb +58 -0
data/test/unit/search/tc_search_and_sort.rb +179 -0
data/test/unit/search/tc_sort.rb +49 -0
data/test/unit/search/tc_sort_field.rb +27 -0
data/test/unit/search/tc_spans.rb +190 -0
data/test/unit/search/tm_searcher.rb +384 -0
data/test/unit/store/tc_fs_store.rb +77 -0
data/test/unit/store/tc_ram_store.rb +35 -0
data/test/unit/store/tm_store.rb +34 -0
data/test/unit/store/tm_store_lock.rb +68 -0
data/test/unit/tc_document.rb +81 -0
data/test/unit/ts_analysis.rb +2 -0
data/test/unit/ts_index.rb +2 -0
data/test/unit/ts_largefile.rb +4 -0
data/test/unit/ts_query_parser.rb +2 -0
data/test/unit/ts_search.rb +2 -0
data/test/unit/ts_store.rb +2 -0
data/test/unit/ts_utils.rb +2 -0
data/test/unit/utils/tc_bit_vector.rb +295 -0
data/test/unit/utils/tc_number_tools.rb +117 -0
data/test/unit/utils/tc_priority_queue.rb +106 -0
metadata +285 -0

data/test/unit/index/tc_index_reader.rb ADDED

@@ -0,0 +1,699 @@
+require File.dirname(__FILE__) + "/../../test_helper"
+module IndexReaderCommon
+  include Ferret::Index
+  include Ferret::Analysis
+  def test_index_reader
+    do_test_get_field_names()
+    do_test_term_enum()
+    do_test_term_doc_enum()
+    do_test_term_vectors()
+    do_test_get_doc()
+  end
+  def do_test_get_field_names()
+    field_names = @ir.field_names
+    assert(field_names.include?(:body))
+    assert(field_names.include?(:changing_field))
+    assert(field_names.include?(:author))
+    assert(field_names.include?(:title))
+    assert(field_names.include?(:text))
+    assert(field_names.include?(:year))
+  end
+  def do_test_term_enum()
+    te = @ir.terms(:author)
+    assert_equal('[{"term":"Leo","frequency":1},{"term":"Tolstoy","frequency":1}]', te.to_json);
+    te.field = :author
+    assert_equal('[["Leo",1],["Tolstoy",1]]', te.to_json(:fast));
+    te.field = :author
+    assert(te.next?)
+    assert_equal("Leo", te.term)
+    assert_equal(1, te.doc_freq)
+    assert(te.next?)
+    assert_equal("Tolstoy", te.term)
+    assert_equal(1, te.doc_freq)
+    assert(! te.next?)
+    te.field = :body
+    assert(te.next?)
+    assert_equal("And", te.term)
+    assert_equal(1, te.doc_freq)
+    assert(te.skip_to("Not"))
+    assert_equal("Not", te.term)
+    assert_equal(1, te.doc_freq)
+    assert(te.next?)
+    assert_equal("Random", te.term)
+    assert_equal(16, te.doc_freq)
+    te.field = :text
+    assert(te.skip_to("which"))
+    assert("which", te.term)
+    assert_equal(1, te.doc_freq)
+    assert(! te.next?)
+    te.field = :title
+    assert(te.next?)
+    assert_equal("War And Peace", te.term)
+    assert_equal(1, te.doc_freq)
+    assert(!te.next?)
+    expected = %w{is 1 more 1 not 1 skip 42 stored 1 text 1 which 1}
+    te = @ir.terms(:text)
+    te.each do |term, doc_freq|
+      assert_equal(expected.shift, term)
+      assert_equal(expected.shift.to_i, doc_freq)
+    end
+    te = @ir.terms_from(:body, "Not")
+    assert_equal("Not", te.term)
+    assert_equal(1, te.doc_freq)
+    assert(te.next?)
+    assert_equal("Random", te.term)
+    assert_equal(16, te.doc_freq)
+  end
+  def do_test_term_doc_enum()
+    assert_equal(IndexTestHelper::INDEX_TEST_DOCS.size, @ir.num_docs())
+    assert_equal(IndexTestHelper::INDEX_TEST_DOCS.size, @ir.max_doc())
+    assert_equal(4, @ir.doc_freq(:body, "Wally"))
+    tde = @ir.term_docs_for(:body, "Wally")
+    [
+      [ 0, 1],
+      [ 5, 1],
+      [18, 3],
+      [20, 6]
+    ].each do |doc, freq|
+      assert(tde.next?)
+      assert_equal(doc, tde.doc())
+      assert_equal(freq, tde.freq())
+    end
+    assert(! tde.next?)
+    tde = @ir.term_docs_for(:body, "Wally")
+    assert_equal('[{"document":0,"frequency":1},{"document":5,"frequency":1},{"document":18,"frequency":3},{"document":20,"frequency":6}]', tde.to_json)
+    tde = @ir.term_docs_for(:body, "Wally")
+    assert_equal('[[0,1],[5,1],[18,3],[20,6]]', tde.to_json(:fast))
+    do_test_term_docpos_enum_skip_to(tde)
+    # test term positions
+    tde = @ir.term_positions_for(:body, "read")
+    [
+      [false,  1, 1, [3]],
+      [false,  2, 2, [1, 4]],
+      [false,  6, 4, [3, 4]],
+      [false,  9, 3, [0, 4]],
+      [ true, 16, 2, [2]],
+      [ true, 21, 6, [3, 4, 5, 8, 9, 10]]
+    ].each do |skip, doc, freq, positions|
+      if skip
+        assert(tde.skip_to(doc))
+      else
+        assert(tde.next?)
+      end
+      assert_equal(doc, tde.doc())
+      assert_equal(freq, tde.freq())
+      positions.each {|pos| assert_equal(pos, tde.next_position())}
+    end
+    assert_nil(tde.next_position())
+    assert(! tde.next?)
+    tde = @ir.term_positions_for(:body, "read")
+    assert_equal('[' +
+       '{"document":1,"frequency":1,"positions":[3]},' +
+       '{"document":2,"frequency":2,"positions":[1,4]},' +
+       '{"document":6,"frequency":4,"positions":[3,4,5,6]},' +
+       '{"document":9,"frequency":3,"positions":[0,4,13]},' +
+       '{"document":10,"frequency":1,"positions":[1]},' +
+       '{"document":16,"frequency":2,"positions":[2,3]},' +
+       '{"document":17,"frequency":1,"positions":[2]},' +
+       '{"document":20,"frequency":1,"positions":[21]},' +
+       '{"document":21,"frequency":6,"positions":[3,4,5,8,9,10]}]',
+       tde.to_json())
+    tde = @ir.term_positions_for(:body, "read")
+    assert_equal('[' +
+       '[1,1,[3]],' +
+       '[2,2,[1,4]],' +
+       '[6,4,[3,4,5,6]],' +
+       '[9,3,[0,4,13]],' +
+       '[10,1,[1]],' +
+       '[16,2,[2,3]],' +
+       '[17,1,[2]],' +
+       '[20,1,[21]],' +
+       '[21,6,[3,4,5,8,9,10]]]',
+       tde.to_json(:fast))
+    tde = @ir.term_positions_for(:body, "read")
+    do_test_term_docpos_enum_skip_to(tde)
+  end
+  def do_test_term_docpos_enum_skip_to(tde)
+    tde.seek(:text, "skip")
+    [
+      [10, 22],
+      [44, 44],
+      [60, 60],
+      [62, 62],
+      [63, 63],
+    ].each do |skip_doc, doc_and_freq|
+      assert(tde.skip_to(skip_doc))
+      assert_equal(doc_and_freq, tde.doc())
+      assert_equal(doc_and_freq, tde.freq())
+    end
+    assert(! tde.skip_to(IndexTestHelper::INDEX_TEST_DOC_COUNT))
+    assert(! tde.skip_to(IndexTestHelper::INDEX_TEST_DOC_COUNT))
+    assert(! tde.skip_to(IndexTestHelper::INDEX_TEST_DOC_COUNT + 100))
+    tde.seek(:text, "skip")
+    assert(! tde.skip_to(IndexTestHelper::INDEX_TEST_DOC_COUNT))
+  end
+  def do_test_term_vectors()
+    expected_tv = TermVector.new(:body,
+      [
+        TVTerm.new("word1", [2, 4, 7]),
+        TVTerm.new("word2", [3]),
+        TVTerm.new("word3", [0, 5, 8, 9]),
+        TVTerm.new("word4", [1, 6])
+      ],
+      [*(0...10)].collect {|i| TVOffsets.new(i*6, (i+1)*6 - 1)})
+    tv = @ir.term_vector(3, :body)
+    assert_equal(expected_tv, tv)
+    tvs = @ir.term_vectors(3)
+    assert_equal(3, tvs.size)
+    assert_equal(expected_tv, tvs[:body])
+    tv = tvs[:author]
+    assert_equal(:author, tv.field)
+    assert_equal([TVTerm.new("Leo", [0]), TVTerm.new("Tolstoy", [1])], tv.terms)
+    assert(tv.offsets.nil?)
+    tv = tvs[:title]
+    assert_equal(:title, tv.field)
+    assert_equal([TVTerm.new("War And Peace", nil)], tv.terms)
+    assert_equal([TVOffsets.new(0, 13)], tv.offsets)
+  end
+  def do_test_get_doc()
+    doc = @ir.get_document(3)
+    [:author, :body, :title, :year].each {|fn| assert(doc.fields.include?(fn))}
+    assert_equal(4, doc.fields.size)
+    assert_equal(0, doc.size)
+    assert_equal([], doc.keys)
+    assert_equal("Leo Tolstoy", doc[:author])
+    assert_equal("word3 word4 word1 word2 word1 word3 word4 word1 word3 word3",
+                 doc[:body])
+    assert_equal("War And Peace", doc[:title])
+    assert_equal("1865", doc[:year])
+    assert_nil(doc[:text])
+    assert_equal(4, doc.size)
+    [:author, :body, :title, :year].each {|fn| assert(doc.keys.include?(fn))}
+    assert_equal([@ir[0].load, @ir[1].load, @ir[2].load], @ir[0, 3].collect {|d| d.load})
+    assert_equal([@ir[61].load, @ir[62].load, @ir[63].load], @ir[61, 100].collect {|d| d.load})
+    assert_equal([@ir[0].load, @ir[1].load, @ir[2].load], @ir[0..2].collect {|d| d.load})
+    assert_equal([@ir[61].load, @ir[62].load, @ir[63].load], @ir[61..100].collect {|d| d.load})
+    assert_equal(@ir[-60], @ir[4])
+  end
+  def test_ir_norms()
+    @ir.set_norm(3, :title, 1)
+    @ir.set_norm(3, :body, 12)
+    @ir.set_norm(3, :author, 145)
+    @ir.set_norm(3, :year, 31)
+    @ir.set_norm(3, :text, 202)
+    @ir.set_norm(25, :text, 20)
+    @ir.set_norm(50, :text, 200)
+    @ir.set_norm(63, :text, 155)
+    norms = @ir.norms(:text)
+    assert_equal(202, norms[ 3])
+    assert_equal( 20, norms[25])
+    assert_equal(200, norms[50])
+    assert_equal(155, norms[63])
+    norms = @ir.norms(:title)
+    assert_equal(1, norms[3])
+    norms = @ir.norms(:body)
+    assert_equal(12, norms[3])
+    norms = @ir.norms(:author)
+    assert_equal(145, norms[3])
+    norms = @ir.norms(:year)
+    # TODO: this returns two possible results depending on whether it is
+    # a multi reader or a segment reader. If it is a multi reader it will
+    # always return an empty set of norms, otherwise it will return nil.
+    # I'm not sure what to do here just yet or if this is even an issue.
+    #assert(norms.nil?)
+    norms = " " * 164
+    @ir.get_norms_into(:text, norms, 100)
+    assert_equal(202, norms[103])
+    assert_equal( 20, norms[125])
+    assert_equal(200, norms[150])
+    assert_equal(155, norms[163])
+    @ir.commit()
+    iw_optimize()
+    ir2 = ir_new()
+    norms = " " * 164
+    ir2.get_norms_into(:text, norms, 100)
+    assert_equal(202, norms[103])
+    assert_equal( 20, norms[125])
+    assert_equal(200, norms[150])
+    assert_equal(155, norms[163])
+    ir2.close()
+  end
+  def test_ir_delete()
+    doc_count = IndexTestHelper::INDEX_TEST_DOCS.size
+    @ir.delete(1000) # non existant doc_num
+    assert(! @ir.has_deletions?())
+    assert_equal(doc_count, @ir.max_doc())
+    assert_equal(doc_count, @ir.num_docs())
+    assert(! @ir.deleted?(10))
+    [
+      [10,            doc_count - 1],
+      [10,            doc_count - 1],
+      [doc_count - 1, doc_count - 2],
+      [doc_count - 2, doc_count - 3],
+    ].each do |del_num, num_docs|
+      @ir.delete(del_num)
+      assert(@ir.has_deletions?())
+      assert_equal(doc_count, @ir.max_doc())
+      assert_equal(num_docs, @ir.num_docs())
+      assert(@ir.deleted?(del_num))
+    end
+    @ir.undelete_all()
+    assert(! @ir.has_deletions?())
+    assert_equal(doc_count, @ir.max_doc())
+    assert_equal(doc_count, @ir.num_docs())
+    assert(! @ir.deleted?(10))
+    assert(! @ir.deleted?(doc_count - 2))
+    assert(! @ir.deleted?(doc_count - 1))
+    del_list = [10, 20, 30, 40, 50, doc_count - 1]
+    del_list.each {|doc_num| @ir.delete(doc_num)}
+    assert(@ir.has_deletions?())
+    assert_equal(doc_count, @ir.max_doc())
+    assert_equal(doc_count - del_list.size, @ir.num_docs())
+    del_list.each {|doc_num| assert(@ir.deleted?(doc_num))}
+    ir2 = ir_new()
+    assert(! ir2.has_deletions?())
+    assert_equal(doc_count, ir2.max_doc())
+    assert_equal(doc_count, ir2.num_docs())
+    @ir.commit()
+    assert(! ir2.has_deletions?())
+    assert_equal(doc_count, ir2.max_doc())
+    assert_equal(doc_count, ir2.num_docs())
+    ir2.close
+    ir2 = ir_new()
+    assert(ir2.has_deletions?())
+    assert_equal(doc_count, ir2.max_doc())
+    assert_equal(doc_count - 6, ir2.num_docs())
+    del_list.each {|doc_num| assert(ir2.deleted?(doc_num))}
+    ir2.undelete_all()
+    assert(! ir2.has_deletions?())
+    assert_equal(doc_count, ir2.max_doc())
+    assert_equal(doc_count, ir2.num_docs())
+    del_list.each {|doc_num| assert(! ir2.deleted?(doc_num))}
+    del_list.each {|doc_num| assert(@ir.deleted?(doc_num))}
+    ir2.commit()
+    del_list.each {|doc_num| assert(@ir.deleted?(doc_num))}
+    del_list.each {|doc_num| ir2.delete(doc_num)}
+    ir2.commit()
+    iw_optimize()
+    ir3 = ir_new()
+    assert(!ir3.has_deletions?())
+    assert_equal(doc_count - 6, ir3.max_doc())
+    assert_equal(doc_count - 6, ir3.num_docs())
+    ir2.close()
+    ir3.close()
+  end
+  def test_latest
+    assert(@ir.latest?)
+    ir2 = ir_new()
+    assert(ir2.latest?)
+    ir2.delete(0)
+    ir2.commit()
+    assert(ir2.latest?)
+    assert(!@ir.latest?)
+    ir2.close()
+  end
+end
+class MultiReaderTest < Test::Unit::TestCase
+  include IndexReaderCommon
+  def ir_new
+    IndexReader.new(@dir)
+  end
+  def iw_optimize
+    iw = IndexWriter.new(:dir => @dir, :analyzer => WhiteSpaceAnalyzer.new())
+    iw.optimize()
+    iw.close()
+  end
+  def setup
+    @dir = Ferret::Store::RAMDirectory.new()
+    iw = IndexWriter.new(:dir => @dir,
+                         :analyzer => WhiteSpaceAnalyzer.new(),
+                         :create => true,
+                         :field_infos => IndexTestHelper::INDEX_TEST_FIS,
+                         :max_buffered_docs => 15)
+    IndexTestHelper::INDEX_TEST_DOCS.each {|doc| iw << doc}
+    # we mustn't optimize here so that MultiReader is used.
+    #iw.optimize() unless self.class == MultiReaderTest
+    iw.close()
+    @ir = ir_new()
+  end
+  def teardown()
+    @ir.close()
+    @dir.close()
+  end
+end
+class SegmentReaderTest < MultiReaderTest
+end
+class MultiExternalReaderTest < Test::Unit::TestCase
+  include IndexReaderCommon
+  def ir_new
+    readers = @dirs.collect {|dir| IndexReader.new(dir) }
+    IndexReader.new(readers)
+  end
+  def iw_optimize
+    @dirs.each do |dir|
+      iw = IndexWriter.new(:dir => dir, :analyzer => WhiteSpaceAnalyzer.new())
+      iw.optimize()
+      iw.close()
+    end
+  end
+  def setup()
+    @dirs = []
+    [
+      [0, 10],
+      [10, 30],
+      [30, IndexTestHelper::INDEX_TEST_DOCS.size]
+    ].each do |start, finish|
+      dir = Ferret::Store::RAMDirectory.new()
+      @dirs << dir
+      iw = IndexWriter.new(:dir => dir,
+                           :analyzer => WhiteSpaceAnalyzer.new(),
+                           :create => true,
+                           :field_infos => IndexTestHelper::INDEX_TEST_FIS)
+      (start...finish).each do |doc_id|
+        iw << IndexTestHelper::INDEX_TEST_DOCS[doc_id]
+      end
+      iw.close()
+    end
+    @ir = ir_new
+  end
+  def teardown()
+    @ir.close()
+    @dirs.each {|dir| dir.close}
+  end
+end
+class MultiExternalReaderDirTest < Test::Unit::TestCase
+  include IndexReaderCommon
+  def ir_new
+    IndexReader.new(@dirs)
+  end
+  def iw_optimize
+    @dirs.each do |dir|
+      iw = IndexWriter.new(:dir => dir, :analyzer => WhiteSpaceAnalyzer.new())
+      iw.optimize()
+      iw.close()
+    end
+  end
+  def setup()
+    @dirs = []
+    [
+      [0, 10],
+      [10, 30],
+      [30, IndexTestHelper::INDEX_TEST_DOCS.size]
+    ].each do |start, finish|
+      dir = Ferret::Store::RAMDirectory.new()
+      @dirs << dir
+      iw = IndexWriter.new(:dir => dir,
+                           :analyzer => WhiteSpaceAnalyzer.new(),
+                           :create => true,
+                           :field_infos => IndexTestHelper::INDEX_TEST_FIS)
+      (start...finish).each do |doc_id|
+        iw << IndexTestHelper::INDEX_TEST_DOCS[doc_id]
+      end
+      iw.close()
+    end
+    @ir = ir_new
+  end
+  def teardown()
+    @ir.close()
+    @dirs.each {|dir| dir.close}
+  end
+end
+class MultiExternalReaderPathTest < Test::Unit::TestCase
+  include IndexReaderCommon
+  def ir_new
+    IndexReader.new(@paths)
+  end
+  def iw_optimize
+    @paths.each do |path|
+      iw = IndexWriter.new(:path => path, :analyzer => WhiteSpaceAnalyzer.new())
+      iw.optimize()
+      iw.close()
+    end
+  end
+  def setup()
+    base_dir = File.expand_path(File.join(File.dirname(__FILE__),
+                       '../../temp/multidir'))
+    FileUtils.mkdir_p(base_dir)
+    @paths = [
+      File.join(base_dir, "i1"),
+      File.join(base_dir, "i2"),
+      File.join(base_dir, "i3")
+    ]
+    [
+      [0, 10],
+      [10, 30],
+      [30, IndexTestHelper::INDEX_TEST_DOCS.size]
+    ].each_with_index do |(start, finish), i|
+      path = @paths[i]
+      iw = IndexWriter.new(:path => path,
+                           :analyzer => WhiteSpaceAnalyzer.new(),
+                           :create => true,
+                           :field_infos => IndexTestHelper::INDEX_TEST_FIS)
+      (start...finish).each do |doc_id|
+        iw << IndexTestHelper::INDEX_TEST_DOCS[doc_id]
+      end
+      iw.close()
+    end
+    @ir = ir_new
+  end
+  def teardown()
+    @ir.close()
+  end
+end
+class IndexReaderTest < Test::Unit::TestCase
+  include Ferret::Index
+  include Ferret::Analysis
+  def setup()
+    @dir = Ferret::Store::RAMDirectory.new()
+  end
+  def teardown()
+    @dir.close()
+  end
+  def test_ir_multivalue_fields()
+    @fs_dpath = File.expand_path(File.join(File.dirname(__FILE__),
+                                           '../../temp/fsdir'))
+    @fs_dir = Ferret::Store::FSDirectory.new(@fs_dpath, true)
+    iw = IndexWriter.new(:dir => @fs_dir,
+                         :analyzer => WhiteSpaceAnalyzer.new(),
+                         :create => true)
+    doc = {
+      :tag => ["Ruby", "C", "Lucene", "Ferret"],
+      :body => "this is the body Document Field",
+      :title => "this is the title DocField",
+      :author => "this is the author field"
+    }
+    iw << doc
+    iw.close()
+    @dir = Ferret::Store::RAMDirectory.new(@fs_dir)
+    ir = IndexReader.new(@dir)
+    assert_equal(doc, ir.get_document(0).load)
+    ir.close
+  end
+  def do_test_term_vectors(ir)
+    expected_tv = TermVector.new(:body,
+      [
+        TVTerm.new("word1", [2, 4, 7]),
+        TVTerm.new("word2", [3]),
+        TVTerm.new("word3", [0, 5, 8, 9]),
+        TVTerm.new("word4", [1, 6])
+      ],
+      [*(0...10)].collect {|i| TVOffsets.new(i*6, (i+1)*6 - 1)})
+    tv = ir.term_vector(3, :body)
+    assert_equal(expected_tv, tv)
+    tvs = ir.term_vectors(3)
+    assert_equal(3, tvs.size)
+    assert_equal(expected_tv, tvs[:body])
+    tv = tvs[:author]
+    assert_equal(:author, tv.field)
+    assert_equal([TVTerm.new("Leo", [0]), TVTerm.new("Tolstoy", [1])], tv.terms)
+    assert(tv.offsets.nil?)
+    tv = tvs[:title]
+    assert_equal(:title, tv.field)
+    assert_equal([TVTerm.new("War And Peace", nil)], tv.terms)
+    assert_equal([TVOffsets.new(0, 13)], tv.offsets)
+  end
+  def do_test_ir_read_while_optimizing(dir)
+    iw = IndexWriter.new(:dir => dir,
+                         :analyzer => WhiteSpaceAnalyzer.new(),
+                         :create => true,
+                         :field_infos => IndexTestHelper::INDEX_TEST_FIS)
+    IndexTestHelper::INDEX_TEST_DOCS.each {|doc| iw << doc}
+    iw.close()
+    ir = IndexReader.new(dir)
+    do_test_term_vectors(ir)
+    iw = IndexWriter.new(:dir => dir, :analyzer => WhiteSpaceAnalyzer.new())
+    iw.optimize()
+    iw.close()
+    do_test_term_vectors(ir)
+    ir.close()
+  end
+  def test_ir_read_while_optimizing()
+    do_test_ir_read_while_optimizing(@dir)
+  end
+  def test_ir_read_while_optimizing_on_disk()
+    dpath = File.expand_path(File.join(File.dirname(__FILE__),
+                       '../../temp/fsdir'))
+    fs_dir = Ferret::Store::FSDirectory.new(dpath, true)
+    do_test_ir_read_while_optimizing(fs_dir)
+    fs_dir.close()
+  end
+  def test_latest()
+    dpath = File.expand_path(File.join(File.dirname(__FILE__),
+                       '../../temp/fsdir'))
+    fs_dir = Ferret::Store::FSDirectory.new(dpath, true)
+    iw = IndexWriter.new(:dir => fs_dir,
+                         :analyzer => WhiteSpaceAnalyzer.new(),
+                         :create => true)
+    iw << {:field => "content"}
+    iw.close()
+    ir = IndexReader.new(fs_dir)
+    assert(ir.latest?)
+    iw = IndexWriter.new(:dir => fs_dir, :analyzer => WhiteSpaceAnalyzer.new())
+    iw << {:field => "content2"}
+    iw.close()
+    assert(!ir.latest?)
+    ir.close()
+    ir = IndexReader.new(fs_dir)
+    assert(ir.latest?)
+    ir.close()
+  end
+end