RubyGems - ferret - Versions diffs - 0.9.6 → 0.10.0 - Mend

ferret 0.9.6 → 0.10.0

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (295) hide show

data/MIT-LICENSE +1 -1
data/README +12 -24
data/Rakefile +38 -54
data/TODO +14 -17
data/ext/analysis.c +982 -823
data/ext/analysis.h +133 -76
data/ext/array.c +96 -58
data/ext/array.h +40 -13
data/ext/bitvector.c +476 -118
data/ext/bitvector.h +264 -22
data/ext/compound_io.c +217 -229
data/ext/defines.h +49 -0
data/ext/document.c +107 -317
data/ext/document.h +31 -65
data/ext/except.c +81 -36
data/ext/except.h +117 -55
data/ext/extconf.rb +2 -9
data/ext/ferret.c +211 -104
data/ext/ferret.h +22 -11
data/ext/filter.c +97 -82
data/ext/fs_store.c +348 -367
data/ext/global.c +226 -188
data/ext/global.h +44 -26
data/ext/hash.c +474 -391
data/ext/hash.h +441 -68
data/ext/hashset.c +124 -96
data/ext/hashset.h +169 -20
data/ext/helper.c +56 -5
data/ext/helper.h +7 -0
data/ext/inc/lang.h +29 -49
data/ext/inc/threading.h +31 -0
data/ext/ind.c +288 -278
data/ext/ind.h +68 -0
data/ext/index.c +5688 -0
data/ext/index.h +663 -616
data/ext/lang.h +29 -49
data/ext/libstemmer.c +3 -3
data/ext/mem_pool.c +84 -0
data/ext/mem_pool.h +35 -0
data/ext/posh.c +1006 -0
data/ext/posh.h +1007 -0
data/ext/priorityqueue.c +117 -194
data/ext/priorityqueue.h +135 -39
data/ext/q_boolean.c +1305 -1108
data/ext/q_const_score.c +106 -93
data/ext/q_filtered_query.c +138 -135
data/ext/q_fuzzy.c +206 -242
data/ext/q_match_all.c +94 -80
data/ext/q_multi_term.c +663 -0
data/ext/q_parser.c +667 -593
data/ext/q_phrase.c +992 -555
data/ext/q_prefix.c +72 -61
data/ext/q_range.c +235 -210
data/ext/q_span.c +1480 -1166
data/ext/q_term.c +273 -246
data/ext/q_wildcard.c +127 -114
data/ext/r_analysis.c +1720 -711
data/ext/r_index.c +3049 -0
data/ext/r_qparser.c +433 -146
data/ext/r_search.c +2934 -1993
data/ext/r_store.c +372 -143
data/ext/r_utils.c +941 -0
data/ext/ram_store.c +330 -326
data/ext/search.c +1291 -668
data/ext/search.h +403 -702
data/ext/similarity.c +91 -113
data/ext/similarity.h +45 -30
data/ext/sort.c +721 -484
data/ext/stopwords.c +361 -273
data/ext/store.c +556 -58
data/ext/store.h +706 -126
data/ext/tags +3578 -2780
data/ext/term_vectors.c +352 -0
data/ext/threading.h +31 -0
data/ext/win32.h +54 -0
data/lib/ferret.rb +5 -17
data/lib/ferret/document.rb +130 -2
data/lib/ferret/index.rb +577 -26
data/lib/ferret/number_tools.rb +157 -0
data/lib/ferret_version.rb +3 -0
data/test/test_helper.rb +5 -13
data/test/unit/analysis/tc_analyzer.rb +513 -1
data/test/unit/analysis/{ctc_tokenstream.rb → tc_token_stream.rb} +23 -0
data/test/unit/index/tc_index.rb +183 -240
data/test/unit/index/tc_index_reader.rb +312 -479
data/test/unit/index/tc_index_writer.rb +397 -13
data/test/unit/index/th_doc.rb +269 -206
data/test/unit/query_parser/tc_query_parser.rb +40 -33
data/test/unit/search/tc_filter.rb +59 -71
data/test/unit/search/tc_fuzzy_query.rb +24 -16
data/test/unit/search/tc_index_searcher.rb +23 -201
data/test/unit/search/tc_multi_searcher.rb +78 -226
data/test/unit/search/tc_search_and_sort.rb +93 -81
data/test/unit/search/tc_sort.rb +23 -23
data/test/unit/search/tc_sort_field.rb +7 -7
data/test/unit/search/tc_spans.rb +51 -47
data/test/unit/search/tm_searcher.rb +339 -0
data/test/unit/store/tc_fs_store.rb +1 -1
data/test/unit/store/tm_store_lock.rb +3 -3
data/test/unit/tc_document.rb +81 -0
data/test/unit/ts_analysis.rb +1 -1
data/test/unit/ts_utils.rb +1 -1
data/test/unit/utils/tc_bit_vector.rb +288 -0
data/test/unit/utils/tc_number_tools.rb +117 -0
data/test/unit/utils/tc_priority_queue.rb +106 -0
metadata +140 -301
data/CHANGELOG +0 -9
data/ext/dummy.exe +0 -0
data/ext/field.c +0 -408
data/ext/frtio.h +0 -13
data/ext/inc/except.h +0 -90
data/ext/index_io.c +0 -382
data/ext/index_rw.c +0 -2658
data/ext/lang.c +0 -41
data/ext/nix_io.c +0 -134
data/ext/q_multi_phrase.c +0 -380
data/ext/r_doc.c +0 -582
data/ext/r_index_io.c +0 -1021
data/ext/r_term.c +0 -219
data/ext/term.c +0 -820
data/ext/termdocs.c +0 -611
data/ext/vector.c +0 -637
data/ext/w32_io.c +0 -150
data/lib/ferret/analysis.rb +0 -11
data/lib/ferret/analysis/analyzers.rb +0 -112
data/lib/ferret/analysis/standard_tokenizer.rb +0 -71
data/lib/ferret/analysis/token.rb +0 -100
data/lib/ferret/analysis/token_filters.rb +0 -86
data/lib/ferret/analysis/token_stream.rb +0 -26
data/lib/ferret/analysis/tokenizers.rb +0 -112
data/lib/ferret/analysis/word_list_loader.rb +0 -27
data/lib/ferret/document/document.rb +0 -152
data/lib/ferret/document/field.rb +0 -312
data/lib/ferret/index/compound_file_io.rb +0 -338
data/lib/ferret/index/document_writer.rb +0 -289
data/lib/ferret/index/field_infos.rb +0 -279
data/lib/ferret/index/fields_io.rb +0 -181
data/lib/ferret/index/index.rb +0 -675
data/lib/ferret/index/index_file_names.rb +0 -33
data/lib/ferret/index/index_reader.rb +0 -503
data/lib/ferret/index/index_writer.rb +0 -534
data/lib/ferret/index/multi_reader.rb +0 -377
data/lib/ferret/index/multiple_term_doc_pos_enum.rb +0 -98
data/lib/ferret/index/segment_infos.rb +0 -130
data/lib/ferret/index/segment_merge_info.rb +0 -49
data/lib/ferret/index/segment_merge_queue.rb +0 -16
data/lib/ferret/index/segment_merger.rb +0 -358
data/lib/ferret/index/segment_reader.rb +0 -412
data/lib/ferret/index/segment_term_enum.rb +0 -169
data/lib/ferret/index/segment_term_vector.rb +0 -58
data/lib/ferret/index/term.rb +0 -53
data/lib/ferret/index/term_buffer.rb +0 -83
data/lib/ferret/index/term_doc_enum.rb +0 -291
data/lib/ferret/index/term_enum.rb +0 -52
data/lib/ferret/index/term_info.rb +0 -37
data/lib/ferret/index/term_infos_io.rb +0 -321
data/lib/ferret/index/term_vector_offset_info.rb +0 -20
data/lib/ferret/index/term_vectors_io.rb +0 -553
data/lib/ferret/query_parser.rb +0 -312
data/lib/ferret/query_parser/query_parser.tab.rb +0 -928
data/lib/ferret/search.rb +0 -50
data/lib/ferret/search/boolean_clause.rb +0 -100
data/lib/ferret/search/boolean_query.rb +0 -299
data/lib/ferret/search/boolean_scorer.rb +0 -294
data/lib/ferret/search/caching_wrapper_filter.rb +0 -40
data/lib/ferret/search/conjunction_scorer.rb +0 -99
data/lib/ferret/search/disjunction_sum_scorer.rb +0 -205
data/lib/ferret/search/exact_phrase_scorer.rb +0 -32
data/lib/ferret/search/explanation.rb +0 -41
data/lib/ferret/search/field_cache.rb +0 -215
data/lib/ferret/search/field_doc.rb +0 -31
data/lib/ferret/search/field_sorted_hit_queue.rb +0 -184
data/lib/ferret/search/filter.rb +0 -11
data/lib/ferret/search/filtered_query.rb +0 -130
data/lib/ferret/search/filtered_term_enum.rb +0 -79
data/lib/ferret/search/fuzzy_query.rb +0 -154
data/lib/ferret/search/fuzzy_term_enum.rb +0 -247
data/lib/ferret/search/hit_collector.rb +0 -34
data/lib/ferret/search/hit_queue.rb +0 -11
data/lib/ferret/search/index_searcher.rb +0 -200
data/lib/ferret/search/match_all_query.rb +0 -104
data/lib/ferret/search/multi_phrase_query.rb +0 -216
data/lib/ferret/search/multi_searcher.rb +0 -261
data/lib/ferret/search/multi_term_query.rb +0 -65
data/lib/ferret/search/non_matching_scorer.rb +0 -22
data/lib/ferret/search/phrase_positions.rb +0 -55
data/lib/ferret/search/phrase_query.rb +0 -214
data/lib/ferret/search/phrase_scorer.rb +0 -152
data/lib/ferret/search/prefix_query.rb +0 -54
data/lib/ferret/search/query.rb +0 -140
data/lib/ferret/search/query_filter.rb +0 -51
data/lib/ferret/search/range_filter.rb +0 -103
data/lib/ferret/search/range_query.rb +0 -139
data/lib/ferret/search/req_excl_scorer.rb +0 -125
data/lib/ferret/search/req_opt_sum_scorer.rb +0 -70
data/lib/ferret/search/score_doc.rb +0 -38
data/lib/ferret/search/score_doc_comparator.rb +0 -114
data/lib/ferret/search/scorer.rb +0 -91
data/lib/ferret/search/similarity.rb +0 -278
data/lib/ferret/search/sloppy_phrase_scorer.rb +0 -47
data/lib/ferret/search/sort.rb +0 -112
data/lib/ferret/search/sort_comparator.rb +0 -60
data/lib/ferret/search/sort_field.rb +0 -91
data/lib/ferret/search/spans.rb +0 -12
data/lib/ferret/search/spans/near_spans_enum.rb +0 -304
data/lib/ferret/search/spans/span_first_query.rb +0 -79
data/lib/ferret/search/spans/span_near_query.rb +0 -108
data/lib/ferret/search/spans/span_not_query.rb +0 -130
data/lib/ferret/search/spans/span_or_query.rb +0 -176
data/lib/ferret/search/spans/span_query.rb +0 -25
data/lib/ferret/search/spans/span_scorer.rb +0 -74
data/lib/ferret/search/spans/span_term_query.rb +0 -105
data/lib/ferret/search/spans/span_weight.rb +0 -84
data/lib/ferret/search/spans/spans_enum.rb +0 -44
data/lib/ferret/search/term_query.rb +0 -128
data/lib/ferret/search/term_scorer.rb +0 -183
data/lib/ferret/search/top_docs.rb +0 -36
data/lib/ferret/search/top_field_docs.rb +0 -17
data/lib/ferret/search/weight.rb +0 -54
data/lib/ferret/search/wildcard_query.rb +0 -26
data/lib/ferret/search/wildcard_term_enum.rb +0 -61
data/lib/ferret/stemmers.rb +0 -1
data/lib/ferret/stemmers/porter_stemmer.rb +0 -218
data/lib/ferret/store.rb +0 -5
data/lib/ferret/store/buffered_index_io.rb +0 -190
data/lib/ferret/store/directory.rb +0 -141
data/lib/ferret/store/fs_store.rb +0 -381
data/lib/ferret/store/index_io.rb +0 -245
data/lib/ferret/store/ram_store.rb +0 -286
data/lib/ferret/utils.rb +0 -8
data/lib/ferret/utils/bit_vector.rb +0 -123
data/lib/ferret/utils/date_tools.rb +0 -138
data/lib/ferret/utils/number_tools.rb +0 -91
data/lib/ferret/utils/parameter.rb +0 -41
data/lib/ferret/utils/priority_queue.rb +0 -120
data/lib/ferret/utils/string_helper.rb +0 -47
data/lib/ferret/utils/thread_local.rb +0 -28
data/lib/ferret/utils/weak_key_hash.rb +0 -60
data/lib/rferret.rb +0 -37
data/rake_utils/code_statistics.rb +0 -106
data/test/benchmark/tb_ram_store.rb +0 -76
data/test/benchmark/tb_rw_vint.rb +0 -26
data/test/functional/thread_safety_index_test.rb +0 -81
data/test/functional/thread_safety_test.rb +0 -137
data/test/longrunning/tc_numbertools.rb +0 -60
data/test/longrunning/tm_store.rb +0 -19
data/test/unit/analysis/ctc_analyzer.rb +0 -532
data/test/unit/analysis/data/wordfile +0 -6
data/test/unit/analysis/rtc_letter_tokenizer.rb +0 -20
data/test/unit/analysis/rtc_lower_case_filter.rb +0 -20
data/test/unit/analysis/rtc_lower_case_tokenizer.rb +0 -27
data/test/unit/analysis/rtc_per_field_analyzer_wrapper.rb +0 -39
data/test/unit/analysis/rtc_porter_stem_filter.rb +0 -16
data/test/unit/analysis/rtc_standard_analyzer.rb +0 -20
data/test/unit/analysis/rtc_standard_tokenizer.rb +0 -20
data/test/unit/analysis/rtc_stop_analyzer.rb +0 -20
data/test/unit/analysis/rtc_stop_filter.rb +0 -14
data/test/unit/analysis/rtc_white_space_analyzer.rb +0 -21
data/test/unit/analysis/rtc_white_space_tokenizer.rb +0 -20
data/test/unit/analysis/rtc_word_list_loader.rb +0 -32
data/test/unit/analysis/tc_token.rb +0 -25
data/test/unit/document/rtc_field.rb +0 -28
data/test/unit/document/tc_document.rb +0 -47
data/test/unit/document/tc_field.rb +0 -98
data/test/unit/index/rtc_compound_file_io.rb +0 -107
data/test/unit/index/rtc_field_infos.rb +0 -127
data/test/unit/index/rtc_fields_io.rb +0 -167
data/test/unit/index/rtc_multiple_term_doc_pos_enum.rb +0 -83
data/test/unit/index/rtc_segment_infos.rb +0 -74
data/test/unit/index/rtc_segment_term_docs.rb +0 -17
data/test/unit/index/rtc_segment_term_enum.rb +0 -60
data/test/unit/index/rtc_segment_term_vector.rb +0 -71
data/test/unit/index/rtc_term_buffer.rb +0 -57
data/test/unit/index/rtc_term_info.rb +0 -19
data/test/unit/index/rtc_term_infos_io.rb +0 -192
data/test/unit/index/rtc_term_vectors_io.rb +0 -108
data/test/unit/index/tc_term.rb +0 -27
data/test/unit/index/tc_term_voi.rb +0 -18
data/test/unit/search/rtc_similarity.rb +0 -37
data/test/unit/search/rtc_sort_field.rb +0 -14
data/test/unit/search/tc_multi_searcher2.rb +0 -126
data/test/unit/store/rtc_fs_store.rb +0 -62
data/test/unit/store/rtc_ram_store.rb +0 -15
data/test/unit/store/rtm_store.rb +0 -150
data/test/unit/store/rtm_store_lock.rb +0 -2
data/test/unit/ts_document.rb +0 -2
data/test/unit/utils/rtc_bit_vector.rb +0 -73
data/test/unit/utils/rtc_date_tools.rb +0 -50
data/test/unit/utils/rtc_number_tools.rb +0 -59
data/test/unit/utils/rtc_parameter.rb +0 -40
data/test/unit/utils/rtc_priority_queue.rb +0 -62
data/test/unit/utils/rtc_string_helper.rb +0 -21
data/test/unit/utils/rtc_thread.rb +0 -61
data/test/unit/utils/rtc_weak_key_hash.rb +0 -25
data/test/utils/number_to_spoken.rb +0 -132

data/lib/ferret/store/index_io.rb DELETED Viewed

@@ -1,245 +0,0 @@
-module Ferret::Store
-  # Ferret's IO Input methods are defined here. The methods read_byte and
-  # read_bytes need to be defined before this class is of any use.
-  class IndexInput
-    # Reads and returns a single byte.
-    def read_byte()
-      raise NotImplementedError
-    end
-    # Reads a specified number of bytes into an array at the specified offset.
-    # buf:: the array to read bytes into
-    # offset:: the offset in the array to start storing bytes
-    # len:: the number of bytes to read
-    def read_bytes(buf, offset, len)
-      raise NotImplementedError
-    end
-    # Reads four bytes and returns an int. read_uint should be used for
-    # unsigned integers for performance reasons.
-    def read_int
-      # This may be slow. I'm not sure if this is the best way to get
-      # integers from files but this is the only way I could find to get
-      # signed integers.
-      #i = read_byte
-      #return (((i&0x80)==0 ? 0 : -1) << 32) |
-             #(i << 24) |
-             #((read_byte) << 16) |
-             #((read_byte) << 8) |
-             #(read_byte)
-      i1 = read_byte
-      i2 = read_byte
-      i3 = read_byte
-      i4 = read_byte
-      res =  (((i1&0x80) == 0 ? 0 : -0x100000000)) +
-             ((i1 << 24) + (i2 << 16) + (i3 << 8) + (i4))
-      return res
-    end
-    # Reads eight bytes and returns a long.
-    def read_long
-      return (read_int << 32) + (read_int & 0xFFFFFFFF)
-    end
-    # Reads four bytes and returns a positive integer
-    def read_uint
-      return ((read_byte) << 24) | ((read_byte) << 16) |
-             ((read_byte) <<  8) |  (read_byte)
-    end
-    # Reads eight bytes and returns a positive integer.
-    def read_ulong
-      return (read_uint << 32) | (read_uint & 0xFFFFFFFF)
-    end
-    # Reads an int stored in variable-length format.  Reads between one and
-    # five bytes.  Smaller values take fewer bytes.  Negative numbers are not
-    # supported.
-    def read_vint
-      b = read_byte
-      i = b & 0x7F # 0x7F = 0b01111111
-      shift = 7
-      while b & 0x80 != 0 # 0x80 = 0b10000000
-        b = read_byte
-        i |= (b & 0x7F) << shift
-        shift += 7
-      end
-      return i
-    end
-    alias :read_vlong :read_vint
-    # Reads a string. A string is stored as a single vint which describes
-    # the length of the string, followed by the actually string itself.
-    def read_string
-      length = read_vint
-      chars = Array.new(length, ' ')
-      read_chars(chars, 0, length)
-      chars.to_s
-    end
-    # Reads UTF-8 encoded characters into an array.
-    # buf:: the array to read characters into
-    # start:: the offset in the array to start storing characters
-    # length:: the number of characters to read
-    #
-    # TODO: Test on some actual UTF-8 documents.
-    def read_chars(buf, start, length)
-      if buf.length < (start + length)
-        # make room for the characters to read
-        buf << " " * (start + length - buf.length)
-      end
-      last = start + length
-      (start...last).each do |i|
-        buf[i] = read_byte.chr
-      end
-#        last = start + length
-#
-#        (start...last).each do |i|
-#          b = read_byte
-#          if (b & 0x80) == 0
-#            buf[i] = (b & 0x7F).chr # don't need to worry about UTF-8 here
-#          else
-#            if (b & 0xE0) != 0xE0
-#              tmp_int = (((b & 0x1F) << 6) | (read_byte & 0x3F))
-#              buf[i] = [tmp_int].pack("C") # pack into a UTF-8 string
-#            else
-#              buf[i] = [
-#                         ((b & 0x0F) << 12) |
-#                         ((read_byte & 0x3F) << 6) |
-#                         (read_byte & 0x3F)
-#                       ].pack("U") # pack into a UTF-8 string
-#            end
-#          end
-#        end
-    end
-    # Closes the stream to futher operations.
-    def close
-      raise NotImplementedError
-    end
-    # Returns the current position in this file, where the next read will
-    # occur.
-    def pos
-      raise NotImplementedError
-    end
-    # Sets current position in this file, where the next read will occur.
-    def seek(pos)
-      raise NotImplementedError
-    end
-    # The number of bytes in the file.
-    def length
-      raise NotImplementedError
-    end
-    # Returns a clone of this stream.
-    #
-    # Clones of a stream access the same data, and are positioned at the same
-    # point as the stream they were cloned from.
-    #
-    # Expert:: Subclasses must ensure that clones may be positioned at
-    # different points in the input from each other and from the stream they
-    # were cloned from.
-    #   def clone
-    #     raise NotImplementedError
-    #   end
-  end
-  # Ferret's IO Output methods are defined here. The methods write_byte and
-  # write_bytes need to be defined before this class is of any use.
-  class IndexOutput
-    # Writes a single byte.
-    def write_byte(b)
-      raise NotImplementedError
-    end
-    # Writes an array of bytes.
-    # buf:: the bytes to write
-    # len:: the number of bytes to write
-    def write_bytes(buf, len)
-      raise NotImplementedError
-    end
-    # Writes an int as four bytes.
-    def write_int(i)
-      write_byte((i >> 24) & 0xFF)
-      write_byte((i >> 16) & 0xFF)
-      write_byte((i >>  8) & 0xFF)
-      write_byte(i & 0xFF)
-    end
-    alias :write_uint :write_int
-    # Writes an int in a variable-length format.  Writes between one and
-    # five bytes.  Smaller values take fewer bytes.  Negative numbers are not
-    # supported.
-    def write_vint(i)
-      while i > 127
-        write_byte((i & 0x7f) | 0x80)
-        i >>= 7
-      end
-      write_byte(i)
-    end
-    alias :write_vlong :write_vint
-    # Writes a long as eight bytes.
-    def write_long(i)
-      write_int(i >> 32)
-      write_int(i)
-    end
-    alias :write_ulong :write_long
-    # Writes a string.
-    def write_string(s)
-      length = s.length()
-      write_vint(length)
-      write_chars(s, 0, length)
-    end
-    # Writes a sequence of UTF-8 encoded characters from a string.
-    # buf:: the source of the characters
-    # start:: the first character in the sequence
-    # length:: the number of characters in the sequence
-    def write_chars(buf, start, length)
-      last = start + length
-      (start ... last).each do |i|
-        write_byte(buf[i])
-      end
-    end
-    # Forces any buffered output to be written.
-    def flush
-      raise NotImplementedError
-    end
-    # Closes this stream to further operations.
-    def close
-      raise NotImplementedError
-    end
-    # Returns the current position in this file, where the next write will
-    # occur.
-    def pos
-      raise NotImplementedError
-    end
-    # Sets current position in this file, where the next write will occur.
-    def seek(pos)
-      raise NotImplementedError
-    end
-    # The number of bytes in the file.
-    def length
-      raise NotImplementedError
-    end
-  end
-end

data/lib/ferret/store/ram_store.rb DELETED Viewed

@@ -1,286 +0,0 @@
-module Ferret::Store
-  require 'monitor'
-  class RAMDirectory < Directory
-    include MonitorMixin
-    def initialize(dir = nil, close_dir = false)
-      super()
-      @files = Hash.new
-      if dir
-        buf = BUFFER.clone
-        dir.each do |file|
-          os = create_output(file)    # make a place on ram disk
-          is = dir.open_input(file)   # read the current file
-          len = is.length             # and copy the file to ram disk
-          if len > buf.size
-            buf << " " * (len - buf.size)
-          end
-          is.read_bytes(buf, 0, len)
-          os.write_bytes(buf, len)
-          is.close()
-          os.close()
-        end
-        dir.close() if close_dir
-      end
-    end
-    # returns an array of strings, one for each file in the directory
-    def each()
-      @files.each do |path, file|
-        next if file =~ /#{LOCK_PREFIX}/
-        yield file
-      end
-    end
-    # Returns true if a file with the given name exists.
-    def exists?(name)
-      @files.has_key?(name)
-    end
-    # Returns the time the named file was last modified.
-    def modified(name)
-      @files[name].mtime
-    end
-    # Set the modified time of an existing file to now.
-    def touch(name)
-      if @files[name].nil?
-        @files[name] = RAMFile.new(name)
-      end
-      @files[name].mtime = Time.now
-    end
-    # Removes an existing file in the directory.
-    def delete(name)
-      @files.delete(name)
-    end
-    # Renames an existing file in the directory.
-    # If a file already exists with the new name, then it is replaced.
-    # This replacement should be atomic.
-    def rename(from, to)
-      @files[to] = @files[from]
-      @files.delete(from)
-    end
-    # Returns the length of a file in the directory.
-    def length(name)
-      @files[name].length
-    end
-    # Creates a new, empty file in the directory with the given name.
-    # Returns a stream writing this file.
-    def create_output(name)
-      file = RAMFile.new(name)
-      @files[name] = file
-      RAMIndexOutput.new(file)
-    end
-    # Returns a stream reading an existing file.
-    def open_input(name)
-      raise IOError, "No file #{name}" if @files[name].nil?
-      RAMIndexInput.new(@files[name])
-    end
-    def print_file(name)
-      input = RAMIndexInput.new(@files[name])
-      buf = " " * input.length
-      input.read_internal(buf, 0, input.length)
-      puts buf
-    end
-    # Construct a Lock.
-    def make_lock(name)
-      RAMLock.new(LOCK_PREFIX + name + ".lck", self)
-    end
-    # Closes the store.
-    def close()
-    end
-    def to_s
-      str = "The files in this directory are: \n"
-      @files.each do |path, file|
-        str << path + " - " + file.size.to_s + "\n"
-      end
-      str
-    end
-    class RAMIndexOutput < BufferedIndexOutput
-      def initialize(f)
-        @file = f
-        @pointer = 0
-        super()
-      end
-      def length
-        return @file.length
-      end
-      def flush_buffer(src, len)
-        buffer_number = (@pointer / BUFFER_SIZE).to_i
-        buffer_offset = @pointer % BUFFER_SIZE
-        bytes_in_buffer = BUFFER_SIZE - buffer_offset
-        bytes_to_copy = [bytes_in_buffer, len].min
-        extend_buffer_if_necessary(buffer_number)
-        buffer = @file.buffers[buffer_number]
-        buffer[buffer_offset, bytes_to_copy] = src[0, bytes_to_copy]
-        if bytes_to_copy < len
-          src_offset = bytes_to_copy
-          bytes_to_copy = len - bytes_to_copy
-          buffer_number += 1
-          extend_buffer_if_necessary(buffer_number)
-          buffer = @file.buffers[buffer_number]
-          buffer[0, bytes_to_copy] = src[src_offset, bytes_to_copy]
-        end
-        @pointer += len
-        @file.length = @pointer unless @pointer < @file.length
-        @file.mtime = Time.now
-      end
-      def reset
-        seek(0)
-        @file.length = 0
-      end
-      def seek(pos)
-        super(pos)
-        @pointer = pos
-      end
-      def close
-        super()
-        @file.mtime = Time.new
-      end
-      def write_to(output)
-        flush()
-        last_buffer_number = (@file.length / BUFFER_SIZE).to_i
-        last_buffer_offset = @file.length % BUFFER_SIZE
-        (0..last_buffer_number).each do |i|
-          len = (i == last_buffer_number ? last_buffer_offset : BUFFER_SIZE)
-          output.write_bytes(@file.buffers[i], len)
-        end
-      end
-      private
-      def extend_buffer_if_necessary(buffer_number)
-        if buffer_number == @file.buffers.size
-          @file.buffers << RAMFile::BUFFER.clone
-        end
-      end
-    end
-    class RAMIndexInput < BufferedIndexInput
-      def initialize(f)
-        @pointer = 0
-        @file = f
-        super()
-      end
-      def length
-        return @file.length
-      end
-      def read_internal(b, offset, length)
-        remainder = length
-        start = @pointer
-        while remainder != 0
-          buffer_number = (start / BUFFER_SIZE).to_i
-          buffer_offset = start % BUFFER_SIZE
-          bytes_in_buffer = BUFFER_SIZE - buffer_offset
-          if bytes_in_buffer >= remainder
-            bytes_to_copy = remainder
-          else
-            bytes_to_copy = bytes_in_buffer
-          end
-          buffer = @file.buffers[buffer_number]
-          bo2 = buffer_offset
-          do2 = offset
-          b[do2, bytes_to_copy] = buffer[bo2, bytes_to_copy]
-          offset += bytes_to_copy
-          start += bytes_to_copy
-          remainder -= bytes_to_copy
-        end
-        @pointer += length
-      end
-      def seek_internal(pos)
-        @pointer = pos
-      end
-      def close
-      end
-    end
-    # This class contains an array of byte arrays which act as buffers to
-    # store the data in.
-    class RAMFile
-      BUFFER = " " * BUFFER_SIZE
-      attr_reader :buffers
-      attr_accessor :mtime
-      #attr_accessor :name
-      attr_accessor :length
-      alias :size :length
-      def initialize(name)
-        @buffers = Array.new
-        @mtime = Time.now
-        @length = 0
-      end
-    end
-    # A Lock is used to lock a data source (in this case a file) so that
-    # not more than one output stream can access a data source at one time.
-    class RAMLock < Lock
-      # pass the name of the file that we are going to lock
-      def initialize(lock_file, dir)
-        @lock_file = lock_file
-        @dir = dir
-      end
-      # obtain the lock on the data source
-      def obtain(lock_timeout = 1)
-        MAX_ATTEMPTS.times do
-          #@dir.synchronize do
-            # create a file if none exists. If one already exists
-            # then someone beat us to the lock so return false
-            if (! locked?) then
-              @dir.create_output(@lock_file)
-              return true
-            end
-          #end
-          # lock was not obtained so sleep for timeout then try again.
-          sleep(lock_timeout)
-        end
-        # lock could not be obtained so raise an exception
-        raise "could not obtain lock: " + @lock_file.to_s
-      end
-      # Release the lock on the data source. Returns true if successful.
-      def release
-        @dir.delete(@lock_file)
-        return true
-      end
-      # returns true if there is a lock on the data source
-      def locked?
-        @dir.exists?(@lock_file)
-      end
-    end
-  end
-end