RubyGems - ferret - Versions diffs - 0.9.6 → 0.10.0 - Mend

ferret 0.9.6 → 0.10.0

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (295) hide show

data/MIT-LICENSE +1 -1
data/README +12 -24
data/Rakefile +38 -54
data/TODO +14 -17
data/ext/analysis.c +982 -823
data/ext/analysis.h +133 -76
data/ext/array.c +96 -58
data/ext/array.h +40 -13
data/ext/bitvector.c +476 -118
data/ext/bitvector.h +264 -22
data/ext/compound_io.c +217 -229
data/ext/defines.h +49 -0
data/ext/document.c +107 -317
data/ext/document.h +31 -65
data/ext/except.c +81 -36
data/ext/except.h +117 -55
data/ext/extconf.rb +2 -9
data/ext/ferret.c +211 -104
data/ext/ferret.h +22 -11
data/ext/filter.c +97 -82
data/ext/fs_store.c +348 -367
data/ext/global.c +226 -188
data/ext/global.h +44 -26
data/ext/hash.c +474 -391
data/ext/hash.h +441 -68
data/ext/hashset.c +124 -96
data/ext/hashset.h +169 -20
data/ext/helper.c +56 -5
data/ext/helper.h +7 -0
data/ext/inc/lang.h +29 -49
data/ext/inc/threading.h +31 -0
data/ext/ind.c +288 -278
data/ext/ind.h +68 -0
data/ext/index.c +5688 -0
data/ext/index.h +663 -616
data/ext/lang.h +29 -49
data/ext/libstemmer.c +3 -3
data/ext/mem_pool.c +84 -0
data/ext/mem_pool.h +35 -0
data/ext/posh.c +1006 -0
data/ext/posh.h +1007 -0
data/ext/priorityqueue.c +117 -194
data/ext/priorityqueue.h +135 -39
data/ext/q_boolean.c +1305 -1108
data/ext/q_const_score.c +106 -93
data/ext/q_filtered_query.c +138 -135
data/ext/q_fuzzy.c +206 -242
data/ext/q_match_all.c +94 -80
data/ext/q_multi_term.c +663 -0
data/ext/q_parser.c +667 -593
data/ext/q_phrase.c +992 -555
data/ext/q_prefix.c +72 -61
data/ext/q_range.c +235 -210
data/ext/q_span.c +1480 -1166
data/ext/q_term.c +273 -246
data/ext/q_wildcard.c +127 -114
data/ext/r_analysis.c +1720 -711
data/ext/r_index.c +3049 -0
data/ext/r_qparser.c +433 -146
data/ext/r_search.c +2934 -1993
data/ext/r_store.c +372 -143
data/ext/r_utils.c +941 -0
data/ext/ram_store.c +330 -326
data/ext/search.c +1291 -668
data/ext/search.h +403 -702
data/ext/similarity.c +91 -113
data/ext/similarity.h +45 -30
data/ext/sort.c +721 -484
data/ext/stopwords.c +361 -273
data/ext/store.c +556 -58
data/ext/store.h +706 -126
data/ext/tags +3578 -2780
data/ext/term_vectors.c +352 -0
data/ext/threading.h +31 -0
data/ext/win32.h +54 -0
data/lib/ferret.rb +5 -17
data/lib/ferret/document.rb +130 -2
data/lib/ferret/index.rb +577 -26
data/lib/ferret/number_tools.rb +157 -0
data/lib/ferret_version.rb +3 -0
data/test/test_helper.rb +5 -13
data/test/unit/analysis/tc_analyzer.rb +513 -1
data/test/unit/analysis/{ctc_tokenstream.rb → tc_token_stream.rb} +23 -0
data/test/unit/index/tc_index.rb +183 -240
data/test/unit/index/tc_index_reader.rb +312 -479
data/test/unit/index/tc_index_writer.rb +397 -13
data/test/unit/index/th_doc.rb +269 -206
data/test/unit/query_parser/tc_query_parser.rb +40 -33
data/test/unit/search/tc_filter.rb +59 -71
data/test/unit/search/tc_fuzzy_query.rb +24 -16
data/test/unit/search/tc_index_searcher.rb +23 -201
data/test/unit/search/tc_multi_searcher.rb +78 -226
data/test/unit/search/tc_search_and_sort.rb +93 -81
data/test/unit/search/tc_sort.rb +23 -23
data/test/unit/search/tc_sort_field.rb +7 -7
data/test/unit/search/tc_spans.rb +51 -47
data/test/unit/search/tm_searcher.rb +339 -0
data/test/unit/store/tc_fs_store.rb +1 -1
data/test/unit/store/tm_store_lock.rb +3 -3
data/test/unit/tc_document.rb +81 -0
data/test/unit/ts_analysis.rb +1 -1
data/test/unit/ts_utils.rb +1 -1
data/test/unit/utils/tc_bit_vector.rb +288 -0
data/test/unit/utils/tc_number_tools.rb +117 -0
data/test/unit/utils/tc_priority_queue.rb +106 -0
metadata +140 -301
data/CHANGELOG +0 -9
data/ext/dummy.exe +0 -0
data/ext/field.c +0 -408
data/ext/frtio.h +0 -13
data/ext/inc/except.h +0 -90
data/ext/index_io.c +0 -382
data/ext/index_rw.c +0 -2658
data/ext/lang.c +0 -41
data/ext/nix_io.c +0 -134
data/ext/q_multi_phrase.c +0 -380
data/ext/r_doc.c +0 -582
data/ext/r_index_io.c +0 -1021
data/ext/r_term.c +0 -219
data/ext/term.c +0 -820
data/ext/termdocs.c +0 -611
data/ext/vector.c +0 -637
data/ext/w32_io.c +0 -150
data/lib/ferret/analysis.rb +0 -11
data/lib/ferret/analysis/analyzers.rb +0 -112
data/lib/ferret/analysis/standard_tokenizer.rb +0 -71
data/lib/ferret/analysis/token.rb +0 -100
data/lib/ferret/analysis/token_filters.rb +0 -86
data/lib/ferret/analysis/token_stream.rb +0 -26
data/lib/ferret/analysis/tokenizers.rb +0 -112
data/lib/ferret/analysis/word_list_loader.rb +0 -27
data/lib/ferret/document/document.rb +0 -152
data/lib/ferret/document/field.rb +0 -312
data/lib/ferret/index/compound_file_io.rb +0 -338
data/lib/ferret/index/document_writer.rb +0 -289
data/lib/ferret/index/field_infos.rb +0 -279
data/lib/ferret/index/fields_io.rb +0 -181
data/lib/ferret/index/index.rb +0 -675
data/lib/ferret/index/index_file_names.rb +0 -33
data/lib/ferret/index/index_reader.rb +0 -503
data/lib/ferret/index/index_writer.rb +0 -534
data/lib/ferret/index/multi_reader.rb +0 -377
data/lib/ferret/index/multiple_term_doc_pos_enum.rb +0 -98
data/lib/ferret/index/segment_infos.rb +0 -130
data/lib/ferret/index/segment_merge_info.rb +0 -49
data/lib/ferret/index/segment_merge_queue.rb +0 -16
data/lib/ferret/index/segment_merger.rb +0 -358
data/lib/ferret/index/segment_reader.rb +0 -412
data/lib/ferret/index/segment_term_enum.rb +0 -169
data/lib/ferret/index/segment_term_vector.rb +0 -58
data/lib/ferret/index/term.rb +0 -53
data/lib/ferret/index/term_buffer.rb +0 -83
data/lib/ferret/index/term_doc_enum.rb +0 -291
data/lib/ferret/index/term_enum.rb +0 -52
data/lib/ferret/index/term_info.rb +0 -37
data/lib/ferret/index/term_infos_io.rb +0 -321
data/lib/ferret/index/term_vector_offset_info.rb +0 -20
data/lib/ferret/index/term_vectors_io.rb +0 -553
data/lib/ferret/query_parser.rb +0 -312
data/lib/ferret/query_parser/query_parser.tab.rb +0 -928
data/lib/ferret/search.rb +0 -50
data/lib/ferret/search/boolean_clause.rb +0 -100
data/lib/ferret/search/boolean_query.rb +0 -299
data/lib/ferret/search/boolean_scorer.rb +0 -294
data/lib/ferret/search/caching_wrapper_filter.rb +0 -40
data/lib/ferret/search/conjunction_scorer.rb +0 -99
data/lib/ferret/search/disjunction_sum_scorer.rb +0 -205
data/lib/ferret/search/exact_phrase_scorer.rb +0 -32
data/lib/ferret/search/explanation.rb +0 -41
data/lib/ferret/search/field_cache.rb +0 -215
data/lib/ferret/search/field_doc.rb +0 -31
data/lib/ferret/search/field_sorted_hit_queue.rb +0 -184
data/lib/ferret/search/filter.rb +0 -11
data/lib/ferret/search/filtered_query.rb +0 -130
data/lib/ferret/search/filtered_term_enum.rb +0 -79
data/lib/ferret/search/fuzzy_query.rb +0 -154
data/lib/ferret/search/fuzzy_term_enum.rb +0 -247
data/lib/ferret/search/hit_collector.rb +0 -34
data/lib/ferret/search/hit_queue.rb +0 -11
data/lib/ferret/search/index_searcher.rb +0 -200
data/lib/ferret/search/match_all_query.rb +0 -104
data/lib/ferret/search/multi_phrase_query.rb +0 -216
data/lib/ferret/search/multi_searcher.rb +0 -261
data/lib/ferret/search/multi_term_query.rb +0 -65
data/lib/ferret/search/non_matching_scorer.rb +0 -22
data/lib/ferret/search/phrase_positions.rb +0 -55
data/lib/ferret/search/phrase_query.rb +0 -214
data/lib/ferret/search/phrase_scorer.rb +0 -152
data/lib/ferret/search/prefix_query.rb +0 -54
data/lib/ferret/search/query.rb +0 -140
data/lib/ferret/search/query_filter.rb +0 -51
data/lib/ferret/search/range_filter.rb +0 -103
data/lib/ferret/search/range_query.rb +0 -139
data/lib/ferret/search/req_excl_scorer.rb +0 -125
data/lib/ferret/search/req_opt_sum_scorer.rb +0 -70
data/lib/ferret/search/score_doc.rb +0 -38
data/lib/ferret/search/score_doc_comparator.rb +0 -114
data/lib/ferret/search/scorer.rb +0 -91
data/lib/ferret/search/similarity.rb +0 -278
data/lib/ferret/search/sloppy_phrase_scorer.rb +0 -47
data/lib/ferret/search/sort.rb +0 -112
data/lib/ferret/search/sort_comparator.rb +0 -60
data/lib/ferret/search/sort_field.rb +0 -91
data/lib/ferret/search/spans.rb +0 -12
data/lib/ferret/search/spans/near_spans_enum.rb +0 -304
data/lib/ferret/search/spans/span_first_query.rb +0 -79
data/lib/ferret/search/spans/span_near_query.rb +0 -108
data/lib/ferret/search/spans/span_not_query.rb +0 -130
data/lib/ferret/search/spans/span_or_query.rb +0 -176
data/lib/ferret/search/spans/span_query.rb +0 -25
data/lib/ferret/search/spans/span_scorer.rb +0 -74
data/lib/ferret/search/spans/span_term_query.rb +0 -105
data/lib/ferret/search/spans/span_weight.rb +0 -84
data/lib/ferret/search/spans/spans_enum.rb +0 -44
data/lib/ferret/search/term_query.rb +0 -128
data/lib/ferret/search/term_scorer.rb +0 -183
data/lib/ferret/search/top_docs.rb +0 -36
data/lib/ferret/search/top_field_docs.rb +0 -17
data/lib/ferret/search/weight.rb +0 -54
data/lib/ferret/search/wildcard_query.rb +0 -26
data/lib/ferret/search/wildcard_term_enum.rb +0 -61
data/lib/ferret/stemmers.rb +0 -1
data/lib/ferret/stemmers/porter_stemmer.rb +0 -218
data/lib/ferret/store.rb +0 -5
data/lib/ferret/store/buffered_index_io.rb +0 -190
data/lib/ferret/store/directory.rb +0 -141
data/lib/ferret/store/fs_store.rb +0 -381
data/lib/ferret/store/index_io.rb +0 -245
data/lib/ferret/store/ram_store.rb +0 -286
data/lib/ferret/utils.rb +0 -8
data/lib/ferret/utils/bit_vector.rb +0 -123
data/lib/ferret/utils/date_tools.rb +0 -138
data/lib/ferret/utils/number_tools.rb +0 -91
data/lib/ferret/utils/parameter.rb +0 -41
data/lib/ferret/utils/priority_queue.rb +0 -120
data/lib/ferret/utils/string_helper.rb +0 -47
data/lib/ferret/utils/thread_local.rb +0 -28
data/lib/ferret/utils/weak_key_hash.rb +0 -60
data/lib/rferret.rb +0 -37
data/rake_utils/code_statistics.rb +0 -106
data/test/benchmark/tb_ram_store.rb +0 -76
data/test/benchmark/tb_rw_vint.rb +0 -26
data/test/functional/thread_safety_index_test.rb +0 -81
data/test/functional/thread_safety_test.rb +0 -137
data/test/longrunning/tc_numbertools.rb +0 -60
data/test/longrunning/tm_store.rb +0 -19
data/test/unit/analysis/ctc_analyzer.rb +0 -532
data/test/unit/analysis/data/wordfile +0 -6
data/test/unit/analysis/rtc_letter_tokenizer.rb +0 -20
data/test/unit/analysis/rtc_lower_case_filter.rb +0 -20
data/test/unit/analysis/rtc_lower_case_tokenizer.rb +0 -27
data/test/unit/analysis/rtc_per_field_analyzer_wrapper.rb +0 -39
data/test/unit/analysis/rtc_porter_stem_filter.rb +0 -16
data/test/unit/analysis/rtc_standard_analyzer.rb +0 -20
data/test/unit/analysis/rtc_standard_tokenizer.rb +0 -20
data/test/unit/analysis/rtc_stop_analyzer.rb +0 -20
data/test/unit/analysis/rtc_stop_filter.rb +0 -14
data/test/unit/analysis/rtc_white_space_analyzer.rb +0 -21
data/test/unit/analysis/rtc_white_space_tokenizer.rb +0 -20
data/test/unit/analysis/rtc_word_list_loader.rb +0 -32
data/test/unit/analysis/tc_token.rb +0 -25
data/test/unit/document/rtc_field.rb +0 -28
data/test/unit/document/tc_document.rb +0 -47
data/test/unit/document/tc_field.rb +0 -98
data/test/unit/index/rtc_compound_file_io.rb +0 -107
data/test/unit/index/rtc_field_infos.rb +0 -127
data/test/unit/index/rtc_fields_io.rb +0 -167
data/test/unit/index/rtc_multiple_term_doc_pos_enum.rb +0 -83
data/test/unit/index/rtc_segment_infos.rb +0 -74
data/test/unit/index/rtc_segment_term_docs.rb +0 -17
data/test/unit/index/rtc_segment_term_enum.rb +0 -60
data/test/unit/index/rtc_segment_term_vector.rb +0 -71
data/test/unit/index/rtc_term_buffer.rb +0 -57
data/test/unit/index/rtc_term_info.rb +0 -19
data/test/unit/index/rtc_term_infos_io.rb +0 -192
data/test/unit/index/rtc_term_vectors_io.rb +0 -108
data/test/unit/index/tc_term.rb +0 -27
data/test/unit/index/tc_term_voi.rb +0 -18
data/test/unit/search/rtc_similarity.rb +0 -37
data/test/unit/search/rtc_sort_field.rb +0 -14
data/test/unit/search/tc_multi_searcher2.rb +0 -126
data/test/unit/store/rtc_fs_store.rb +0 -62
data/test/unit/store/rtc_ram_store.rb +0 -15
data/test/unit/store/rtm_store.rb +0 -150
data/test/unit/store/rtm_store_lock.rb +0 -2
data/test/unit/ts_document.rb +0 -2
data/test/unit/utils/rtc_bit_vector.rb +0 -73
data/test/unit/utils/rtc_date_tools.rb +0 -50
data/test/unit/utils/rtc_number_tools.rb +0 -59
data/test/unit/utils/rtc_parameter.rb +0 -40
data/test/unit/utils/rtc_priority_queue.rb +0 -62
data/test/unit/utils/rtc_string_helper.rb +0 -21
data/test/unit/utils/rtc_thread.rb +0 -61
data/test/unit/utils/rtc_weak_key_hash.rb +0 -25
data/test/utils/number_to_spoken.rb +0 -132

data/ext/q_term.c CHANGED Viewed

@@ -1,310 +1,337 @@
 #include <string.h>
 #include "search.h"
+#define TQ(query) ((TermQuery *)(query))
+#define TSc(scorer) ((TermScorer *)(scorer))
 /***************************************************************************
  *
- * TermWeight
+ * TermScorer
  *
  ***************************************************************************/
-Scorer *tw_scorer(Weight *self, IndexReader *ir)
+#define SCORE_CACHE_SIZE 32
+#define TDE_READ_SIZE 32
+typedef struct TermScorer
+{
+    Scorer          super;
+    int             docs[TDE_READ_SIZE];
+    int             freqs[TDE_READ_SIZE];
+    int             pointer;
+    int             pointer_max;
+    float           score_cache[SCORE_CACHE_SIZE];
+    Weight         *weight;
+    TermDocEnum    *tde;
+    uchar          *norms;
+    float           weight_value;
+} TermScorer;
+static float tsc_score(Scorer *self)
+{
+    TermScorer *ts = TSc(self);
+    int freq = ts->freqs[ts->pointer];
+    float score;
+    /* compute tf(f)*weight */
+    if (freq < SCORE_CACHE_SIZE) {    /* check cache */
+        score = ts->score_cache[freq];  /* cache hit */
+    }
+    else {
+        /* cache miss */
+        score = sim_tf(self->similarity, (float)freq) * ts->weight_value;
+    }
+    /* normalize for field */
+    score *= sim_decode_norm(self->similarity, ts->norms[self->doc]);
+    return score;
+}
+static bool tsc_next(Scorer *self)
+{
+    TermScorer *ts = TSc(self);
+    ts->pointer++;
+    if (ts->pointer >= ts->pointer_max) {
+        /* refill buffer */
+        ts->pointer_max = ts->tde->read(ts->tde, ts->docs, ts->freqs,
+                                        TDE_READ_SIZE);
+        if (ts->pointer_max != 0) {
+            ts->pointer = 0;
+        }
+        else {
+            return false;
+        }
+    }
+    self->doc = ts->docs[ts->pointer];
+    return true;
+}
+static bool tsc_skip_to(Scorer *self, int doc_num)
 {
-  Term *term = ((TermQuery *)self->query->data)->term;
-  TermDocEnum *tde = ir_term_docs_for(ir,term);
-  if (!tde) return NULL;
+    TermScorer *ts = TSc(self);
+    TermDocEnum *tde = ts->tde;
+    /* first scan in cache */
+    while (++(ts->pointer) < ts->pointer_max) {
+        if (ts->docs[ts->pointer] >= doc_num) {
+            self->doc = ts->docs[ts->pointer];
+            return true;
+        }
+    }
-  return tsc_create(self, tde, ir->get_norms_always(ir, term->field));
+    /* not found in cache, seek underlying stream */
+    if (tde->skip_to(tde, doc_num)) {
+        ts->pointer_max = 1;
+        ts->pointer = 0;
+        ts->docs[0] = self->doc = tde->doc_num(tde);
+        ts->freqs[0] = tde->freq(tde);
+        return true;
+    }
+    else {
+        return false;
+    }
 }
-Explanation *tw_explain(Weight *self, IndexReader *ir, int doc_num)
+static Explanation *tsc_explain(Scorer *self, int doc_num)
 {
-  Explanation *qnorm_expl;
-  Explanation *field_expl;
-  Scorer *scorer;
-  Explanation *tf_expl;
-  uchar *field_norms;
-  float field_norm;
-  Explanation *field_norm_expl;
-  char *query_str = self->query->to_s(self->query, "");
-  TermQuery *tq = (TermQuery *)self->query->data;
-  Term *term = tq->term;
-  char *field_name = term->field;
-  Explanation *expl = expl_create(0.0,
-      strfmt("weight(%s in %d), product of:", query_str, doc_num));
-  /* We need two of these as it's included in both the query explanation
-   * and the field explanation */
-  Explanation *idf_expl1 = expl_create(self->idf,
-      strfmt("idf(doc_freq=%d)", ir->doc_freq(ir, tq->term)));
-  Explanation *idf_expl2 = expl_create(self->idf,
-      strfmt("idf(doc_freq=%d)", ir->doc_freq(ir, tq->term)));
-  /* explain query weight */
-  Explanation *query_expl = expl_create(0.0,
-      strfmt("query_weight(%s), product of:", query_str));
-  free(query_str);
-  if (self->query->boost != 1.0) {
-    expl_add_detail(query_expl, expl_create(self->query->boost, estrdup("boost")));
-  }
-  expl_add_detail(query_expl, idf_expl1);
-  qnorm_expl = expl_create(self->qnorm, estrdup("query_norm"));
-  expl_add_detail(query_expl, qnorm_expl);
-  query_expl->value = self->query->boost * idf_expl1->value * qnorm_expl->value;
-  expl_add_detail(expl, query_expl);
-  /* explain field weight */
-  field_expl = expl_create(0.0,
-      strfmt("field_weight(%s:%s in %d), product of:",
-        field_name, term->text, doc_num));
-  scorer = self->scorer(self, ir);
-  tf_expl = scorer->explain(scorer, doc_num);
-  scorer->destroy(scorer);
-  expl_add_detail(field_expl, tf_expl);
-  expl_add_detail(field_expl, idf_expl2);
-  field_norms = ir->get_norms(ir, field_name);
-  field_norm = (field_norms
-    ? sim_decode_norm(self->similarity, field_norms[doc_num])
-    : (float)0.0);
-  field_norm_expl = expl_create(field_norm,
-      strfmt("field_norm(field=%s, doc=%d)", field_name, doc_num));
-  expl_add_detail(field_expl, field_norm_expl);
-  field_expl->value = tf_expl->value * idf_expl2->value * field_norm_expl->value;
-  /* combine them */
-  if (query_expl->value == 1.0) {
-    expl_destoy(expl);
-    return field_expl;
-  } else {
-    expl->value = (query_expl->value * field_expl->value);
-    expl_add_detail(expl, field_expl);
-    return expl;
-  }
+    TermScorer *ts = TSc(self);
+    Query *query = ts->weight->get_query(ts->weight);
+    int tf = 0;
+    tsc_skip_to(self, doc_num);
+    if (self->doc == doc_num) {
+        tf = ts->freqs[ts->pointer];
+    }
+    return expl_new(sim_tf(self->similarity, (float)tf),
+                    "tf(term_freq(%s:%s)=%d)",
+                    TQ(query)->field, TQ(query)->term, tf);
 }
-char *tw_to_s(Weight *self)
+static void tsc_destroy(Scorer *self)
 {
-  return strfmt("TermWeight(%f)", self->value);
+    TSc(self)->tde->close(TSc(self)->tde);
+    scorer_destroy_i(self);
 }
-Weight *tw_create(Query *query, Searcher *searcher)
+static Scorer *tsc_new(Weight *weight, TermDocEnum *tde, uchar *norms)
 {
-  Weight *self = w_create(query);
-  self->scorer    = &tw_scorer;
-  self->explain   = &tw_explain;
-  self->to_s      = &tw_to_s;
-  self->sum_of_squared_weights = &w_sum_of_squared_weights;
-  self->similarity = query->get_similarity(query, searcher);
-  self->idf = sim_idf(self->similarity,
-      searcher->doc_freq(searcher, ((TermQuery *)query->data)->term),
-      searcher->max_doc(searcher)); // compute idf
-  return self;
+    int i;
+    Scorer *self            = scorer_new(TermScorer, weight->similarity);
+    TSc(self)->weight       = weight;
+    TSc(self)->tde          = tde;
+    TSc(self)->norms        = norms;
+    TSc(self)->weight_value = weight->value;
+    for (i = 0; i < SCORE_CACHE_SIZE; i++) {
+        TSc(self)->score_cache[i]
+            = sim_tf(self->similarity, (float)i) * TSc(self)->weight_value;
+    }
+    self->score             = &tsc_score;
+    self->next              = &tsc_next;
+    self->skip_to           = &tsc_skip_to;
+    self->explain           = &tsc_explain;
+    self->destroy           = &tsc_destroy;
+    return self;
 }
 /***************************************************************************
  *
- * TermQuery
+ * TermWeight
  *
  ***************************************************************************/
-void tq_destroy(Query *self)
+static Scorer *tw_scorer(Weight *self, IndexReader *ir)
 {
-  TermQuery *tq = self->data;
-  term_destroy(tq->term);
-  free(tq);
-  q_destroy_i(self);
-}
+    TermQuery *tq = TQ(self->query);
+    TermDocEnum *tde = ir_term_docs_for(ir, tq->field, tq->term);
+    if (!tde) {
+        return NULL;
+    }
-char *tq_to_s(Query *self, char *field)
-{
-  Term *term = ((TermQuery *)self->data)->term;
-  size_t flen = strlen(term->field);
-  size_t tlen = strlen(term->text);
-  char *buffer = ALLOC_N(char, 34 + flen + tlen);
-  char *b = buffer;
-  if (strcmp(field, term->field) != 0) {
-    memcpy(b, term->field, sizeof(char) * flen);
-    b[flen] = ':';
-    b += flen + 1;
-  }
-  memcpy(b, term->text, tlen);
-  b += tlen;
-  *b = 0;
-  if (self->boost != 1.0) {
-    *b = '^';
-    dbl_to_s(b+1, self->boost);
-  }
-  return buffer;
+    return tsc_new(self, tde, ir_get_norms(ir, tq->field));
 }
-static void tq_extract_terms(Query *self, HashSet *terms)
+static Explanation *tw_explain(Weight *self, IndexReader *ir, int doc_num)
 {
-  Term *term = ((TermQuery *)self->data)->term;
-  hs_add(terms, term_clone(term));
-}
+    Explanation *qnorm_expl;
+    Explanation *field_expl;
+    Scorer *scorer;
+    Explanation *tf_expl;
+    uchar *field_norms;
+    float field_norm;
+    Explanation *field_norm_expl;
+    char *query_str = self->query->to_s(self->query, "");
+    TermQuery *tq = TQ(self->query);
+    char *term = tq->term;
+    char *field = tq->field;
+    Explanation *expl = expl_new(0.0, "weight(%s in %d), product of:",
+                                 query_str, doc_num);
+    /* We need two of these as it's included in both the query explanation
+     * and the field explanation */
+    Explanation *idf_expl1 = expl_new(self->idf, "idf(doc_freq=%d)",
+                                      ir_doc_freq(ir, field, term));
+    Explanation *idf_expl2 = expl_new(self->idf, "idf(doc_freq=%d)",
+                                      ir_doc_freq(ir, field, term));
+    /* explain query weight */
+    Explanation *query_expl = expl_new(0.0, "query_weight(%s), product of:",
+                                       query_str);
+    free(query_str);
+    if (self->query->boost != 1.0) {
+        expl_add_detail(query_expl, expl_new(self->query->boost, "boost"));
+    }
-static uint tq_hash(Query *self)
-{
-  return term_hash(((TermQuery *)self->data)->term);
+    expl_add_detail(query_expl, idf_expl1);
+    qnorm_expl = expl_new(self->qnorm, "query_norm");
+    expl_add_detail(query_expl, qnorm_expl);
+    query_expl->value = self->query->boost
+        * idf_expl1->value * qnorm_expl->value;
+    expl_add_detail(expl, query_expl);
+    /* explain field weight */
+    field_expl = expl_new(0.0, "field_weight(%s:%s in %d), product of:",
+                          field, term, doc_num);
+    scorer = self->scorer(self, ir);
+    tf_expl = scorer->explain(scorer, doc_num);
+    scorer->destroy(scorer);
+    expl_add_detail(field_expl, tf_expl);
+    expl_add_detail(field_expl, idf_expl2);
+    field_norms = ir_get_norms(ir, field);
+    field_norm = (field_norms
+                  ? sim_decode_norm(self->similarity, field_norms[doc_num])
+                  : (float)0.0);
+    field_norm_expl = expl_new(field_norm, "field_norm(field=%s, doc=%d)",
+                               field, doc_num);
+    expl_add_detail(field_expl, field_norm_expl);
+    field_expl->value = tf_expl->value * idf_expl2->value
+        * field_norm_expl->value;
+    /* combine them */
+    if (query_expl->value == 1.0) {
+        expl_destroy(expl);
+        return field_expl;
+    } else {
+        expl->value = (query_expl->value * field_expl->value);
+        expl_add_detail(expl, field_expl);
+        return expl;
+    }
 }
-static int tq_eq(Query *self, Query *o)
+static char *tw_to_s(Weight *self)
 {
-  return term_eq(((TermQuery *)self->data)->term,
-              ((TermQuery *)o->data)->term);
+    return strfmt("TermWeight(%f)", self->value);
 }
-Query *tq_create(Term *term)
+static Weight *tw_new(Query *query, Searcher *searcher)
 {
-  Query *self = q_create();
-  TermQuery *tq = ALLOC(TermQuery);
-  tq->term = term;
-  self->type = TERM_QUERY;
-  self->data = tq;
-  self->extract_terms = &tq_extract_terms;
-  self->to_s = &tq_to_s;
-  self->hash = &tq_hash;
-  self->eq = &tq_eq;
-  self->destroy_i = &tq_destroy;
-  self->create_weight_i = &tw_create;
-  return self;
+    Weight *self    = w_new(Weight, query);
+    self->scorer    = &tw_scorer;
+    self->explain   = &tw_explain;
+    self->to_s      = &tw_to_s;
+    self->similarity = query->get_similarity(query, searcher);
+    self->idf = sim_idf(self->similarity,
+                        searcher->doc_freq(searcher,
+                                           TQ(query)->field,
+                                           TQ(query)->term),
+                        searcher->max_doc(searcher)); /* compute idf */
+    return self;
 }
 /***************************************************************************
  *
- * TermScorer
+ * TermQuery
  *
  ***************************************************************************/
-float tsc_score(Scorer *self)
+static void tq_destroy(Query *self)
 {
-  TermScorer *ts = (TermScorer *)self->data;
-  int freq = ts->freqs[ts->pointer];
-  float score;
-  /* compute tf(f)*weight */
-  if (freq < SCORE_CACHE_SIZE) {    /* check cache */
-    score = ts->score_cache[freq];  /* cache hit */
-  } else {
-    score = sim_tf(self->similarity, (float)freq) * ts->weight_value; /* cache miss */
-  }
-  /* normalize for field */
-  score *= sim_decode_norm(self->similarity, ts->norms[self->doc]);
-  return score;
+    free(TQ(self)->term);
+    free(TQ(self)->field);
+    q_destroy_i(self);
 }
-bool tsc_next(Scorer *self)
+static char *tq_to_s(Query *self, const char *field)
 {
-  TermScorer *ts = (TermScorer *)self->data;
-  ts->pointer++;
-  if (ts->pointer >= ts->pointer_max) {
-    /* refill buffer */
-    ts->pointer_max = ts->tde->read(ts->tde, ts->docs, ts->freqs, TDE_READ_SIZE);
-    if (ts->pointer_max != 0) {
-      ts->pointer = 0;
-    } else {
-      ts->tde->close(ts->tde); /* close stream */
-      ts->tde = NULL;
-      return false;
+    size_t flen = strlen(TQ(self)->field);
+    size_t tlen = strlen(TQ(self)->term);
+    char *buffer = ALLOC_N(char, 34 + flen + tlen);
+    char *b = buffer;
+    if (strcmp(field, TQ(self)->field) != 0) {
+        memcpy(b, TQ(self)->field, sizeof(char) * flen);
+        b[flen] = ':';
+        b += flen + 1;
+    }
+    memcpy(b, TQ(self)->term, tlen);
+    b += tlen;
+    *b = 0;
+    if (self->boost != 1.0) {
+        *b = '^';
+        dbl_to_s(b+1, self->boost);
     }
-  }
-  self->doc = ts->docs[ts->pointer];
-  return true;
+    return buffer;
 }
-bool tsc_skip_to(Scorer *self, int doc_num)
+static void tq_extract_terms(Query *self, HashSet *terms)
 {
-  TermScorer *ts = (TermScorer *)self->data;
-  TermDocEnum *tde = ts->tde;
-  /* first scan in cache */
-  while (++(ts->pointer) < ts->pointer_max) {
-    if (ts->docs[ts->pointer] >= doc_num) {
-      self->doc = ts->docs[ts->pointer];
-      return true;
-    }
-  }
-  /* not found in cache, seek underlying stream */
-  if (tde->skip_to(tde, doc_num)) {
-    ts->pointer_max = 1;
-    ts->pointer = 0;
-    ts->docs[0] = self->doc = tde->doc_num(tde);
-    ts->freqs[0] = tde->freq(tde);
-    return true;
-  } else {
-    return false;
-  }
+    hs_add(terms, term_new(TQ(self)->field, TQ(self)->term));
 }
-Explanation *tsc_explain(Scorer *self, int doc_num)
+static ulong tq_hash(Query *self)
 {
-  Explanation *tf_explanation;
-  TermScorer *ts = (TermScorer *)self->data;
-  Query *query = ts->weight->get_query(ts->weight);
-  Term *term = ((TermQuery *)query->data)->term;
-  int tf = 0;
-  TermDocEnum *tde = ts->tde;
-  while (ts->pointer < ts->pointer_max) {
-    if (ts->docs[ts->pointer] == doc_num)
-      tf = ts->freqs[ts->pointer];
-    ts->pointer++;
-  }
-  if (tf == 0) {
-    while (tde->next(tde)) {
-      if (tde->doc_num(tde) == doc_num)
-        tf = tde->freq(tde);
-    }
-  }
-  tde->close(tde);
-  ts->tde = NULL;
-  tf_explanation = expl_create(sim_tf(self->similarity, (float)tf),
-      strfmt("tf(term_freq(%s:%s)=%d)", term->field, term->text, tf));
+    return str_hash(TQ(self)->term) ^ str_hash(TQ(self)->field);
+}
-  return tf_explanation;
+static int tq_eq(Query *self, Query *o)
+{
+    return (strcmp(TQ(self)->term, TQ(o)->term) == 0)
+        && (strcmp(TQ(self)->field, TQ(o)->field) == 0);
 }
-void tsc_destroy(Scorer *self)
+static MatchVector *tq_get_matchv_i(Query *self, MatchVector *mv,
+                                    TermVector *tv)
 {
-  TermScorer *ts = (TermScorer *)self->data;
-  if (ts->tde) ts->tde->close(ts->tde);
-  scorer_destroy_i(self);
+    if (strcmp(tv->field, TQ(self)->field) == 0) {
+        int i;
+        TVTerm *tv_term = tv_get_tv_term(tv, TQ(self)->term);
+        if (tv_term) {
+            for (i = 0; i < tv_term->freq; i++) {
+                int pos = tv_term->positions[i];
+                matchv_add(mv, pos, pos);
+            }
+        }
+    }
+    return mv;
 }
-Scorer *tsc_create(Weight *weight, TermDocEnum *tde, uchar *norms)
+Query *tq_new(const char *field, const char *term)
 {
-  int i;
-  Scorer *self = scorer_create(weight->similarity);
-  TermScorer *ts = ALLOC(TermScorer);
-  ZEROSET(ts, TermScorer, 1);
-  self->data = ts;
-  ts->weight = weight;
-  ts->tde = tde;
-  ts->norms = norms;
-  ts->weight_value = weight->value;
-  for (i = 0; i < SCORE_CACHE_SIZE; i++) {
-    ts->score_cache[i] = sim_tf(self->similarity, (float)i) * ts->weight_value;
-  }
-  self->score = &tsc_score;
-  self->next = &tsc_next;
-  self->skip_to = &tsc_skip_to;
-  self->explain = &tsc_explain;
-  self->destroy = &tsc_destroy;
-  return self;
+    Query *self             = q_new(TermQuery);
+    TQ(self)->field         = estrdup(field);
+    TQ(self)->term          = estrdup(term);
+    self->type              = TERM_QUERY;
+    self->extract_terms     = &tq_extract_terms;
+    self->to_s              = &tq_to_s;
+    self->hash              = &tq_hash;
+    self->eq                = &tq_eq;
+    self->destroy_i         = &tq_destroy;
+    self->create_weight_i   = &tw_new;
+    self->get_matchv_i      = &tq_get_matchv_i;
+    return self;
 }