RubyGems - cppjieba_rb - Versions diffs - 0.3.3 → 0.4.0 - Mend

cppjieba_rb 0.3.3 → 0.4.0

Files changed (130) hide show

checksums.yaml +5 -5
data/.travis.yml +3 -0
data/README.md +1 -1
data/Rakefile +2 -2
data/cppjieba_rb.gemspec +4 -4
data/lib/cppjieba_rb/version.rb +1 -1
metadata +17 -135
data/ext/cppjieba/.gitignore +0 -17
data/ext/cppjieba/.travis.yml +0 -21
data/ext/cppjieba/CMakeLists.txt +0 -28
data/ext/cppjieba/ChangeLog.md +0 -236
data/ext/cppjieba/README.md +0 -292
data/ext/cppjieba/README_EN.md +0 -113
data/ext/cppjieba/appveyor.yml +0 -32
data/ext/cppjieba/deps/CMakeLists.txt +0 -1
data/ext/cppjieba/deps/gtest/CMakeLists.txt +0 -5
data/ext/cppjieba/deps/gtest/include/gtest/gtest-death-test.h +0 -283
data/ext/cppjieba/deps/gtest/include/gtest/gtest-message.h +0 -230
data/ext/cppjieba/deps/gtest/include/gtest/gtest-param-test.h +0 -1421
data/ext/cppjieba/deps/gtest/include/gtest/gtest-param-test.h.pump +0 -487
data/ext/cppjieba/deps/gtest/include/gtest/gtest-printers.h +0 -796
data/ext/cppjieba/deps/gtest/include/gtest/gtest-spi.h +0 -232
data/ext/cppjieba/deps/gtest/include/gtest/gtest-test-part.h +0 -176
data/ext/cppjieba/deps/gtest/include/gtest/gtest-typed-test.h +0 -259
data/ext/cppjieba/deps/gtest/include/gtest/gtest.h +0 -2155
data/ext/cppjieba/deps/gtest/include/gtest/gtest_pred_impl.h +0 -358
data/ext/cppjieba/deps/gtest/include/gtest/gtest_prod.h +0 -58
data/ext/cppjieba/deps/gtest/include/gtest/internal/gtest-death-test-internal.h +0 -308
data/ext/cppjieba/deps/gtest/include/gtest/internal/gtest-filepath.h +0 -210
data/ext/cppjieba/deps/gtest/include/gtest/internal/gtest-internal.h +0 -1226
data/ext/cppjieba/deps/gtest/include/gtest/internal/gtest-linked_ptr.h +0 -233
data/ext/cppjieba/deps/gtest/include/gtest/internal/gtest-param-util-generated.h +0 -4822
data/ext/cppjieba/deps/gtest/include/gtest/internal/gtest-param-util-generated.h.pump +0 -301
data/ext/cppjieba/deps/gtest/include/gtest/internal/gtest-param-util.h +0 -619
data/ext/cppjieba/deps/gtest/include/gtest/internal/gtest-port.h +0 -1788
data/ext/cppjieba/deps/gtest/include/gtest/internal/gtest-string.h +0 -350
data/ext/cppjieba/deps/gtest/include/gtest/internal/gtest-tuple.h +0 -968
data/ext/cppjieba/deps/gtest/include/gtest/internal/gtest-tuple.h.pump +0 -336
data/ext/cppjieba/deps/gtest/include/gtest/internal/gtest-type-util.h +0 -3330
data/ext/cppjieba/deps/gtest/include/gtest/internal/gtest-type-util.h.pump +0 -296
data/ext/cppjieba/deps/gtest/src/.deps/.dirstamp +0 -0
data/ext/cppjieba/deps/gtest/src/.deps/gtest-all.Plo +0 -681
data/ext/cppjieba/deps/gtest/src/.deps/gtest_main.Plo +0 -509
data/ext/cppjieba/deps/gtest/src/.dirstamp +0 -0
data/ext/cppjieba/deps/gtest/src/gtest-all.cc +0 -48
data/ext/cppjieba/deps/gtest/src/gtest-death-test.cc +0 -1234
data/ext/cppjieba/deps/gtest/src/gtest-filepath.cc +0 -380
data/ext/cppjieba/deps/gtest/src/gtest-internal-inl.h +0 -1038
data/ext/cppjieba/deps/gtest/src/gtest-port.cc +0 -746
data/ext/cppjieba/deps/gtest/src/gtest-printers.cc +0 -356
data/ext/cppjieba/deps/gtest/src/gtest-test-part.cc +0 -110
data/ext/cppjieba/deps/gtest/src/gtest-typed-test.cc +0 -110
data/ext/cppjieba/deps/gtest/src/gtest.cc +0 -4898
data/ext/cppjieba/deps/gtest/src/gtest_main.cc +0 -39
data/ext/cppjieba/deps/limonp/ArgvContext.hpp +0 -70
data/ext/cppjieba/deps/limonp/BlockingQueue.hpp +0 -49
data/ext/cppjieba/deps/limonp/BoundedBlockingQueue.hpp +0 -67
data/ext/cppjieba/deps/limonp/BoundedQueue.hpp +0 -65
data/ext/cppjieba/deps/limonp/Closure.hpp +0 -206
data/ext/cppjieba/deps/limonp/Colors.hpp +0 -31
data/ext/cppjieba/deps/limonp/Condition.hpp +0 -38
data/ext/cppjieba/deps/limonp/Config.hpp +0 -103
data/ext/cppjieba/deps/limonp/FileLock.hpp +0 -74
data/ext/cppjieba/deps/limonp/ForcePublic.hpp +0 -7
data/ext/cppjieba/deps/limonp/LocalVector.hpp +0 -139
data/ext/cppjieba/deps/limonp/Logging.hpp +0 -76
data/ext/cppjieba/deps/limonp/Md5.hpp +0 -411
data/ext/cppjieba/deps/limonp/MutexLock.hpp +0 -51
data/ext/cppjieba/deps/limonp/NonCopyable.hpp +0 -21
data/ext/cppjieba/deps/limonp/StdExtension.hpp +0 -159
data/ext/cppjieba/deps/limonp/StringUtil.hpp +0 -365
data/ext/cppjieba/deps/limonp/Thread.hpp +0 -44
data/ext/cppjieba/deps/limonp/ThreadPool.hpp +0 -86
data/ext/cppjieba/dict/README.md +0 -31
data/ext/cppjieba/dict/hmm_model.utf8 +0 -34
data/ext/cppjieba/dict/idf.utf8 +0 -258826
data/ext/cppjieba/dict/jieba.dict.utf8 +0 -348982
data/ext/cppjieba/dict/pos_dict/char_state_tab.utf8 +0 -6653
data/ext/cppjieba/dict/pos_dict/prob_emit.utf8 +0 -166
data/ext/cppjieba/dict/pos_dict/prob_start.utf8 +0 -259
data/ext/cppjieba/dict/pos_dict/prob_trans.utf8 +0 -5222
data/ext/cppjieba/dict/stop_words.utf8 +0 -1534
data/ext/cppjieba/dict/user.dict.utf8 +0 -4
data/ext/cppjieba/include/cppjieba/DictTrie.hpp +0 -277
data/ext/cppjieba/include/cppjieba/FullSegment.hpp +0 -93
data/ext/cppjieba/include/cppjieba/HMMModel.hpp +0 -129
data/ext/cppjieba/include/cppjieba/HMMSegment.hpp +0 -190
data/ext/cppjieba/include/cppjieba/Jieba.hpp +0 -130
data/ext/cppjieba/include/cppjieba/KeywordExtractor.hpp +0 -153
data/ext/cppjieba/include/cppjieba/MPSegment.hpp +0 -137
data/ext/cppjieba/include/cppjieba/MixSegment.hpp +0 -109
data/ext/cppjieba/include/cppjieba/PosTagger.hpp +0 -77
data/ext/cppjieba/include/cppjieba/PreFilter.hpp +0 -54
data/ext/cppjieba/include/cppjieba/QuerySegment.hpp +0 -90
data/ext/cppjieba/include/cppjieba/SegmentBase.hpp +0 -46
data/ext/cppjieba/include/cppjieba/SegmentTagged.hpp +0 -23
data/ext/cppjieba/include/cppjieba/TextRankExtractor.hpp +0 -190
data/ext/cppjieba/include/cppjieba/Trie.hpp +0 -174
data/ext/cppjieba/include/cppjieba/Unicode.hpp +0 -227
data/ext/cppjieba/test/CMakeLists.txt +0 -5
data/ext/cppjieba/test/demo.cpp +0 -80
data/ext/cppjieba/test/load_test.cpp +0 -54
data/ext/cppjieba/test/testdata/curl.res +0 -1
data/ext/cppjieba/test/testdata/extra_dict/jieba.dict.small.utf8 +0 -109750
data/ext/cppjieba/test/testdata/gbk_dict/hmm_model.gbk +0 -34
data/ext/cppjieba/test/testdata/gbk_dict/jieba.dict.gbk +0 -348982
data/ext/cppjieba/test/testdata/jieba.dict.0.1.utf8 +0 -93
data/ext/cppjieba/test/testdata/jieba.dict.0.utf8 +0 -93
data/ext/cppjieba/test/testdata/jieba.dict.1.utf8 +0 -67
data/ext/cppjieba/test/testdata/jieba.dict.2.utf8 +0 -64
data/ext/cppjieba/test/testdata/load_test.urls +0 -2
data/ext/cppjieba/test/testdata/review.100 +0 -100
data/ext/cppjieba/test/testdata/review.100.res +0 -200
data/ext/cppjieba/test/testdata/server.conf +0 -19
data/ext/cppjieba/test/testdata/testlines.gbk +0 -9
data/ext/cppjieba/test/testdata/testlines.utf8 +0 -8
data/ext/cppjieba/test/testdata/userdict.2.utf8 +0 -1
data/ext/cppjieba/test/testdata/userdict.english +0 -2
data/ext/cppjieba/test/testdata/userdict.utf8 +0 -8
data/ext/cppjieba/test/testdata/weicheng.utf8 +0 -247
data/ext/cppjieba/test/unittest/CMakeLists.txt +0 -24
data/ext/cppjieba/test/unittest/gtest_main.cpp +0 -39
data/ext/cppjieba/test/unittest/jieba_test.cpp +0 -133
data/ext/cppjieba/test/unittest/keyword_extractor_test.cpp +0 -79
data/ext/cppjieba/test/unittest/pos_tagger_test.cpp +0 -41
data/ext/cppjieba/test/unittest/pre_filter_test.cpp +0 -43
data/ext/cppjieba/test/unittest/segments_test.cpp +0 -256
data/ext/cppjieba/test/unittest/textrank_test.cpp +0 -86
data/ext/cppjieba/test/unittest/trie_test.cpp +0 -177
data/ext/cppjieba/test/unittest/unicode_test.cpp +0 -43

data/ext/cppjieba/include/cppjieba/MPSegment.hpp DELETED Viewed

@@ -1,137 +0,0 @@
-#ifndef CPPJIEBA_MPSEGMENT_H
-#define CPPJIEBA_MPSEGMENT_H
-#include <algorithm>
-#include <set>
-#include <cassert>
-#include "limonp/Logging.hpp"
-#include "DictTrie.hpp"
-#include "SegmentTagged.hpp"
-#include "PosTagger.hpp"
-namespace cppjieba {
-class MPSegment: public SegmentTagged {
- public:
-  MPSegment(const string& dictPath, const string& userDictPath = "")
-    : dictTrie_(new DictTrie(dictPath, userDictPath)), isNeedDestroy_(true) {
-  }
-  MPSegment(const DictTrie* dictTrie)
-    : dictTrie_(dictTrie), isNeedDestroy_(false) {
-    assert(dictTrie_);
-  }
-  ~MPSegment() {
-    if (isNeedDestroy_) {
-      delete dictTrie_;
-    }
-  }
-  void Cut(const string& sentence, vector<string>& words) const {
-    Cut(sentence, words, MAX_WORD_LENGTH);
-  }
-  void Cut(const string& sentence,
-        vector<string>& words,
-        size_t max_word_len) const {
-    vector<Word> tmp;
-    Cut(sentence, tmp, max_word_len);
-    GetStringsFromWords(tmp, words);
-  }
-  void Cut(const string& sentence,
-        vector<Word>& words,
-        size_t max_word_len = MAX_WORD_LENGTH) const {
-    PreFilter pre_filter(symbols_, sentence);
-    PreFilter::Range range;
-    vector<WordRange> wrs;
-    wrs.reserve(sentence.size()/2);
-    while (pre_filter.HasNext()) {
-      range = pre_filter.Next();
-      Cut(range.begin, range.end, wrs, max_word_len);
-    }
-    words.clear();
-    words.reserve(wrs.size());
-    GetWordsFromWordRanges(sentence, wrs, words);
-  }
-  void Cut(RuneStrArray::const_iterator begin,
-           RuneStrArray::const_iterator end,
-           vector<WordRange>& words,
-           size_t max_word_len = MAX_WORD_LENGTH) const {
-    vector<Dag> dags;
-    dictTrie_->Find(begin,
-          end,
-          dags,
-          max_word_len);
-    CalcDP(dags);
-    CutByDag(begin, end, dags, words);
-  }
-  const DictTrie* GetDictTrie() const {
-    return dictTrie_;
-  }
-  bool Tag(const string& src, vector<pair<string, string> >& res) const {
-    return tagger_.Tag(src, res, *this);
-  }
-  bool IsUserDictSingleChineseWord(const Rune& value) const {
-    return dictTrie_->IsUserDictSingleChineseWord(value);
-  }
- private:
-  void CalcDP(vector<Dag>& dags) const {
-    size_t nextPos;
-    const DictUnit* p;
-    double val;
-    for (vector<Dag>::reverse_iterator rit = dags.rbegin(); rit != dags.rend(); rit++) {
-      rit->pInfo = NULL;
-      rit->weight = MIN_DOUBLE;
-      assert(!rit->nexts.empty());
-      for (LocalVector<pair<size_t, const DictUnit*> >::const_iterator it = rit->nexts.begin(); it != rit->nexts.end(); it++) {
-        nextPos = it->first;
-        p = it->second;
-        val = 0.0;
-        if (nextPos + 1 < dags.size()) {
-          val += dags[nextPos + 1].weight;
-        }
-        if (p) {
-          val += p->weight;
-        } else {
-          val += dictTrie_->GetMinWeight();
-        }
-        if (val > rit->weight) {
-          rit->pInfo = p;
-          rit->weight = val;
-        }
-      }
-    }
-  }
-  void CutByDag(RuneStrArray::const_iterator begin,
-        RuneStrArray::const_iterator end,
-        const vector<Dag>& dags,
-        vector<WordRange>& words) const {
-    size_t i = 0;
-    while (i < dags.size()) {
-      const DictUnit* p = dags[i].pInfo;
-      if (p) {
-        assert(p->word.size() >= 1);
-        WordRange wr(begin + i, begin + i + p->word.size() - 1);
-        words.push_back(wr);
-        i += p->word.size();
-      } else { //single chinese word
-        WordRange wr(begin + i, begin + i);
-        words.push_back(wr);
-        i++;
-      }
-    }
-  }
-  const DictTrie* dictTrie_;
-  bool isNeedDestroy_;
-  PosTagger tagger_;
-}; // class MPSegment
-} // namespace cppjieba
-#endif

data/ext/cppjieba/include/cppjieba/MixSegment.hpp DELETED Viewed

@@ -1,109 +0,0 @@
-#ifndef CPPJIEBA_MIXSEGMENT_H
-#define CPPJIEBA_MIXSEGMENT_H
-#include <cassert>
-#include "MPSegment.hpp"
-#include "HMMSegment.hpp"
-#include "limonp/StringUtil.hpp"
-#include "PosTagger.hpp"
-namespace cppjieba {
-class MixSegment: public SegmentTagged {
- public:
-  MixSegment(const string& mpSegDict, const string& hmmSegDict,
-        const string& userDict = "")
-    : mpSeg_(mpSegDict, userDict),
-      hmmSeg_(hmmSegDict) {
-  }
-  MixSegment(const DictTrie* dictTrie, const HMMModel* model)
-    : mpSeg_(dictTrie), hmmSeg_(model) {
-  }
-  ~MixSegment() {
-  }
-  void Cut(const string& sentence, vector<string>& words) const {
-    Cut(sentence, words, true);
-  }
-  void Cut(const string& sentence, vector<string>& words, bool hmm) const {
-    vector<Word> tmp;
-    Cut(sentence, tmp, hmm);
-    GetStringsFromWords(tmp, words);
-  }
-  void Cut(const string& sentence, vector<Word>& words, bool hmm = true) const {
-    PreFilter pre_filter(symbols_, sentence);
-    PreFilter::Range range;
-    vector<WordRange> wrs;
-    wrs.reserve(sentence.size() / 2);
-    while (pre_filter.HasNext()) {
-      range = pre_filter.Next();
-      Cut(range.begin, range.end, wrs, hmm);
-    }
-    words.clear();
-    words.reserve(wrs.size());
-    GetWordsFromWordRanges(sentence, wrs, words);
-  }
-  void Cut(RuneStrArray::const_iterator begin, RuneStrArray::const_iterator end, vector<WordRange>& res, bool hmm) const {
-    if (!hmm) {
-      mpSeg_.Cut(begin, end, res);
-      return;
-    }
-    vector<WordRange> words;
-    assert(end >= begin);
-    words.reserve(end - begin);
-    mpSeg_.Cut(begin, end, words);
-    vector<WordRange> hmmRes;
-    hmmRes.reserve(end - begin);
-    for (size_t i = 0; i < words.size(); i++) {
-      //if mp Get a word, it's ok, put it into result
-      if (words[i].left != words[i].right || (words[i].left == words[i].right && mpSeg_.IsUserDictSingleChineseWord(words[i].left->rune))) {
-        res.push_back(words[i]);
-        continue;
-      }
-      // if mp Get a single one and it is not in userdict, collect it in sequence
-      size_t j = i;
-      while (j < words.size() && words[j].left == words[j].right && !mpSeg_.IsUserDictSingleChineseWord(words[j].left->rune)) {
-        j++;
-      }
-      // Cut the sequence with hmm
-      assert(j - 1 >= i);
-      // TODO
-      hmmSeg_.Cut(words[i].left, words[j - 1].left + 1, hmmRes);
-      //put hmm result to result
-      for (size_t k = 0; k < hmmRes.size(); k++) {
-        res.push_back(hmmRes[k]);
-      }
-      //clear tmp vars
-      hmmRes.clear();
-      //let i jump over this piece
-      i = j - 1;
-    }
-  }
-  const DictTrie* GetDictTrie() const {
-    return mpSeg_.GetDictTrie();
-  }
-  bool Tag(const string& src, vector<pair<string, string> >& res) const {
-    return tagger_.Tag(src, res, *this);
-  }
-  string LookupTag(const string &str) const {
-    return tagger_.LookupTag(str, *this);
-  }
- private:
-  MPSegment mpSeg_;
-  HMMSegment hmmSeg_;
-  PosTagger tagger_;
-}; // class MixSegment
-} // namespace cppjieba
-#endif

data/ext/cppjieba/include/cppjieba/PosTagger.hpp DELETED Viewed

@@ -1,77 +0,0 @@
-#ifndef CPPJIEBA_POS_TAGGING_H
-#define CPPJIEBA_POS_TAGGING_H
-#include "limonp/StringUtil.hpp"
-#include "SegmentTagged.hpp"
-#include "DictTrie.hpp"
-namespace cppjieba {
-using namespace limonp;
-static const char* const POS_M = "m";
-static const char* const POS_ENG = "eng";
-static const char* const POS_X = "x";
-class PosTagger {
- public:
-  PosTagger() {
-  }
-  ~PosTagger() {
-  }
-  bool Tag(const string& src, vector<pair<string, string> >& res, const SegmentTagged& segment) const {
-    vector<string> CutRes;
-    segment.Cut(src, CutRes);
-    for (vector<string>::iterator itr = CutRes.begin(); itr != CutRes.end(); ++itr) {
-      res.push_back(make_pair(*itr, LookupTag(*itr, segment)));
-    }
-    return !res.empty();
-  }
-  string LookupTag(const string &str, const SegmentTagged& segment) const {
-    const DictUnit *tmp = NULL;
-    RuneStrArray runes;
-    const DictTrie * dict = segment.GetDictTrie();
-    assert(dict != NULL);
-      if (!DecodeRunesInString(str, runes)) {
-        XLOG(ERROR) << "Decode failed.";
-        return POS_X;
-      }
-      tmp = dict->Find(runes.begin(), runes.end());
-      if (tmp == NULL || tmp->tag.empty()) {
-        return SpecialRule(runes);
-      } else {
-        return tmp->tag;
-      }
-  }
- private:
-  const char* SpecialRule(const RuneStrArray& unicode) const {
-    size_t m = 0;
-    size_t eng = 0;
-    for (size_t i = 0; i < unicode.size() && eng < unicode.size() / 2; i++) {
-      if (unicode[i].rune < 0x80) {
-        eng ++;
-        if ('0' <= unicode[i].rune && unicode[i].rune <= '9') {
-          m++;
-        }
-      }
-    }
-    // ascii char is not found
-    if (eng == 0) {
-      return POS_X;
-    }
-    // all the ascii is number char
-    if (m == eng) {
-      return POS_M;
-    }
-    // the ascii chars contain english letter
-    return POS_ENG;
-  }
-}; // class PosTagger
-} // namespace cppjieba
-#endif

data/ext/cppjieba/include/cppjieba/PreFilter.hpp DELETED Viewed

@@ -1,54 +0,0 @@
-#ifndef CPPJIEBA_PRE_FILTER_H
-#define CPPJIEBA_PRE_FILTER_H
-#include "Trie.hpp"
-#include "limonp/Logging.hpp"
-namespace cppjieba {
-class PreFilter {
- public:
-  //TODO use WordRange instead of Range
-  struct Range {
-    RuneStrArray::const_iterator begin;
-    RuneStrArray::const_iterator end;
-  }; // struct Range
-  PreFilter(const unordered_set<Rune>& symbols,
-        const string& sentence)
-    : symbols_(symbols) {
-    if (!DecodeRunesInString(sentence, sentence_)) {
-      XLOG(ERROR) << "decode failed. ";
-    }
-    cursor_ = sentence_.begin();
-  }
-  ~PreFilter() {
-  }
-  bool HasNext() const {
-    return cursor_ != sentence_.end();
-  }
-  Range Next() {
-    Range range;
-    range.begin = cursor_;
-    while (cursor_ != sentence_.end()) {
-      if (IsIn(symbols_, cursor_->rune)) {
-        if (range.begin == cursor_) {
-          cursor_ ++;
-        }
-        range.end = cursor_;
-        return range;
-      }
-      cursor_ ++;
-    }
-    range.end = sentence_.end();
-    return range;
-  }
- private:
-  RuneStrArray::const_iterator cursor_;
-  RuneStrArray sentence_;
-  const unordered_set<Rune>& symbols_;
-}; // class PreFilter
-} // namespace cppjieba
-#endif // CPPJIEBA_PRE_FILTER_H

data/ext/cppjieba/include/cppjieba/QuerySegment.hpp DELETED Viewed

@@ -1,90 +0,0 @@
-#ifndef CPPJIEBA_QUERYSEGMENT_H
-#define CPPJIEBA_QUERYSEGMENT_H
-#include <algorithm>
-#include <set>
-#include <cassert>
-#include "limonp/Logging.hpp"
-#include "DictTrie.hpp"
-#include "SegmentBase.hpp"
-#include "FullSegment.hpp"
-#include "MixSegment.hpp"
-#include "Unicode.hpp"
-#include "DictTrie.hpp"
-namespace cppjieba {
-class QuerySegment: public SegmentBase {
- public:
-  QuerySegment(const string& dict, const string& model, const string& userDict = "")
-    : mixSeg_(dict, model, userDict),
-      trie_(mixSeg_.GetDictTrie()) {
-  }
-  QuerySegment(const DictTrie* dictTrie, const HMMModel* model)
-    : mixSeg_(dictTrie, model), trie_(dictTrie) {
-  }
-  ~QuerySegment() {
-  }
-  void Cut(const string& sentence, vector<string>& words) const {
-    Cut(sentence, words, true);
-  }
-  void Cut(const string& sentence, vector<string>& words, bool hmm) const {
-    vector<Word> tmp;
-    Cut(sentence, tmp, hmm);
-    GetStringsFromWords(tmp, words);
-  }
-  void Cut(const string& sentence, vector<Word>& words, bool hmm = true) const {
-    PreFilter pre_filter(symbols_, sentence);
-    PreFilter::Range range;
-    vector<WordRange> wrs;
-    wrs.reserve(sentence.size()/2);
-    while (pre_filter.HasNext()) {
-      range = pre_filter.Next();
-      Cut(range.begin, range.end, wrs, hmm);
-    }
-    words.clear();
-    words.reserve(wrs.size());
-    GetWordsFromWordRanges(sentence, wrs, words);
-  }
-  void Cut(RuneStrArray::const_iterator begin, RuneStrArray::const_iterator end, vector<WordRange>& res, bool hmm) const {
-    //use mix Cut first
-    vector<WordRange> mixRes;
-    mixSeg_.Cut(begin, end, mixRes, hmm);
-    vector<WordRange> fullRes;
-    for (vector<WordRange>::const_iterator mixResItr = mixRes.begin(); mixResItr != mixRes.end(); mixResItr++) {
-      if (mixResItr->Length() > 2) {
-        for (size_t i = 0; i + 1 < mixResItr->Length(); i++) {
-          WordRange wr(mixResItr->left + i, mixResItr->left + i + 1);
-          if (trie_->Find(wr.left, wr.right + 1) != NULL) {
-            res.push_back(wr);
-          }
-        }
-      }
-      if (mixResItr->Length() > 3) {
-        for (size_t i = 0; i + 2 < mixResItr->Length(); i++) {
-          WordRange wr(mixResItr->left + i, mixResItr->left + i + 2);
-          if (trie_->Find(wr.left, wr.right + 1) != NULL) {
-            res.push_back(wr);
-          }
-        }
-      }
-      res.push_back(*mixResItr);
-    }
-  }
- private:
-  bool IsAllAscii(const Unicode& s) const {
-   for(size_t i = 0; i < s.size(); i++) {
-     if (s[i] >= 0x80) {
-       return false;
-     }
-   }
-   return true;
-  }
-  MixSegment mixSeg_;
-  const DictTrie* trie_;
-}; // QuerySegment
-} // namespace cppjieba
-#endif