sastrawi 0.1.0.pre → 0.1.4

Sign up to get free protection for your applications and to get access to all the features.
Files changed (92) hide show
  1. checksums.yaml +5 -5
  2. data/.gitignore +1 -1
  3. data/.travis.yml +7 -5
  4. data/CONTRIBUTING.md +22 -0
  5. data/Gemfile +0 -0
  6. data/LICENSE.txt +1 -1
  7. data/README.md +53 -19
  8. data/Rakefile +2 -2
  9. data/_config.yml +1 -0
  10. data/bin/sastrawi +24 -0
  11. data/data/{kata-dasar.txt → base-word.txt} +0 -0
  12. data/lib/sastrawi.rb +1 -9
  13. data/lib/sastrawi/dictionary/array_dictionary.rb +36 -2
  14. data/lib/sastrawi/morphology/disambiguator/disambiguator_prefix_rule10.rb +1 -1
  15. data/lib/sastrawi/morphology/disambiguator/disambiguator_prefix_rule11.rb +1 -1
  16. data/lib/sastrawi/morphology/disambiguator/disambiguator_prefix_rule12.rb +1 -1
  17. data/lib/sastrawi/morphology/disambiguator/disambiguator_prefix_rule13a.rb +1 -1
  18. data/lib/sastrawi/morphology/disambiguator/disambiguator_prefix_rule13b.rb +1 -1
  19. data/lib/sastrawi/morphology/disambiguator/disambiguator_prefix_rule14.rb +1 -1
  20. data/lib/sastrawi/morphology/disambiguator/disambiguator_prefix_rule15a.rb +1 -1
  21. data/lib/sastrawi/morphology/disambiguator/disambiguator_prefix_rule15b.rb +1 -1
  22. data/lib/sastrawi/morphology/disambiguator/disambiguator_prefix_rule16.rb +1 -1
  23. data/lib/sastrawi/morphology/disambiguator/disambiguator_prefix_rule17a.rb +1 -1
  24. data/lib/sastrawi/morphology/disambiguator/disambiguator_prefix_rule17b.rb +1 -1
  25. data/lib/sastrawi/morphology/disambiguator/disambiguator_prefix_rule17c.rb +0 -0
  26. data/lib/sastrawi/morphology/disambiguator/disambiguator_prefix_rule17d.rb +1 -1
  27. data/lib/sastrawi/morphology/disambiguator/disambiguator_prefix_rule18a.rb +1 -1
  28. data/lib/sastrawi/morphology/disambiguator/disambiguator_prefix_rule18b.rb +1 -1
  29. data/lib/sastrawi/morphology/disambiguator/disambiguator_prefix_rule19.rb +1 -1
  30. data/lib/sastrawi/morphology/disambiguator/disambiguator_prefix_rule1a.rb +0 -0
  31. data/lib/sastrawi/morphology/disambiguator/disambiguator_prefix_rule1b.rb +1 -1
  32. data/lib/sastrawi/morphology/disambiguator/disambiguator_prefix_rule2.rb +1 -1
  33. data/lib/sastrawi/morphology/disambiguator/disambiguator_prefix_rule20.rb +1 -1
  34. data/lib/sastrawi/morphology/disambiguator/disambiguator_prefix_rule21a.rb +1 -1
  35. data/lib/sastrawi/morphology/disambiguator/disambiguator_prefix_rule21b.rb +1 -1
  36. data/lib/sastrawi/morphology/disambiguator/disambiguator_prefix_rule23.rb +1 -1
  37. data/lib/sastrawi/morphology/disambiguator/disambiguator_prefix_rule24.rb +1 -1
  38. data/lib/sastrawi/morphology/disambiguator/disambiguator_prefix_rule25.rb +1 -1
  39. data/lib/sastrawi/morphology/disambiguator/disambiguator_prefix_rule26a.rb +1 -1
  40. data/lib/sastrawi/morphology/disambiguator/disambiguator_prefix_rule26b.rb +1 -1
  41. data/lib/sastrawi/morphology/disambiguator/disambiguator_prefix_rule27.rb +1 -1
  42. data/lib/sastrawi/morphology/disambiguator/disambiguator_prefix_rule28a.rb +1 -1
  43. data/lib/sastrawi/morphology/disambiguator/disambiguator_prefix_rule28b.rb +1 -1
  44. data/lib/sastrawi/morphology/disambiguator/disambiguator_prefix_rule29.rb +2 -2
  45. data/lib/sastrawi/morphology/disambiguator/disambiguator_prefix_rule3.rb +1 -1
  46. data/lib/sastrawi/morphology/disambiguator/disambiguator_prefix_rule30a.rb +1 -1
  47. data/lib/sastrawi/morphology/disambiguator/disambiguator_prefix_rule30b.rb +1 -1
  48. data/lib/sastrawi/morphology/disambiguator/disambiguator_prefix_rule30c.rb +0 -0
  49. data/lib/sastrawi/morphology/disambiguator/disambiguator_prefix_rule31a.rb +1 -1
  50. data/lib/sastrawi/morphology/disambiguator/disambiguator_prefix_rule31b.rb +1 -1
  51. data/lib/sastrawi/morphology/disambiguator/disambiguator_prefix_rule32.rb +1 -1
  52. data/lib/sastrawi/morphology/disambiguator/disambiguator_prefix_rule34.rb +1 -1
  53. data/lib/sastrawi/morphology/disambiguator/disambiguator_prefix_rule35.rb +1 -1
  54. data/lib/sastrawi/morphology/disambiguator/disambiguator_prefix_rule36.rb +1 -1
  55. data/lib/sastrawi/morphology/disambiguator/disambiguator_prefix_rule37a.rb +2 -2
  56. data/lib/sastrawi/morphology/disambiguator/disambiguator_prefix_rule37b.rb +2 -2
  57. data/lib/sastrawi/morphology/disambiguator/disambiguator_prefix_rule38a.rb +2 -2
  58. data/lib/sastrawi/morphology/disambiguator/disambiguator_prefix_rule38b.rb +2 -2
  59. data/lib/sastrawi/morphology/disambiguator/disambiguator_prefix_rule39a.rb +2 -2
  60. data/lib/sastrawi/morphology/disambiguator/disambiguator_prefix_rule39b.rb +2 -2
  61. data/lib/sastrawi/morphology/disambiguator/disambiguator_prefix_rule4.rb +0 -0
  62. data/lib/sastrawi/morphology/disambiguator/disambiguator_prefix_rule40a.rb +2 -2
  63. data/lib/sastrawi/morphology/disambiguator/disambiguator_prefix_rule40b.rb +2 -2
  64. data/lib/sastrawi/morphology/disambiguator/disambiguator_prefix_rule41.rb +0 -0
  65. data/lib/sastrawi/morphology/disambiguator/disambiguator_prefix_rule42.rb +0 -0
  66. data/lib/sastrawi/morphology/disambiguator/disambiguator_prefix_rule5.rb +2 -2
  67. data/lib/sastrawi/morphology/disambiguator/disambiguator_prefix_rule6a.rb +0 -0
  68. data/lib/sastrawi/morphology/disambiguator/disambiguator_prefix_rule6b.rb +1 -1
  69. data/lib/sastrawi/morphology/disambiguator/disambiguator_prefix_rule7.rb +1 -1
  70. data/lib/sastrawi/morphology/disambiguator/disambiguator_prefix_rule8.rb +1 -1
  71. data/lib/sastrawi/morphology/disambiguator/disambiguator_prefix_rule9.rb +2 -2
  72. data/lib/sastrawi/morphology/invalid_affix_pair_specification.rb +4 -0
  73. data/lib/sastrawi/stemmer/cache/array_cache.rb +2 -2
  74. data/lib/sastrawi/stemmer/cached_stemmer.rb +1 -1
  75. data/lib/sastrawi/stemmer/confix_stripping/precedence_adjustment_specification.rb +5 -0
  76. data/lib/sastrawi/stemmer/context/context.rb +28 -7
  77. data/lib/sastrawi/stemmer/context/removal.rb +1 -1
  78. data/lib/sastrawi/stemmer/context/visitor/dont_stem_short_word.rb +0 -0
  79. data/lib/sastrawi/stemmer/context/visitor/prefix_disambiguator.rb +2 -2
  80. data/lib/sastrawi/stemmer/context/visitor/remove_derivational_suffix.rb +10 -1
  81. data/lib/sastrawi/stemmer/context/visitor/remove_inflectional_particle.rb +9 -1
  82. data/lib/sastrawi/stemmer/context/visitor/remove_inflectional_possessive_pronoun.rb +9 -1
  83. data/lib/sastrawi/stemmer/context/visitor/remove_plain_prefix.rb +9 -1
  84. data/lib/sastrawi/stemmer/context/visitor/visitor_provider.rb +1 -1
  85. data/lib/sastrawi/stemmer/filter/text_normalizer.rb +0 -0
  86. data/lib/sastrawi/stemmer/stemmer.rb +31 -15
  87. data/lib/sastrawi/stemmer/stemmer_factory.rb +5 -1
  88. data/lib/sastrawi/stop_word_remover/stop_word_remover.rb +5 -2
  89. data/lib/sastrawi/stop_word_remover/stop_word_remover_factory.rb +102 -130
  90. data/lib/sastrawi/version.rb +1 -1
  91. data/sastrawi.gemspec +6 -5
  92. metadata +22 -19
@@ -1,18 +1,21 @@
1
1
  module Sastrawi
2
2
  module StopWordRemover
3
3
  class StopWordRemover
4
- attr_accessor :dictionary
4
+ attr_reader :dictionary
5
5
 
6
6
  def initialize(dictionary)
7
7
  @dictionary = dictionary
8
8
  end
9
9
 
10
+ ##
11
+ # Remove stop words
12
+
10
13
  def remove(text)
11
14
  words = text.split(' ')
12
15
  stop_words = []
13
16
 
14
17
  words.each do |word|
15
- unless @dictionary.include?(word)
18
+ unless @dictionary.contains?(word)
16
19
  stop_words.push(word)
17
20
  end
18
21
  end
@@ -1,9 +1,10 @@
1
1
  require 'sastrawi/dictionary/array_dictionary'
2
+
2
3
  require 'sastrawi/stop_word_remover/stop_word_remover'
3
4
 
4
5
  module Sastrawi
5
6
  module StopWordRemover
6
- module StopWordRemoverFactory
7
+ class StopWordRemoverFactory
7
8
  def create_stop_word_remover
8
9
  stop_words = get_stop_word
9
10
 
@@ -14,135 +15,106 @@ module Sastrawi
14
15
  end
15
16
 
16
17
  def get_stop_word
17
- stop_words = [
18
- 'a', 'ada', 'adalah', 'adanya', 'adapun', 'agak', 'agaknya', 'agar',
19
- 'akan', 'akankah', 'akhir', 'akhiri', 'akhirnya', 'aku', 'akulah', 'amat',
20
- 'amatlah', 'anda', 'andalah', 'antar', 'antara', 'antaranya', 'apa',
21
- 'apaan', 'apabila', 'apakah', 'apalagi', 'apatah', 'arti', 'artinya',
22
- 'asal', 'asalkan', 'atas', 'atau', 'ataukah', 'ataupun', 'awal', 'awalnya',
23
- 'b', 'bagai', 'bagaikan', 'bagaimana', 'bagaimanakah', 'bagaimanapun',
24
- 'bagainamakah', 'bagi', 'bagian', 'bahkan', 'bahwa', 'bahwasannya',
25
- 'bahwasanya', 'baik', 'baiklah', 'bakal', 'bakalan', 'balik', 'banyak',
26
- 'bapak', 'baru', 'bawah', 'beberapa', 'begini', 'beginian', 'beginikah',
27
- 'beginilah', 'begitu', 'begitukah', 'begitulah', 'begitupun', 'bekerja',
28
- 'belakang', 'belakangan', 'belum', 'belumlah', 'benar', 'benarkah',
29
- 'benarlah', 'berada', 'berakhir', 'berakhirlah', 'berakhirnya', 'berapa',
30
- 'berapakah', 'berapalah', 'berapapun', 'berarti', 'berawal', 'berbagai',
31
- 'berdatangan', 'beri', 'berikan', 'berikut', 'berikutnya', 'berjumlah',
32
- 'berkali-kali', 'berkata', 'berkehendak', 'berkeinginan', 'berkenaan',
33
- 'berlainan', 'berlalu', 'berlangsung', 'berlebihan', 'bermacam',
34
- 'bermacam-macam', 'bermaksud', 'bermula', 'bersama', 'bersama-sama',
35
- 'bersiap', 'bersiap-siap', 'bertanya', 'bertanya-tanya', 'berturut',
36
- 'berturut-turut', 'bertutur', 'berujar', 'berupa', 'besar', 'betul',
37
- 'betulkah', 'biasa', 'biasanya', 'bila', 'bilakah', 'bisa', 'bisakah',
38
- 'boleh', 'bolehkah', 'bolehlah', 'buat', 'bukan', 'bukankah', 'bukanlah',
39
- 'bukannya', 'bulan', 'bung', 'c', 'cara', 'caranya', 'cukup', 'cukupkah',
40
- 'cukuplah', 'cuma', 'd', 'dahulu', 'dalam', 'dan', 'dapat', 'dari',
41
- 'daripada', 'datang', 'dekat', 'demi', 'demikian', 'demikianlah', 'dengan',
42
- 'depan', 'di', 'dia', 'diakhiri', 'diakhirinya', 'dialah', 'diantara',
43
- 'diantaranya', 'diberi', 'diberikan', 'diberikannya', 'dibuat',
44
- 'dibuatnya', 'didapat', 'didatangkan', 'digunakan', 'diibaratkan',
45
- 'diibaratkannya', 'diingat', 'diingatkan', 'diinginkan', 'dijawab',
46
- 'dijelaskan', 'dijelaskannya', 'dikarenakan', 'dikatakan', 'dikatakannya',
47
- 'dikerjakan', 'diketahui', 'diketahuinya', 'dikira', 'dilakukan',
48
- 'dilalui', 'dilihat', 'dimaksud', 'dimaksudkan', 'dimaksudkannya',
49
- 'dimaksudnya', 'diminta', 'dimintai', 'dimisalkan', 'dimulai',
50
- 'dimulailah', 'dimulainya', 'dimungkinkan', 'dini', 'dipastikan',
51
- 'diperbuat', 'diperbuatnya', 'dipergunakan', 'diperkirakan',
52
- 'diperlihatkan', 'diperlukan', 'diperlukannya', 'dipersoalkan',
53
- 'dipertanyakan', 'dipunyai', 'diri', 'dirinya','disampaikan', 'disebut',
54
- 'disebutkan', 'disebutkannya', 'disini', 'disinilah', 'ditambahkan',
55
- 'ditandaskan', 'ditanya', 'ditanyai','ditanyakan', 'ditegaskan',
56
- 'ditujukan', 'ditunjuk', 'ditunjuki', 'ditunjukkan', 'ditunjukkannya',
57
- 'ditunjuknya', 'dituturkan', 'dituturkannya', 'diucapkan', 'diucapkannya',
58
- 'diungkapkan', 'dong', 'dua', 'dulu', 'e', 'empat', 'enak', 'enggak',
59
- 'enggaknya', 'entah', 'entahlah', 'f', 'g', 'guna', 'gunakan', 'h',
60
- 'hadap', 'hai', 'hal', 'halo', 'hallo', 'hampir', 'hanya', 'hanyalah',
61
- 'hari', 'harus', 'haruslah', 'harusnya', 'helo', 'hello', 'hendak',
62
- 'hendaklah', 'hendaknya', 'hingga', 'i', 'ia', 'ialah', 'ibarat',
63
- 'ibaratkan', 'ibaratnya', 'ibu', 'ikut', 'ingat', 'ingat-ingat', 'ingin',
64
- 'inginkah', 'inginkan', 'ini', 'inikah', 'inilah', 'itu', 'itukah',
65
- 'itulah', 'j', 'jadi', 'jadilah', 'jadinya', 'jangan', 'jangankan',
66
- 'janganlah', 'jauh', 'jawab', 'jawaban', 'jawabnya', 'jelas', 'jelaskan',
67
- 'jelaslah', 'jelasnya', 'jika', 'jikalau', 'juga', 'jumlah', 'jumlahnya',
68
- 'justru', 'k', 'kadar', 'kala', 'kalau', 'kalaulah', 'kalaupun', 'kali',
69
- 'kalian', 'kami', 'kamilah', 'kamu', 'kamulah', 'kan', 'kapan', 'kapankah',
70
- 'kapanpun', 'karena', 'karenanya', 'kasus', 'kata', 'katakan',
71
- 'katakanlah', 'katanya', 'ke', 'keadaan', 'kebetulan', 'kecil', 'kedua',
72
- 'keduanya', 'keinginan', 'kelamaan', 'kelihatan', 'kelihatannya', 'kelima',
73
- 'keluar', 'kembali', 'kemudian', 'kemungkinan', 'kemungkinannya', 'kena',
74
- 'kenapa', 'kepada', 'kepadanya', 'kerja', 'kesampaian', 'keseluruhan',
75
- 'keseluruhannya', 'keterlaluan', 'ketika', 'khusus', 'khususnya', 'kini',
76
- 'kinilah', 'kira', 'kira-kira', 'kiranya', 'kita', 'kitalah', 'kok',
77
- 'kurang', 'l', 'lagi', 'lagian', 'lah', 'lain', 'lainnya', 'laku', 'lalu',
78
- 'lama', 'lamanya', 'langsung', 'lanjut', 'lanjutnya', 'lebih', 'lewat',
79
- 'lihat', 'lima', 'luar', 'm', 'macam', 'maka', 'makanya', 'makin',
80
- 'maksud', 'malah', 'malahan', 'mampu', 'mampukah', 'mana', 'manakala',
81
- 'manalagi', 'masa', 'masalah', 'masalahnya', 'masih', 'masihkah', 'masing',
82
- 'masing-masing', 'masuk', 'mata', 'mau', 'maupun', 'melainkan',
83
- 'melakukan', 'melalui', 'melihat', 'melihatnya', 'memang', 'memastikan',
84
- 'memberi', 'memberikan', 'membuat', 'memerlukan', 'memihak', 'meminta',
85
- 'memintakan', 'memisalkan', 'memperbuat', 'mempergunakan', 'memperkirakan',
86
- 'memperlihatkan', 'mempersiapkan', 'mempersoalkan', 'mempertanyakan',
87
- 'mempunyai', 'memulai', 'memungkinkan', 'menaiki', 'menambahkan',
88
- 'menandaskan', 'menanti', 'menanti-nanti', 'menantikan', 'menanya',
89
- 'menanyai', 'menanyakan', 'mendapat', 'mendapatkan', 'mendatang',
90
- 'mendatangi', 'mendatangkan', 'menegaskan', 'mengakhiri', 'mengapa',
91
- 'mengatakan', 'mengatakannya', 'mengenai', 'mengerjakan', 'mengetahui',
92
- 'menggunakan', 'menghendaki', 'mengibaratkan', 'mengibaratkannya',
93
- 'mengingat', 'mengingatkan', 'menginginkan', 'mengira', 'mengucapkan',
94
- 'mengucapkannya', 'mengungkapkan', 'menjadi', 'menjawab', 'menjelaskan',
95
- 'menuju', 'menunjuk', 'menunjuki', 'menunjukkan', 'menunjuknya', 'menurut',
96
- 'menuturkan', 'menyampaikan', 'menyangkut', 'menyatakan', 'menyebutkan',
97
- 'menyeluruh', 'menyiapkan', 'merasa', 'mereka', 'merekalah', 'merupakan',
98
- 'meski', 'meskipun', 'meyakini', 'meyakinkan', 'minta', 'mirip', 'misal',
99
- 'misalkan', 'misalnya', 'mohon', 'mula', 'mulai', 'mulailah', 'mulanya',
100
- 'mungkin', 'mungkinkah', 'n', 'nah', 'naik', 'namun', 'nanti', 'nantinya',
101
- 'nya', 'nyaris', 'nyata', 'nyatanya', 'o', 'oleh', 'olehnya', 'orang', 'p',
102
- 'pada', 'padahal', 'padanya', 'pak', 'paling', 'panjang', 'pantas', 'para',
103
- 'pasti', 'pastilah', 'penting', 'pentingnya', 'per', 'percuma', 'perlu',
104
- 'perlukah', 'perlunya', 'pernah', 'persoalan', 'pertama', 'pertama-tama',
105
- 'pertanyaan', 'pertanyakan', 'pihak', 'pihaknya', 'pukul', 'pula', 'pun',
106
- 'punya', 'q', 'r', 'rasa', 'rasanya', 'rupa', 'rupanya', 's', 'saat',
107
- 'saatnya', 'saja', 'sajalah', 'salam', 'saling', 'sama', 'sama-sama',
108
- 'sambil', 'sampai', 'sampai-sampai', 'sampaikan', 'sana', 'sangat',
109
- 'sangatlah', 'sangkut', 'satu', 'saya', 'sayalah', 'se', 'sebab',
110
- 'sebabnya', 'sebagai', 'sebagaimana', 'sebagainya', 'sebagian', 'sebaik',
111
- 'sebaik-baiknya', 'sebaiknya', 'sebaliknya', 'sebanyak', 'sebegini',
112
- 'sebegitu', 'sebelum', 'sebelumnya', 'sebenarnya', 'seberapa', 'sebesar',
113
- 'sebetulnya', 'sebisanya', 'sebuah', 'sebut', 'sebutlah', 'sebutnya',
114
- 'secara', 'secukupnya', 'sedang', 'sedangkan', 'sedemikian', 'sedikit',
115
- 'sedikitnya', 'seenaknya', 'segala', 'segalanya', 'segera', 'seharusnya',
116
- 'sehingga', 'seingat', 'sejak', 'sejauh', 'sejenak', 'sejumlah', 'sekadar',
117
- 'sekadarnya', 'sekali', 'sekali-kali', 'sekalian', 'sekaligus',
118
- 'sekalipun', 'sekarang', 'sekaranglah', 'sekecil', 'seketika', 'sekiranya',
119
- 'sekitar', 'sekitarnya', 'sekurang-kurangnya', 'sekurangnya', 'sela',
120
- 'selain', 'selaku', 'selalu', 'selama', 'selama-lamanya', 'selamanya',
121
- 'selanjutnya', 'seluruh', 'seluruhnya', 'semacam', 'semakin', 'semampu',
122
- 'semampunya', 'semasa', 'semasih', 'semata', 'semata-mata', 'semaunya',
123
- 'sementara', 'semisal', 'semisalnya', 'sempat', 'semua', 'semuanya',
124
- 'semula', 'sendiri', 'sendirian', 'sendirinya', 'seolah','seolah-olah',
125
- 'seorang', 'sepanjang', 'sepantasnya', 'sepantasnyalah', 'seperlunya',
126
- 'seperti', 'sepertinya', 'sepihak', 'sering', 'seringnya', 'serta',
127
- 'serupa', 'sesaat', 'sesama', 'sesampai', 'sesegera', 'sesekali',
128
- 'seseorang', 'sesuatu', 'sesuatunya', 'sesudah', 'sesudahnya', 'setelah',
129
- 'setempat', 'setengah', 'seterusnya', 'setiap', 'setiba', 'setibanya',
130
- 'setidak-tidaknya', 'setidaknya', 'setinggi', 'seusai', 'sewaktu', 'siap',
131
- 'siapa', 'siapakah', 'siapapun', 'sini', 'sinilah', 'soal', 'soalnya',
132
- 'suatu', 'sudah', 'sudahkah', 'sudahlah', 'supaya', 't', 'tadi', 'tadinya',
133
- 'tahu', 'tak', 'tambah', 'tambahnya', 'tampak', 'tampaknya', 'tandas',
134
- 'tandasnya', 'tanpa', 'tanya', 'tanyakan', 'tanyanya', 'tapi', 'tegas',
135
- 'tegasnya', 'telah', 'tempat', 'tentang', 'tentu', 'tentulah', 'tentunya',
136
- 'tepat', 'terakhir', 'terasa', 'terbanyak', 'terdahulu', 'terdapat',
137
- 'terdiri', 'terhadap', 'terhadapnya', 'teringat', 'teringat-ingat',
138
- 'terjadi', 'terjadilah', 'terjadinya', 'terkira', 'terlalu', 'terlebih',
139
- 'terlihat', 'termasuk', 'ternyata', 'tersampaikan', 'tersebut',
140
- 'tersebutlah', 'tertentu', 'tertuju', 'terus', 'terutama', 'tetap',
141
- 'tetapi', 'tiap', 'tiba', 'tiba-tiba', 'tidak', 'tidakkah', 'tidaklah',
142
- 'tiga', 'toh', 'tuju', 'tunjuk', 'turut', 'tutur', 'tuturnya', 'u', 'ucap',
143
- 'ucapnya', 'ujar', 'ujarnya', 'umumnya', 'ungkap', 'ungkapnya', 'untuk',
144
- 'usah', 'usai', 'v', 'w', 'waduh', 'wah', 'wahai', 'waktunya', 'walau',
145
- 'walaupun', 'wong', 'x', 'y', 'ya', 'yaitu', 'yakin', 'yakni', 'yang', 'z'
18
+ stop_words = %w[a ada adalah adanya adapun agak agaknya agar akan
19
+ akankah akhir akhiri akhirnya aku akulah amat amatlah anda andalah
20
+ antar antara antaranya apa apaan apabila apakah apalagi apatah arti
21
+ artinya asal asalkan atas atau ataukah ataupun awal awalnya b bagai
22
+ bagaikan bagaimana bagaimanakah bagaimanapun bagainamakah bagi bagian
23
+ bahkan bahwa bahwasannya bahwasanya baik baiklah bakal bakalan balik
24
+ banyak bapak baru bawah beberapa begini beginian beginikah beginilah
25
+ begitu begitukah begitulah begitupun bekerja belakang belakangan
26
+ belum belumlah benar benarkah benarlah berada berakhir berakhirlah
27
+ berakhirnya berapa berapakah berapalah berapapun berarti berawal
28
+ berbagai berdatangan beri berikan berikut berikutnya berjumlah
29
+ berkali-kali berkata berkehendak berkeinginan berkenaan berlainan
30
+ berlalu berlangsung berlebihan bermacam bermacam-macam bermaksud
31
+ bermula bersama bersama-sama bersiap bersiap-siap bertanya
32
+ bertanya-tanya berturut berturut-turut bertutur berujar berupa besar
33
+ betul betulkah biasa biasanya bila bilakah bisa bisakah boleh bolehkah
34
+ bolehlah buat bukan bukankah bukanlah bukannya bulan bung c cara
35
+ caranya cukup cukupkah cukuplah cuma d dahulu dalam dan dapat dari
36
+ daripada datang dekat demi demikian demikianlah dengan depan di dia
37
+ diakhiri diakhirinya dialah diantara diantaranya diberi diberikan
38
+ diberikannya dibuat dibuatnya didapat didatangkan digunakan
39
+ diibaratkan diibaratkannya diingat diingatkan diinginkan dijawab
40
+ dijelaskan dijelaskannya dikarenakan dikatakan dikatakannya dikerjakan
41
+ diketahui diketahuinya dikira dilakukan dilalui dilihat dimaksud
42
+ dimaksudkan dimaksudkannya dimaksudnya diminta dimintai dimisalkan
43
+ dimulai dimulailah dimulainya dimungkinkan dini dipastikan diperbuat
44
+ diperbuatnya dipergunakan diperkirakan diperlihatkan diperlukan
45
+ diperlukannya dipersoalkan dipertanyakan dipunyai diri dirinya
46
+ disampaikan disebut disebutkan disebutkannya disini disinilah
47
+ ditambahkan ditandaskan ditanya ditanyai ditanyakan ditegaskan
48
+ ditujukan ditunjuk ditunjuki ditunjukkan ditunjukkannya ditunjuknya
49
+ dituturkan dituturkannya diucapkan diucapkannya diungkapkan dong dua
50
+ dulu e empat enak enggak enggaknya entah entahlah f g guna gunakan h
51
+ hadap hai hal halo hallo hampir hanya hanyalah hari harus haruslah
52
+ harusnya helo hello hendak hendaklah hendaknya hingga i ia ialah
53
+ ibarat ibaratkan ibaratnya ibu ikut ingat ingat-ingat ingin inginkah
54
+ inginkan ini inikah inilah itu itukah itulah j jadi jadilah jadinya
55
+ jangan jangankan janganlah jauh jawab jawaban jawabnya jelas jelaskan
56
+ jelaslah jelasnya jika jikalau juga jumlah jumlahnya justru k kadar
57
+ kala kalau kalaulah kalaupun kali kalian kami kamilah kamu kamulah kan
58
+ kapan kapankah kapanpun karena karenanya kasus kata katakan katakanlah
59
+ katanya ke keadaan kebetulan kecil kedua keduanya keinginan kelamaan
60
+ kelihatan kelihatannya kelima keluar kembali kemudian kemungkinan
61
+ kemungkinannya kena kenapa kepada kepadanya kerja kesampaian
62
+ keseluruhan keseluruhannya keterlaluan ketika khusus khususnya kini
63
+ kinilah kira kira-kira kiranya kita kitalah kok kurang l lagi lagian
64
+ lah lain lainnya laku lalu lama lamanya langsung lanjut lanjutnya
65
+ lebih lewat lihat lima luar m macam maka makanya makin maksud malah
66
+ malahan mampu mampukah mana manakala manalagi masa masalah masalahnya
67
+ masih masihkah masing masing-masing masuk mata mau maupun melainkan
68
+ melakukan melalui melihat melihatnya memang memastikan memberi
69
+ memberikan membuat memerlukan memihak meminta memintakan memisalkan
70
+ memperbuat mempergunakan memperkirakan memperlihatkan mempersiapkan
71
+ mempersoalkan mempertanyakan mempunyai memulai memungkinkan menaiki
72
+ menambahkan menandaskan menanti menanti-nanti menantikan menanya
73
+ menanyai menanyakan mendapat mendapatkan mendatang mendatangi
74
+ mendatangkan menegaskan mengakhiri mengapa mengatakan mengatakannya
75
+ mengenai mengerjakan mengetahui menggunakan menghendaki mengibaratkan
76
+ mengibaratkannya mengingat mengingatkan menginginkan mengira
77
+ mengucapkan mengucapkannya mengungkapkan menjadi menjawab menjelaskan
78
+ menuju menunjuk menunjuki menunjukkan menunjuknya menurut menuturkan
79
+ menyampaikan menyangkut menyatakan menyebutkan menyeluruh menyiapkan
80
+ merasa mereka merekalah merupakan meski meskipun meyakini meyakinkan
81
+ minta mirip misal misalkan misalnya mohon mula mulai mulailah mulanya
82
+ mungkin mungkinkah n nah naik namun nanti nantinya nya nyaris nyata
83
+ nyatanya o oleh olehnya orang p pada padahal padanya pak paling
84
+ panjang pantas para pasti pastilah penting pentingnya per percuma
85
+ perlu perlukah perlunya pernah persoalan pertama pertama-tama
86
+ pertanyaan pertanyakan pihak pihaknya pukul pula pun punya q r rasa
87
+ rasanya rupa rupanya s saat saatnya saja sajalah salam saling sama
88
+ sama-sama sambil sampai sampai-sampai sampaikan sana sangat sangatlah
89
+ sangkut satu saya sayalah se sebab sebabnya sebagai sebagaimana
90
+ sebagainya sebagian sebaik sebaik-baiknya sebaiknya sebaliknya
91
+ sebanyak sebegini sebegitu sebelum sebelumnya sebenarnya seberapa
92
+ sebesar sebetulnya sebisanya sebuah sebut sebutlah sebutnya secara
93
+ secukupnya sedang sedangkan sedemikian sedikit sedikitnya seenaknya
94
+ segala segalanya segera seharusnya sehingga seingat sejak sejauh
95
+ sejenak sejumlah sekadar sekadarnya sekali sekali-kali sekalian
96
+ sekaligus sekalipun sekarang sekaranglah sekecil seketika sekiranya
97
+ sekitar sekitarnya sekurang-kurangnya sekurangnya sela selain selaku
98
+ selalu selama selama-lamanya selamanya selanjutnya seluruh seluruhnya
99
+ semacam semakin semampu semampunya semasa semasih semata semata-mata
100
+ semaunya sementara semisal semisalnya sempat semua semuanya semula
101
+ sendiri sendirian sendirinya seolah seolah-olah seorang sepanjang
102
+ sepantasnya sepantasnyalah seperlunya seperti sepertinya sepihak
103
+ sering seringnya serta serupa sesaat sesama sesampai sesegera sesekali
104
+ seseorang sesuatu sesuatunya sesudah sesudahnya setelah setempat
105
+ setengah seterusnya setiap setiba setibanya setidak-tidaknya
106
+ setidaknya setinggi seusai sewaktu siap siapa siapakah siapapun sini
107
+ sinilah soal soalnya suatu sudah sudahkah sudahlah supaya t tadi
108
+ tadinya tahu tak tambah tambahnya tampak tampaknya tandas tandasnya
109
+ tanpa tanya tanyakan tanyanya tapi tegas tegasnya telah tempat tentang
110
+ tentu tentulah tentunya tepat terakhir terasa terbanyak terdahulu
111
+ terdapat terdiri terhadap terhadapnya teringat teringat-ingat terjadi
112
+ terjadilah terjadinya terkira terlalu terlebih terlihat termasuk
113
+ ternyata tersampaikan tersebut tersebutlah tertentu tertuju terus
114
+ terutama tetap tetapi tiap tiba tiba-tiba tidak tidakkah tidaklah tiga
115
+ toh tuju tunjuk turut tutur tuturnya u ucap ucapnya ujar ujarnya
116
+ umumnya ungkap ungkapnya untuk usah usai v w waduh wah wahai waktunya
117
+ walau walaupun wong x y ya yaitu yakin yakni yang z
146
118
  ]
147
119
 
148
120
  stop_words
@@ -1,3 +1,3 @@
1
1
  module Sastrawi
2
- VERSION = "0.1.0.pre"
2
+ VERSION = "0.1.4"
3
3
  end
data/sastrawi.gemspec CHANGED
@@ -6,6 +6,7 @@ require 'sastrawi/version'
6
6
  Gem::Specification.new do |spec|
7
7
  spec.name = "sastrawi"
8
8
  spec.version = Sastrawi::VERSION
9
+ spec.required_ruby_version = ">= 2.3.8"
9
10
  spec.authors = ["Andrias Meisyal"]
10
11
  spec.email = ["andriasonline@gmail.com"]
11
12
 
@@ -15,11 +16,11 @@ Gem::Specification.new do |spec|
15
16
  spec.license = "MIT"
16
17
 
17
18
  spec.files = `git ls-files -z`.split("\x0").reject { |f| f.match(%r{^(test|spec|features)/}) }
18
- spec.bindir = "exe"
19
- spec.executables = spec.files.grep(%r{^exe/}) { |f| File.basename(f) }
19
+ spec.bindir = "bin"
20
+ spec.executables = spec.files.grep(%r{^bin/}) { |f| File.basename(f) }
20
21
  spec.require_paths = ["lib"]
21
22
 
22
- spec.add_development_dependency "bundler", "~> 1.12"
23
- spec.add_development_dependency "rake", "~> 10.0"
24
- spec.add_development_dependency "rspec", "~> 3.0"
23
+ spec.add_development_dependency "bundler", "~> 2.2.14"
24
+ spec.add_development_dependency "rake", "~> 13.0.1"
25
+ spec.add_development_dependency "rspec", "~> 3.10.0"
25
26
  end
metadata CHANGED
@@ -1,14 +1,14 @@
1
1
  --- !ruby/object:Gem::Specification
2
2
  name: sastrawi
3
3
  version: !ruby/object:Gem::Version
4
- version: 0.1.0.pre
4
+ version: 0.1.4
5
5
  platform: ruby
6
6
  authors:
7
7
  - Andrias Meisyal
8
- autorequire:
9
- bindir: exe
8
+ autorequire:
9
+ bindir: bin
10
10
  cert_chain: []
11
- date: 2017-02-13 00:00:00.000000000 Z
11
+ date: 2021-04-10 00:00:00.000000000 Z
12
12
  dependencies:
13
13
  - !ruby/object:Gem::Dependency
14
14
  name: bundler
@@ -16,56 +16,60 @@ dependencies:
16
16
  requirements:
17
17
  - - "~>"
18
18
  - !ruby/object:Gem::Version
19
- version: '1.12'
19
+ version: 2.2.14
20
20
  type: :development
21
21
  prerelease: false
22
22
  version_requirements: !ruby/object:Gem::Requirement
23
23
  requirements:
24
24
  - - "~>"
25
25
  - !ruby/object:Gem::Version
26
- version: '1.12'
26
+ version: 2.2.14
27
27
  - !ruby/object:Gem::Dependency
28
28
  name: rake
29
29
  requirement: !ruby/object:Gem::Requirement
30
30
  requirements:
31
31
  - - "~>"
32
32
  - !ruby/object:Gem::Version
33
- version: '10.0'
33
+ version: 13.0.1
34
34
  type: :development
35
35
  prerelease: false
36
36
  version_requirements: !ruby/object:Gem::Requirement
37
37
  requirements:
38
38
  - - "~>"
39
39
  - !ruby/object:Gem::Version
40
- version: '10.0'
40
+ version: 13.0.1
41
41
  - !ruby/object:Gem::Dependency
42
42
  name: rspec
43
43
  requirement: !ruby/object:Gem::Requirement
44
44
  requirements:
45
45
  - - "~>"
46
46
  - !ruby/object:Gem::Version
47
- version: '3.0'
47
+ version: 3.10.0
48
48
  type: :development
49
49
  prerelease: false
50
50
  version_requirements: !ruby/object:Gem::Requirement
51
51
  requirements:
52
52
  - - "~>"
53
53
  - !ruby/object:Gem::Version
54
- version: '3.0'
54
+ version: 3.10.0
55
55
  description: A Ruby library which allows you to stem words in Bahasa Indonesia.
56
56
  email:
57
57
  - andriasonline@gmail.com
58
- executables: []
58
+ executables:
59
+ - sastrawi
59
60
  extensions: []
60
61
  extra_rdoc_files: []
61
62
  files:
62
63
  - ".gitignore"
63
64
  - ".travis.yml"
65
+ - CONTRIBUTING.md
64
66
  - Gemfile
65
67
  - LICENSE.txt
66
68
  - README.md
67
69
  - Rakefile
68
- - data/kata-dasar.txt
70
+ - _config.yml
71
+ - bin/sastrawi
72
+ - data/base-word.txt
69
73
  - lib/sastrawi.rb
70
74
  - lib/sastrawi/dictionary/array_dictionary.rb
71
75
  - lib/sastrawi/morphology/disambiguator/disambiguator_prefix_rule10.rb
@@ -150,7 +154,7 @@ homepage: https://github.com/meisyal/sastrawi-ruby
150
154
  licenses:
151
155
  - MIT
152
156
  metadata: {}
153
- post_install_message:
157
+ post_install_message:
154
158
  rdoc_options: []
155
159
  require_paths:
156
160
  - lib
@@ -158,16 +162,15 @@ required_ruby_version: !ruby/object:Gem::Requirement
158
162
  requirements:
159
163
  - - ">="
160
164
  - !ruby/object:Gem::Version
161
- version: '0'
165
+ version: 2.3.8
162
166
  required_rubygems_version: !ruby/object:Gem::Requirement
163
167
  requirements:
164
- - - ">"
168
+ - - ">="
165
169
  - !ruby/object:Gem::Version
166
- version: 1.3.1
170
+ version: '0'
167
171
  requirements: []
168
- rubyforge_project:
169
- rubygems_version: 2.5.1
170
- signing_key:
172
+ rubygems_version: 3.2.13
173
+ signing_key:
171
174
  specification_version: 4
172
175
  summary: Ruby bindings for Sastrawi
173
176
  test_files: []