sastrawi 0.1.0.pre → 0.1.4
Sign up to get free protection for your applications and to get access to all the features.
- checksums.yaml +5 -5
- data/.gitignore +1 -1
- data/.travis.yml +7 -5
- data/CONTRIBUTING.md +22 -0
- data/Gemfile +0 -0
- data/LICENSE.txt +1 -1
- data/README.md +53 -19
- data/Rakefile +2 -2
- data/_config.yml +1 -0
- data/bin/sastrawi +24 -0
- data/data/{kata-dasar.txt → base-word.txt} +0 -0
- data/lib/sastrawi.rb +1 -9
- data/lib/sastrawi/dictionary/array_dictionary.rb +36 -2
- data/lib/sastrawi/morphology/disambiguator/disambiguator_prefix_rule10.rb +1 -1
- data/lib/sastrawi/morphology/disambiguator/disambiguator_prefix_rule11.rb +1 -1
- data/lib/sastrawi/morphology/disambiguator/disambiguator_prefix_rule12.rb +1 -1
- data/lib/sastrawi/morphology/disambiguator/disambiguator_prefix_rule13a.rb +1 -1
- data/lib/sastrawi/morphology/disambiguator/disambiguator_prefix_rule13b.rb +1 -1
- data/lib/sastrawi/morphology/disambiguator/disambiguator_prefix_rule14.rb +1 -1
- data/lib/sastrawi/morphology/disambiguator/disambiguator_prefix_rule15a.rb +1 -1
- data/lib/sastrawi/morphology/disambiguator/disambiguator_prefix_rule15b.rb +1 -1
- data/lib/sastrawi/morphology/disambiguator/disambiguator_prefix_rule16.rb +1 -1
- data/lib/sastrawi/morphology/disambiguator/disambiguator_prefix_rule17a.rb +1 -1
- data/lib/sastrawi/morphology/disambiguator/disambiguator_prefix_rule17b.rb +1 -1
- data/lib/sastrawi/morphology/disambiguator/disambiguator_prefix_rule17c.rb +0 -0
- data/lib/sastrawi/morphology/disambiguator/disambiguator_prefix_rule17d.rb +1 -1
- data/lib/sastrawi/morphology/disambiguator/disambiguator_prefix_rule18a.rb +1 -1
- data/lib/sastrawi/morphology/disambiguator/disambiguator_prefix_rule18b.rb +1 -1
- data/lib/sastrawi/morphology/disambiguator/disambiguator_prefix_rule19.rb +1 -1
- data/lib/sastrawi/morphology/disambiguator/disambiguator_prefix_rule1a.rb +0 -0
- data/lib/sastrawi/morphology/disambiguator/disambiguator_prefix_rule1b.rb +1 -1
- data/lib/sastrawi/morphology/disambiguator/disambiguator_prefix_rule2.rb +1 -1
- data/lib/sastrawi/morphology/disambiguator/disambiguator_prefix_rule20.rb +1 -1
- data/lib/sastrawi/morphology/disambiguator/disambiguator_prefix_rule21a.rb +1 -1
- data/lib/sastrawi/morphology/disambiguator/disambiguator_prefix_rule21b.rb +1 -1
- data/lib/sastrawi/morphology/disambiguator/disambiguator_prefix_rule23.rb +1 -1
- data/lib/sastrawi/morphology/disambiguator/disambiguator_prefix_rule24.rb +1 -1
- data/lib/sastrawi/morphology/disambiguator/disambiguator_prefix_rule25.rb +1 -1
- data/lib/sastrawi/morphology/disambiguator/disambiguator_prefix_rule26a.rb +1 -1
- data/lib/sastrawi/morphology/disambiguator/disambiguator_prefix_rule26b.rb +1 -1
- data/lib/sastrawi/morphology/disambiguator/disambiguator_prefix_rule27.rb +1 -1
- data/lib/sastrawi/morphology/disambiguator/disambiguator_prefix_rule28a.rb +1 -1
- data/lib/sastrawi/morphology/disambiguator/disambiguator_prefix_rule28b.rb +1 -1
- data/lib/sastrawi/morphology/disambiguator/disambiguator_prefix_rule29.rb +2 -2
- data/lib/sastrawi/morphology/disambiguator/disambiguator_prefix_rule3.rb +1 -1
- data/lib/sastrawi/morphology/disambiguator/disambiguator_prefix_rule30a.rb +1 -1
- data/lib/sastrawi/morphology/disambiguator/disambiguator_prefix_rule30b.rb +1 -1
- data/lib/sastrawi/morphology/disambiguator/disambiguator_prefix_rule30c.rb +0 -0
- data/lib/sastrawi/morphology/disambiguator/disambiguator_prefix_rule31a.rb +1 -1
- data/lib/sastrawi/morphology/disambiguator/disambiguator_prefix_rule31b.rb +1 -1
- data/lib/sastrawi/morphology/disambiguator/disambiguator_prefix_rule32.rb +1 -1
- data/lib/sastrawi/morphology/disambiguator/disambiguator_prefix_rule34.rb +1 -1
- data/lib/sastrawi/morphology/disambiguator/disambiguator_prefix_rule35.rb +1 -1
- data/lib/sastrawi/morphology/disambiguator/disambiguator_prefix_rule36.rb +1 -1
- data/lib/sastrawi/morphology/disambiguator/disambiguator_prefix_rule37a.rb +2 -2
- data/lib/sastrawi/morphology/disambiguator/disambiguator_prefix_rule37b.rb +2 -2
- data/lib/sastrawi/morphology/disambiguator/disambiguator_prefix_rule38a.rb +2 -2
- data/lib/sastrawi/morphology/disambiguator/disambiguator_prefix_rule38b.rb +2 -2
- data/lib/sastrawi/morphology/disambiguator/disambiguator_prefix_rule39a.rb +2 -2
- data/lib/sastrawi/morphology/disambiguator/disambiguator_prefix_rule39b.rb +2 -2
- data/lib/sastrawi/morphology/disambiguator/disambiguator_prefix_rule4.rb +0 -0
- data/lib/sastrawi/morphology/disambiguator/disambiguator_prefix_rule40a.rb +2 -2
- data/lib/sastrawi/morphology/disambiguator/disambiguator_prefix_rule40b.rb +2 -2
- data/lib/sastrawi/morphology/disambiguator/disambiguator_prefix_rule41.rb +0 -0
- data/lib/sastrawi/morphology/disambiguator/disambiguator_prefix_rule42.rb +0 -0
- data/lib/sastrawi/morphology/disambiguator/disambiguator_prefix_rule5.rb +2 -2
- data/lib/sastrawi/morphology/disambiguator/disambiguator_prefix_rule6a.rb +0 -0
- data/lib/sastrawi/morphology/disambiguator/disambiguator_prefix_rule6b.rb +1 -1
- data/lib/sastrawi/morphology/disambiguator/disambiguator_prefix_rule7.rb +1 -1
- data/lib/sastrawi/morphology/disambiguator/disambiguator_prefix_rule8.rb +1 -1
- data/lib/sastrawi/morphology/disambiguator/disambiguator_prefix_rule9.rb +2 -2
- data/lib/sastrawi/morphology/invalid_affix_pair_specification.rb +4 -0
- data/lib/sastrawi/stemmer/cache/array_cache.rb +2 -2
- data/lib/sastrawi/stemmer/cached_stemmer.rb +1 -1
- data/lib/sastrawi/stemmer/confix_stripping/precedence_adjustment_specification.rb +5 -0
- data/lib/sastrawi/stemmer/context/context.rb +28 -7
- data/lib/sastrawi/stemmer/context/removal.rb +1 -1
- data/lib/sastrawi/stemmer/context/visitor/dont_stem_short_word.rb +0 -0
- data/lib/sastrawi/stemmer/context/visitor/prefix_disambiguator.rb +2 -2
- data/lib/sastrawi/stemmer/context/visitor/remove_derivational_suffix.rb +10 -1
- data/lib/sastrawi/stemmer/context/visitor/remove_inflectional_particle.rb +9 -1
- data/lib/sastrawi/stemmer/context/visitor/remove_inflectional_possessive_pronoun.rb +9 -1
- data/lib/sastrawi/stemmer/context/visitor/remove_plain_prefix.rb +9 -1
- data/lib/sastrawi/stemmer/context/visitor/visitor_provider.rb +1 -1
- data/lib/sastrawi/stemmer/filter/text_normalizer.rb +0 -0
- data/lib/sastrawi/stemmer/stemmer.rb +31 -15
- data/lib/sastrawi/stemmer/stemmer_factory.rb +5 -1
- data/lib/sastrawi/stop_word_remover/stop_word_remover.rb +5 -2
- data/lib/sastrawi/stop_word_remover/stop_word_remover_factory.rb +102 -130
- data/lib/sastrawi/version.rb +1 -1
- data/sastrawi.gemspec +6 -5
- metadata +22 -19
@@ -1,18 +1,21 @@
|
|
1
1
|
module Sastrawi
|
2
2
|
module StopWordRemover
|
3
3
|
class StopWordRemover
|
4
|
-
|
4
|
+
attr_reader :dictionary
|
5
5
|
|
6
6
|
def initialize(dictionary)
|
7
7
|
@dictionary = dictionary
|
8
8
|
end
|
9
9
|
|
10
|
+
##
|
11
|
+
# Remove stop words
|
12
|
+
|
10
13
|
def remove(text)
|
11
14
|
words = text.split(' ')
|
12
15
|
stop_words = []
|
13
16
|
|
14
17
|
words.each do |word|
|
15
|
-
unless @dictionary.
|
18
|
+
unless @dictionary.contains?(word)
|
16
19
|
stop_words.push(word)
|
17
20
|
end
|
18
21
|
end
|
@@ -1,9 +1,10 @@
|
|
1
1
|
require 'sastrawi/dictionary/array_dictionary'
|
2
|
+
|
2
3
|
require 'sastrawi/stop_word_remover/stop_word_remover'
|
3
4
|
|
4
5
|
module Sastrawi
|
5
6
|
module StopWordRemover
|
6
|
-
|
7
|
+
class StopWordRemoverFactory
|
7
8
|
def create_stop_word_remover
|
8
9
|
stop_words = get_stop_word
|
9
10
|
|
@@ -14,135 +15,106 @@ module Sastrawi
|
|
14
15
|
end
|
15
16
|
|
16
17
|
def get_stop_word
|
17
|
-
stop_words = [
|
18
|
-
|
19
|
-
|
20
|
-
|
21
|
-
|
22
|
-
|
23
|
-
|
24
|
-
|
25
|
-
|
26
|
-
|
27
|
-
|
28
|
-
|
29
|
-
|
30
|
-
|
31
|
-
|
32
|
-
|
33
|
-
|
34
|
-
|
35
|
-
|
36
|
-
|
37
|
-
|
38
|
-
|
39
|
-
|
40
|
-
|
41
|
-
|
42
|
-
|
43
|
-
|
44
|
-
|
45
|
-
|
46
|
-
|
47
|
-
|
48
|
-
|
49
|
-
|
50
|
-
|
51
|
-
|
52
|
-
|
53
|
-
|
54
|
-
|
55
|
-
|
56
|
-
|
57
|
-
|
58
|
-
|
59
|
-
|
60
|
-
|
61
|
-
|
62
|
-
|
63
|
-
|
64
|
-
|
65
|
-
|
66
|
-
|
67
|
-
|
68
|
-
|
69
|
-
|
70
|
-
|
71
|
-
|
72
|
-
|
73
|
-
|
74
|
-
|
75
|
-
|
76
|
-
|
77
|
-
|
78
|
-
|
79
|
-
|
80
|
-
|
81
|
-
|
82
|
-
|
83
|
-
|
84
|
-
|
85
|
-
|
86
|
-
|
87
|
-
|
88
|
-
|
89
|
-
|
90
|
-
|
91
|
-
|
92
|
-
|
93
|
-
|
94
|
-
|
95
|
-
|
96
|
-
|
97
|
-
|
98
|
-
|
99
|
-
|
100
|
-
|
101
|
-
|
102
|
-
|
103
|
-
|
104
|
-
|
105
|
-
|
106
|
-
|
107
|
-
|
108
|
-
|
109
|
-
|
110
|
-
|
111
|
-
|
112
|
-
|
113
|
-
|
114
|
-
|
115
|
-
|
116
|
-
|
117
|
-
'sekadarnya', 'sekali', 'sekali-kali', 'sekalian', 'sekaligus',
|
118
|
-
'sekalipun', 'sekarang', 'sekaranglah', 'sekecil', 'seketika', 'sekiranya',
|
119
|
-
'sekitar', 'sekitarnya', 'sekurang-kurangnya', 'sekurangnya', 'sela',
|
120
|
-
'selain', 'selaku', 'selalu', 'selama', 'selama-lamanya', 'selamanya',
|
121
|
-
'selanjutnya', 'seluruh', 'seluruhnya', 'semacam', 'semakin', 'semampu',
|
122
|
-
'semampunya', 'semasa', 'semasih', 'semata', 'semata-mata', 'semaunya',
|
123
|
-
'sementara', 'semisal', 'semisalnya', 'sempat', 'semua', 'semuanya',
|
124
|
-
'semula', 'sendiri', 'sendirian', 'sendirinya', 'seolah','seolah-olah',
|
125
|
-
'seorang', 'sepanjang', 'sepantasnya', 'sepantasnyalah', 'seperlunya',
|
126
|
-
'seperti', 'sepertinya', 'sepihak', 'sering', 'seringnya', 'serta',
|
127
|
-
'serupa', 'sesaat', 'sesama', 'sesampai', 'sesegera', 'sesekali',
|
128
|
-
'seseorang', 'sesuatu', 'sesuatunya', 'sesudah', 'sesudahnya', 'setelah',
|
129
|
-
'setempat', 'setengah', 'seterusnya', 'setiap', 'setiba', 'setibanya',
|
130
|
-
'setidak-tidaknya', 'setidaknya', 'setinggi', 'seusai', 'sewaktu', 'siap',
|
131
|
-
'siapa', 'siapakah', 'siapapun', 'sini', 'sinilah', 'soal', 'soalnya',
|
132
|
-
'suatu', 'sudah', 'sudahkah', 'sudahlah', 'supaya', 't', 'tadi', 'tadinya',
|
133
|
-
'tahu', 'tak', 'tambah', 'tambahnya', 'tampak', 'tampaknya', 'tandas',
|
134
|
-
'tandasnya', 'tanpa', 'tanya', 'tanyakan', 'tanyanya', 'tapi', 'tegas',
|
135
|
-
'tegasnya', 'telah', 'tempat', 'tentang', 'tentu', 'tentulah', 'tentunya',
|
136
|
-
'tepat', 'terakhir', 'terasa', 'terbanyak', 'terdahulu', 'terdapat',
|
137
|
-
'terdiri', 'terhadap', 'terhadapnya', 'teringat', 'teringat-ingat',
|
138
|
-
'terjadi', 'terjadilah', 'terjadinya', 'terkira', 'terlalu', 'terlebih',
|
139
|
-
'terlihat', 'termasuk', 'ternyata', 'tersampaikan', 'tersebut',
|
140
|
-
'tersebutlah', 'tertentu', 'tertuju', 'terus', 'terutama', 'tetap',
|
141
|
-
'tetapi', 'tiap', 'tiba', 'tiba-tiba', 'tidak', 'tidakkah', 'tidaklah',
|
142
|
-
'tiga', 'toh', 'tuju', 'tunjuk', 'turut', 'tutur', 'tuturnya', 'u', 'ucap',
|
143
|
-
'ucapnya', 'ujar', 'ujarnya', 'umumnya', 'ungkap', 'ungkapnya', 'untuk',
|
144
|
-
'usah', 'usai', 'v', 'w', 'waduh', 'wah', 'wahai', 'waktunya', 'walau',
|
145
|
-
'walaupun', 'wong', 'x', 'y', 'ya', 'yaitu', 'yakin', 'yakni', 'yang', 'z'
|
18
|
+
stop_words = %w[a ada adalah adanya adapun agak agaknya agar akan
|
19
|
+
akankah akhir akhiri akhirnya aku akulah amat amatlah anda andalah
|
20
|
+
antar antara antaranya apa apaan apabila apakah apalagi apatah arti
|
21
|
+
artinya asal asalkan atas atau ataukah ataupun awal awalnya b bagai
|
22
|
+
bagaikan bagaimana bagaimanakah bagaimanapun bagainamakah bagi bagian
|
23
|
+
bahkan bahwa bahwasannya bahwasanya baik baiklah bakal bakalan balik
|
24
|
+
banyak bapak baru bawah beberapa begini beginian beginikah beginilah
|
25
|
+
begitu begitukah begitulah begitupun bekerja belakang belakangan
|
26
|
+
belum belumlah benar benarkah benarlah berada berakhir berakhirlah
|
27
|
+
berakhirnya berapa berapakah berapalah berapapun berarti berawal
|
28
|
+
berbagai berdatangan beri berikan berikut berikutnya berjumlah
|
29
|
+
berkali-kali berkata berkehendak berkeinginan berkenaan berlainan
|
30
|
+
berlalu berlangsung berlebihan bermacam bermacam-macam bermaksud
|
31
|
+
bermula bersama bersama-sama bersiap bersiap-siap bertanya
|
32
|
+
bertanya-tanya berturut berturut-turut bertutur berujar berupa besar
|
33
|
+
betul betulkah biasa biasanya bila bilakah bisa bisakah boleh bolehkah
|
34
|
+
bolehlah buat bukan bukankah bukanlah bukannya bulan bung c cara
|
35
|
+
caranya cukup cukupkah cukuplah cuma d dahulu dalam dan dapat dari
|
36
|
+
daripada datang dekat demi demikian demikianlah dengan depan di dia
|
37
|
+
diakhiri diakhirinya dialah diantara diantaranya diberi diberikan
|
38
|
+
diberikannya dibuat dibuatnya didapat didatangkan digunakan
|
39
|
+
diibaratkan diibaratkannya diingat diingatkan diinginkan dijawab
|
40
|
+
dijelaskan dijelaskannya dikarenakan dikatakan dikatakannya dikerjakan
|
41
|
+
diketahui diketahuinya dikira dilakukan dilalui dilihat dimaksud
|
42
|
+
dimaksudkan dimaksudkannya dimaksudnya diminta dimintai dimisalkan
|
43
|
+
dimulai dimulailah dimulainya dimungkinkan dini dipastikan diperbuat
|
44
|
+
diperbuatnya dipergunakan diperkirakan diperlihatkan diperlukan
|
45
|
+
diperlukannya dipersoalkan dipertanyakan dipunyai diri dirinya
|
46
|
+
disampaikan disebut disebutkan disebutkannya disini disinilah
|
47
|
+
ditambahkan ditandaskan ditanya ditanyai ditanyakan ditegaskan
|
48
|
+
ditujukan ditunjuk ditunjuki ditunjukkan ditunjukkannya ditunjuknya
|
49
|
+
dituturkan dituturkannya diucapkan diucapkannya diungkapkan dong dua
|
50
|
+
dulu e empat enak enggak enggaknya entah entahlah f g guna gunakan h
|
51
|
+
hadap hai hal halo hallo hampir hanya hanyalah hari harus haruslah
|
52
|
+
harusnya helo hello hendak hendaklah hendaknya hingga i ia ialah
|
53
|
+
ibarat ibaratkan ibaratnya ibu ikut ingat ingat-ingat ingin inginkah
|
54
|
+
inginkan ini inikah inilah itu itukah itulah j jadi jadilah jadinya
|
55
|
+
jangan jangankan janganlah jauh jawab jawaban jawabnya jelas jelaskan
|
56
|
+
jelaslah jelasnya jika jikalau juga jumlah jumlahnya justru k kadar
|
57
|
+
kala kalau kalaulah kalaupun kali kalian kami kamilah kamu kamulah kan
|
58
|
+
kapan kapankah kapanpun karena karenanya kasus kata katakan katakanlah
|
59
|
+
katanya ke keadaan kebetulan kecil kedua keduanya keinginan kelamaan
|
60
|
+
kelihatan kelihatannya kelima keluar kembali kemudian kemungkinan
|
61
|
+
kemungkinannya kena kenapa kepada kepadanya kerja kesampaian
|
62
|
+
keseluruhan keseluruhannya keterlaluan ketika khusus khususnya kini
|
63
|
+
kinilah kira kira-kira kiranya kita kitalah kok kurang l lagi lagian
|
64
|
+
lah lain lainnya laku lalu lama lamanya langsung lanjut lanjutnya
|
65
|
+
lebih lewat lihat lima luar m macam maka makanya makin maksud malah
|
66
|
+
malahan mampu mampukah mana manakala manalagi masa masalah masalahnya
|
67
|
+
masih masihkah masing masing-masing masuk mata mau maupun melainkan
|
68
|
+
melakukan melalui melihat melihatnya memang memastikan memberi
|
69
|
+
memberikan membuat memerlukan memihak meminta memintakan memisalkan
|
70
|
+
memperbuat mempergunakan memperkirakan memperlihatkan mempersiapkan
|
71
|
+
mempersoalkan mempertanyakan mempunyai memulai memungkinkan menaiki
|
72
|
+
menambahkan menandaskan menanti menanti-nanti menantikan menanya
|
73
|
+
menanyai menanyakan mendapat mendapatkan mendatang mendatangi
|
74
|
+
mendatangkan menegaskan mengakhiri mengapa mengatakan mengatakannya
|
75
|
+
mengenai mengerjakan mengetahui menggunakan menghendaki mengibaratkan
|
76
|
+
mengibaratkannya mengingat mengingatkan menginginkan mengira
|
77
|
+
mengucapkan mengucapkannya mengungkapkan menjadi menjawab menjelaskan
|
78
|
+
menuju menunjuk menunjuki menunjukkan menunjuknya menurut menuturkan
|
79
|
+
menyampaikan menyangkut menyatakan menyebutkan menyeluruh menyiapkan
|
80
|
+
merasa mereka merekalah merupakan meski meskipun meyakini meyakinkan
|
81
|
+
minta mirip misal misalkan misalnya mohon mula mulai mulailah mulanya
|
82
|
+
mungkin mungkinkah n nah naik namun nanti nantinya nya nyaris nyata
|
83
|
+
nyatanya o oleh olehnya orang p pada padahal padanya pak paling
|
84
|
+
panjang pantas para pasti pastilah penting pentingnya per percuma
|
85
|
+
perlu perlukah perlunya pernah persoalan pertama pertama-tama
|
86
|
+
pertanyaan pertanyakan pihak pihaknya pukul pula pun punya q r rasa
|
87
|
+
rasanya rupa rupanya s saat saatnya saja sajalah salam saling sama
|
88
|
+
sama-sama sambil sampai sampai-sampai sampaikan sana sangat sangatlah
|
89
|
+
sangkut satu saya sayalah se sebab sebabnya sebagai sebagaimana
|
90
|
+
sebagainya sebagian sebaik sebaik-baiknya sebaiknya sebaliknya
|
91
|
+
sebanyak sebegini sebegitu sebelum sebelumnya sebenarnya seberapa
|
92
|
+
sebesar sebetulnya sebisanya sebuah sebut sebutlah sebutnya secara
|
93
|
+
secukupnya sedang sedangkan sedemikian sedikit sedikitnya seenaknya
|
94
|
+
segala segalanya segera seharusnya sehingga seingat sejak sejauh
|
95
|
+
sejenak sejumlah sekadar sekadarnya sekali sekali-kali sekalian
|
96
|
+
sekaligus sekalipun sekarang sekaranglah sekecil seketika sekiranya
|
97
|
+
sekitar sekitarnya sekurang-kurangnya sekurangnya sela selain selaku
|
98
|
+
selalu selama selama-lamanya selamanya selanjutnya seluruh seluruhnya
|
99
|
+
semacam semakin semampu semampunya semasa semasih semata semata-mata
|
100
|
+
semaunya sementara semisal semisalnya sempat semua semuanya semula
|
101
|
+
sendiri sendirian sendirinya seolah seolah-olah seorang sepanjang
|
102
|
+
sepantasnya sepantasnyalah seperlunya seperti sepertinya sepihak
|
103
|
+
sering seringnya serta serupa sesaat sesama sesampai sesegera sesekali
|
104
|
+
seseorang sesuatu sesuatunya sesudah sesudahnya setelah setempat
|
105
|
+
setengah seterusnya setiap setiba setibanya setidak-tidaknya
|
106
|
+
setidaknya setinggi seusai sewaktu siap siapa siapakah siapapun sini
|
107
|
+
sinilah soal soalnya suatu sudah sudahkah sudahlah supaya t tadi
|
108
|
+
tadinya tahu tak tambah tambahnya tampak tampaknya tandas tandasnya
|
109
|
+
tanpa tanya tanyakan tanyanya tapi tegas tegasnya telah tempat tentang
|
110
|
+
tentu tentulah tentunya tepat terakhir terasa terbanyak terdahulu
|
111
|
+
terdapat terdiri terhadap terhadapnya teringat teringat-ingat terjadi
|
112
|
+
terjadilah terjadinya terkira terlalu terlebih terlihat termasuk
|
113
|
+
ternyata tersampaikan tersebut tersebutlah tertentu tertuju terus
|
114
|
+
terutama tetap tetapi tiap tiba tiba-tiba tidak tidakkah tidaklah tiga
|
115
|
+
toh tuju tunjuk turut tutur tuturnya u ucap ucapnya ujar ujarnya
|
116
|
+
umumnya ungkap ungkapnya untuk usah usai v w waduh wah wahai waktunya
|
117
|
+
walau walaupun wong x y ya yaitu yakin yakni yang z
|
146
118
|
]
|
147
119
|
|
148
120
|
stop_words
|
data/lib/sastrawi/version.rb
CHANGED
data/sastrawi.gemspec
CHANGED
@@ -6,6 +6,7 @@ require 'sastrawi/version'
|
|
6
6
|
Gem::Specification.new do |spec|
|
7
7
|
spec.name = "sastrawi"
|
8
8
|
spec.version = Sastrawi::VERSION
|
9
|
+
spec.required_ruby_version = ">= 2.3.8"
|
9
10
|
spec.authors = ["Andrias Meisyal"]
|
10
11
|
spec.email = ["andriasonline@gmail.com"]
|
11
12
|
|
@@ -15,11 +16,11 @@ Gem::Specification.new do |spec|
|
|
15
16
|
spec.license = "MIT"
|
16
17
|
|
17
18
|
spec.files = `git ls-files -z`.split("\x0").reject { |f| f.match(%r{^(test|spec|features)/}) }
|
18
|
-
spec.bindir = "
|
19
|
-
spec.executables = spec.files.grep(%r{^
|
19
|
+
spec.bindir = "bin"
|
20
|
+
spec.executables = spec.files.grep(%r{^bin/}) { |f| File.basename(f) }
|
20
21
|
spec.require_paths = ["lib"]
|
21
22
|
|
22
|
-
spec.add_development_dependency "bundler", "~>
|
23
|
-
spec.add_development_dependency "rake", "~>
|
24
|
-
spec.add_development_dependency "rspec", "~> 3.0"
|
23
|
+
spec.add_development_dependency "bundler", "~> 2.2.14"
|
24
|
+
spec.add_development_dependency "rake", "~> 13.0.1"
|
25
|
+
spec.add_development_dependency "rspec", "~> 3.10.0"
|
25
26
|
end
|
metadata
CHANGED
@@ -1,14 +1,14 @@
|
|
1
1
|
--- !ruby/object:Gem::Specification
|
2
2
|
name: sastrawi
|
3
3
|
version: !ruby/object:Gem::Version
|
4
|
-
version: 0.1.
|
4
|
+
version: 0.1.4
|
5
5
|
platform: ruby
|
6
6
|
authors:
|
7
7
|
- Andrias Meisyal
|
8
|
-
autorequire:
|
9
|
-
bindir:
|
8
|
+
autorequire:
|
9
|
+
bindir: bin
|
10
10
|
cert_chain: []
|
11
|
-
date:
|
11
|
+
date: 2021-04-10 00:00:00.000000000 Z
|
12
12
|
dependencies:
|
13
13
|
- !ruby/object:Gem::Dependency
|
14
14
|
name: bundler
|
@@ -16,56 +16,60 @@ dependencies:
|
|
16
16
|
requirements:
|
17
17
|
- - "~>"
|
18
18
|
- !ruby/object:Gem::Version
|
19
|
-
version:
|
19
|
+
version: 2.2.14
|
20
20
|
type: :development
|
21
21
|
prerelease: false
|
22
22
|
version_requirements: !ruby/object:Gem::Requirement
|
23
23
|
requirements:
|
24
24
|
- - "~>"
|
25
25
|
- !ruby/object:Gem::Version
|
26
|
-
version:
|
26
|
+
version: 2.2.14
|
27
27
|
- !ruby/object:Gem::Dependency
|
28
28
|
name: rake
|
29
29
|
requirement: !ruby/object:Gem::Requirement
|
30
30
|
requirements:
|
31
31
|
- - "~>"
|
32
32
|
- !ruby/object:Gem::Version
|
33
|
-
version:
|
33
|
+
version: 13.0.1
|
34
34
|
type: :development
|
35
35
|
prerelease: false
|
36
36
|
version_requirements: !ruby/object:Gem::Requirement
|
37
37
|
requirements:
|
38
38
|
- - "~>"
|
39
39
|
- !ruby/object:Gem::Version
|
40
|
-
version:
|
40
|
+
version: 13.0.1
|
41
41
|
- !ruby/object:Gem::Dependency
|
42
42
|
name: rspec
|
43
43
|
requirement: !ruby/object:Gem::Requirement
|
44
44
|
requirements:
|
45
45
|
- - "~>"
|
46
46
|
- !ruby/object:Gem::Version
|
47
|
-
version:
|
47
|
+
version: 3.10.0
|
48
48
|
type: :development
|
49
49
|
prerelease: false
|
50
50
|
version_requirements: !ruby/object:Gem::Requirement
|
51
51
|
requirements:
|
52
52
|
- - "~>"
|
53
53
|
- !ruby/object:Gem::Version
|
54
|
-
version:
|
54
|
+
version: 3.10.0
|
55
55
|
description: A Ruby library which allows you to stem words in Bahasa Indonesia.
|
56
56
|
email:
|
57
57
|
- andriasonline@gmail.com
|
58
|
-
executables:
|
58
|
+
executables:
|
59
|
+
- sastrawi
|
59
60
|
extensions: []
|
60
61
|
extra_rdoc_files: []
|
61
62
|
files:
|
62
63
|
- ".gitignore"
|
63
64
|
- ".travis.yml"
|
65
|
+
- CONTRIBUTING.md
|
64
66
|
- Gemfile
|
65
67
|
- LICENSE.txt
|
66
68
|
- README.md
|
67
69
|
- Rakefile
|
68
|
-
-
|
70
|
+
- _config.yml
|
71
|
+
- bin/sastrawi
|
72
|
+
- data/base-word.txt
|
69
73
|
- lib/sastrawi.rb
|
70
74
|
- lib/sastrawi/dictionary/array_dictionary.rb
|
71
75
|
- lib/sastrawi/morphology/disambiguator/disambiguator_prefix_rule10.rb
|
@@ -150,7 +154,7 @@ homepage: https://github.com/meisyal/sastrawi-ruby
|
|
150
154
|
licenses:
|
151
155
|
- MIT
|
152
156
|
metadata: {}
|
153
|
-
post_install_message:
|
157
|
+
post_install_message:
|
154
158
|
rdoc_options: []
|
155
159
|
require_paths:
|
156
160
|
- lib
|
@@ -158,16 +162,15 @@ required_ruby_version: !ruby/object:Gem::Requirement
|
|
158
162
|
requirements:
|
159
163
|
- - ">="
|
160
164
|
- !ruby/object:Gem::Version
|
161
|
-
version:
|
165
|
+
version: 2.3.8
|
162
166
|
required_rubygems_version: !ruby/object:Gem::Requirement
|
163
167
|
requirements:
|
164
|
-
- - "
|
168
|
+
- - ">="
|
165
169
|
- !ruby/object:Gem::Version
|
166
|
-
version:
|
170
|
+
version: '0'
|
167
171
|
requirements: []
|
168
|
-
|
169
|
-
|
170
|
-
signing_key:
|
172
|
+
rubygems_version: 3.2.13
|
173
|
+
signing_key:
|
171
174
|
specification_version: 4
|
172
175
|
summary: Ruby bindings for Sastrawi
|
173
176
|
test_files: []
|