faker-okinawa 0.1.0
Sign up to get free protection for your applications and to get access to all the features.
- checksums.yaml +7 -0
- data/.gitignore +9 -0
- data/CODE_OF_CONDUCT.md +49 -0
- data/Gemfile +4 -0
- data/LICENSE.txt +21 -0
- data/README.md +66 -0
- data/Rakefile +2 -0
- data/bin/console +14 -0
- data/bin/setup +8 -0
- data/faker-okinawa.gemspec +23 -0
- data/lib/faker/okinawa.rb +14 -0
- data/lib/faker/okinawa/address.rb +35 -0
- data/lib/faker/okinawa/awamori.rb +14 -0
- data/lib/faker/okinawa/base.rb +14 -0
- data/lib/faker/okinawa/fish.rb +14 -0
- data/lib/faker/okinawa/food.rb +14 -0
- data/lib/faker/okinawa/name.rb +14 -0
- data/lib/faker/okinawa/odic.rb +40 -0
- data/lib/faker/okinawa/school.rb +14 -0
- data/lib/faker/okinawa/version.rb +5 -0
- data/o-dic/address.dic +1068 -0
- data/o-dic/amami.dic +69 -0
- data/o-dic/awamori.dic +809 -0
- data/o-dic/base.dic +63 -0
- data/o-dic/bin-dic/ATOK.zip +0 -0
- data/o-dic/bin-dic/Kotoeri.dmg +0 -0
- data/o-dic/bin-dic/MSIME.zip +0 -0
- data/o-dic/bin-dic/MSIME2000.zip +0 -0
- data/o-dic/bin-dic/MSIME2002.zip +0 -0
- data/o-dic/bin-dic/MSIME2003.zip +0 -0
- data/o-dic/bin-dic/MSIME2007.zip +0 -0
- data/o-dic/bin-dic/VJEDelta40.zip +0 -0
- data/o-dic/bin-dic/anthydic20090901.tar.bz2 +0 -0
- data/o-dic/bin-dic/cannadic.tar.bz2 +0 -0
- data/o-dic/bin-dic/cannadic20030407.tar.bz2 +0 -0
- data/o-dic/bin-dic/cannadic20051104.tar.bz2 +0 -0
- data/o-dic/bin-dic/google-20111218.zip +0 -0
- data/o-dic/bus.dic +216 -0
- data/o-dic/city.dic +209 -0
- data/o-dic/doc/History.doc +138 -0
- data/o-dic/doc/README.1ST +79 -0
- data/o-dic/doc/format.txt +169 -0
- data/o-dic/food.dic +524 -0
- data/o-dic/geo.dic +815 -0
- data/o-dic/history.dic +1078 -0
- data/o-dic/island.dic +354 -0
- data/o-dic/misc.dic +1166 -0
- data/o-dic/name.dic +1039 -0
- data/o-dic/park.dic +535 -0
- data/o-dic/sakana.dic +160 -0
- data/o-dic/school.dic +1068 -0
- data/o-dic/script/ODIC.pm +98 -0
- data/o-dic/script/ccount.pl +111 -0
- data/o-dic/script/geta_checker.sh +29 -0
- data/o-dic/script/oki2atk.pl +192 -0
- data/o-dic/script/oki2canna.pl +131 -0
- data/o-dic/script/oki2cha.pl +154 -0
- data/o-dic/script/oki2jis.pl +167 -0
- data/o-dic/script/oki2kotoeri.pl +127 -0
- data/o-dic/script/oki2mozc.pl +156 -0
- data/o-dic/script/oki2msime.pl +136 -0
- data/o-dic/script/oki2osxjapaneseim.pl +168 -0
- data/o-dic/script/oki2vje.pl +138 -0
- data/o-dic/script/wcount.pl +114 -0
- metadata +135 -0
@@ -0,0 +1,154 @@
|
|
1
|
+
#!/usr/bin/perl
|
2
|
+
#
|
3
|
+
# oki2cha.pl - 沖縄辞書のファイルを茶筌で使える形式のテキストに変換する
|
4
|
+
#
|
5
|
+
# $Id: oki2cha.pl,v 1.3 2003/04/25 06:15:56 void Exp $
|
6
|
+
#
|
7
|
+
# このスクリプトを使って、以下のように「okinawa.dic」を生成してください。
|
8
|
+
# $ cat ../*.dic | ./oki2cha.pl > okinawa.dic
|
9
|
+
# $ /usr/local/libexec/chasen/makeint okinawa.dic > okinawa.txt
|
10
|
+
# $ /usr/local/libexec/chasen/sortdic okinawa.txt > okinawa.int
|
11
|
+
# $ /usr/local/libexec/chasen/pattool -F okinawa
|
12
|
+
# $ rm okinawa.txt
|
13
|
+
|
14
|
+
require 5.6.0;
|
15
|
+
use FindBin;
|
16
|
+
use lib $FindBin::Bin; # For search scripts/ODIC.pm
|
17
|
+
require 'ODIC.pm';
|
18
|
+
use strict;
|
19
|
+
use Getopt::Long qw(:config posix_default no_ignore_case gnu_compat);
|
20
|
+
|
21
|
+
our $phonate;
|
22
|
+
our $word;
|
23
|
+
our $class;
|
24
|
+
|
25
|
+
my $help_only;
|
26
|
+
my $skip_geta;
|
27
|
+
|
28
|
+
GetOptions(
|
29
|
+
'help|h' => \$help_only,
|
30
|
+
'skip-geta|g' => \$skip_geta
|
31
|
+
);
|
32
|
+
if (defined($help_only)) {
|
33
|
+
print STDERR "usage: $0 [--help|-h] [--skip-geta|-g]\n";
|
34
|
+
exit 1;
|
35
|
+
}
|
36
|
+
|
37
|
+
while (<>) {
|
38
|
+
# JIS X 0208 に含まれていない文字を含む行を読み飛ばす
|
39
|
+
# 読み飛ばしにはコメントに「〓あり」マーカーが必要
|
40
|
+
next if (defined($skip_geta) && /〓あり/);
|
41
|
+
|
42
|
+
next if (/@@@/); # @@@のある行は読み飛ばす。
|
43
|
+
s/#.*$//; # `#'以降を取り去る
|
44
|
+
next if (/^\s*$/); # その結果空行になった行は読み飛ばす。
|
45
|
+
if (/(\S+)\s+(\S+)\s+(\S+)/) {
|
46
|
+
$phonate = $1; # 読み
|
47
|
+
$word = $2; # 単語
|
48
|
+
$class = $3; # 品詞
|
49
|
+
ODIC::check_phonate($phonate);
|
50
|
+
ODIC::check_word($word);
|
51
|
+
&convert_class;
|
52
|
+
}
|
53
|
+
else {
|
54
|
+
print STDERR "Error: $.: too few field number `$_'\n";
|
55
|
+
print "$_";
|
56
|
+
}
|
57
|
+
}
|
58
|
+
&version;
|
59
|
+
exit 0;
|
60
|
+
|
61
|
+
|
62
|
+
sub convert_class {
|
63
|
+
if ($class eq "普通名詞") {
|
64
|
+
print ODIC::to_eucjp("(品詞 (名詞 一般)) ((見出し語 ($word 2000)) (読み $phonate))\n");
|
65
|
+
}
|
66
|
+
elsif ($class eq "サ変名詞") {
|
67
|
+
print ODIC::to_eucjp("(品詞 (名詞 サ変接続)) ((見出し語 ($word 2000)) (読み $phonate))\n");
|
68
|
+
}
|
69
|
+
elsif ($class eq "形動名詞") {
|
70
|
+
print ODIC::to_eucjp("(品詞 (名詞 形容動詞語幹)) ((見出し語 ($word 2000)) (読み $phonate))\n");
|
71
|
+
}
|
72
|
+
elsif ($class eq "姓") {
|
73
|
+
print ODIC::to_eucjp("(品詞 (名詞 固有名詞 人名 姓)) ((見出し語 ($word 1000)) (読み $phonate))\n");
|
74
|
+
}
|
75
|
+
elsif ($class eq "名") {
|
76
|
+
print ODIC::to_eucjp("(品詞 (名詞 固有名詞 人名 名)) ((見出し語 ($word 2000)) (読み $phonate))\n");
|
77
|
+
}
|
78
|
+
elsif ($class eq "その他の人名") {
|
79
|
+
print ODIC::to_eucjp("(品詞 (名詞 固有名詞 人名 一般)) ((見出し語 ($word 2000)) (読み $phonate))\n");
|
80
|
+
}
|
81
|
+
elsif ($class eq "単純地名") {
|
82
|
+
print ODIC::to_eucjp("(品詞 (名詞 固有名詞 地域 一般)) ((見出し語 ($word 2000)) (読み $phonate))\n");
|
83
|
+
}
|
84
|
+
elsif ($class eq "接尾語付き地名") {
|
85
|
+
print ODIC::to_eucjp("(品詞 (名詞 固有名詞 地域 一般)) ((見出し語 ($word 2000)) (読み $phonate))\n");
|
86
|
+
}
|
87
|
+
elsif ($class eq "組織名") {
|
88
|
+
print ODIC::to_eucjp("(品詞 (名詞 固有名詞 組織)) ((見出し語 ($word 3000)) (読み $phonate))\n");
|
89
|
+
}
|
90
|
+
elsif ($class eq "その他固有名詞") {
|
91
|
+
print ODIC::to_eucjp("(品詞 (名詞 固有名詞 一般)) ((見出し語 ($word 2000)) (読み $phonate))\n");
|
92
|
+
}
|
93
|
+
elsif ($class eq "副詞") {
|
94
|
+
print ODIC::to_eucjp("(品詞 (副詞 一般)) ((見出し語 ($word 2000)) (読み $phonate))\n");
|
95
|
+
}
|
96
|
+
elsif ($class eq "接続詞") {
|
97
|
+
print ODIC::to_eucjp("(品詞 (接続詞)) ((見出し語 ($word 2000)) (読み $phonate))\n");
|
98
|
+
}
|
99
|
+
elsif ($class eq "感動詞") {
|
100
|
+
print ODIC::to_eucjp("(品詞 (感動詞)) ((見出し語 ($word 2000)) (読み $phonate))\n");
|
101
|
+
}
|
102
|
+
elsif ($class eq "形容詞") {
|
103
|
+
print ODIC::to_eucjp("(品詞 (形容詞 自立)) ((見出し語 ($word 2000)) (読み $phonate))\n");
|
104
|
+
}
|
105
|
+
elsif ($class eq "形容動詞") {
|
106
|
+
print ODIC::to_eucjp("(品詞 (名詞 形容動詞語幹)) ((見出し語 ($word 2000)) (読み $phonate))\n");
|
107
|
+
}
|
108
|
+
elsif ($class eq "接頭語") { # !!!
|
109
|
+
print ODIC::to_eucjp("(品詞 (接頭詞 名詞接続)) ((見出し語 ($word 2000)) (読み $phonate))\n");
|
110
|
+
}
|
111
|
+
elsif ($class eq "数字列接頭語") {
|
112
|
+
print ODIC::to_eucjp("(品詞 (接頭詞 数接続)) ((見出し語 ($word 2000)) (読み $phonate))\n");
|
113
|
+
}
|
114
|
+
elsif ($class eq "接尾語") {
|
115
|
+
print ODIC::to_eucjp("(品詞 (名詞 接尾 一般)) ((見出し語 ($word 2000)) (読み $phonate))\n");
|
116
|
+
}
|
117
|
+
elsif ($class eq "人名接尾語") {
|
118
|
+
print ODIC::to_eucjp("(品詞 (名詞 接尾 人名)) ((見出し語 ($word 2000)) (読み $phonate))\n");
|
119
|
+
}
|
120
|
+
elsif ($class eq "地名接尾語") {
|
121
|
+
print ODIC::to_eucjp("(品詞 (名詞 接尾 地域)) ((見出し語 ($word 2000)) (読み $phonate))\n");
|
122
|
+
}
|
123
|
+
elsif ($class eq "組織名接尾語") {
|
124
|
+
print ODIC::to_eucjp("(品詞 (名詞 接尾 一般)) ((見出し語 ($word 2000)) (読み $phonate))\n");
|
125
|
+
}
|
126
|
+
elsif ($class eq "数字列接尾語") {
|
127
|
+
print ODIC::to_eucjp("(品詞 (名詞 接尾 助数詞)) ((見出し語 ($word 2000)) (読み $phonate))\n");
|
128
|
+
}
|
129
|
+
elsif ($class eq "成句") {
|
130
|
+
print ODIC::to_eucjp("(品詞 (名詞 引用文字列)) ((見出し語 ($word 2000)) (読み $phonate))\n");
|
131
|
+
}
|
132
|
+
elsif ($class eq "無品詞") {
|
133
|
+
print ODIC::to_eucjp("(品詞 (名詞 引用文字列)) ((見出し語 ($word 2000)) (読み $phonate))\n");
|
134
|
+
}
|
135
|
+
else {
|
136
|
+
print STDERR "Error: $.: unknown class `$class': $phonate\t$word\n";
|
137
|
+
print ODIC::to_eucjp("$phonate,$word,$class\n");
|
138
|
+
}
|
139
|
+
}
|
140
|
+
|
141
|
+
|
142
|
+
sub version {
|
143
|
+
my $sec;
|
144
|
+
my $min;
|
145
|
+
my $hour;
|
146
|
+
my $mday;
|
147
|
+
my $mon;
|
148
|
+
my $year;
|
149
|
+
|
150
|
+
($sec, $min, $hour, $mday, $mon, $year) = localtime(time());
|
151
|
+
$year += 1900;
|
152
|
+
$mon++;
|
153
|
+
print ODIC::to_eucjp("(品詞 (名詞 引用文字列)) ((見出し語 ($year/$mon/$mday沖縄辞書の日付け 2000)) (読み おきなわじしょのひづけ))\n");
|
154
|
+
}
|
@@ -0,0 +1,167 @@
|
|
1
|
+
#!/usr/bin/perl
|
2
|
+
#
|
3
|
+
# oki2jis.pl - 沖縄辞書のファイルを JIS X 4062 の形式のテキストに変換する
|
4
|
+
#
|
5
|
+
# $Id: oki2jis.pl,v 1.7 2006/09/01 18:20:06 void Exp $
|
6
|
+
#
|
7
|
+
# このスクリプトを使って、以下のように「okinawa.txt」を生成してください。
|
8
|
+
# $ cat ../*.dic | script/oki2jis.pl | sort -u | nkf -s > okinawa.txt
|
9
|
+
# 後半のnkfのオプションは先方の都合に合わせて変更してください。
|
10
|
+
|
11
|
+
require 5.6.0;
|
12
|
+
use FindBin;
|
13
|
+
use lib $FindBin::Bin; # For search scripts/ODIC.pm
|
14
|
+
require 'ODIC.pm';
|
15
|
+
use strict;
|
16
|
+
use Getopt::Long qw(:config posix_default no_ignore_case gnu_compat);
|
17
|
+
|
18
|
+
our $phonate;
|
19
|
+
our $word;
|
20
|
+
our $class;
|
21
|
+
|
22
|
+
my $help_only;
|
23
|
+
my $skip_geta;
|
24
|
+
|
25
|
+
GetOptions(
|
26
|
+
'help|h' => \$help_only,
|
27
|
+
'skip-geta|g' => \$skip_geta
|
28
|
+
);
|
29
|
+
if (defined($help_only)) {
|
30
|
+
print STDERR "usage: $0 [--help|-h] [--skip-geta|-g]\n";
|
31
|
+
exit 1;
|
32
|
+
}
|
33
|
+
|
34
|
+
&header;
|
35
|
+
while (<>) {
|
36
|
+
# JIS X 0208 に含まれていない文字を含む行を読み飛ばす
|
37
|
+
# 読み飛ばしにはコメントに「〓あり」マーカーが必要
|
38
|
+
next if (defined($skip_geta) && /〓あり/);
|
39
|
+
|
40
|
+
s/#.*$//; # `#'以降を取り去る
|
41
|
+
next if (/^\s*$/); # その結果空行になった行は読み飛ばす。
|
42
|
+
if (/(\S+)\s+(\S+)\s+(\S+)/) {
|
43
|
+
$phonate = $1; # 読み
|
44
|
+
$word = $2; # 単語
|
45
|
+
$class = $3; # 品詞
|
46
|
+
ODIC::check_phonate($phonate);
|
47
|
+
ODIC::check_word($word);
|
48
|
+
&convert_class;
|
49
|
+
}
|
50
|
+
else {
|
51
|
+
print STDERR "Error: $.: too few field number `$_'\n";
|
52
|
+
print "$_";
|
53
|
+
}
|
54
|
+
}
|
55
|
+
&version;
|
56
|
+
exit 0;
|
57
|
+
|
58
|
+
|
59
|
+
sub convert_class {
|
60
|
+
if ($class eq "普通名詞") {
|
61
|
+
print "$phonate,$word,$class\n"; # !!!
|
62
|
+
}
|
63
|
+
elsif ($class eq "サ変名詞") {
|
64
|
+
print "$phonate,$word,$class\n";
|
65
|
+
}
|
66
|
+
elsif ($class eq "形動名詞") {
|
67
|
+
print "$phonate,$word,$class\n";
|
68
|
+
}
|
69
|
+
elsif ($class eq "姓") {
|
70
|
+
print "$phonate,$word,$class\n";
|
71
|
+
}
|
72
|
+
elsif ($class eq "名") {
|
73
|
+
print "$phonate,$word,$class\n";
|
74
|
+
}
|
75
|
+
elsif ($class eq "その他の人名") {
|
76
|
+
print "$phonate,$word,$class\n";
|
77
|
+
}
|
78
|
+
elsif ($class eq "単純地名") {
|
79
|
+
print "$phonate,$word,$class\n";
|
80
|
+
}
|
81
|
+
elsif ($class eq "接尾語付き地名") {
|
82
|
+
print "$phonate,$word,$class\n";
|
83
|
+
}
|
84
|
+
elsif ($class eq "組織名") {
|
85
|
+
print "$phonate,$word,$class\n"; # !!!
|
86
|
+
}
|
87
|
+
elsif ($class eq "その他固有名詞") {
|
88
|
+
print "$phonate,$word,その他の固有名詞\n";
|
89
|
+
}
|
90
|
+
elsif ($class eq "副詞") {
|
91
|
+
print "$phonate,$word,$class\n";
|
92
|
+
}
|
93
|
+
elsif ($class eq "接続詞") {
|
94
|
+
print "$phonate,$word,$class\n";
|
95
|
+
}
|
96
|
+
elsif ($class eq "感動詞") {
|
97
|
+
print "$phonate,$word,$class\n";
|
98
|
+
}
|
99
|
+
elsif ($class eq "形容詞") {
|
100
|
+
print "$phonate,$word,$class\n";
|
101
|
+
}
|
102
|
+
elsif ($class eq "形容動詞") {
|
103
|
+
print "$phonate,$word,$class\n";
|
104
|
+
}
|
105
|
+
elsif ($class eq "接頭語") { # !!!
|
106
|
+
print "$phonate,$word,$class\n";
|
107
|
+
}
|
108
|
+
elsif ($class eq "数字列接頭語") {
|
109
|
+
print "$phonate,$word,$class\n";
|
110
|
+
}
|
111
|
+
elsif ($class eq "接尾語") {
|
112
|
+
print "$phonate,$word,$class\n";
|
113
|
+
}
|
114
|
+
elsif ($class eq "人名接尾語") {
|
115
|
+
print "$phonate,$word,$class\n";
|
116
|
+
}
|
117
|
+
elsif ($class eq "地名接尾語") {
|
118
|
+
print "$phonate,$word,$class\n";
|
119
|
+
}
|
120
|
+
elsif ($class eq "組織名接尾語") {
|
121
|
+
print "$phonate,$word,$class\n";
|
122
|
+
}
|
123
|
+
elsif ($class eq "数字列接尾語") {
|
124
|
+
print "$phonate,$word,$class\n";
|
125
|
+
}
|
126
|
+
elsif ($class eq "成句") {
|
127
|
+
print "$phonate,$word,$class\n"; # !!!
|
128
|
+
}
|
129
|
+
elsif ($class eq "無品詞") {
|
130
|
+
print "$phonate,$word,$class\n";
|
131
|
+
}
|
132
|
+
else {
|
133
|
+
print STDERR "Error: $.: unknown class `$class': $phonate\t$word\n";
|
134
|
+
print "$phonate,$word,$class\n";
|
135
|
+
}
|
136
|
+
}
|
137
|
+
|
138
|
+
|
139
|
+
sub header {
|
140
|
+
my($year, $mon, $mday);
|
141
|
+
my($hour, $min, $sec);
|
142
|
+
|
143
|
+
($sec, $min, $hour, $mday, $mon, $year) = localtime(time());
|
144
|
+
$year += 1900;
|
145
|
+
$mon++;
|
146
|
+
print ",,\"適合規格=JIS X 4062:1998\"\n";
|
147
|
+
print ",,\"表題=沖縄辞書\"\n";
|
148
|
+
print ",,\"分野=琉球、沖縄\"\n";
|
149
|
+
print ",,\"版=第$year/$mon/$mday版\"\n";
|
150
|
+
print ",,\"編者=沖縄辞書プロジェクト\"\n";
|
151
|
+
print ",,\"作成日=$year-$mon-$mday\"\n";
|
152
|
+
}
|
153
|
+
|
154
|
+
|
155
|
+
sub version {
|
156
|
+
my $sec;
|
157
|
+
my $min;
|
158
|
+
my $hour;
|
159
|
+
my $mday;
|
160
|
+
my $mon;
|
161
|
+
my $year;
|
162
|
+
|
163
|
+
($sec, $min, $hour, $mday, $mon, $year) = localtime(time());
|
164
|
+
$year += 1900;
|
165
|
+
$mon++;
|
166
|
+
print "おきなわじしょのひづけ,$year/$mon/$mday(沖縄辞書の日付け),無品詞\n";
|
167
|
+
}
|
@@ -0,0 +1,127 @@
|
|
1
|
+
#!/usr/bin/perl
|
2
|
+
#
|
3
|
+
# oki2kotoeri.pl - 沖縄辞書のファイルをことえり3.1で読み込める形式のテキストに変換
|
4
|
+
#
|
5
|
+
# $Id: oki2kotoeri.pl,v 1.8 2006/09/01 18:20:06 void Exp $
|
6
|
+
#
|
7
|
+
# このスクリプトを使って、以下のように「okinawa.txt」を生成してください。
|
8
|
+
# $ cat *.dic | script/oki2kotoeri.pl | sort -u > okinawa.txt
|
9
|
+
# 読みは20文字以内、単語は32文字以内です。
|
10
|
+
#
|
11
|
+
# メニューバーのことえりメニューから[単語登録/辞書編集...]を選び、
|
12
|
+
# 「ことえり単語登録」ダイアログを出す。
|
13
|
+
# メニューバーの[辞書]メニューの[新規ユーザ辞書の作成...]を選び
|
14
|
+
# 別名で保存欄に『okinawa.dic』と記入。
|
15
|
+
# このときに[場所]が『Dictionaries』になっていることを確認して、[保存]ボタンを押す。
|
16
|
+
# (すでに同名のファイルがある場合は別のディレクトリーにするのではなく、
|
17
|
+
# 別のファイル名にしておいてあとでなんとかする。そのディレクトリーじゃないとうまくいかないようだ)
|
18
|
+
# 『ユーザー辞書』、『指定変換辞書』の指定はdefaultのままでOK。
|
19
|
+
# [ことえり単語登録]ダイアログ上部の[辞書]のところで『okinawa.dic』を選ぶ。
|
20
|
+
# メニューバーの[辞書]メニューの[テキストや辞書から取り込む...]を選び、
|
21
|
+
# ここで先ほど生成しておいた『okinawa.txt』を指定。(選んで[開く]を押す)
|
22
|
+
|
23
|
+
require 5.6.0;
|
24
|
+
use FindBin;
|
25
|
+
use lib $FindBin::Bin; # For search scripts/ODIC.pm
|
26
|
+
require 'ODIC.pm';
|
27
|
+
use strict;
|
28
|
+
our $phonate;
|
29
|
+
our $word;
|
30
|
+
our $class;
|
31
|
+
|
32
|
+
while (<>) {
|
33
|
+
# JIS X 0208 に含まれていない文字を含む行を読み飛ばす
|
34
|
+
# 読み飛ばしにはコメントに「〓あり」マーカーが必要
|
35
|
+
next if (/〓あり/);
|
36
|
+
|
37
|
+
s/#.*$//; # `#'以降を取り去る
|
38
|
+
next if (/^\s*$/); # その結果空行になった行は読み飛ばす。
|
39
|
+
if (/(\S+)\s+(\S+)\s+(\S+)/) {
|
40
|
+
$phonate = $1; # 読み
|
41
|
+
$word = $2; # 単語
|
42
|
+
$class = $3; # 品詞
|
43
|
+
ODIC::check_phonate($phonate);
|
44
|
+
ODIC::check_word($word);
|
45
|
+
&convert_class;
|
46
|
+
}
|
47
|
+
else {
|
48
|
+
print STDERR "Error: $.: too few field number `$_'\n";
|
49
|
+
print "$_";
|
50
|
+
}
|
51
|
+
}
|
52
|
+
&version;
|
53
|
+
exit 0;
|
54
|
+
|
55
|
+
|
56
|
+
sub convert_class {
|
57
|
+
if ($class eq "普通名詞") { # OK
|
58
|
+
}
|
59
|
+
elsif ($class eq "サ変名詞") { # OK
|
60
|
+
}
|
61
|
+
elsif ($class eq "形動名詞") {
|
62
|
+
}
|
63
|
+
elsif ($class eq "姓") {
|
64
|
+
}
|
65
|
+
elsif ($class eq "名") {
|
66
|
+
}
|
67
|
+
elsif ($class eq "その他の人名") {
|
68
|
+
}
|
69
|
+
elsif ($class eq "単純地名") {
|
70
|
+
}
|
71
|
+
elsif ($class eq "接尾語付き地名") {
|
72
|
+
}
|
73
|
+
elsif ($class eq "組織名") {
|
74
|
+
}
|
75
|
+
elsif ($class eq "その他固有名詞") {
|
76
|
+
$class = 'その他の固有名詞';
|
77
|
+
}
|
78
|
+
elsif ($class eq "副詞") {
|
79
|
+
}
|
80
|
+
elsif ($class eq "接続詞") {
|
81
|
+
}
|
82
|
+
elsif ($class eq "感動詞") {
|
83
|
+
}
|
84
|
+
elsif ($class eq "形容詞") { # OK
|
85
|
+
}
|
86
|
+
elsif ($class eq "形容動詞") { # OK
|
87
|
+
}
|
88
|
+
elsif ($class eq "接頭語") { # *
|
89
|
+
$class = '普通名詞';
|
90
|
+
}
|
91
|
+
elsif ($class eq "数字列接頭語") { # OK
|
92
|
+
}
|
93
|
+
elsif ($class eq "接尾語") { # *
|
94
|
+
$class = '普通名詞';
|
95
|
+
}
|
96
|
+
elsif ($class eq "人名接尾語") {
|
97
|
+
}
|
98
|
+
elsif ($class eq "地名接尾語") {
|
99
|
+
}
|
100
|
+
elsif ($class eq "組織名接尾語") {
|
101
|
+
}
|
102
|
+
elsif ($class eq "数字列接尾語") {
|
103
|
+
}
|
104
|
+
elsif ($class eq "成句") {
|
105
|
+
}
|
106
|
+
elsif ($class eq "無品詞") { # OK
|
107
|
+
}
|
108
|
+
else {
|
109
|
+
print STDERR "Error: $.: unknown class `$class': $phonate\t$word\n";
|
110
|
+
}
|
111
|
+
print ODIC::to_shiftjis("$phonate,$word,$class\r\n");
|
112
|
+
}
|
113
|
+
|
114
|
+
|
115
|
+
sub version {
|
116
|
+
my $sec;
|
117
|
+
my $min;
|
118
|
+
my $hour;
|
119
|
+
my $mday;
|
120
|
+
my $mon;
|
121
|
+
my $year;
|
122
|
+
|
123
|
+
($sec, $min, $hour, $mday, $mon, $year) = localtime(time());
|
124
|
+
$year += 1900;
|
125
|
+
$mon++;
|
126
|
+
print ODIC::to_shiftjis("おきなわじしょのひづけ,$year年$mon月$mday日(沖縄辞書の日付け),無品詞\r\n");
|
127
|
+
}
|