racc 1.4.6
This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.
- data/.gitattributes +2 -0
- data/.gitignore +7 -0
- data/COPYING +515 -0
- data/ChangeLog +846 -0
- data/DEPENDS +4 -0
- data/README.en.rdoc +86 -0
- data/README.ja.rdoc +96 -0
- data/Rakefile +15 -0
- data/TODO +5 -0
- data/bin/racc +308 -0
- data/bin/racc2y +195 -0
- data/bin/y2racc +339 -0
- data/doc/en/NEWS.en.rdoc +282 -0
- data/doc/en/command.en.html +78 -0
- data/doc/en/debug.en.rdoc +20 -0
- data/doc/en/grammar.en.rdoc +230 -0
- data/doc/en/index.en.html +10 -0
- data/doc/en/parser.en.rdoc +74 -0
- data/doc/en/usage.en.html +92 -0
- data/doc/ja/NEWS.ja.rdoc +307 -0
- data/doc/ja/command.ja.html +94 -0
- data/doc/ja/debug.ja.rdoc +36 -0
- data/doc/ja/grammar.ja.rdoc +348 -0
- data/doc/ja/index.ja.html +10 -0
- data/doc/ja/parser.ja.rdoc +125 -0
- data/doc/ja/usage.ja.html +414 -0
- data/ext/racc/cparse/MANIFEST +4 -0
- data/ext/racc/cparse/cparse.c +824 -0
- data/ext/racc/cparse/depend +1 -0
- data/ext/racc/cparse/extconf.rb +7 -0
- data/fastcache/extconf.rb +2 -0
- data/fastcache/fastcache.c +185 -0
- data/lib/racc.rb +6 -0
- data/lib/racc/compat.rb +40 -0
- data/lib/racc/debugflags.rb +59 -0
- data/lib/racc/exception.rb +15 -0
- data/lib/racc/grammar.rb +1115 -0
- data/lib/racc/grammarfileparser.rb +559 -0
- data/lib/racc/info.rb +16 -0
- data/lib/racc/iset.rb +91 -0
- data/lib/racc/logfilegenerator.rb +214 -0
- data/lib/racc/parser.rb +439 -0
- data/lib/racc/parserfilegenerator.rb +511 -0
- data/lib/racc/pre-setup +13 -0
- data/lib/racc/sourcetext.rb +34 -0
- data/lib/racc/state.rb +971 -0
- data/lib/racc/statetransitiontable.rb +316 -0
- data/lib/racc/static.rb +5 -0
- data/misc/dist.sh +31 -0
- data/sample/array.y +67 -0
- data/sample/array2.y +59 -0
- data/sample/calc-ja.y +66 -0
- data/sample/calc.y +65 -0
- data/sample/conflict.y +15 -0
- data/sample/hash.y +60 -0
- data/sample/lalr.y +17 -0
- data/sample/lists.y +57 -0
- data/sample/syntax.y +46 -0
- data/sample/yyerr.y +46 -0
- data/setup.rb +1587 -0
- data/tasks/doc.rb +12 -0
- data/tasks/email.rb +55 -0
- data/tasks/file.rb +37 -0
- data/tasks/gem.rb +37 -0
- data/tasks/test.rb +16 -0
- data/test/assets/chk.y +126 -0
- data/test/assets/conf.y +16 -0
- data/test/assets/digraph.y +29 -0
- data/test/assets/echk.y +118 -0
- data/test/assets/err.y +60 -0
- data/test/assets/expect.y +7 -0
- data/test/assets/firstline.y +4 -0
- data/test/assets/ichk.y +102 -0
- data/test/assets/intp.y +546 -0
- data/test/assets/mailp.y +437 -0
- data/test/assets/newsyn.y +25 -0
- data/test/assets/noend.y +4 -0
- data/test/assets/nonass.y +41 -0
- data/test/assets/normal.y +27 -0
- data/test/assets/norule.y +4 -0
- data/test/assets/nullbug1.y +25 -0
- data/test/assets/nullbug2.y +15 -0
- data/test/assets/opt.y +123 -0
- data/test/assets/percent.y +35 -0
- data/test/assets/recv.y +97 -0
- data/test/assets/rrconf.y +14 -0
- data/test/assets/scan.y +72 -0
- data/test/assets/syntax.y +50 -0
- data/test/assets/unterm.y +5 -0
- data/test/assets/useless.y +12 -0
- data/test/assets/yyerr.y +46 -0
- data/test/bench.y +36 -0
- data/test/helper.rb +88 -0
- data/test/infini.y +8 -0
- data/test/scandata/brace +7 -0
- data/test/scandata/gvar +1 -0
- data/test/scandata/normal +4 -0
- data/test/scandata/percent +18 -0
- data/test/scandata/slash +10 -0
- data/test/src.intp +34 -0
- data/test/start.y +20 -0
- data/test/test_chk_y.rb +51 -0
- data/test/test_grammar_file_parser.rb +15 -0
- data/test/test_racc_command.rb +155 -0
- data/test/test_scan_y.rb +51 -0
- data/test/testscanner.rb +51 -0
- data/web/racc.en.rhtml +42 -0
- data/web/racc.ja.rhtml +51 -0
- metadata +166 -0
@@ -0,0 +1,94 @@
|
|
1
|
+
<h1>Raccコマンドリファレンス</h1>
|
2
|
+
<p>
|
3
|
+
racc [-o<var>filename</var>] [--output-file=<var>filename</var>]
|
4
|
+
[-e<var>rubypath</var>] [--embedded=<var>rubypath</var>]
|
5
|
+
[-v] [--verbose]
|
6
|
+
[-O<var>filename</var>] [--log-file=<var>filename</var>]
|
7
|
+
[-g] [--debug]
|
8
|
+
[-E] [--embedded]
|
9
|
+
[-l] [--no-line-convert]
|
10
|
+
[-c] [--line-convert-all]
|
11
|
+
[-a] [--no-omit-actions]
|
12
|
+
[-C] [--check-only]
|
13
|
+
[-S] [--output-status]
|
14
|
+
[--version] [--copyright] [--help] <var>grammarfile</var>
|
15
|
+
</p>
|
16
|
+
|
17
|
+
<dl>
|
18
|
+
<dt><var>filename</var>
|
19
|
+
<dd>
|
20
|
+
Raccの文法ファイルを指定します。拡張子には特に制限はありません。
|
21
|
+
</dd>
|
22
|
+
<dt>-o<var>outfile</var>, --output-file=<var>outfile</var>
|
23
|
+
<dd>
|
24
|
+
作成するクラスをかきこむファイル名を指定します。デフォルトは<filename>.tab.rbです。
|
25
|
+
</dd>
|
26
|
+
<dt>-O<var>filename</var>, --log-file=<var>filename</var>
|
27
|
+
<dd>
|
28
|
+
-v オプションをつけた時に生成するログファイルの名前を
|
29
|
+
<var>filename</var> に変更します。
|
30
|
+
デフォルトは <var>filename</var>.output です。
|
31
|
+
</dd>
|
32
|
+
<dt>-e<var>rubypath</var>, --executable=<var>rubypath</var>
|
33
|
+
<dd>
|
34
|
+
実行可能ファイルを生成します。<var>rubypath</var>は Ruby 本体のパスです。
|
35
|
+
<var>rubypath</var>を単に 'ruby' にした時には Racc が動作している
|
36
|
+
Ruby のパスを使用します。
|
37
|
+
</dd>
|
38
|
+
<dt>-v, --verbose
|
39
|
+
<dd>
|
40
|
+
ファイル "filename".output に詳細な解析情報を出力します。
|
41
|
+
</dd>
|
42
|
+
<dt>-g, --debug
|
43
|
+
<dd>
|
44
|
+
出力するコードにデバッグ用コードを加えます。-g をつけて生成したパーサで
|
45
|
+
@yydebug を true にセットすると、デバッグ用のコードが出力されます。<br>
|
46
|
+
-g をつけるだけでは何もおこりませんので注意してください。
|
47
|
+
</dd>
|
48
|
+
<dt>-E, --embedded
|
49
|
+
<dd>
|
50
|
+
ランタイムルーチンをすべて含んだコードを生成します。
|
51
|
+
つまり、このオプションをつけて生成したコードは Ruby さえあれば動きます。
|
52
|
+
</dd>
|
53
|
+
<dt>-C, --check-only
|
54
|
+
<dd>
|
55
|
+
(文法ファイルの) 文法のチェックだけをして終了します。
|
56
|
+
</dd>
|
57
|
+
<dt>-S, --output-status
|
58
|
+
<dd>
|
59
|
+
進行状況を逐一報告します。
|
60
|
+
</dd>
|
61
|
+
<dt>-l, --no-line-convert
|
62
|
+
<dd>
|
63
|
+
<p>
|
64
|
+
Ruby では例外が発生した時のファイル名や行番号を表示してくれますが、
|
65
|
+
Racc の生成したパーサは、デフォルトではこの場合のファイル名・行番号を
|
66
|
+
文法ファイルでのものに置きかえます。このフラグはその機能をオフにします。
|
67
|
+
</p>
|
68
|
+
<p>
|
69
|
+
ruby 1.4.3 以前のバージョンではバグのために定数の参照に失敗する
|
70
|
+
場合があるので、定数参照に関してなにかおかしいことがおこったらこのフラグを
|
71
|
+
試してみてください。
|
72
|
+
</p>
|
73
|
+
</dd>
|
74
|
+
<dt>-c, --line-convert-all
|
75
|
+
<dd>
|
76
|
+
アクションと inner に加え header footer の行番号も変換します。
|
77
|
+
header と footer がつながっているような場合には使わないでください。
|
78
|
+
<dt>-a, --no-omit-actions
|
79
|
+
<dd>
|
80
|
+
全てのアクションに対応するメソッド定義と呼び出しを行います。
|
81
|
+
例えアクションが省略されていても空のメソッドを生成します。
|
82
|
+
</dd>
|
83
|
+
<dt>--version
|
84
|
+
<dd>
|
85
|
+
Racc のバージョンを出力して終了します。
|
86
|
+
</dd>
|
87
|
+
<dt>--copyright
|
88
|
+
<dd>
|
89
|
+
著作権表示を出力して終了します。
|
90
|
+
<dt>--help
|
91
|
+
<dd>
|
92
|
+
オプションの簡単な説明を出力して終了します。
|
93
|
+
</dd>
|
94
|
+
</dl>
|
@@ -0,0 +1,36 @@
|
|
1
|
+
= パーサのデバッグ
|
2
|
+
|
3
|
+
ここでは、Racc を使っていくうえで遭遇しそうな問題について書きます。
|
4
|
+
|
5
|
+
== 文法ファイルがパースエラーになる
|
6
|
+
|
7
|
+
エラーメッセージに出ている行番号のあたりを見て間違いを
|
8
|
+
探してください。ブロックを閉じる行でエラーになる場合は、
|
9
|
+
どこかで開き括弧などを増やしてしまっている可能性が高いです。
|
10
|
+
|
11
|
+
== なんたら conflict って言われた
|
12
|
+
|
13
|
+
一番ありがちで一番面倒な問題は衝突 (conflict) でしょう。
|
14
|
+
文法中に衝突があると、racc はコンパイル後に
|
15
|
+
「5 shift/reduce conflict」のようなメッセージを表示します。
|
16
|
+
-v をつけると出力される .output ファイルからはさらに詳しい情報が得られます。
|
17
|
+
それをどう使うか、とかそういうことに関しては、それなりの本を読んでください。
|
18
|
+
とてもここに書けるような単純な話ではありません。
|
19
|
+
当然ながら『Ruby を 256 倍使うための本 無道編』(青木峰郎著)がお勧めです。
|
20
|
+
|
21
|
+
== パーサは問題なく生成できたけど予想どおりに動かない
|
22
|
+
|
23
|
+
racc に -g オプションをつけてパーサを出力すると、デバッグ用のコードが
|
24
|
+
付加されます。ここで、パーサクラスのインスタンス変数 @yydebug を true に
|
25
|
+
しておいてから do_parse/yyparse を呼ぶと、デバッグ用メッセージが出力
|
26
|
+
されます。パーサが動作する様子が直接見えますので、完全に現在の状態を
|
27
|
+
把握できます。これを見てどこがおかしいのかわかったらあとは直すだけ。
|
28
|
+
|
29
|
+
== next_token に関して
|
30
|
+
|
31
|
+
いまだ自分でも忘れることが多いのが
|
32
|
+
「送るトークンが尽きたら [false,なにか] を送る」ということです。
|
33
|
+
ちなみに Racc 0.10.2 以降では一度 [false,なにか] を受け取ったら
|
34
|
+
それ以上 next_token は呼ばないことが保証されています。
|
35
|
+
|
36
|
+
追記: 最近は [false,なにか] ではなく nil でもよいことになった。
|
@@ -0,0 +1,348 @@
|
|
1
|
+
= 規則ファイル文法リファレンス
|
2
|
+
|
3
|
+
== 文法に関する前バージョンとの非互換
|
4
|
+
|
5
|
+
* (1.2.5) ユーザーコードを連結する時、外部ファイルよりも
|
6
|
+
埋めこんであるコードを先に連結します。
|
7
|
+
* (1.1.6) 新しいディレクティブ options が追加されました。
|
8
|
+
* (1.1.5) 予約語 token の意味が変更になりました。
|
9
|
+
* (0.14) ルールの最後のセミコロンが省略可能になりました。
|
10
|
+
また、token prechigh などが予約語でなくなりました。
|
11
|
+
* (10.2) prepare が header に driver が footer になりました。
|
12
|
+
今はそのままでも使えますが、2.0 からは対応しません。
|
13
|
+
* (0.10) class に対応する end がなくなりました。
|
14
|
+
* (0.9) ダサダサのピリオド方式をやめて { と } で囲むようにしました。
|
15
|
+
|
16
|
+
== 全体の構造
|
17
|
+
|
18
|
+
トップレベルは、規則部とユーザーコード部に分けられます。
|
19
|
+
ユーザーコード部はクラス定義の後に来なければいけません。
|
20
|
+
|
21
|
+
=== コメント
|
22
|
+
|
23
|
+
文法ファイルには、一部例外を除いて、ほとんどどこにでもコメントを
|
24
|
+
書くことができます。コメントは、Rubyの #.....(行末) スタイルと、
|
25
|
+
Cの /*......*/ スタイルを使うことができます。
|
26
|
+
|
27
|
+
=== 規則部
|
28
|
+
|
29
|
+
規則部は以下のような形をしています。
|
30
|
+
--
|
31
|
+
class クラス名 [< スーパークラス]
|
32
|
+
[演算子順位]
|
33
|
+
[トークン宣言]
|
34
|
+
[オプション]
|
35
|
+
[expect]
|
36
|
+
[トークンシンボル値おきかえ]
|
37
|
+
[スタート規則]
|
38
|
+
rule
|
39
|
+
文法記述
|
40
|
+
--
|
41
|
+
"クラス名"はここで定義するパーサクラスの名前です。
|
42
|
+
これはそのままRubyのクラス名になります。
|
43
|
+
|
44
|
+
また M::C のように「::」を使った名前を使うと、クラス定義を
|
45
|
+
モジュール M の中にネストさせます。つまり class M::C ならば
|
46
|
+
--
|
47
|
+
module M
|
48
|
+
class C < Racc::Parser
|
49
|
+
いろいろ
|
50
|
+
end
|
51
|
+
end
|
52
|
+
--
|
53
|
+
のように出力します。
|
54
|
+
|
55
|
+
さらに、Ruby と同じ構文でスーパークラスを指定できます。
|
56
|
+
ただしこの指定をするとパーサの動作に重大な影響を与えるので、
|
57
|
+
特に必要がない限り指定してはいけません。これは将来の拡張の
|
58
|
+
ために用意したもので、現在指定する必然性はあまりありません。
|
59
|
+
|
60
|
+
=== 文法の記述
|
61
|
+
|
62
|
+
racc で生成するパーサが理解できる文法を記述します。
|
63
|
+
文法は、予約語 rule と end の間に、以下のような書式で書きます。
|
64
|
+
--
|
65
|
+
トークン: トークンの並び アクション
|
66
|
+
|
67
|
+
トークン: トークンの並び アクション
|
68
|
+
| トークンの並び アクション
|
69
|
+
| トークンの並び アクション
|
70
|
+
(必要なだけ同じようにつづける)
|
71
|
+
--
|
72
|
+
アクションは { } で囲みます。アクションでは Ruby の文はほとんど
|
73
|
+
使えますが、一部だけは非対応です。対応していないものは以下のとおり。
|
74
|
+
|
75
|
+
* ヒアドキュメント
|
76
|
+
* =begin ... =end 型コメント
|
77
|
+
* スペースで始まる正規表現
|
78
|
+
* ごくまれに % の演算。普通に演算子のまわりにスペースを入れていれば問題なし
|
79
|
+
|
80
|
+
このあたりに関しては完全な対応はまず無理です。あきらめてください。
|
81
|
+
|
82
|
+
左辺の値($$)は、オプションによって返し方がかわります。まずデフォルトでは
|
83
|
+
ローカル変数 result (そのデフォルト値は val[0])が 左辺値を表し、アクション
|
84
|
+
ブロックを抜けた時の result の値が左辺値になります。または明示的に return
|
85
|
+
で返した場合もこの値になります。一方、options で no_result_var を指定した
|
86
|
+
場合、左辺値はアクションブロックの最後の文の値になります (Ruby のメソッドと
|
87
|
+
同じ)。
|
88
|
+
|
89
|
+
どちらの場合でもアクションは省略でき、省略した場合の左辺値は常に val[0] です。
|
90
|
+
|
91
|
+
以下に文法記述の全体の例をしめします。
|
92
|
+
--
|
93
|
+
rule
|
94
|
+
goal: def ruls source
|
95
|
+
{
|
96
|
+
result = val
|
97
|
+
}
|
98
|
+
|
99
|
+
def : /* none */
|
100
|
+
{
|
101
|
+
result = []
|
102
|
+
}
|
103
|
+
| def startdesig
|
104
|
+
{
|
105
|
+
result[0] = val[1]
|
106
|
+
}
|
107
|
+
| def
|
108
|
+
precrule # これは上の行の続き
|
109
|
+
{
|
110
|
+
result[1] = val[1]
|
111
|
+
}
|
112
|
+
(略)
|
113
|
+
--
|
114
|
+
アクション内では特別な意味をもった変数がいくつか使えます。
|
115
|
+
そのような変数を以下に示します。括弧の中は yacc での表記です。
|
116
|
+
|
117
|
+
* result ($$)
|
118
|
+
|
119
|
+
左辺の値。初期値は val[0] です。
|
120
|
+
|
121
|
+
* val ($1,$2,$3…)
|
122
|
+
|
123
|
+
右辺の記号の値の配列。Ruby の配列なので当然インデックスはゼロから始まります。
|
124
|
+
この配列は毎回作られるので自由に変更したり捨てたりして構いません。
|
125
|
+
|
126
|
+
* _values (...,$-2,$-1,$0)
|
127
|
+
|
128
|
+
値スタック。Racc コアが使っているオブジェクトがそのまま渡されます。
|
129
|
+
この変数の意味がわかる人以外は<em>絶対に</em>変更してはいけません。
|
130
|
+
|
131
|
+
またアクションの特別な形式に、埋めこみアクションというものがあります。
|
132
|
+
これはトークン列の途中の好きなところに記述することができます。
|
133
|
+
以下に埋めこみアクションの例を示します。
|
134
|
+
--
|
135
|
+
target: A B { puts 'test test' } C D { normal action }
|
136
|
+
--
|
137
|
+
このように記述すると A B を検出した時点で puts が実行されます。
|
138
|
+
また、埋めこみアクションはそれ自体が値を持ちます。つまり、以下の例において
|
139
|
+
--
|
140
|
+
target: A { result = 1 } B { p val[1] }
|
141
|
+
--
|
142
|
+
最後にある p val[1] は埋めこみアクションの値 1 を表示します。
|
143
|
+
B の値ではありません。
|
144
|
+
|
145
|
+
意味的には、埋めこみアクションは空の規則を持つ非終端記号を追加することと
|
146
|
+
全く同じ働きをします。つまり、上の例は次のコードと完全に同じ意味です。
|
147
|
+
--
|
148
|
+
target : A nonterm B { p val[1] }
|
149
|
+
nonterm : /* 空の規則 */ { result = 1 }
|
150
|
+
--
|
151
|
+
|
152
|
+
=== 演算子優先順位
|
153
|
+
|
154
|
+
あるトークン上でシフト・還元衝突がおこったとき、そのトークンに
|
155
|
+
演算子優先順位が設定してあると衝突を解消できる場合があります。
|
156
|
+
そのようなものとして特に有名なのは数式の演算子と if...else 構文です。
|
157
|
+
|
158
|
+
優先順位で解決できる文法は、うまく文法をくみかえてやれば
|
159
|
+
優先順位なしでも同じ効果を得ることができます。しかしたいていの
|
160
|
+
場合は優先順位を設定して解決するほうが文法を簡単にできます。
|
161
|
+
|
162
|
+
シフト・還元衝突がおこったとき、Racc はまずその規則に順位が設定
|
163
|
+
されているか調べます。規則の順位は、その規則で一番うしろにある
|
164
|
+
終端トークンの優先順位です。たとえば
|
165
|
+
--
|
166
|
+
target: TERM_A nonterm_a TERM_B nonterm_b
|
167
|
+
--
|
168
|
+
のような規則の順位はTERM_Bの優先順位になります。もしTERM_Bに
|
169
|
+
優先順位が設定されていなかったら、優先順位で衝突を解決することは
|
170
|
+
できないと判断し、「Shift/Reduce conflict」を報告します。
|
171
|
+
|
172
|
+
演算子の優先順位はつぎのように書いて定義します。
|
173
|
+
--
|
174
|
+
prechigh
|
175
|
+
nonassoc PLUSPLUS
|
176
|
+
left MULTI DEVIDE
|
177
|
+
left PLUS MINUS
|
178
|
+
right '='
|
179
|
+
preclow
|
180
|
+
--
|
181
|
+
prechigh に近い行にあるほど優先順位の高いトークンです。上下をまるごと
|
182
|
+
さかさまにして preclow...prechigh の順番に書くこともできます。left
|
183
|
+
などは必ず行の最初になければいけません。
|
184
|
+
|
185
|
+
left right nonassoc はそれぞれ「結合性」を表します。結合性によって、
|
186
|
+
同じ順位の演算子の規則が衝突した場合にシフト還元のどちらをとるかが
|
187
|
+
決まります。たとえば
|
188
|
+
--
|
189
|
+
a - b - c
|
190
|
+
--
|
191
|
+
が
|
192
|
+
--
|
193
|
+
(a - b) - c
|
194
|
+
--
|
195
|
+
になるのが左結合 (left) です。四則演算は普通これです。
|
196
|
+
一方
|
197
|
+
--
|
198
|
+
a - (b - c)
|
199
|
+
--
|
200
|
+
になるのが右結合 (right) です。代入のクオートは普通 right です。
|
201
|
+
またこのように演算子が重なるのはエラーである場合、非結合 (nonassoc) です。
|
202
|
+
C 言語の ++ や単項のマイナスなどがこれにあたります。
|
203
|
+
|
204
|
+
ところで、説明したとおり通常は還元する規則の最後のトークンが順位を
|
205
|
+
決めるのですが、ある規則に限ってそのトークンとは違う順位にしたいことも
|
206
|
+
あります。例えば符号反転のマイナスは引き算のマイナスより順位を高く
|
207
|
+
しないといけません。このような場合 yacc では %prec を使います。
|
208
|
+
racc ではイコール記号を使って同じことをできます。
|
209
|
+
--
|
210
|
+
prechigh
|
211
|
+
nonassoc UMINUS
|
212
|
+
left '*' '/'
|
213
|
+
left '+' '-'
|
214
|
+
preclow
|
215
|
+
(略)
|
216
|
+
exp: exp '*' exp
|
217
|
+
| exp '-' exp
|
218
|
+
| '-' exp = UMINUS # ここだけ順位を上げる
|
219
|
+
--
|
220
|
+
このように記述すると、'-' exp の規則の順位が UMINUS の順位になります。
|
221
|
+
こうすることで符号反転の '-' は '*' よりも順位が高くなるので、
|
222
|
+
意図どおりになります。
|
223
|
+
|
224
|
+
=== トークン宣言
|
225
|
+
|
226
|
+
トークン(終端記号)のつづりを間違えるというのはよくあることですが、
|
227
|
+
発見するのはなかなか難しいものです。1.1.5 からはトークンを明示的に
|
228
|
+
宣言することで、宣言にないトークン / 宣言にだけあるトークンに対して
|
229
|
+
警告が出るようになりました。yacc の %token と似ていますが最大の違いは
|
230
|
+
racc では必須ではなく、しかもエラーにならず警告だけ、という点です。
|
231
|
+
|
232
|
+
トークン宣言は以下のように書きます。
|
233
|
+
--
|
234
|
+
token A B C D
|
235
|
+
E F G H
|
236
|
+
--
|
237
|
+
トークンのリストを複数行にわたって書けることに注目してください。
|
238
|
+
racc では一般に「予約語」は行の先頭に来た時だけ予約語とみなされるので
|
239
|
+
prechigh などもシンボルとして使えます。ただし深淵な理由から end だけは
|
240
|
+
どうやっても予約語になってしまいます。
|
241
|
+
|
242
|
+
=== オプション
|
243
|
+
|
244
|
+
racc のコマンドラインオプションの一部をファイル中にデフォルト値
|
245
|
+
として記述することができます。
|
246
|
+
--
|
247
|
+
options オプション オプション …
|
248
|
+
--
|
249
|
+
現在ここで使えるのは
|
250
|
+
|
251
|
+
* omit_action_call
|
252
|
+
|
253
|
+
空のアクション呼び出しを省略する
|
254
|
+
|
255
|
+
* result_var
|
256
|
+
|
257
|
+
変数 result を使う
|
258
|
+
|
259
|
+
です。
|
260
|
+
それぞれ no_ を頭につけることで意味を反転できます。
|
261
|
+
|
262
|
+
=== expect
|
263
|
+
|
264
|
+
実用になるパーサはたいてい無害な shift/reduce conflict を含みます。
|
265
|
+
しかし文法ファイルを書いた本人はそれを知っているからいいですが、
|
266
|
+
ユーザが文法ファイルを処理した時に「conflict」と表示されたら
|
267
|
+
不安に思うでしょう。そのような場合、以下のように書いておくと
|
268
|
+
shift/reduce conflict のメッセージを抑制できます。
|
269
|
+
--
|
270
|
+
expect 3
|
271
|
+
--
|
272
|
+
この場合 shift/reduce conflict はぴったり三つでなければいけません。
|
273
|
+
三つでない場合はやはり表示が出ます (ゼロでも出ます)。
|
274
|
+
また reduce/reduce conflict の表示は抑制できません。
|
275
|
+
|
276
|
+
=== トークンシンボル値の変更
|
277
|
+
|
278
|
+
トークンシンボルを表す値は、デフォルトでは
|
279
|
+
|
280
|
+
* 文法中、引用符でかこまれていないもの (RULEとかXENDとか)
|
281
|
+
→その名前の文字列を intern して得られるシンボル (1.4 では Fixnum)
|
282
|
+
* 引用符でかこまれているもの(':'とか'.'とか)
|
283
|
+
→その文字列そのまま
|
284
|
+
|
285
|
+
となっていますが、たとえば他の形式のスキャナがすでに存在する場合などは、
|
286
|
+
これにあわせなければならず、このままでは不便です。このような場合には、
|
287
|
+
convert 節を加えることで、トークンシンボルを表す値を変えることができます。
|
288
|
+
以下がその例です。
|
289
|
+
--
|
290
|
+
convert
|
291
|
+
PLUS 'PlusClass' #→ PlusClass
|
292
|
+
MIN 'MinusClass' #→ MinusClass
|
293
|
+
end
|
294
|
+
--
|
295
|
+
デフォルトではトークンシンボル PLUS に対してはトークンシンボル値は
|
296
|
+
:PLUS ですが、上のような記述がある場合は PlusClass になります。
|
297
|
+
変換後の値は false・nil 以外ならなんでも使えます。
|
298
|
+
|
299
|
+
変換後の値として文字列を使うときは、次のように引用符を重ねる必要があります。
|
300
|
+
--
|
301
|
+
convert
|
302
|
+
PLUS '"plus"' #→ "plus"
|
303
|
+
end
|
304
|
+
--
|
305
|
+
また、「'」を使っても生成された Ruby のコード上では「"」になるので
|
306
|
+
注意してください。バックスラッシュによるクオートは有効ですが、バック
|
307
|
+
スラッシュは消えずにそのまま残ります。
|
308
|
+
--
|
309
|
+
PLUS '"plus\n"' #→ "plus\n"
|
310
|
+
MIN "\"minus#{val}\"" #→ \"minus#{val}\"
|
311
|
+
--
|
312
|
+
|
313
|
+
=== スタート規則
|
314
|
+
|
315
|
+
パーサをつくるためには、どの規則が「最初の」規則か、ということを Racc におしえて
|
316
|
+
やらなければいけません。それを明示的に書くのがスタート規則です。スタート規則は
|
317
|
+
次のように書きます。
|
318
|
+
--
|
319
|
+
start real_target
|
320
|
+
--
|
321
|
+
start は行の最初にこなければいけません。このように書くと、ファイルで
|
322
|
+
一番最初に出てくる real_target の規則をスタート規則として使います。
|
323
|
+
省略した場合は、ファイルの最初の規則がスタート規則になります。普通は
|
324
|
+
最初の規則を一番上にかくほうが書きやすく、わかりやすくなりますから、
|
325
|
+
この記法はあまりつかう必要はないでしょう。
|
326
|
+
|
327
|
+
=== ユーザーコード部
|
328
|
+
|
329
|
+
ユーザーコードは、パーサクラスが書きこまれるファイルに、
|
330
|
+
アクションの他にもコードを含めたい時に使います。このようなものは
|
331
|
+
書きこまれる場所に応じて三つ存在し、パーサクラスの定義の前が
|
332
|
+
header、クラスの定義中(の冒頭)が inner、定義の後が footer です。
|
333
|
+
ユーザコードとして書いたものは全く手を加えずにそのまま連結されます。
|
334
|
+
|
335
|
+
ユーザーコード部の書式は以下の通りです。
|
336
|
+
--
|
337
|
+
---- 識別子
|
338
|
+
ruby の文
|
339
|
+
ruby の文
|
340
|
+
ruby の文
|
341
|
+
|
342
|
+
---- 識別子
|
343
|
+
ruby の文
|
344
|
+
:
|
345
|
+
--
|
346
|
+
行の先頭から四つ以上連続した「-」(マイナス)があるとユーザーコードと
|
347
|
+
みなされます。識別子は一つの単語で、そのあとには「=」以外なら何を
|
348
|
+
書いてもかまいません。
|