aozora2html 0.7.0 → 2.0.0
Sign up to get free protection for your applications and to get access to all the features.
- checksums.yaml +5 -5
- data/.github/workflows/ruby.yml +34 -0
- data/.gitignore +8 -3
- data/.rubocop.yml +227 -0
- data/.travis.yml +5 -0
- data/CHANGELOG.md +33 -0
- data/LICENSE +116 -0
- data/README.md +16 -11
- data/aozora2html.gemspec +6 -6
- data/bin/aozora2html +6 -54
- data/lib/aozora2html/accent_parser.rb +91 -0
- data/lib/aozora2html/error.rb +16 -0
- data/lib/aozora2html/header.rb +139 -0
- data/lib/aozora2html/i18n.rb +28 -0
- data/lib/aozora2html/ruby_buffer.rb +81 -0
- data/lib/aozora2html/style_stack.rb +27 -0
- data/lib/aozora2html/tag/accent.rb +39 -0
- data/lib/aozora2html/tag/block.rb +19 -0
- data/lib/aozora2html/tag/chitsuki.rb +15 -0
- data/lib/aozora2html/tag/dakuten_katakana.rb +23 -0
- data/lib/aozora2html/tag/decorate.rb +18 -0
- data/lib/aozora2html/tag/dir.rb +15 -0
- data/lib/aozora2html/tag/editor_note.rb +16 -0
- data/lib/aozora2html/tag/embed_gaiji.rb +48 -0
- data/lib/aozora2html/tag/font_size.rb +17 -0
- data/lib/aozora2html/tag/gaiji.rb +11 -0
- data/lib/aozora2html/tag/img.rb +21 -0
- data/lib/aozora2html/tag/indent.rb +8 -0
- data/lib/aozora2html/tag/inline.rb +13 -0
- data/lib/aozora2html/tag/inline_caption.rb +15 -0
- data/lib/aozora2html/tag/inline_font_size.rb +18 -0
- data/lib/aozora2html/tag/inline_keigakomi.rb +15 -0
- data/lib/aozora2html/tag/inline_yokogumi.rb +16 -0
- data/lib/aozora2html/tag/jisage.rb +15 -0
- data/lib/aozora2html/tag/jizume.rb +16 -0
- data/lib/aozora2html/tag/kaeriten.rb +15 -0
- data/lib/aozora2html/tag/keigakomi.rb +13 -0
- data/lib/aozora2html/tag/kunten.rb +12 -0
- data/lib/aozora2html/tag/midashi.rb +18 -0
- data/lib/aozora2html/tag/multiline.rb +6 -0
- data/lib/aozora2html/tag/multiline_caption.rb +15 -0
- data/lib/aozora2html/tag/multiline_chitsuki.rb +8 -0
- data/lib/aozora2html/tag/multiline_jisage.rb +8 -0
- data/lib/aozora2html/tag/multiline_midashi.rb +22 -0
- data/lib/aozora2html/tag/multiline_style.rb +17 -0
- data/lib/aozora2html/tag/multiline_yokogumi.rb +17 -0
- data/lib/aozora2html/tag/okurigana.rb +15 -0
- data/lib/aozora2html/tag/oneline_chitsuki.rb +9 -0
- data/lib/aozora2html/tag/oneline_indent.rb +2 -0
- data/lib/aozora2html/tag/oneline_jisage.rb +7 -0
- data/lib/aozora2html/tag/reference_mentioned.rb +46 -0
- data/lib/aozora2html/tag/ruby.rb +98 -0
- data/lib/aozora2html/tag/un_embed_gaiji.rb +24 -0
- data/lib/aozora2html/tag.rb +55 -0
- data/lib/aozora2html/tag_parser.rb +53 -0
- data/lib/aozora2html/utils.rb +93 -0
- data/lib/aozora2html/version.rb +1 -1
- data/lib/aozora2html/yaml_loader.rb +31 -0
- data/lib/aozora2html.rb +0 -4
- data/lib/extensions.rb +44 -0
- data/lib/jstream.rb +68 -0
- data/lib/t2hs.rb +837 -1765
- data/test/test_aozora2html.rb +320 -43
- data/test/test_aozora_accent_parser.rb +13 -2
- data/test/test_command_parse.rb +213 -0
- data/test/test_dakuten_katakana_tag.rb +5 -4
- data/test/test_decorate_tag.rb +5 -4
- data/test/test_dir_tag.rb +5 -4
- data/test/test_editor_note_tag.rb +4 -4
- data/test/test_exception.rb +4 -4
- data/test/test_font_size_tag.rb +15 -7
- data/test/test_gaiji_tag.rb +14 -7
- data/test/test_header.rb +60 -0
- data/test/test_i18n.rb +23 -0
- data/test/test_img_tag.rb +5 -4
- data/test/test_inline_caption_tag.rb +5 -4
- data/test/test_inline_font_size_tag.rb +7 -6
- data/test/test_inline_keigakomi_tag.rb +5 -4
- data/test/test_inline_yokogumi_tag.rb +5 -4
- data/test/test_jizume_tag.rb +7 -6
- data/test/test_jstream.rb +5 -5
- data/test/test_kaeriten_tag.rb +5 -4
- data/test/test_keigakomi_tag.rb +8 -7
- data/test/test_midashi_tag.rb +38 -0
- data/test/test_multiline_caption_tag.rb +7 -6
- data/test/test_multiline_midashi_tag.rb +24 -7
- data/test/test_multiline_style_tag.rb +7 -6
- data/test/test_multiline_yokogumi_tag.rb +7 -6
- data/test/test_okurigana_tag.rb +5 -4
- data/test/test_ruby_parse.rb +130 -0
- data/test/test_ruby_tag.rb +5 -4
- data/test/test_tag_parser.rb +10 -10
- data/vendor/jis2ucs/README.md +3 -6
- data/yml/accent_table.yml +240 -0
- data/yml/command_table.yml +61 -0
- data/yml/jis2ucs.yml +11234 -0
- metadata +74 -42
- data/appveyor.yml +0 -19
- data/lib/accent_tag.rb +0 -23
- data/lib/aozora2html/jis2ucs.rb +0 -11237
- data/lib/embed_gaiji_tag.rb +0 -34
@@ -4,35 +4,52 @@ require 'aozora2html'
|
|
4
4
|
|
5
5
|
class MultilineMidashiTagTest < Test::Unit::TestCase
|
6
6
|
def setup
|
7
|
+
@parser = Object.new
|
7
8
|
stub(@parser).block_allowed_context?{true}
|
8
9
|
stub(@parser).new_midashi_id{2}
|
9
10
|
end
|
10
11
|
|
11
12
|
def test_multiline_midashi_new
|
12
|
-
tag =
|
13
|
-
assert_equal
|
14
|
-
assert_equal true, tag.kind_of?(
|
15
|
-
assert_equal true, tag.kind_of?(
|
13
|
+
tag = Aozora2Html::Tag::MultilineMidashi.new(@parser,"小".encode("shift_jis"),:normal)
|
14
|
+
assert_equal Aozora2Html::Tag::MultilineMidashi, tag.class
|
15
|
+
assert_equal true, tag.kind_of?(Aozora2Html::Tag::Block)
|
16
|
+
assert_equal true, tag.kind_of?(Aozora2Html::Tag::Multiline)
|
16
17
|
end
|
17
18
|
|
18
19
|
def test_to_s
|
19
|
-
tag =
|
20
|
+
tag = Aozora2Html::Tag::MultilineMidashi.new(@parser,"小".encode("shift_jis"),:normal)
|
20
21
|
assert_equal "<h5 class=\"ko-midashi\"><a class=\"midashi_anchor\" id=\"midashi2\">", tag.to_s
|
21
22
|
assert_equal "</a></h5>", tag.close_tag
|
22
23
|
end
|
23
24
|
|
24
25
|
def test_to_s_chu
|
25
|
-
tag =
|
26
|
+
tag = Aozora2Html::Tag::MultilineMidashi.new(@parser,"中".encode("shift_jis"),:dogyo)
|
26
27
|
assert_equal "<h4 class=\"dogyo-naka-midashi\"><a class=\"midashi_anchor\" id=\"midashi2\">", tag.to_s
|
27
28
|
assert_equal "</a></h4>", tag.close_tag
|
28
29
|
end
|
29
30
|
|
30
31
|
def test_to_s_dai
|
31
|
-
tag =
|
32
|
+
tag = Aozora2Html::Tag::MultilineMidashi.new(@parser,"大".encode("shift_jis"),:mado)
|
32
33
|
assert_equal "<h3 class=\"mado-o-midashi\"><a class=\"midashi_anchor\" id=\"midashi2\">", tag.to_s
|
33
34
|
assert_equal "</a></h3>", tag.close_tag
|
34
35
|
end
|
35
36
|
|
37
|
+
def test_undeined_midashi
|
38
|
+
begin
|
39
|
+
Aozora2Html::Tag::MultilineMidashi.new(@parser,"あ".encode("shift_jis"),:mado)
|
40
|
+
rescue Aozora2Html::Error => e
|
41
|
+
assert_equal e.message(123).encode("utf-8"), "エラー(123行目):未定義な見出しです. \r\n処理を停止します"
|
42
|
+
end
|
43
|
+
end
|
44
|
+
|
45
|
+
def test_undeined_midashi2
|
46
|
+
begin
|
47
|
+
Aozora2Html::Tag::MultilineMidashi.new(@parser,"大".encode("shift_jis"),:madoo)
|
48
|
+
rescue Aozora2Html::Error => e
|
49
|
+
assert_equal e.message(123).encode("utf-8"), "エラー(123行目):未定義な見出しです. \r\n処理を停止します"
|
50
|
+
end
|
51
|
+
end
|
52
|
+
|
36
53
|
def teardown
|
37
54
|
end
|
38
55
|
end
|
@@ -3,18 +3,19 @@ require 'aozora2html'
|
|
3
3
|
|
4
4
|
class MultilineStyleTagTest < Test::Unit::TestCase
|
5
5
|
def setup
|
6
|
-
|
6
|
+
@parser = Object.new
|
7
|
+
stub(@parser).block_allowed_context?{true}
|
7
8
|
end
|
8
9
|
|
9
10
|
def test_multiline_style_new
|
10
|
-
tag =
|
11
|
-
assert_equal
|
12
|
-
assert_equal true, tag.kind_of?(
|
13
|
-
assert_equal true, tag.kind_of?(
|
11
|
+
tag = Aozora2Html::Tag::MultilineStyle.new(@parser,"style1")
|
12
|
+
assert_equal Aozora2Html::Tag::MultilineStyle, tag.class
|
13
|
+
assert_equal true, tag.kind_of?(Aozora2Html::Tag::Block)
|
14
|
+
assert_equal true, tag.kind_of?(Aozora2Html::Tag::Multiline)
|
14
15
|
end
|
15
16
|
|
16
17
|
def test_to_s
|
17
|
-
tag =
|
18
|
+
tag = Aozora2Html::Tag::MultilineStyle.new(@parser,"s1")
|
18
19
|
assert_equal "<div class=\"s1\">", tag.to_s
|
19
20
|
assert_equal "</div>", tag.close_tag
|
20
21
|
end
|
@@ -3,18 +3,19 @@ require 'aozora2html'
|
|
3
3
|
|
4
4
|
class MultilineYokogumiTagTest < Test::Unit::TestCase
|
5
5
|
def setup
|
6
|
-
|
6
|
+
@parser = Object.new
|
7
|
+
stub(@parser).block_allowed_context?{true}
|
7
8
|
end
|
8
9
|
|
9
10
|
def test_multiline_yokogumi_new
|
10
|
-
tag =
|
11
|
-
assert_equal
|
12
|
-
assert_equal true, tag.kind_of?(
|
13
|
-
assert_equal true, tag.kind_of?(
|
11
|
+
tag = Aozora2Html::Tag::MultilineYokogumi.new(@parser)
|
12
|
+
assert_equal Aozora2Html::Tag::MultilineYokogumi, tag.class
|
13
|
+
assert_equal true, tag.kind_of?(Aozora2Html::Tag::Block)
|
14
|
+
assert_equal true, tag.kind_of?(Aozora2Html::Tag::Multiline)
|
14
15
|
end
|
15
16
|
|
16
17
|
def test_to_s
|
17
|
-
tag =
|
18
|
+
tag = Aozora2Html::Tag::MultilineYokogumi.new(@parser)
|
18
19
|
assert_equal "<div class=\"yokogumi\">", tag.to_s
|
19
20
|
assert_equal "</div>", tag.close_tag
|
20
21
|
end
|
data/test/test_okurigana_tag.rb
CHANGED
@@ -4,17 +4,18 @@ require 'aozora2html'
|
|
4
4
|
|
5
5
|
class OkuriganaTagTest < Test::Unit::TestCase
|
6
6
|
def setup
|
7
|
+
@parser = Object.new
|
7
8
|
stub(@parser).block_allowed_context?{true}
|
8
9
|
end
|
9
10
|
|
10
11
|
def test_okurigana_new
|
11
|
-
tag =
|
12
|
-
assert_equal
|
13
|
-
assert_equal true, tag.kind_of?(
|
12
|
+
tag = Aozora2Html::Tag::Okurigana.new(@parser,"aaa")
|
13
|
+
assert_equal Aozora2Html::Tag::Okurigana, tag.class
|
14
|
+
assert_equal true, tag.kind_of?(Aozora2Html::Tag::Inline)
|
14
15
|
end
|
15
16
|
|
16
17
|
def test_to_s
|
17
|
-
tag =
|
18
|
+
tag = Aozora2Html::Tag::Okurigana.new(@parser,"テスト".encode("shift_jis"))
|
18
19
|
assert_equal "<sup class=\"okurigana\">テスト</sup>", tag.to_s.encode("utf-8")
|
19
20
|
end
|
20
21
|
|
@@ -0,0 +1,130 @@
|
|
1
|
+
# encoding: utf-8
|
2
|
+
require 'test_helper'
|
3
|
+
require 'aozora2html'
|
4
|
+
|
5
|
+
class RubyParseTest < Test::Unit::TestCase
|
6
|
+
def setup
|
7
|
+
end
|
8
|
+
|
9
|
+
def test_parse_ruby1
|
10
|
+
src = "青空文庫《あおぞらぶんこ》\r\n"
|
11
|
+
parsed = parse_text(src)
|
12
|
+
expected = "<ruby><rb>青空文庫</rb><rp>(</rp><rt>あおぞらぶんこ</rt><rp>)</rp></ruby><br />\r\n"
|
13
|
+
assert_equal expected, parsed
|
14
|
+
end
|
15
|
+
|
16
|
+
def test_parse_ruby1b
|
17
|
+
src = "身装《みなり》\r\n"
|
18
|
+
parsed = parse_text(src)
|
19
|
+
expected = "<ruby><rb>身装</rb><rp>(</rp><rt>みなり</rt><rp>)</rp></ruby><br />\r\n"
|
20
|
+
assert_equal expected, parsed
|
21
|
+
end
|
22
|
+
|
23
|
+
def test_parse_ruby2
|
24
|
+
src = "霧の|ロンドン警視庁《スコットランドヤード》\r\n"
|
25
|
+
parsed = parse_text(src)
|
26
|
+
expected = "霧の<ruby><rb>ロンドン警視庁</rb><rp>(</rp><rt>スコットランドヤード</rt><rp>)</rp></ruby><br />\r\n"
|
27
|
+
assert_equal expected, parsed
|
28
|
+
end
|
29
|
+
|
30
|
+
def test_parse_ruby2b
|
31
|
+
src = "いかにも最|猛者《もさ》のように\r\n"
|
32
|
+
parsed = parse_text(src)
|
33
|
+
expected = "いかにも最<ruby><rb>猛者</rb><rp>(</rp><rt>もさ</rt><rp>)</rp></ruby>のように<br />\r\n"
|
34
|
+
assert_equal expected, parsed
|
35
|
+
end
|
36
|
+
|
37
|
+
def test_parse_ruby3
|
38
|
+
src = "〆切《しめきり》を逃れるために、市ヶ谷《いちがや》から転々《てんてん》と、居を移した。\r\n"
|
39
|
+
parsed = parse_text(src)
|
40
|
+
expected = "<ruby><rb>〆切</rb><rp>(</rp><rt>しめきり</rt><rp>)</rp></ruby>を逃れるために、<ruby><rb>市ヶ谷</rb><rp>(</rp><rt>いちがや</rt><rp>)</rp></ruby>から<ruby><rb>転々</rb><rp>(</rp><rt>てんてん</rt><rp>)</rp></ruby>と、居を移した。<br />\r\n"
|
41
|
+
assert_equal expected, parsed
|
42
|
+
end
|
43
|
+
|
44
|
+
def test_parse_ruby4
|
45
|
+
src = "水鉢を置いた※[#「木+靈」、第3水準1-86-29]子窓《れんじまど》の下には\r\n"
|
46
|
+
parsed = parse_text(src)
|
47
|
+
expected = "水鉢を置いた<ruby><rb><img src=\"../../../gaiji/1-86/1-86-29.png\" alt=\"※(「木+靈」、第3水準1-86-29)\" class=\"gaiji\" />子窓</rb><rp>(</rp><rt>れんじまど</rt><rp>)</rp></ruby>の下には<br />\r\n"
|
48
|
+
assert_equal expected, parsed
|
49
|
+
end
|
50
|
+
|
51
|
+
def test_parse_ruby5
|
52
|
+
src = "それが彼の 〔E'tude〕《エチュード》 だった。\r\n"
|
53
|
+
parsed = parse_text(src)
|
54
|
+
expected = "それが彼の <ruby><rb><img src=\"../../../gaiji/1-09/1-09-32.png\" alt=\"※(アキュートアクセント付きE)\" class=\"gaiji\" />tude</rb><rp>(</rp><rt>エチュード</rt><rp>)</rp></ruby> だった。<br />\r\n"
|
55
|
+
assert_equal expected, parsed
|
56
|
+
end
|
57
|
+
|
58
|
+
def test_parse_ruby6
|
59
|
+
src = "青空文庫[#「青空文庫」の左に「あおぞらぶんこ」のルビ]\r\n"
|
60
|
+
parsed = parse_text(src)
|
61
|
+
expected = "青空文庫<span class=\"notes\">[#「青空文庫」の左に「あおぞらぶんこ」のルビ]</span><br />\r\n"
|
62
|
+
assert_equal expected, parsed
|
63
|
+
end
|
64
|
+
|
65
|
+
def test_parse_ruby7
|
66
|
+
src = "青空文庫《あおぞらぶんこ》[#「青空文庫」の左に「aozora bunko」のルビ]\r\n"
|
67
|
+
parsed = parse_text(src)
|
68
|
+
expected = %Q|<ruby><rb>青空文庫</rb><rp>(</rp><rt>あおぞらぶんこ</rt><rp>)</rp></ruby><span class="notes">[#「青空文庫」の左に「aozora bunko」のルビ]</span><br />\r\n|
|
69
|
+
assert_equal expected, parsed
|
70
|
+
end
|
71
|
+
|
72
|
+
def test_parse_ruby8
|
73
|
+
src = "大空文庫[#「大空文庫」に「ママ」の注記]\r\n"
|
74
|
+
parsed = parse_text(src)
|
75
|
+
expected = %Q|<ruby><rb>大空文庫</rb><rp>(</rp><rt>ママ</rt><rp>)</rp></ruby><br />\r\n|
|
76
|
+
assert_equal expected, parsed
|
77
|
+
end
|
78
|
+
|
79
|
+
def test_parse_ruby9
|
80
|
+
src = "大空文庫[#「大空文庫」の左に「ママ」の注記]\r\n"
|
81
|
+
parsed = parse_text(src)
|
82
|
+
expected = %Q|大空文庫<span class="notes">[#「大空文庫」の左に「ママ」の注記]</span><br />\r\n|
|
83
|
+
assert_equal expected, parsed
|
84
|
+
end
|
85
|
+
|
86
|
+
def test_parse_ruby10
|
87
|
+
src = "大空文庫《あおぞらぶんこ》[#「大空文庫」の左に「ママ」の注記]\r\n"
|
88
|
+
parsed = parse_text(src)
|
89
|
+
expected = %Q|<ruby><rb>大空文庫</rb><rp>(</rp><rt>あおぞらぶんこ</rt><rp>)</rp></ruby><span class="notes">[#「大空文庫」の左に「ママ」の注記]</span><br />\r\n|
|
90
|
+
assert_equal expected, parsed
|
91
|
+
end
|
92
|
+
|
93
|
+
def test_parse_ruby11
|
94
|
+
src = "大空文庫《あおぞらぶんこ》[#「大空文庫」の左に「ママ」の注記]\r\n"
|
95
|
+
parsed = parse_text(src)
|
96
|
+
expected = %Q|<ruby><rb>大空文庫</rb><rp>(</rp><rt>あおぞらぶんこ</rt><rp>)</rp></ruby><span class="notes">[#「大空文庫」の左に「ママ」の注記]</span><br />\r\n|
|
97
|
+
assert_equal expected, parsed
|
98
|
+
end
|
99
|
+
|
100
|
+
def test_parse_ruby12
|
101
|
+
src = "大空文庫《あおぞらぶんこ》[#「大空文庫」に「ママ」の注記]\r\n"
|
102
|
+
assert_raise(Aozora2Html::Error.new("同じ箇所に2つのルビはつけられません".encode("shift_jis"))) do
|
103
|
+
_parsed = parse_text(src)
|
104
|
+
end
|
105
|
+
end
|
106
|
+
|
107
|
+
def test_parse_ruby13
|
108
|
+
src = "[#注記付き]名※[#二の字点、1-2-22][#「(銘々)」の注記付き終わり]\r\n"
|
109
|
+
parsed = parse_text(src)
|
110
|
+
expected = %Q|<ruby><rb>名<img src="../../../gaiji/1-02/1-02-22.png" alt="※(二の字点、1-2-22)" class="gaiji" /></rb><rp>(</rp><rt>(銘々)</rt><rp>)</rp></ruby><br />\r\n|
|
111
|
+
assert_equal expected, parsed
|
112
|
+
end
|
113
|
+
|
114
|
+
def parse_text(input_text)
|
115
|
+
input = StringIO.new(input_text.encode("shift_jis"))
|
116
|
+
output = StringIO.new
|
117
|
+
parser = Aozora2Html.new(input, output)
|
118
|
+
parser.instance_eval{@section=:tail}
|
119
|
+
catch(:terminate) do
|
120
|
+
loop do
|
121
|
+
parser.parse
|
122
|
+
end
|
123
|
+
end
|
124
|
+
|
125
|
+
output.string.encode("utf-8")
|
126
|
+
end
|
127
|
+
|
128
|
+
end
|
129
|
+
|
130
|
+
|
data/test/test_ruby_tag.rb
CHANGED
@@ -4,17 +4,18 @@ require 'aozora2html'
|
|
4
4
|
|
5
5
|
class RubyTagTest < Test::Unit::TestCase
|
6
6
|
def setup
|
7
|
+
@parser = Object.new
|
7
8
|
stub(@parser).block_allowed_context?{true}
|
8
9
|
end
|
9
10
|
|
10
11
|
def test_ruby_new
|
11
|
-
tag =
|
12
|
-
assert_equal
|
13
|
-
assert_equal true, tag.kind_of?(
|
12
|
+
tag = Aozora2Html::Tag::Ruby.new(@parser,"aaa".encode("shift_jis"),"bb")
|
13
|
+
assert_equal Aozora2Html::Tag::Ruby, tag.class
|
14
|
+
assert_equal true, tag.kind_of?(Aozora2Html::Tag::Inline)
|
14
15
|
end
|
15
16
|
|
16
17
|
def test_to_s
|
17
|
-
tag =
|
18
|
+
tag = Aozora2Html::Tag::Ruby.new(@parser,"テスト".encode("shift_jis"),"てすと".encode("shift_jis"))
|
18
19
|
assert_equal "<ruby><rb>テスト</rb><rp>(</rp><rt>てすと</rt><rp>)</rp></ruby>", tag.to_s.encode("utf-8")
|
19
20
|
end
|
20
21
|
|
data/test/test_tag_parser.rb
CHANGED
@@ -6,14 +6,14 @@ require 'tmpdir'
|
|
6
6
|
|
7
7
|
class TagParserTest < Test::Unit::TestCase
|
8
8
|
def setup
|
9
|
-
@jisx0213 =
|
9
|
+
@jisx0213 = Aozora2Html::Tag::EmbedGaiji.use_jisx0213
|
10
10
|
end
|
11
11
|
|
12
12
|
def test_parse_katakana
|
13
13
|
str = "テスト!あいうえお\r\n".encode("shift_jis")
|
14
14
|
strio = StringIO.new(str)
|
15
15
|
stream = Jstream.new(strio)
|
16
|
-
command,
|
16
|
+
command, _raw = Aozora2Html::TagParser.new(stream,"!".encode("shift_jis"),{},[]).process
|
17
17
|
expected = "テスト"
|
18
18
|
assert_equal expected, command.to_s.encode("utf-8")
|
19
19
|
end
|
@@ -22,7 +22,7 @@ class TagParserTest < Test::Unit::TestCase
|
|
22
22
|
str = "腹がへっても[#「腹がへっても」に傍点]、ひもじゅうない[#「ひもじゅうない」に傍点]とかぶりを振っている…\r\n".encode("shift_jis")
|
23
23
|
strio = StringIO.new(str)
|
24
24
|
stream = Jstream.new(strio)
|
25
|
-
command,
|
25
|
+
command, _raw = Aozora2Html::TagParser.new(stream,"…".encode("shift_jis"),{},[]).process
|
26
26
|
expected = '<em class="sesame_dot">腹がへっても</em>、<em class="sesame_dot">ひもじゅうない</em>とかぶりを振っている'
|
27
27
|
assert_equal expected, command.to_s.encode("utf-8")
|
28
28
|
end
|
@@ -31,7 +31,7 @@ class TagParserTest < Test::Unit::TestCase
|
|
31
31
|
str = "※[#「てへん+劣」、第3水準1-84-77]…\r\n".encode("shift_jis")
|
32
32
|
strio = StringIO.new(str)
|
33
33
|
stream = Jstream.new(strio)
|
34
|
-
command,
|
34
|
+
command, _raw = Aozora2Html::TagParser.new(stream,"…".encode("shift_jis"),{},[]).process
|
35
35
|
expected = '<img src="../../../gaiji/1-84/1-84-77.png" alt="※(「てへん+劣」、第3水準1-84-77)" class="gaiji" />'
|
36
36
|
assert_equal expected, command.to_s.encode("utf-8")
|
37
37
|
end
|
@@ -40,7 +40,7 @@ class TagParserTest < Test::Unit::TestCase
|
|
40
40
|
str = "※[#「口+世」、ページ数-行数]…\r\n".encode("shift_jis")
|
41
41
|
strio = StringIO.new(str)
|
42
42
|
stream = Jstream.new(strio)
|
43
|
-
command,
|
43
|
+
command, _raw = Aozora2Html::TagParser.new(stream,"…".encode("shift_jis"),{},[]).process
|
44
44
|
expected = '※<span class="notes">[#「口+世」、ページ数-行数]</span>'
|
45
45
|
assert_equal expected, command.to_s.encode("utf-8")
|
46
46
|
end
|
@@ -49,7 +49,7 @@ class TagParserTest < Test::Unit::TestCase
|
|
49
49
|
str = "※[#二の字点、1-2-22]…\r\n".encode("shift_jis")
|
50
50
|
strio = StringIO.new(str)
|
51
51
|
stream = Jstream.new(strio)
|
52
|
-
command,
|
52
|
+
command, _raw = Aozora2Html::TagParser.new(stream,"…".encode("shift_jis"),{},[]).process
|
53
53
|
expected = '<img src="../../../gaiji/1-02/1-02-22.png" alt="※(二の字点、1-2-22)" class="gaiji" />'
|
54
54
|
assert_equal expected, command.to_s.encode("utf-8")
|
55
55
|
end
|
@@ -58,23 +58,23 @@ class TagParserTest < Test::Unit::TestCase
|
|
58
58
|
str = "自[#二]女王國[#一]東度[#レ]海千餘里。…\r\n".encode("shift_jis")
|
59
59
|
strio = StringIO.new(str)
|
60
60
|
stream = Jstream.new(strio)
|
61
|
-
command,
|
61
|
+
command, _raw = Aozora2Html::TagParser.new(stream,"…".encode("shift_jis"),{},[]).process
|
62
62
|
expected = '自<sub class="kaeriten">二</sub>女王國<sub class="kaeriten">一</sub>東度<sub class="kaeriten">レ</sub>海千餘里。'
|
63
63
|
assert_equal expected, command.to_s.encode("utf-8")
|
64
64
|
end
|
65
65
|
|
66
66
|
def test_parse_gaiji_jisx0213
|
67
|
-
|
67
|
+
Aozora2Html::Tag::EmbedGaiji.use_jisx0213 = true
|
68
68
|
str = "※[#「てへん+劣」、第3水準1-84-77]…\r\n".encode("shift_jis")
|
69
69
|
strio = StringIO.new(str)
|
70
70
|
stream = Jstream.new(strio)
|
71
|
-
command,
|
71
|
+
command, _raw = Aozora2Html::TagParser.new(stream,"…".encode("shift_jis"),{},[]).process
|
72
72
|
expected = '挘'
|
73
73
|
assert_equal expected, command.to_s.encode("utf-8")
|
74
74
|
end
|
75
75
|
|
76
76
|
def teardown
|
77
|
-
|
77
|
+
Aozora2Html::Tag::EmbedGaiji.use_jisx0213 = @jisx0213
|
78
78
|
end
|
79
79
|
end
|
80
80
|
|
data/vendor/jis2ucs/README.md
CHANGED
@@ -4,7 +4,7 @@ JIS X 0213の面区点番号からUnicode(UCS)の数値文字参照に変換す
|
|
4
4
|
|
5
5
|
元となる対応表は、下記URLのものを使っています。
|
6
6
|
|
7
|
-
http://w3.kcua.ac.jp/~fujiwara/jis2000/jis2004/jisx0213-2004-mono.html
|
7
|
+
<http://w3.kcua.ac.jp/~fujiwara/jis2000/jis2004/jisx0213-2004-mono.html>
|
8
8
|
|
9
9
|
## 生成方法
|
10
10
|
|
@@ -12,15 +12,12 @@ http://w3.kcua.ac.jp/~fujiwara/jis2000/jis2004/jisx0213-2004-mono.html
|
|
12
12
|
|
13
13
|
`jis2ucs.rb`を生成するには、コマンドラインで以下のように実行します。
|
14
14
|
|
15
|
-
```
|
15
|
+
```shell-session
|
16
16
|
$ ruby mkconv.rb > ../../lib/aozora2html/jis2ucs.rb
|
17
17
|
```
|
18
18
|
|
19
19
|
## License
|
20
20
|
|
21
|
-
jis2ucs.rb
|
22
|
-
|
21
|
+
`jis2ucs.rb`のLicenseはCC0とします。
|
23
22
|
|
24
23
|
Masayoshi Takahashi
|
25
|
-
|
26
|
-
|
@@ -0,0 +1,240 @@
|
|
1
|
+
---
|
2
|
+
"!":
|
3
|
+
"@":
|
4
|
+
- 1-09/1-09-03
|
5
|
+
- 逆感嘆符
|
6
|
+
"?":
|
7
|
+
"@":
|
8
|
+
- 1-09/1-09-22
|
9
|
+
- 逆疑問符
|
10
|
+
A:
|
11
|
+
"`":
|
12
|
+
- 1-09/1-09-23
|
13
|
+
- グレーブアクセント付きA
|
14
|
+
"'":
|
15
|
+
- 1-09/1-09-24
|
16
|
+
- アキュートアクセント付きA
|
17
|
+
"^":
|
18
|
+
- 1-09/1-09-25
|
19
|
+
- サーカムフレックスアクセント付き
|
20
|
+
"~":
|
21
|
+
- 1-09/1-09-26
|
22
|
+
- チルド付きA
|
23
|
+
":":
|
24
|
+
- 1-09/1-09-27
|
25
|
+
- ダイエレシス付きA
|
26
|
+
"&":
|
27
|
+
- 1-09/1-09-28
|
28
|
+
- 上リング付きA
|
29
|
+
_:
|
30
|
+
- 1-09/1-09-85
|
31
|
+
- マクロン付きA
|
32
|
+
E:
|
33
|
+
"&":
|
34
|
+
- 1-09/1-09-29
|
35
|
+
- リガチャAE
|
36
|
+
C:
|
37
|
+
",":
|
38
|
+
- 1-09/1-09-30
|
39
|
+
- セディラ付きC
|
40
|
+
E:
|
41
|
+
"`":
|
42
|
+
- 1-09/1-09-31
|
43
|
+
- グレーブアクセント付きE
|
44
|
+
"'":
|
45
|
+
- 1-09/1-09-32
|
46
|
+
- アキュートアクセント付きE
|
47
|
+
"^":
|
48
|
+
- 1-09/1-09-33
|
49
|
+
- サーカムフレックスアクセント付きE
|
50
|
+
":":
|
51
|
+
- 1-09/1-09-34
|
52
|
+
- ダイエレシス付きE
|
53
|
+
_:
|
54
|
+
- 1-09/1-09-88
|
55
|
+
- マクロン付きE
|
56
|
+
I:
|
57
|
+
"`":
|
58
|
+
- 1-09/1-09-35
|
59
|
+
- グレーブアクセント付きI
|
60
|
+
"'":
|
61
|
+
- 1-09/1-09-36
|
62
|
+
- アキュートアクセント付きI
|
63
|
+
"^":
|
64
|
+
- 1-09/1-09-37
|
65
|
+
- サーカムフレックスアクセント付きI
|
66
|
+
":":
|
67
|
+
- 1-09/1-09-38
|
68
|
+
- ダイエレシス付きI
|
69
|
+
_:
|
70
|
+
- 1-09/1-09-86
|
71
|
+
- マクロン付きI
|
72
|
+
N:
|
73
|
+
"~":
|
74
|
+
- 1-09/1-09-40
|
75
|
+
- チルド付きN
|
76
|
+
O:
|
77
|
+
"`":
|
78
|
+
- 1-09/1-09-41
|
79
|
+
- グレーブアクセント付きO
|
80
|
+
"'":
|
81
|
+
- 1-09/1-09-42
|
82
|
+
- アキュートアクセント付きO
|
83
|
+
"^":
|
84
|
+
- 1-09/1-09-43
|
85
|
+
- サーカムフレックスアクセント付きO
|
86
|
+
"~":
|
87
|
+
- 1-09/1-09-44
|
88
|
+
- チルド付きO
|
89
|
+
":":
|
90
|
+
- 1-09/1-09-45
|
91
|
+
- ダイエレシス付きO
|
92
|
+
"/":
|
93
|
+
- 1-09/1-09-46
|
94
|
+
- ストローク付きO
|
95
|
+
_:
|
96
|
+
- 1-09/1-09-89
|
97
|
+
- マクロン付きO
|
98
|
+
E:
|
99
|
+
"&":
|
100
|
+
- 1-11/1-11-11
|
101
|
+
- リガチャOE大文字
|
102
|
+
U:
|
103
|
+
"`":
|
104
|
+
- 1-09/1-09-47
|
105
|
+
- グレーブアクセント付きU
|
106
|
+
"'":
|
107
|
+
- 1-09/1-09-48
|
108
|
+
- アキュートアクセント付きU
|
109
|
+
"^":
|
110
|
+
- 1-09/1-09-49
|
111
|
+
- サーカムフレックスアクセント付きU
|
112
|
+
":":
|
113
|
+
- 1-09/1-09-50
|
114
|
+
- ダイエレシス付きU
|
115
|
+
_:
|
116
|
+
- 1-09/1-09-87
|
117
|
+
- マクロン付きU
|
118
|
+
Y:
|
119
|
+
"'":
|
120
|
+
- 1-09/1-09-51
|
121
|
+
- アキュートアクセント付きY
|
122
|
+
s:
|
123
|
+
"&":
|
124
|
+
- 1-09/1-09-53
|
125
|
+
- ドイツ語エスツェット
|
126
|
+
a:
|
127
|
+
"`":
|
128
|
+
- 1-09/1-09-54
|
129
|
+
- グレーブアクセント付きA小文字
|
130
|
+
"'":
|
131
|
+
- 1-09/1-09-55
|
132
|
+
- アキュートアクセント付きA小文字
|
133
|
+
"^":
|
134
|
+
- 1-09/1-09-56
|
135
|
+
- サーカムフレックスアクセント付きA小文字
|
136
|
+
"~":
|
137
|
+
- 1-09/1-09-57
|
138
|
+
- チルド付きA小文字
|
139
|
+
":":
|
140
|
+
- 1-09/1-09-58
|
141
|
+
- ダイエレシス付きA小文字
|
142
|
+
"&":
|
143
|
+
- 1-09/1-09-59
|
144
|
+
- 上リング付きA小文字
|
145
|
+
_:
|
146
|
+
- 1-09/1-09-90
|
147
|
+
- マクロン付きA小文字
|
148
|
+
e:
|
149
|
+
"&":
|
150
|
+
- 1-09/1-09-60
|
151
|
+
- リガチャAE小文字
|
152
|
+
c:
|
153
|
+
",":
|
154
|
+
- 1-09/1-09-61
|
155
|
+
- セディラ付きC小文字
|
156
|
+
e:
|
157
|
+
"`":
|
158
|
+
- 1-09/1-09-62
|
159
|
+
- グレーブアクセント付きE小文字
|
160
|
+
"'":
|
161
|
+
- 1-09/1-09-63
|
162
|
+
- アキュートアクセント付きE小文字
|
163
|
+
"^":
|
164
|
+
- 1-09/1-09-64
|
165
|
+
- サーカムフレックスアクセント付きE小文字
|
166
|
+
":":
|
167
|
+
- 1-09/1-09-65
|
168
|
+
- ダイエレシス付きE小文字
|
169
|
+
_:
|
170
|
+
- 1-09/1-09-93
|
171
|
+
- マクロン付きE小文字
|
172
|
+
i:
|
173
|
+
"`":
|
174
|
+
- 1-09/1-09-66
|
175
|
+
- グレーブアクセント付きI小文字
|
176
|
+
"'":
|
177
|
+
- 1-09/1-09-67
|
178
|
+
- アキュートアクセント付きI小文字
|
179
|
+
"^":
|
180
|
+
- 1-09/1-09-68
|
181
|
+
- サーカムフレックスアクセント付きI小文字
|
182
|
+
":":
|
183
|
+
- 1-09/1-09-69
|
184
|
+
- ダイエレシス付きI小文字
|
185
|
+
_:
|
186
|
+
- 1-09/1-09-91
|
187
|
+
- マクロン付きI小文字
|
188
|
+
n:
|
189
|
+
"~":
|
190
|
+
- 1-09/1-09-71
|
191
|
+
- チルド付きN小文字
|
192
|
+
o:
|
193
|
+
"`":
|
194
|
+
- 1-09/1-09-72
|
195
|
+
- グレーブアクセント付きO小文字
|
196
|
+
"'":
|
197
|
+
- 1-09/1-09-73
|
198
|
+
- アキュートアクセント付きO小文字
|
199
|
+
"^":
|
200
|
+
- 1-09/1-09-74
|
201
|
+
- サーカムフレックスアクセント付きO小文字
|
202
|
+
"~":
|
203
|
+
- 1-09/1-09-75
|
204
|
+
- チルド付きO小文字
|
205
|
+
":":
|
206
|
+
- 1-09/1-09-76
|
207
|
+
- ダイエレシス付きO小文字
|
208
|
+
_:
|
209
|
+
- 1-09/1-09-94
|
210
|
+
- マクロン付きO小文字
|
211
|
+
"/":
|
212
|
+
- 1-09/1-09-77
|
213
|
+
- ストローク付きO小文字
|
214
|
+
e:
|
215
|
+
"&":
|
216
|
+
- 1-11/1-11-10
|
217
|
+
- リガチャOE小文字
|
218
|
+
u:
|
219
|
+
"`":
|
220
|
+
- 1-09/1-09-78
|
221
|
+
- グレーブアクセント付きU小文字
|
222
|
+
"'":
|
223
|
+
- 1-09/1-09-79
|
224
|
+
- アキュートアクセント付きU小文字
|
225
|
+
"^":
|
226
|
+
- 1-09/1-09-80
|
227
|
+
- サーカムフレックスアクセント付きU小文字
|
228
|
+
_:
|
229
|
+
- 1-09/1-09-92
|
230
|
+
- マクロン付きU小文字
|
231
|
+
":":
|
232
|
+
- 1-09/1-09-81
|
233
|
+
- ダイエレシス付きU小文字
|
234
|
+
y:
|
235
|
+
"'":
|
236
|
+
- 1-09/1-09-82
|
237
|
+
- アキュートアクセント付きY小文字
|
238
|
+
":":
|
239
|
+
- 1-09/1-09-84
|
240
|
+
- ダイエレシス付きY小文字
|