content_scrapper 0.0.5 → 0.0.6

Sign up to get free protection for your applications and to get access to all the features.
@@ -1,7 +1,7 @@
1
1
  --- !ruby/object:Gem::Specification
2
2
  name: content_scrapper
3
3
  version: !ruby/object:Gem::Version
4
- version: 0.0.4
4
+ version: 99.99.99
5
5
  platform: ruby
6
6
  authors:
7
7
  - Gyorgy Frivolt
@@ -88,6 +88,7 @@ post_install_message:
88
88
  rdoc_options:
89
89
  - --charset=UTF-8
90
90
  require_paths:
91
+ - bin
91
92
  - lib
92
93
  required_ruby_version: !ruby/object:Gem::Requirement
93
94
  requirements:
data/VERSION CHANGED
@@ -1 +1 @@
1
- 0.0.5
1
+ 0.0.6
@@ -5,11 +5,11 @@
5
5
 
6
6
  Gem::Specification.new do |s|
7
7
  s.name = %q{content_scrapper}
8
- s.version = "0.0.5"
8
+ s.version = "0.0.6"
9
9
 
10
10
  s.required_rubygems_version = Gem::Requirement.new(">= 0") if s.respond_to? :required_rubygems_version=
11
11
  s.authors = ["Gyorgy Frivolt"]
12
- s.date = %q{2010-02-22}
12
+ s.date = %q{2010-02-28}
13
13
  s.description = %q{If you want to cut only the content of pages, without any other part (like the menu, header, footer, commercials, etc.), you might find this gem very handy. A DSL is also defined for nifty definitions for your screen scrapping and sanitization.}
14
14
  s.email = %q{gyorgy.frivolt@gmail.com}
15
15
  s.extra_rdoc_files = [
@@ -33,6 +33,7 @@ Gem::Specification.new do |s|
33
33
  "test/helper.rb",
34
34
  "test/test_content_mapping.rb",
35
35
  "test/test_content_scrapper.rb",
36
+ "test/test_pages/encoding.html",
36
37
  "test/test_pages/pretty.html",
37
38
  "test/test_pages/twocontent.html",
38
39
  "test/test_pages/ugly.html"
@@ -1,7 +1,8 @@
1
+ require 'iconv'
1
2
 
2
3
  class ContentMapping
3
4
 
4
- attr_reader :content_xpaths_list, :url_pattern_regexp
5
+ attr_reader :content_xpaths_list, :url_pattern_regexp, :iconv_from, :iconv_to
5
6
 
6
7
  def initialize
7
8
  @content_xpaths_list = []
@@ -15,6 +16,11 @@ class ContentMapping
15
16
  @content_xpaths_list << content_xpath
16
17
  end
17
18
 
19
+ def iconv(args)
20
+ @iconv_from = args[:from]
21
+ @iconv_to = args[:to]
22
+ end
23
+
18
24
  def matches_url?(url)
19
25
  url =~ @url_pattern_regexp
20
26
  end
@@ -24,6 +30,7 @@ class ContentMapping
24
30
  content_section = doc.xpath(content_xpath)
25
31
  content = content_section.to_a.join("\n")
26
32
  content = Sanitize.clean(content, content_scrapper.sanitize_settings) unless content_scrapper.nil?
33
+ content = Iconv.conv(to=iconv_to, from=iconv_from, content) unless iconv_to.nil?
27
34
  return content if content_section.count > 0
28
35
  end
29
36
  nil
@@ -41,4 +41,19 @@ class TestContentMapping < Test::Unit::TestCase
41
41
  end
42
42
  end
43
43
 
44
+ context "on pattern for page for encoding" do
45
+ setup do
46
+ @mapping = ContentMapping.new
47
+ @mapping.instance_eval do
48
+ url_pattern /^http:\/\/www\.matchme\.com\//
49
+ content_at '//div[@class="node node-story"]/div[@class="content"]/p'
50
+ iconv :to => 'utf8', :from => 'latin1'
51
+ end
52
+ page = File.open("#{File.dirname(__FILE__)}/test_pages/encoding.html").read
53
+ @document = Nokogiri::HTML(page)
54
+ end
55
+ should "scrap a page with converted content" do
56
+ @mapping.scrap_content(@document)
57
+ end
58
+ end
44
59
  end
@@ -0,0 +1,401 @@
1
+ <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Strict//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-strict.dtd">
2
+ <html xmlns="http://www.w3.org/1999/xhtml" lang="hu" xml:lang="hu">
3
+ <body>
4
+ <head>
5
+ <title>Hét faluból tizenhárom elsős - mi lesz veled, Zoboralja? | Új Szó Online</title>
6
+ <style type="text/css" media="all">@import "/files/css/fc90e27d76dea4e437bc94916391dc85.css";</style>
7
+ <!--[if IE 7]><link rel="stylesheet" href="/sites/all/themes/ujszo_v3/css/fix-ie7.css" type="text/css"><![endif]-->
8
+ <!--[if lte IE 6]><link rel="stylesheet" href="/sites/all/themes/ujszo_v3/css/fix-ie6.css" type="text/css"><![endif]--> <meta http-equiv="Content-Type" content="text/html; charset=utf-8" />
9
+
10
+ <!-- Additional IE/Win specific style sheet (Conditional Comments) -->
11
+ <!--[if IE]>
12
+ <style type="text/css" media="all">@import "/sites/all/modules/jstools/tabs/tabs-ie.css";</style>
13
+ <![endif]-->
14
+
15
+ <link rel="alternate" type="application/rss+xml" title="Új Szó RSS hírcsatorna" href="/rss.xml" />
16
+
17
+ <link rel="shortcut icon" href="/files/favicon.gif" type="image/x-icon" />
18
+ <meta name = "description" content = "Szlovákiai magyar napilap"/>
19
+ <meta name="verify-v1" content="MP8qxYv97DSWqgDjc/v4VFbmsnPzb9ngO5yOer4OtCw=" />
20
+ </head>
21
+ <body>
22
+ <div id="frame" >
23
+
24
+ <!-- Header -->
25
+ <div id="header">
26
+ <div id="logo"><a href="/"><img src="/files/icons/logo.png" alt="Új Szó logó" title = "Az Új Szó Online címlapja" /></a></div> <div id="header-top"><div id="block-uj_szo-0" class="block uj_szo">
27
+ <div class="content"><ul><li class="first print-cimlap"><a href="/napilap-cimlap/friss/2010/02/22" title="Az Új Szó nyomtatott kiadásának címlapja" class="print-cimlap">Napilap</a></li>
28
+ <li class="elofizetes"><a href="http://predplatne.petitpress.sk/form.php?id_tit=100" title="Fizessen elő a napilapra" class="elofizetes">Előfizetés</a></li>
29
+ <li class="hirdetes"><a href="/hirdetes" title="Hirdetőinknek" class="hirdetes">Hirdetés</a></li>
30
+ <li class="last kapcsolat"><a href="/kapcsolat" title="Kapcsolat" class="kapcsolat">Írjon nekünk!</a></li>
31
+ </ul></div>
32
+ </div><div id="block-block-10" class="block block">
33
+ <div class="content"><form action="http://www.google.com/cse" id="cse-search-box">
34
+ <div><input type="hidden" name="cx" value="001394528048999203370:hvb0wufmbgm" /><input type="hidden" name="ie" value="UTF-8" /><input type="text" name="q" size="31"/></div>
35
+ </form></div>
36
+ </div></div> <div id="header-middle"><div id="block-uj_szo_ads-1" class="block uj_szo_ads">
37
+ <div class="content"><div id='bmone2n-595.3.2.64'>
38
+ <noscript><div style='display:inline'><a href='http://go.cz.bbelements.com/please/redirect/595/3/2/64/'><img src='http://go.cz.bbelements.com/please/showit/595/3/2/64/?typkodu=img' width='990' height='100' style='border-width:0' alt='' /></a></div></noscript></div></div>
39
+ </div></div> </div>
40
+ <div id="header-bottom"><div id="block-nameday-0" class="block nameday">
41
+ <div class="content"><span>2010. február 23. kedd</span>Ma: <span>Alfréd (HU), Roman(a) (SK)</span>Holnap: <span>Mátyás (HU), Metej (SK)</span><a href="http://post.sk/pohladnice">&laquo; Küldj képeslapot!</a></div>
42
+ </div><div id="block-block-3" class="block block">
43
+ <div class="content"><p><a href="#" id="bookmark">Kedvencek közé</a> | <a href="#" id="startpage">Beállítás kezdőlapnak</a></p>
44
+ </div>
45
+ </div></div>
46
+ <div id="content"><div id="content-wrap">
47
+ <!-- Left sidebar -->
48
+ <div id="sidebar-left"><div id="block-menu-2" class="block menu">
49
+ <div class="content">
50
+ <ul class="menu">
51
+ <li class="leaf"><a href="/online-cimlap" title="Az online kiadás címlapja">Címlap</a></li>
52
+ <li class="leaf"><a href="/online/kozelet-cimlap" title="Az online kiadás Közélet rovatának címlapja">Közélet</a></li>
53
+ <li class="leaf"><a href="/online/regio-cimlap" title="Az online kiadás Régió rovatának címlapja">Régió</a></li>
54
+ <li class="leaf"><a href="/online/velemeny-es-hatter-cimlap" title="Az online kiadás Vélemény és háttér rovatának címlapja">Vélemény és háttér</a></li>
55
+ <li class="leaf"><a href="/online/gazdasag-cimlap" title="Az online kiadás Gazdaság rovatának címlapja">Gazdaság</a></li>
56
+ <li class="leaf"><a href="/online/kulfold-cimlap" title="Az online kiadás Külföld rovatának címlapja">Külföld</a></li>
57
+ <li class="leaf"><a href="/online/kultura-cimlap" title="Az online kiadás Kultúra rovatának címlapja">Kultúra</a></li>
58
+ <li class="leaf"><a href="/online/sport-cimlap" title="Az online kiadás Sport rovatának címlapja">Sport</a></li>
59
+ <li class="leaf"><a href="/online/panorama-cimlap" title="Az online kiadás Panoráma rovatának címlapja">Panoráma</a></li>
60
+
61
+ </ul>
62
+ </div>
63
+ </div><div id="block-views-print_frontpage" class="block views">
64
+ <h2>Az Új Szó aktuális címlapja</h2> <div class="content"><div class='view view-print-frontpage'><ul><li><div class='field-print-frontpage-image-fid'><a href="/printfront/2010/02/22/2010-02-23"><img src="http://ujszo.com/files/imagecache/print_edition_frontpage/files/UJO0_20100223_001.jpg" alt="" title="Az Új Szó keddi címlapja" /></a></div></li></ul></div>
65
+ </div>
66
+ </div><div id="block-block-12" class="block block">
67
+ <div class="content"><p><a href="/angol_nyelvlecke"><img src="/files/english_lessons/english-lessons.jpg" alt="Angol<br />
68
+ nyelvlecke" /></a><br/><a href="/dok"><img src="/files/download_document2.jpg" alt="Letölthető dokumentumok" /></a><!--<br/><a href="/foiskolai-melleklet"><img src="/files/english_lessons/egyetem.jpg" alt="Főiskolai melléklet" /></a>--></p>
69
+ </div>
70
+ </div><div id="block-views-weather_temp" class="block views">
71
+ <h2>Időjárás</h2> <div class="content"><div class='view view-weather-temp'><div class="weather-icons">
72
+ <span class="west"><span class="weather_icon"><img src="/files/icons/rainy.gif" alt="Esős" /></span></span>
73
+ <span class="center"><span class="weather_icon"><img src="/files/icons/rainy.gif" alt="Esős" /></span></span>
74
+ <span class="east"><span class="weather_icon"><img src="/files/icons/snowy.gif" alt="Havas" /></span></span>
75
+ </div>
76
+ <div class="weather-temperatures">
77
+ <span class="west">6°C</span>
78
+ <span class="center">6°C</span>
79
+ <span class="east">5°C</span>
80
+ </div>
81
+ </div>
82
+ </div>
83
+ </div><div id="block-views-weather_desc" class="block views">
84
+ <div class="content"><div class='view view-weather-desc'><ul><li><div class='title'><h3><a href="/idojaras-leiras/2010/02/21/vasarnap-hetfo-es-kedd">Vasárnap, hétfő és kedd</a></h3></div><div class='body'><span class='print-link'></span><p><b>Vasárnap </b>országszerte jobbára derült az égbolt, helyenként azonban hosszabb-rövidebb időre megnövekedhet a felhőzet. Itt-ott eső, havazás, hószállingózás is előfordulhat. A legmagasabba nappali hőmérséklet 3 és 7 fok közt alakul. Éjszakára -1 és -5 fokközé hűl le a levegő.</p>
85
+ <p> <b>Hétfőre </b>megnövekszik a felhőzet, sok helyen valószínű csapadék. Napközben 0 és 4, délnyugaton 6 fok körüli hőmérséklet valószínű. Éjjel +2 és -3 fok közti értékeket mutathat a hőmérő.</p>
86
+ <p> <b>Kedden </b>délelőtt változékony lesz az időjárás, sokfelé képződhet köd. Délután már borult égboltra, esőkre, esetleg havazásra számíthatunk. Nappal 4-9 fok várható.</p>
87
+ </div></li></ul></div>
88
+ </div>
89
+ </div><div id="block-anonymous_poll-0" class="block anonymous_poll">
90
+ <h2>Közvélemény-kutatás</h2> <div class="content"><form action="/szavazas/329889" accept-charset="UTF-8" method="post" id="anonymous-poll-view-voting">
91
+ <div><div class="anonymous_poll"> <div class="vote-form"> <div class="choices"><div class="form-item">
92
+ <label>Ön figyelemmel kíséri a téli olimpia eseményeit? </label>
93
+ <div class="form-radios"><div class="form-item" id="edit-choice-wrapper">
94
+ <label class="option"><input type="radio" name="choice" value="0" class="form-radio" /> Igen</label>
95
+ </div>
96
+ <div class="form-item" id="edit-choice-wrapper">
97
+ <label class="option"><input type="radio" name="choice" value="1" class="form-radio" /> Nem</label>
98
+ </div>
99
+ <div class="form-item" id="edit-choice-wrapper">
100
+ <label class="option"><input type="radio" name="choice" value="2" class="form-radio" /> Ritkán</label>
101
+ </div>
102
+ </div>
103
+ </div>
104
+ </div><input type="hidden" name="nid" id="edit-nid" value="329889" />
105
+ <input type="submit" name="op" id="edit-vote" value="Szavazás" class="form-submit" />
106
+ </div><input type="hidden" name="form_id" id="edit-anonymous-poll-view-voting" value="anonymous_poll_view_voting" />
107
+ </div>
108
+ </div></form>
109
+ <ul class="links"><li class="first 0"><a href="/anonymous-poll" title="A webhelyen indított szavazások." class="0">Korábbi szavazások</a></li>
110
+ <li class="last 1"><a href="/szavazas/329889" title="Eredmények megtekintése." class="1">Eredmények</a></li>
111
+ </ul></div>
112
+ </div><div id="block-nbs_exchange_rates-0" class="block nbs_exchange_rates">
113
+ <h2>Napi árfolyamok</h2> <div class="content"><table><tbody><tr><td class="flag flag-USD">USD</td><td></td><td class="arrow arrow-up">1,36</td></tr><tr><td class="flag flag-CZK">CZK</td><td></td><td class="arrow arrow-down">25,75</td></tr><tr><td class="flag flag-GBP">GBP</td><td></td><td class="arrow arrow-nochange">0,88</td></tr><tr><td class="flag flag-HUF">HUF</td><td></td><td class="arrow arrow-down">269,75</td></tr><tr><td class="flag flag-PLN">PLN</td><td></td><td class="arrow arrow-down">3,96</td></tr></tbody></table></div>
114
+ </div><div id="block-views-useful_links" class="block views">
115
+ <h2>Hasznos linkek</h2> <div class="content"><div class='view view-useful-links'><ul><li><div class='body'><span class='print-link'></span><div class="field field-type-link field-field-link"><div class="field-items"><div class="field-item odd"><a href="http://www.foruminst.sk/index.php?p=&amp;t=a&amp;xp=&amp;Data_Id=1&amp;MId=&amp;Lev=&amp;Ind=11&amp;P=index,hu," target="_blank">Szlovákiai települések nevei magyarul</a></div><div class="field-item even"><a href="http://stratyanalezy.sk/" target="_blank">Talált tárgyak</a></div><div class="field-item odd"><a href="http://www.obedovat.sk/bratislava/restauracie.php" target="_blank">Hol ebédeljek?</a></div><div class="field-item even"><a href="http://poloha.vlaku.info/" target="_blank">Vonatok késése</a></div><div class="field-item odd"><a href="http://www.cp.sk/" target="_blank">Vasúti és autóbusz-menetrend</a></div><div class="field-item even"><a href="http://www.elvira.hu/" target="_blank">Magyarországi vasúti menetrend</a></div><div class="field-item odd"><a href="http://www.menetrendek.hu/" target="_blank">Magyarországi tömegközlekedési menetrendek egy helyen</a></div></div></div></div></li></ul></div>
116
+ </div>
117
+ </div><div id="block-block-13" class="block block">
118
+ <div class="content"><div style="width:100%;text-align:center">
119
+ <a href="http://mti.hu" target="_blank"><img src="/files/partners/mti_logo2.jpg" alt="MTI hírek jogtisztán" border="0"/><br />
120
+ </a>
121
+ </div>
122
+ </div>
123
+ </div></div> <!-- Main and right -->
124
+ <div id="main-and-right">
125
+ <!-- Main -->
126
+ <div id="main">
127
+ <div class="breadcrumb"><a href="/">Címlap</a> » <a href="/taxonomy/term/4">Régió</a></div> <div class="node node-story">
128
+
129
+ <!-- Title area -->
130
+ <div class="one-line-teaser"></div>
131
+ <h1>
132
+ Hét faluból tizenhárom elsős - mi lesz veled, Zoboralja? </h1>
133
+
134
+ <!-- Meta -->
135
+ <div class="meta">
136
+ <div class="font-send-print"><a href="/forward?path=online/regio/2010/02/23/het-falubol-tizenharom-elsos-mi-lesz-veled-zoboralja"><img src="/files/icons/envelope.png" alt="Cikk küldése ismerősnek" /></a><a href="/print/331570"><img src="/files/icons/printer.png" alt="Cikk nyomtatása" /></a> </div>
137
+ <div class="submitted">2010. február 23. kedd, 10:42 | <a href="/user/53">Vrabec Mária</a></div>
138
+ </div>
139
+
140
+ <!-- Intro -->
141
+ <div class="intro">
142
+ <div class="logline">Nyitra</div> |
143
+ <div class="long-teaser"><p>Csupán tizenhárom gyereket írattak magyar iskolába a Zoboralján, a legtöbb faluban kettőt, két településen pedig egyet sem. Két magyar elsős lesz a Nyitrai járás legnagyobb magyar községében, Nagycétényben. Sovány vigasz, hogy a szlovák osztályba is csak két gyereket írattak be. Kálazról hatodik éve egy gyerek sem jár Nagycéténybe, az iskolabusz már csak öt felső tagozatos diákot szállít, közülük is az egyik nagylapási. Nyitracsehin is két gyerek megy magyar iskolába.</p>
144
+ </div>
145
+ </div>
146
+
147
+ <!-- Single image -->
148
+ <div class="image"><img src="http://ujszo.com/files/imagecache/story_image/files/beirat.jpg" alt="" title="" /></div>
149
+ <div class="image-caption"></div>
150
+ <div class="image-photographer">ČTK-felvétel</div>
151
+
152
+ <!-- Gallery -->
153
+
154
+ <!-- Related information -->
155
+
156
+ <!-- Content -->
157
+ <div class="content"><p>Idén a pogrányi alapiskola a listavezető, öt elsőst írtattak be hozzájuk. Ketten helybeliek, egy gesztei, egy zsérei, egy pedig a csitári menedékotthonban lakik édesanyjával, és meglehet, hogy ők szeptemberig el is költöznek. Alsóbodokon, ahonnan ötödik osztálytól szintén Pogrányba járnak a gyerekek, idén egyetlen magyar elsős sincs.</p>
158
+ <p>Második éve nincs magyar elsős Gímesen sem, ami annál tragikusabb, hogy a faluban teljes szervezettségű magyar iskola működik – kilenc évfolyamban mindössze 42 gyerekkel. A felső tagozatra Gímesre utaznak a zsérei és a koloni magyar gyerekek is, mindkét faluban két-két gyereket írattak magyar iskolába. A kilátások szerint négy év múlva a járás mindhárom kilencosztályos magyar iskolájában négy diák fog ülni az ötödik osztály padjaiban, vagyis évfolyamonként több pedagógusra lesz szükség, mint ahány diákot oktatnak majd. Hogy ezt tudják-e, akarják-e majd finanszírozni az önkormányzatok, az várhatóan az őszi helyhatósági választások egyik legfontosabb témája lesz.</p>
159
+ </div>
160
+
161
+
162
+
163
+ <!-- Tags -->
164
+ <div class="taxonomy">
165
+ <h4>Címkék:</h4>
166
+ <div class="terms"><ul class="links inline"><li class="first taxonomy_term_7560"><a href="/beiratas" rel="tag" title="" class="taxonomy_term_7560">beíratás</a></li>
167
+ <li class="taxonomy_term_6125"><a href="/iskola" rel="tag" title="" class="taxonomy_term_6125">iskola</a></li>
168
+ <li class="taxonomy_term_9544"><a href="/magyar-iskola" rel="tag" title="" class="taxonomy_term_9544">magyar iskola</a></li>
169
+ <li class="taxonomy_term_3295"><a href="/oktatas-0" rel="tag" title="" class="taxonomy_term_3295">Oktatás</a></li>
170
+ <li class="last taxonomy_term_21239"><a href="/zoboralja" rel="tag" title="" class="taxonomy_term_21239">Zoboralja</a></li>
171
+ </ul></div>
172
+ </div>
173
+
174
+ <!-- Comments-->
175
+ <div class="comments">
176
+ <h4>Hozzászólások (6):</h4><br/><div class='view view-latest-comments'><ul><li><div class='timestamp'>2010. február 23. kedd 14:16</div><div class='name'>i (nem ellenőrzött)</div><div class='subject'><div class="comment-subject"><a href="/node/331570/talk#comment-34239">Kedves előttem szóló, azt</a></div></div></li><li><div class='timestamp'>2010. február 23. kedd 14:11</div><div class='name'>szlovákiai magyar(hid párti) (nem ellenőrzött)</div><div class='subject'><div class="comment-subject"><a href="/node/331570/talk#comment-34236">necsodákozzatok nagy</a></div></div></li><li><div class='timestamp'>2010. február 23. kedd 14:09</div><div class='name'>i (nem ellenőrzött)</div><div class='subject'><div class="comment-subject"><a href="/node/331570/talk#comment-34234">Zoboralja már az utolsó</a></div></div></li><li><div class='timestamp'>2010. február 23. kedd 13:29</div><div class='name'>Balkó Gábor (nem ellenőrzött)</div><div class='subject'><div class="comment-subject"><a href="/node/331570/talk#comment-34233">katasztrófa</a></div></div></li><li><div class='timestamp'>2010. február 23. kedd 12:44</div><div class='name'>Don Bosso (nem ellenőrzött)</div><div class='subject'><div class="comment-subject"><a href="/node/331570/talk#comment-34231">Most akkor mind tudósok</a></div></div></li></ul></div>
177
+ <ul class="comment-links"><li><a href="/comment/reply/331570#comment-form">Új hozzászólás</a> | <a href="/node/331570/talk">Az összes hozzászólás &raquo;</a></li></ul> </div>
178
+
179
+ <!-- Related nodes -->
180
+ <div class="related-links">
181
+ <ul>
182
+ <li><a href="/online/regio/2010/02/06/beiratkozas-galanta-csallokozkurt">Beiratkozás - Galánta, Csallóközkürt</a></li>
183
+ <li><a href="/online/regio/2010/02/04/gyakran-kenyelembol-valasztjak-a-szlovak-alapiskolat-a-szulok">Gyakran kényelemből választják a szlovák alapiskolát a szülők </a></li>
184
+ <li><a href="/online/regio/2010/02/21/matyusfoldi-beiratasi-eredmenyek">Mátyusföldi beíratási eredmények</a></li>
185
+ <li><a href="/online/kozelet/2010/02/19/keleten-vege-a-tavaszi-szunetnek">Keleten vége a tavaszi szünetnek</a></li>
186
+ <li><a href="/online/regio/2010/01/28/kis-hijan-megszunt-most-egyre-nepszerubb-az-ipolyszalkai-iskola">Kis híján megszűnt, most egyre népszerűbb az ipolyszalkai iskola</a></li>
187
+ </ul>
188
+ </div>
189
+
190
+ </div>
191
+ </div>
192
+ <!-- Right sidebar -->
193
+ <div id="sidebar-right"><div id="block-views-latest_stories" class="block views">
194
+ <div class="content"><div class='view view-latest-stories'><div class='view-header view-header-latest-stories'><h2><a href="/online">Legfrissebb hírek &raquo;</a></h2>
195
+ </div>
196
+ <ul><li><div class='created'>14:10</div><div class='title'><h3><a href="/online/regio/2010/02/23/osszefirkaltak-a-falut">Összefirkálták a falut</a></h3></div></li><li><div class='created'>13:57</div><div class='title'><h3><a href="/online/panorama/2010/02/23/a-rugalmas-munkaido-jot-tesz-az-egeszsegnek">A rugalmas munkaidő jót tesz az egészségnek </a></h3></div></li><li><div class='created'>13:10</div><div class='title'><h3><a href="/online/regio/2010/02/23/szivott-volna-de-megszivta">Szívott volna, de megszívta</a></h3></div></li><li><div class='created'>12:58</div><div class='title'><h3><a href="/online/regio/2010/02/23/betoltheto-allasok-a-levai-jarasban">Betölthető állások a Lévai járásban</a></h3></div></li><li><div class='created'>12:50</div><div class='title'><h3><a href="/online/panorama/2010/02/23/nyerjen-autot-a-vasarnappal">Nyerjen autót a Vasárnappal!</a></h3></div></li><li><div class='created'>12:39</div><div class='title'><h3><a href="/online/gazdasag/2010/02/23/maganceg-figyeli-meg-az-allampolgarokat">Magáncég figyeli meg az állampolgárokat</a></h3></div></li><li><div class='created'>12:34</div><div class='title'><h3><a href="/online/panorama/2010/02/23/vadat-emeltek-egy-amerikai-gyermekorvos-ellen-471-szeres-nemi-visszaeles-">Vádat emeltek egy amerikai gyermekorvos ellen 471-szeres nemi visszaélés miatt</a></h3></div></li><li><div class='created'>11:58</div><div class='title'><h3><a href="/online/regio/2010/02/23/tolmacs-mellett-arokba-fordult-egy-kamion">Tolmács mellett árokba fordult egy kamion</a></h3></div></li><li><div class='created'>11:43</div><div class='title'><h3><a href="/online/regio/2010/02/23/ujabb-gyilkossaggal-gyanusitjak-frantisek-s-t">Újabb gyilkossággal gyanúsítják František S.-t</a></h3></div></li><li><div class='created'>11:28</div><div class='title'><h3><a href="/online/kozelet/2010/02/23/fico-nem-ment-el-a-birosagra">Fico nem ment el a bíróságra</a></h3></div></li><li><div class='created'>11:26</div><div class='title'><h3><a href="/online/regio/2010/02/23/gyorshir-tolmacs-tlmace-mellett-arokba-fordult-egy-kamion-lezartak-az-i76-ut">GYORSHÍR: Tolmács (Tlmače) mellett árokba fordult egy kamion, lezárták az I/76 utat</a></h3></div></li><li><div class='created'>11:15</div><div class='title'><h3><a href="/online/regio/2010/02/23/szabad-munkahelyek-a-dunaszerdahelyi-jarasban">Szabad munkahelyek a Dunaszerdahelyi járásban</a></h3></div></li></ul></div>
197
+ </div>
198
+ </div><div id="block-uj_szo_ads-0" class="block uj_szo_ads">
199
+ <div class="content"><div id='bmone2n-595.6.3.20'>
200
+ <noscript><div style='display:inline'><a href='http://go.cz.bbelements.com/please/redirect/595/6/3/20/'><img src='http://go.cz.bbelements.com/please/showit/595/6/3/20/?typkodu=img' width='300' height='300' style='border-width:0' alt='' /></a></div></noscript></div></div>
201
+ </div><div id="block-quicktabs-6" class="block">
202
+ <h2 class="title">A rovat legolvasottabb hírei</h2> <div class="content"><div class="quicktabs_wrapper"><ul class="quicktabs_tabs"><li><a href="#">24 óra</a></li><li><a href="#">3 nap</a></li><li><a href="#">7 nap</a></li></ul><div class="quicktabs_main"><div class="quicktabs"><div class="block block-simple_statistics" id="block-simple_statistics-0">
203
+ <div class="content"><div class='view view-popular-24'>
204
+ <ul>
205
+ <li>
206
+ <div class='created'>13:25</div>
207
+ <div class='title'>
208
+ <h3><a href="/online/regio/2010/02/22/eltunt-frantisek-malcik-foto">Eltűnt František Malčík (fotó)</a></h3>
209
+ </div>
210
+ </li>
211
+ <li>
212
+ <div class='created'>16:59</div>
213
+ <div class='title'>
214
+ <h3><a href="/online/regio/2010/02/22/harom-napon-belul-elokerult-a-lopott-bmw">Három napon belül előkerült a lopott BMW </a></h3>
215
+ </div>
216
+ </li>
217
+ <li>
218
+ <div class='created'>13:59</div>
219
+ <div class='title'>
220
+ <h3><a href="/online/regio/2010/02/22/frontalis-utkozes-het-serulttel">Frontális ütközés hét sérülttel </a></h3>
221
+ </div>
222
+ </li>
223
+ <li>
224
+ <div class='created'>08:27</div>
225
+ <div class='title'>
226
+ <h3><a href="/online/regio/2010/02/23/a-levai-jaras-mkp-s-kepviselojeloltjei">A Lévai járás MKP-s képviselőjelöltjei</a></h3>
227
+ </div>
228
+ </li>
229
+ <li>
230
+ <div class='created'>10:42</div>
231
+ <div class='title'>
232
+ <h3><a href="/online/regio/2010/02/23/het-falubol-tizenharom-elsos-mi-lesz-veled-zoboralja">Hét faluból tizenhárom elsős - mi lesz veled, Zoboralja?</a></h3>
233
+ </div>
234
+ </li>
235
+ </ul>
236
+ </div>
237
+ </div>
238
+ </div>
239
+ </div><div class="quicktabs"><div class="block block-simple_statistics" id="block-simple_statistics-1">
240
+ <div class="content"><div class='view view-popular-3'>
241
+ <ul>
242
+ <li>
243
+ <div class='created'>február 22.</div>
244
+ <div class='title'>
245
+ <h3><a href="/online/regio/2010/02/22/eltunt-frantisek-malcik-foto">Eltűnt František Malčík (fotó)</a></h3>
246
+ </div>
247
+ </li>
248
+ <li>
249
+ <div class='created'>február 22.</div>
250
+ <div class='title'>
251
+ <h3><a href="/online/regio/2010/02/22/geppisztoly-volt-a-hatso-ulesen">Géppisztoly volt a hátsó ülésen</a></h3>
252
+ </div>
253
+ </li>
254
+ <li>
255
+ <div class='created'>február 22.</div>
256
+ <div class='title'>
257
+ <h3><a href="/online/regio/2010/02/22/gyorshir-robbanas-tortent-a-nyitranovaki-vegyi-uzemben">GYORSHÍR: robbanás történt a nyitranováki vegyi üzemben</a></h3>
258
+ </div>
259
+ </li>
260
+ <li>
261
+ <div class='created'>február 21.</div>
262
+ <div class='title'>
263
+ <h3><a href="/online/regio/2010/02/21/matyusfoldi-beiratasi-eredmenyek">Mátyusföldi beíratási eredmények</a></h3>
264
+ </div>
265
+ </li>
266
+ <li>
267
+ <div class='created'>február 19.</div>
268
+ <div class='title'>
269
+ <h3><a href="/online/regio/2010/02/19/ujabb-gyanus-szamlak-tornaljan">Újabb gyanús számlák Tornalján</a></h3>
270
+ </div>
271
+ </li>
272
+ </ul>
273
+ </div>
274
+ </div>
275
+ </div>
276
+ </div><div class="quicktabs"><div class="block block-simple_statistics" id="block-simple_statistics-2">
277
+ <div class="content"><div class='view view-popular-7'>
278
+ <ul>
279
+ <li>
280
+ <div class='created'>február 17.</div>
281
+ <div class='title'>
282
+ <h3><a href="/online/regio/2010/02/17/fotok-a-szencnel-tortent-tragikus-balesetrol">Fotók a Szencnél történt tragikus balesetről </a></h3>
283
+ </div>
284
+ </li>
285
+ <li>
286
+ <div class='created'>február 12.</div>
287
+ <div class='title'>
288
+ <h3><a href="/online/regio/2010/02/12/tragikus-kozlekedesi-baleset">Tragikus közlekedési baleset</a></h3>
289
+ </div>
290
+ </li>
291
+ <li>
292
+ <div class='created'>február 19.</div>
293
+ <div class='title'>
294
+ <h3><a href="/online/regio/2010/02/19/ujabb-gyanus-szamlak-tornaljan">Újabb gyanús számlák Tornalján</a></h3>
295
+ </div>
296
+ </li>
297
+ <li>
298
+ <div class='created'>február 15.</div>
299
+ <div class='title'>
300
+ <h3><a href="/online/regio/2010/02/15/rengeteg-rendor-az-utakon">Rengeteg rendőr az utakon</a></h3>
301
+ </div>
302
+ </li>
303
+ <li>
304
+ <div class='created'>február 17.</div>
305
+ <div class='title'>
306
+ <h3><a href="/online/regio/2010/02/17/eltunt-anna-basova-foto">Eltűnt Anna Bašová (fotó)</a></h3>
307
+ </div>
308
+ </li>
309
+ </ul>
310
+ </div>
311
+ </div>
312
+ </div>
313
+ </div></div></div></div>
314
+ </div><div id="block-views-latest_photos" class="block views">
315
+ <div class="content"><div class='view view-latest-photos'><div class='view-header view-header-latest-photos'><h2><a href="/foto">Fotók &raquo;</a></h2>
316
+ </div>
317
+ <ul><li><div class='field-photo-image-fid'><a href="/foto/2010/02/23/nem-akarmilyen-rendorauto-az-utdijrendorseg-jarmuve-erzekeli-hogy-van-e-fedelzeti-eg"><img src="http://ujszo.com/files/imagecache/photo_thumbnail/files/obuscan.jpg" alt="" title="" /></a></div><div class='title'><h3><a href="/foto/2010/02/23/nem-akarmilyen-rendorauto-az-utdijrendorseg-jarmuve-erzekeli-hogy-van-e-fedelzeti-eg">Nem akármilyen rendőrautó. Az útdíjrendőrség járműve érzékeli, hogy van-e fedélzeti egység a kamionokban. </a></h3></div></li><li><div class='field-photo-image-fid'><a href="/foto/2010/02/23/robert-fico-miniszterelnok-ma-az-egeszsegugyi-miniszteriumot-ellenorizte-es-termesze"><img src="http://ujszo.com/files/imagecache/photo_thumbnail/files/ficoellen.jpg" alt="" title="" /></a></div><div class='title'><h3><a href="/foto/2010/02/23/robert-fico-miniszterelnok-ma-az-egeszsegugyi-miniszteriumot-ellenorizte-es-termesze">Robert Fico miniszterelnök ma az egészségügyi minisztériumot ellenőrizte, és természetesen mindennel elégedett volt</a></h3></div></li></ul></div>
318
+ </div>
319
+ </div><div id="block-views-latest_videos" class="block views">
320
+ <div class="content"><div class='view view-latest-videos'><div class='view-header view-header-latest-videos'><h2><a href="/video">Videók &raquo;</a></h2>
321
+ </div>
322
+ <ul><li><div class='field-video-image-fid'><a href="/video/2010/02/23/az-uj-audi-a8-tesztje"><img src="http://ujszo.com/files/imagecache/photo_thumbnail/files/audia8.JPG" alt="" title="" /></a></div><div class='title'><h3><a href="/video/2010/02/23/az-uj-audi-a8-tesztje">Az új Audi A8 tesztje</a></h3></div></li><li><div class='field-video-image-fid'><a href="/video/2010/02/23/az-orrszarvu"><img src="http://ujszo.com/files/imagecache/photo_thumbnail/files/orrszar.jpg" alt="" title="" /></a></div><div class='title'><h3><a href="/video/2010/02/23/az-orrszarvu">Az orrszarvú</a></h3></div></li></ul></div>
323
+ </div>
324
+ </div><div id="block-quicktabs-4" class="block">
325
+ <h2 class="title"><a href="/a-nap-szama">A nap száma »</a></h2> <div class="content"><div class="quicktabs_wrapper"><ul class="quicktabs_tabs"><li><a href="#">Mai</a></li><li><a href="#">Tegnapi</a></li></ul><div class="quicktabs_main"><div class="quicktabs"><div class="block block-views" id="block-views-number1">
326
+ <div class="content"><div class='view view-number1'><ul><li><div class='title'><h3><a href="/a-nap-szama/2010/02/22/500-millio">500 millió</a></h3></div><div class='body'><span class='print-link'></span><p>A kenyheci ipari parkban eddig 500 millió eurót ruháztak be a külföldi cégek</p>
327
+ </div></li></ul></div>
328
+ </div>
329
+ </div>
330
+ </div><div class="quicktabs"><div class="block block-views" id="block-views-number2">
331
+ <div class="content"><div class='view view-number2'><ul><li><div class='title'><h3><a href="/a-nap-szama/2010/02/21/3800">3800 </a></h3></div><div class='body'><span class='print-link'></span><p>Már ennél is több barátja van az Új Szó Online-nak a Faceboookon. Köszönjük a hűséget! A szerkesztők</p>
332
+ </div></li></ul></div>
333
+ </div>
334
+ </div>
335
+ </div></div></div></div>
336
+ </div><div id="block-quicktabs-5" class="block">
337
+ <h2 class="title"><a href="/a-nap-mondata">A nap mondata »</a></h2> <div class="content"><div class="quicktabs_wrapper"><ul class="quicktabs_tabs"><li><a href="#">Mai</a></li><li><a href="#">Tegnapi</a></li></ul><div class="quicktabs_main"><div class="quicktabs"><div class="block block-views" id="block-views-quote1">
338
+ <div class="content"><div class='view view-quote1'><ul><li><div class='field-quote-value'><blockquote><a href="/a-nap-mondata/2010/02/22/pigy-szolitotta-fel-a-dontoen-nyugdijas-szimpatizansokat-mesterhazy-attila-">Utánam, srácok!</a></blockquote></div><div class='field-quote-description-value'><p>Így szólította fel a döntően nyugdíjas szimpatizánsokat Mesterházy Attila, az MSZP miniszterelnök-jelöltje a kampánynyitóján</p>
339
+ </div></li></ul></div>
340
+ </div>
341
+ </div>
342
+ </div><div class="quicktabs"><div class="block block-views" id="block-views-quote2">
343
+ <div class="content"><div class='view view-quote2'><ul><li><div class='field-quote-value'><blockquote><a href="/a-nap-mondata/2010/02/20/probert-fico-kormanyfop">Természetesen minden reggel hokit nézek, hiszen mi mást tehetnék. Nagyon szeretem a hokit.</a></blockquote></div><div class='field-quote-description-value'><p>Robert Fico kormányfő</p>
344
+ </div></li></ul></div>
345
+ </div>
346
+ </div>
347
+ </div></div></div></div>
348
+ </div><div id="block-views-parameter_rss" class="block views">
349
+ <div class="content"><div class='view view-parameter-rss'><div class='view-header view-header-parameter-rss'><h2><a href="/rss/parameter">Paraméter RSS »</a></h2>
350
+ </div>
351
+ <ul><li><div class='title'><h3><a href="/rss/2010/02/23/egy-homalyos-hatteru-maganceg-figyel-bennunket">Egy homályos hátterű magáncég figyel bennünket?</a></h3></div></li><li><div class='title'><h3><a href="/rss/2010/02/23/megan-foxnak-van-a-legjobb-teste-a-brit-ferfiak-szerint">Megan Foxnak van a legjobb teste a brit férfiak szerint</a></h3></div></li><li><div class='title'><h3><a href="/rss/2010/02/23/felmeztelenul-szerepel-egy-reklamban-a-szupermodell">Félmeztelenül szerepel egy reklámban a szupermodell</a></h3></div></li><li><div class='title'><h3><a href="/rss/2010/02/23/mdf-mutyizott-a-fidesz-es-az-mszp">MDF: Mutyizott a Fidesz és az MSZP</a></h3></div></li><li><div class='title'><h3><a href="/rss/2010/02/23/vancouver-2010-csaknem-1600-doppingteszt-pozitiv-eset-nelkul">Vancouver 2010 - Csaknem 1600 doppingteszt pozitív eset nélkül</a></h3></div></li></ul></div>
352
+ </div>
353
+ </div></div> </div><!-- End of main_and_right -->
354
+ </div></div><!-- End of #content -->
355
+
356
+ </div><!-- End of #frame -->
357
+
358
+ <!-- Footer -->
359
+ <div id="footer"><div id="footer_left"><a href="/impresszum">Impresszum</a> | <a href="/inzercia">Inzercia</a> | <a href="/advertise_with_us">Advertise with us</a> | <a href="/werbung">Werbung</a> | <a href="/copyright">&copy; 2008 Petit Press</a></div>
360
+ <div id="footer_right"><a href="http://www.brainsum.sk" title="Internetová reklama a tvorba web stránok">web design &amp; development: brainsum</a></div>
361
+
362
+
363
+ </div>
364
+ <script type="text/javascript" src="/misc/jquery.js"></script>
365
+ <script type="text/javascript" src="/misc/drupal.js"></script>
366
+ <script type="text/javascript" src="/sites/all/modules/date/date_timezone/date_timezone.js"></script>
367
+ <script type="text/javascript" src="/sites/all/modules/jquery_cookie/jquery.cookie.compressed.js"></script>
368
+ <script type="text/javascript" src="/sites/all/modules/jquery_update/compat-1.0.js"></script>
369
+ <script type="text/javascript" src="/sites/all/modules/jstools/jstools.js"></script>
370
+ <script type="text/javascript" src="/sites/all/modules/jstools/activemenu/activemenu.js"></script>
371
+ <script type="text/javascript" src="/sites/all/modules/jstools/tabs/jquery.tabs.pack.js"></script>
372
+ <script type="text/javascript" src="/sites/all/modules/jstools/jquery.history_remote.pack.js"></script>
373
+ <script type="text/javascript" src="/sites/all/modules/jstools/tabs/tabs.js"></script>
374
+ <script type="text/javascript" src="/sites/all/modules/anonymous_poll/anonymous_poll.js"></script>
375
+ <script type="text/javascript" src="/sites/all/modules/quicktabs/js/quicktabs.js"></script>
376
+ <script type="text/javascript" src="/sites/all/modules/jquery_update/collapse-fix.js"></script>
377
+ <script type="text/javascript">Drupal.extend({ settings: { "jstools": { "cleanurls": true, "basePath": "/" }, "activemenu": { "#block-menu-1": "activemenu/menu", "#block-menu-2": "activemenu/menu", "#block-menu-201": "activemenu/menu", "#block-user-1": "activemenu/menu" }, "tabs": { "slide": false, "fade": false, "speed": "slow", "auto_height": false, "next_text": "next", "previous_text": "previous" }, "lightbox2": { "rtl": false, "file_path": "/(\\w\\w/)files", "base_path": "/", "default_image": "/sites/all/modules/lightbox2/images/brokenimage.jpg", "border_size": "10", "font_color": "000", "box_color": "fff", "top_position": "", "overlay_opacity": "0.6", "overlay_color": "000", "disable_close_click": 1, "resize_sequence": "0", "resize_speed": 400, "fade_in_speed": 400, "slide_down_speed": 600, "use_alt_layout": 0, "disable_resize": 0, "disable_zoom": 0, "force_show_nav": 0, "loop_items": 0, "node_link_text": "További információk, hozzászólás", "node_link_target": 0, "image_count": "Kép: !current / !total. A lapozó nyilak megjelenítéséhez mozgassa az egeret a kép felett.", "page_count": "Oldal: !current / !total", "lite_press_x_close": "press \x3ca href=\"#\" onclick=\"hideLightbox(); return FALSE;\"\x3e\x3ckbd\x3ex\x3c/kbd\x3e\x3c/a\x3e to close", "keys_close": "c x 27", "keys_previous": "p 37", "keys_next": "n 39", "keys_zoom": "z", "keys_play_pause": "32", "display_image_size": "", "image_node_sizes": "()", "trigger_lightbox_classes": "", "trigger_lightbox_group_classes": "", "trigger_slideshow_classes": "", "trigger_lightframe_classes": "", "trigger_lightframe_group_classes": "", "custom_class_handler": "lightbox", "custom_trigger_classes": "img.lightbox", "disable_for_gallery_lists": 1, "disable_for_acidfree_gallery_lists": true, "enable_acidfree_videos": false, "slideshow_interval": 10000, "slideshow_automatic_exit": 0, "show_play_pause": 1, "pause_on_next_click": 1, "pause_on_previous_click": true, "loop_slides": 0, "iframe_width": "600", "iframe_height": "600", "iframe_border": 1, "enable_video": 0, "flvPlayer": "/flvplayer.swf" }, "quicktabs": { "effect": "none" }, "googleanalytics": { "trackOutgoing": 1, "trackMailto": 1, "trackDownload": 1, "trackDownloadExtensions": "7z|aac|avi|csv|doc|exe|flv|gif|gz|jpe?g|js|mp(3|4|e?g)|mov|pdf|phps|png|ppt|rar|sit|tar|torrent|txt|wma|wmv|xls|xml|zip", "LegacyVersion": 0 } } });</script>
378
+ <script type="text/javascript" src="/sites/all/modules/lightbox2/js/auto_image_handling.js"></script>
379
+ <script type="text/javascript" src="/sites/all/modules/lightbox2/js/lightbox.js"></script>
380
+ <script type="text/javascript" src="/sites/all/modules/google_analytics/googleanalytics.js"></script>
381
+ <script type="text/javascript" src="/sites/all/themes/ujszo_v3/scripts/ujszo.js"></script>
382
+ <script type="text/javascript">var gaJsHost = (("https:" == document.location.protocol) ? "https://ssl." : "http://www.");document.write(unescape("%3Cscript src='" + gaJsHost + "google-analytics.com/ga.js' type='text/javascript'%3E%3C/script%3E"));</script>
383
+ <script type="text/javascript">var pageTracker = _gat._getTracker("UA-4632252-1");pageTracker._initData();pageTracker._trackPageview();</script>
384
+ <!-- (C)2000-2008 Gemius SA - gemiusAudience / ujszo.com / PS -->
385
+ <script type="text/javascript">
386
+ <!--//--><![CDATA[//><!--
387
+ var pp_gemius_identifier = new String('11LqlursN9TE6sFkhT4415QKTF3GWUPZ9AjHP5vq7IL.k7');
388
+ //--><!]]>
389
+ </script>
390
+ <script type="text/javascript" src="/sites/all/themes/ujszo_v3/scripts/gemius.js"></script>
391
+ <script type='text/javascript' charset='windows-1250' src='http://go.cz.bbelements.com/bb/bb_one2n.js?1237931830'></script>
392
+ <script type='text/javascript'>/* <![CDATA[ */
393
+ bmone2n.addPosition('595.6.3.20','');
394
+ bmone2n.addPosition('595.3.2.64','');
395
+ bmone2n.getAd('go.cz.bbelements.com','',''+(typeof(bburlparam)=='string'?'&'+bburlparam:''),'windows-1250');
396
+ /* ]]> */</script>
397
+ <div id='bmone2t-595.6.3.20' style='display:none'><script type='text/javascript'>/* <![CDATA[ */ bmone2n.makeAd('595.6.3.20'); /* ]]> */</script></div>
398
+ <div id='bmone2t-595.3.2.64' style='display:none'><script type='text/javascript'>/* <![CDATA[ */ bmone2n.makeAd('595.3.2.64'); /* ]]> */</script></div>
399
+ <script type='text/javascript'>/* <![CDATA[ */ bmone2n.moveAd(); /* ]]> */</script>
400
+ </body>
401
+ </html>
metadata CHANGED
@@ -1,7 +1,7 @@
1
1
  --- !ruby/object:Gem::Specification
2
2
  name: content_scrapper
3
3
  version: !ruby/object:Gem::Version
4
- version: 0.0.5
4
+ version: 0.0.6
5
5
  platform: ruby
6
6
  authors:
7
7
  - Gyorgy Frivolt
@@ -9,7 +9,7 @@ autorequire:
9
9
  bindir: bin
10
10
  cert_chain: []
11
11
 
12
- date: 2010-02-22 00:00:00 +01:00
12
+ date: 2010-02-28 00:00:00 +01:00
13
13
  default_executable:
14
14
  dependencies:
15
15
  - !ruby/object:Gem::Dependency
@@ -78,6 +78,7 @@ files:
78
78
  - test/helper.rb
79
79
  - test/test_content_mapping.rb
80
80
  - test/test_content_scrapper.rb
81
+ - test/test_pages/encoding.html
81
82
  - test/test_pages/pretty.html
82
83
  - test/test_pages/twocontent.html
83
84
  - test/test_pages/ugly.html