nayutaya-ironnews-utility 0.3.6 → 0.3.7

Sign up to get free protection for your applications and to get access to all the features.
@@ -5,11 +5,13 @@ module IronnewsUtility
5
5
  [%r'\A(http://[a-z]+\.yomiuri\.co\.jp/.+)\?from=[a-z0-9]+\Z', '\1'].freeze,
6
6
  [%r'\A(http://japan\.cnet\.com/.+)\?ref=rss\Z', '\1'].freeze,
7
7
  [%r'\A(http://journal\.mycom\.co\.jp/.+)\?rt=na\Z', '\1index.html'].freeze,
8
+ [%r'\A(http://journal\.mycom\.co\.jp/.+/)\Z', '\1index.html'].freeze,
8
9
  [%r'\A(http://mainichi\.jp/.+)\?inb=[a-z]+\Z', '\1'].freeze,
9
10
  [%r'\A(http://mainichi\.jp/.+)\?link_id=[A-Z0-9]+\Z', '\1'].freeze,
10
11
  [%r'\A(http://news\.searchina\.ne\.jp/.+)&pt=large\Z', '\1'].freeze,
11
12
  [%r'\A(http://techon\.nikkeibp\.co\.jp/.+)\?ref=rss\Z', '\1'].freeze,
12
13
  [%r'\A(http://www\.asahi\.com/.+)\?ref=rss\Z', '\1'].freeze,
14
+ [%r'\A(http://www\.asahi\.com/.+)_01(\.html)\Z', '\1\2'].freeze,
13
15
  [%r'\A(http://www\.chunichi\.co\.jp/.+)\?ref=rank\Z', '\1'].freeze,
14
16
  [%r'\A(http://www\.jiji\.com/.+)&j1\Z', '\1'].freeze,
15
17
  [%r'\A(http://www\.jiji\.com/.+)&n=1\Z', '\1'].freeze,
@@ -39,6 +39,9 @@ module IronnewsUtility
39
39
  "response.jp" => [
40
40
  [%r'\A(.+) \| レスポンス自動車ニュース(Response.jp)\Z', '\1'].freeze,
41
41
  ].freeze,
42
+ "rocketnews24.com" => [
43
+ [%r'\A(.+) – ロケットニュース24(β)\Z', '\1'].freeze,
44
+ ].freeze,
42
45
  "sankei.jp.msn.com" => [
43
46
  [%r'\A(.+) - MSN産経ニュース\Z', '\1'].freeze,
44
47
  [%r'\A(.+) \(\d+/\d+ページ\)\Z', '\1'].freeze,
@@ -68,6 +71,9 @@ module IronnewsUtility
68
71
  [%r'\A(.+) - (社会|国際|トラベル|ビジネス・経済|政治|サイエンス)\Z', '\1'].freeze,
69
72
  [%r'\A(.+) - (関西|関西交通・旅ニュース)\Z', '\1'].freeze,
70
73
  ].freeze,
74
+ "www.bloomberg.co.jp" => [
75
+ [%r'\A(.+) - Bloomberg\.co\.jp\Z', '\1'].freeze,
76
+ ].freeze,
71
77
  "www.business-i.jp" => [
72
78
  [%r'\A(.+) - FujiSankei Business i\./Bloomberg GLOBAL FINANCE\Z', '\1'].freeze,
73
79
  ].freeze,
@@ -80,23 +86,37 @@ module IronnewsUtility
80
86
  "www.cnn.co.jp" => [
81
87
  [%r'\ACNN\.co\.jp:(.+)\Z', '\1'].freeze,
82
88
  ].freeze,
89
+ "www.ehime-np.co.jp" => [
90
+ [%r'\A(.+) 愛媛新聞社ONLINE\Z', '\1'].freeze,
91
+ ].freeze,
83
92
  "www.fnn-news.com" => [
84
93
  [%r'\AFNNニュース: (.+)\Z', '\1'].freeze,
85
94
  ].freeze,
95
+ "www.gifu-np.co.jp" => [
96
+ [%r'\A(.+)(?: | − )岐阜新聞 Web\Z', '\1'].freeze,
97
+ ].freeze,
86
98
  "www.hokkaido-np.co.jp" => [
87
99
  [%r'\A(.+)−北海道新聞\[.+\]\Z', '\1'].freeze,
88
100
  ].freeze,
101
+ "www.j-cast.com" => [
102
+ [%r'\A(.+) : J-CAST(?:ニュース|会社ウォッチ|モノウォッチ|テレビウォッチ)\Z', '\1'].freeze,
103
+ [%r'\A(.+) \(\d+/\d+\)\Z', '\1'].freeze,
104
+ ].freeze,
89
105
  "www.jiji.com" => [
90
106
  [%r'\A時事ドットコム:(.+)\Z', '\1'].freeze,
91
107
  ].freeze,
92
108
  "www.kahoku.co.jp" => [
93
- [%r'\A河北新報 東北のニュース/(.+)\Z', '\1'].freeze,
109
+ [%r'\A河北新報 (?:東北|内外)のニュース/(.+)\Z', '\1'].freeze,
94
110
  [%r'\A河北新報 (.+)\Z', '\1'].freeze,
95
111
  ].freeze,
112
+ "www.kfb.co.jp" => [
113
+ [%r'\A(.+) :: 福島県内ニュース :: KFB福島放送\Z', '\1'].freeze,
114
+ ].freeze,
96
115
  "www.kobe-np.co.jp" => [
97
116
  [%r'\A神戸新聞|(.+)\Z', '\1'].freeze,
98
117
  [%r'\A全国海外ニュース|(.+)\Z', '\1'].freeze,
99
- [%r'\A事件・事故|(.+)\Z', '\1'].freeze,
118
+ [%r'\A(?:淡路|阪神・北摂|姫路・西播磨|但馬|東播磨|神戸)|(.+)\Z', '\1'].freeze,
119
+ [%r'\A(?:事件・事故|社会|文化|経済)|(.+)\Z', '\1'].freeze,
100
120
  ].freeze,
101
121
  "www.kyoto-np.co.jp" => [
102
122
  [%r'\A(.+):京都新聞\Z', '\1'].freeze,
@@ -110,19 +130,52 @@ module IronnewsUtility
110
130
  "www.nhk.or.jp" => [
111
131
  [%r'\ANHKニュース (.+)\Z', '\1'].freeze,
112
132
  ].freeze,
133
+ "www.nikkansports.com" => [
134
+ [%r'\A(.+) : nikkansports.com\Z', '\1'].freeze,
135
+ ].freeze,
113
136
  "www.nishinippon.co.jp" => [
114
137
  [%r'\A(.+) / 西日本新聞\Z', '\1'].freeze,
115
138
  ].freeze,
139
+ "www.sankei-kansai.com" => [
140
+ [%r'\A(.+):産経関西(産経新聞大阪本社公式ニュースサイト)\Z', '\1'].freeze,
141
+ ].freeze,
142
+ "www.sankeibiz.jp" => [
143
+ [%r'\A(.+) - SankeiBiz(サンケイビズ)\Z', '\1'].freeze,
144
+ [%r'\A(.+) \(\d+/\d+ページ\)\Z', '\1'].freeze,
145
+ ].freeze,
146
+ "www.shikoku-np.co.jp" => [
147
+ [%r'\A(.+) \| 四国新聞社\Z', '\1'].freeze,
148
+ [%r'\A(.+) \| (?:香川の|全国|スポーツ)ニュース\Z', '\1'].freeze,
149
+ [%r'\A(.+)―四国新聞社\Z', '\1'].freeze,
150
+ ].freeze,
151
+ "www.shimotsuke.co.jp" => [
152
+ [%r'\A(.+) |下野新聞「SOON」\Z', '\1'].freeze,
153
+ ].freeze,
154
+ "www.shinmai.co.jp" => [
155
+ [%r'\A信濃毎日新聞[信毎web] (.+)\Z', '\1'].freeze,
156
+ [%r'\A(.+)|信濃毎日新聞[信毎web]\Z', '\1'].freeze,
157
+ [%r'\A(.+)|(?:長野全県|東北信|中南信)ダイジェスト\Z', '\1'].freeze,
158
+ ].freeze,
159
+ "www.sponichi.co.jp" => [
160
+ [%r'\A(.+) ― スポニチ Sponichi Annex ニュース\Z', '\1'].freeze,
161
+ [%r'\A(.+) ― スポニチ Sponichi Annex 大阪\Z', '\1'].freeze,
162
+ ].freeze,
116
163
  "www.tetsudo.com" => [
117
164
  [%r'\A(.+) - 鉄道コム\Z', '\1'].freeze,
118
165
  ].freeze,
119
166
  "www.tokyo-np.co.jp" => [
120
167
  [%r'\A東京新聞:(.+)\(TOKYO Web\)\Z', '\1'].freeze,
121
168
  ].freeze,
169
+ "www.toonippo.co.jp" => [
170
+ [%r'\A(.+)/Web東奥・ニュース\d{14}\Z', '\1'].freeze,
171
+ ].freeze,
122
172
  "www.yomiuri.co.jp" => [
123
173
  [%r'\A(.+) : YOMIURI ONLINE(読売新聞)\Z', '\1'].freeze,
124
174
  [%r'\A(.+) : (社会|マネー・経済|国際|地域|旅ゅ〜ん!)\Z', '\1'].freeze,
125
175
  [%r'\A(.+) : 経済ニュース\Z', '\1'].freeze,
126
176
  ].freeze,
177
+ "yamagata-np.jp" => [
178
+ [%r'\A(.+)|山形新聞\Z', '\1'].freeze,
179
+ ].freeze,
127
180
  }.freeze
128
181
  end
@@ -11,18 +11,20 @@ module IronnewsUtility
11
11
  %r'\Ahttp://japan\.donga\.com/', # 理由: title要素に記事名が含まれていないため
12
12
  %r'\Ahttp://japanese\.donga\.com/', # 理由: title要素に記事名が含まれていないため
13
13
  %r'\Ahttp://jp\.reuters\.com/', # 理由: 記事名の取得に失敗することが多く、かつ鉄道関連の記事が少ないため
14
- %r'\Ahttp://mainichi\.jp/enta/sports/baseball/news/', # 理由: title要素に記事名が含まれていないため
14
+ %r'\Ahttp://mainichi\.jp/enta/sports/baseball/news/m', # 理由: title要素に記事名が含まれていないため
15
15
  %r'\Ahttp://mainichi\.jp/life/money/kabu/nsj/news/', # 理由: title要素に記事名が含まれていないため
16
16
  %r'\Ahttp://mainichi\.jp/select/.+?/news/m', # 理由: title要素に記事名が含まれていないため
17
17
  %r'\Ahttp://mainichi\.pheedo\.jp/', # 理由: リダイレクト用URLであるため
18
18
  %r'\Ahttp://markets\.nikkei\.co\.jp/', # 理由: title要素に記事名が含まれていないため
19
19
  %r'\Ahttp://news\.ibc\.co\.jp/', # 理由: title要素に記事名が含まれていないため
20
+ %r'\Ahttp://news\.rkb\.ne\.jp/', # 理由: title要素に記事名が含まれていないため
20
21
  %r'\Ahttp://news\.searchina\.ne\.jp/', # 理由: 記事の閲覧が有料であるため
21
22
  %r'\Ahttp://news\.tbs\.co\.jp/newseye/', # 理由: 記事の閲覧可能期間が短いため
22
23
  %r'\Ahttp://release\.nikkei\.co\.jp/', # 理由: title要素に記事名が含まれていないため
23
24
  %r'\Ahttp://rkk\.jp/', # 理由: title要素に記事名が含まれていないため
24
25
  %r'\Ahttp://rss\.asahi\.com/', # 理由: リダイレクト用URLであるため
25
26
  %r'\Ahttp://rss\.rssad\.jp/', # 理由: リダイレクト用URLであるため
27
+ %r'\Ahttp://sports\.nikkei\.co\.jp/', # 理由: title要素に記事名が含まれていないため
26
28
  %r'\Ahttp://www.pheedo.jp/', # 理由: リダイレクト用URLであるため
27
29
  %r'\Ahttp://www2\.knb\.ne\.jp/', # 理由: title要素に記事名が含まれていないため
28
30
  %r'\Ahttp://www\.asahi\.com/english/weekly/', # 理由: title要素に記事名が含まれていないため
@@ -53,7 +55,6 @@ module IronnewsUtility
53
55
  %r'\Ahttp://www\.wbs\.co\.jp/', # 理由: title要素に記事名が含まれていないため
54
56
  %r'\Ahttp://www\.worldtimes\.co\.jp/today/', # 理由: title要素に記事名が含まれていないため
55
57
  %r'\Ahttp://www\.xinhua\.jp/', # 理由: 記事の閲覧が有料であるため
56
- %r'\Ahttp://sports\.nikkei\.co\.jp/', # 理由: title要素に記事名が含まれていないため
57
- %r'\Ahttp://news\.rkb\.ne\.jp/', # 理由: title要素に記事名が含まれていないため
58
+ %r'\Ahttp://mytown\.asahi\.com/.+/news\.php\Z', # 理由: 実体が存在しないため
58
59
  ].freeze
59
60
  end
@@ -1,4 +1,4 @@
1
1
 
2
2
  module IronnewsUtility
3
- VERSION = "0.3.6"
3
+ VERSION = "0.3.7"
4
4
  end
@@ -5,8 +5,8 @@ Gem::Specification.new do |s|
5
5
  s.required_ruby_version = Gem::Requirement.new(">= 1.8.6")
6
6
 
7
7
  s.name = "nayutaya-ironnews-utility"
8
- s.version = "0.3.6"
9
- s.date = "2010-01-29"
8
+ s.version = "0.3.7"
9
+ s.date = "2010-02-18"
10
10
 
11
11
  s.authors = ["Yuya Kato"]
12
12
  s.email = "yuyakato@gmail.com"
metadata CHANGED
@@ -1,7 +1,7 @@
1
1
  --- !ruby/object:Gem::Specification
2
2
  name: nayutaya-ironnews-utility
3
3
  version: !ruby/object:Gem::Version
4
- version: 0.3.6
4
+ version: 0.3.7
5
5
  platform: ruby
6
6
  authors:
7
7
  - Yuya Kato
@@ -9,7 +9,7 @@ autorequire:
9
9
  bindir: bin
10
10
  cert_chain: []
11
11
 
12
- date: 2010-01-29 00:00:00 +09:00
12
+ date: 2010-02-18 00:00:00 +09:00
13
13
  default_executable:
14
14
  dependencies: []
15
15