nayutaya-ironnews-utility 0.3.6 → 0.3.7
Sign up to get free protection for your applications and to get access to all the features.
@@ -5,11 +5,13 @@ module IronnewsUtility
|
|
5
5
|
[%r'\A(http://[a-z]+\.yomiuri\.co\.jp/.+)\?from=[a-z0-9]+\Z', '\1'].freeze,
|
6
6
|
[%r'\A(http://japan\.cnet\.com/.+)\?ref=rss\Z', '\1'].freeze,
|
7
7
|
[%r'\A(http://journal\.mycom\.co\.jp/.+)\?rt=na\Z', '\1index.html'].freeze,
|
8
|
+
[%r'\A(http://journal\.mycom\.co\.jp/.+/)\Z', '\1index.html'].freeze,
|
8
9
|
[%r'\A(http://mainichi\.jp/.+)\?inb=[a-z]+\Z', '\1'].freeze,
|
9
10
|
[%r'\A(http://mainichi\.jp/.+)\?link_id=[A-Z0-9]+\Z', '\1'].freeze,
|
10
11
|
[%r'\A(http://news\.searchina\.ne\.jp/.+)&pt=large\Z', '\1'].freeze,
|
11
12
|
[%r'\A(http://techon\.nikkeibp\.co\.jp/.+)\?ref=rss\Z', '\1'].freeze,
|
12
13
|
[%r'\A(http://www\.asahi\.com/.+)\?ref=rss\Z', '\1'].freeze,
|
14
|
+
[%r'\A(http://www\.asahi\.com/.+)_01(\.html)\Z', '\1\2'].freeze,
|
13
15
|
[%r'\A(http://www\.chunichi\.co\.jp/.+)\?ref=rank\Z', '\1'].freeze,
|
14
16
|
[%r'\A(http://www\.jiji\.com/.+)&j1\Z', '\1'].freeze,
|
15
17
|
[%r'\A(http://www\.jiji\.com/.+)&n=1\Z', '\1'].freeze,
|
@@ -39,6 +39,9 @@ module IronnewsUtility
|
|
39
39
|
"response.jp" => [
|
40
40
|
[%r'\A(.+) \| レスポンス自動車ニュース(Response.jp)\Z', '\1'].freeze,
|
41
41
|
].freeze,
|
42
|
+
"rocketnews24.com" => [
|
43
|
+
[%r'\A(.+) – ロケットニュース24(β)\Z', '\1'].freeze,
|
44
|
+
].freeze,
|
42
45
|
"sankei.jp.msn.com" => [
|
43
46
|
[%r'\A(.+) - MSN産経ニュース\Z', '\1'].freeze,
|
44
47
|
[%r'\A(.+) \(\d+/\d+ページ\)\Z', '\1'].freeze,
|
@@ -68,6 +71,9 @@ module IronnewsUtility
|
|
68
71
|
[%r'\A(.+) - (社会|国際|トラベル|ビジネス・経済|政治|サイエンス)\Z', '\1'].freeze,
|
69
72
|
[%r'\A(.+) - (関西|関西交通・旅ニュース)\Z', '\1'].freeze,
|
70
73
|
].freeze,
|
74
|
+
"www.bloomberg.co.jp" => [
|
75
|
+
[%r'\A(.+) - Bloomberg\.co\.jp\Z', '\1'].freeze,
|
76
|
+
].freeze,
|
71
77
|
"www.business-i.jp" => [
|
72
78
|
[%r'\A(.+) - FujiSankei Business i\./Bloomberg GLOBAL FINANCE\Z', '\1'].freeze,
|
73
79
|
].freeze,
|
@@ -80,23 +86,37 @@ module IronnewsUtility
|
|
80
86
|
"www.cnn.co.jp" => [
|
81
87
|
[%r'\ACNN\.co\.jp:(.+)\Z', '\1'].freeze,
|
82
88
|
].freeze,
|
89
|
+
"www.ehime-np.co.jp" => [
|
90
|
+
[%r'\A(.+) 愛媛新聞社ONLINE\Z', '\1'].freeze,
|
91
|
+
].freeze,
|
83
92
|
"www.fnn-news.com" => [
|
84
93
|
[%r'\AFNNニュース: (.+)\Z', '\1'].freeze,
|
85
94
|
].freeze,
|
95
|
+
"www.gifu-np.co.jp" => [
|
96
|
+
[%r'\A(.+)(?: | − )岐阜新聞 Web\Z', '\1'].freeze,
|
97
|
+
].freeze,
|
86
98
|
"www.hokkaido-np.co.jp" => [
|
87
99
|
[%r'\A(.+)−北海道新聞\[.+\]\Z', '\1'].freeze,
|
88
100
|
].freeze,
|
101
|
+
"www.j-cast.com" => [
|
102
|
+
[%r'\A(.+) : J-CAST(?:ニュース|会社ウォッチ|モノウォッチ|テレビウォッチ)\Z', '\1'].freeze,
|
103
|
+
[%r'\A(.+) \(\d+/\d+\)\Z', '\1'].freeze,
|
104
|
+
].freeze,
|
89
105
|
"www.jiji.com" => [
|
90
106
|
[%r'\A時事ドットコム:(.+)\Z', '\1'].freeze,
|
91
107
|
].freeze,
|
92
108
|
"www.kahoku.co.jp" => [
|
93
|
-
[%r'\A河北新報
|
109
|
+
[%r'\A河北新報 (?:東北|内外)のニュース/(.+)\Z', '\1'].freeze,
|
94
110
|
[%r'\A河北新報 (.+)\Z', '\1'].freeze,
|
95
111
|
].freeze,
|
112
|
+
"www.kfb.co.jp" => [
|
113
|
+
[%r'\A(.+) :: 福島県内ニュース :: KFB福島放送\Z', '\1'].freeze,
|
114
|
+
].freeze,
|
96
115
|
"www.kobe-np.co.jp" => [
|
97
116
|
[%r'\A神戸新聞|(.+)\Z', '\1'].freeze,
|
98
117
|
[%r'\A全国海外ニュース|(.+)\Z', '\1'].freeze,
|
99
|
-
[%r'\A
|
118
|
+
[%r'\A(?:淡路|阪神・北摂|姫路・西播磨|但馬|東播磨|神戸)|(.+)\Z', '\1'].freeze,
|
119
|
+
[%r'\A(?:事件・事故|社会|文化|経済)|(.+)\Z', '\1'].freeze,
|
100
120
|
].freeze,
|
101
121
|
"www.kyoto-np.co.jp" => [
|
102
122
|
[%r'\A(.+):京都新聞\Z', '\1'].freeze,
|
@@ -110,19 +130,52 @@ module IronnewsUtility
|
|
110
130
|
"www.nhk.or.jp" => [
|
111
131
|
[%r'\ANHKニュース (.+)\Z', '\1'].freeze,
|
112
132
|
].freeze,
|
133
|
+
"www.nikkansports.com" => [
|
134
|
+
[%r'\A(.+) : nikkansports.com\Z', '\1'].freeze,
|
135
|
+
].freeze,
|
113
136
|
"www.nishinippon.co.jp" => [
|
114
137
|
[%r'\A(.+) / 西日本新聞\Z', '\1'].freeze,
|
115
138
|
].freeze,
|
139
|
+
"www.sankei-kansai.com" => [
|
140
|
+
[%r'\A(.+):産経関西(産経新聞大阪本社公式ニュースサイト)\Z', '\1'].freeze,
|
141
|
+
].freeze,
|
142
|
+
"www.sankeibiz.jp" => [
|
143
|
+
[%r'\A(.+) - SankeiBiz(サンケイビズ)\Z', '\1'].freeze,
|
144
|
+
[%r'\A(.+) \(\d+/\d+ページ\)\Z', '\1'].freeze,
|
145
|
+
].freeze,
|
146
|
+
"www.shikoku-np.co.jp" => [
|
147
|
+
[%r'\A(.+) \| 四国新聞社\Z', '\1'].freeze,
|
148
|
+
[%r'\A(.+) \| (?:香川の|全国|スポーツ)ニュース\Z', '\1'].freeze,
|
149
|
+
[%r'\A(.+)―四国新聞社\Z', '\1'].freeze,
|
150
|
+
].freeze,
|
151
|
+
"www.shimotsuke.co.jp" => [
|
152
|
+
[%r'\A(.+) |下野新聞「SOON」\Z', '\1'].freeze,
|
153
|
+
].freeze,
|
154
|
+
"www.shinmai.co.jp" => [
|
155
|
+
[%r'\A信濃毎日新聞[信毎web] (.+)\Z', '\1'].freeze,
|
156
|
+
[%r'\A(.+)|信濃毎日新聞[信毎web]\Z', '\1'].freeze,
|
157
|
+
[%r'\A(.+)|(?:長野全県|東北信|中南信)ダイジェスト\Z', '\1'].freeze,
|
158
|
+
].freeze,
|
159
|
+
"www.sponichi.co.jp" => [
|
160
|
+
[%r'\A(.+) ― スポニチ Sponichi Annex ニュース\Z', '\1'].freeze,
|
161
|
+
[%r'\A(.+) ― スポニチ Sponichi Annex 大阪\Z', '\1'].freeze,
|
162
|
+
].freeze,
|
116
163
|
"www.tetsudo.com" => [
|
117
164
|
[%r'\A(.+) - 鉄道コム\Z', '\1'].freeze,
|
118
165
|
].freeze,
|
119
166
|
"www.tokyo-np.co.jp" => [
|
120
167
|
[%r'\A東京新聞:(.+)\(TOKYO Web\)\Z', '\1'].freeze,
|
121
168
|
].freeze,
|
169
|
+
"www.toonippo.co.jp" => [
|
170
|
+
[%r'\A(.+)/Web東奥・ニュース\d{14}\Z', '\1'].freeze,
|
171
|
+
].freeze,
|
122
172
|
"www.yomiuri.co.jp" => [
|
123
173
|
[%r'\A(.+) : YOMIURI ONLINE(読売新聞)\Z', '\1'].freeze,
|
124
174
|
[%r'\A(.+) : (社会|マネー・経済|国際|地域|旅ゅ〜ん!)\Z', '\1'].freeze,
|
125
175
|
[%r'\A(.+) : 経済ニュース\Z', '\1'].freeze,
|
126
176
|
].freeze,
|
177
|
+
"yamagata-np.jp" => [
|
178
|
+
[%r'\A(.+)|山形新聞\Z', '\1'].freeze,
|
179
|
+
].freeze,
|
127
180
|
}.freeze
|
128
181
|
end
|
@@ -11,18 +11,20 @@ module IronnewsUtility
|
|
11
11
|
%r'\Ahttp://japan\.donga\.com/', # 理由: title要素に記事名が含まれていないため
|
12
12
|
%r'\Ahttp://japanese\.donga\.com/', # 理由: title要素に記事名が含まれていないため
|
13
13
|
%r'\Ahttp://jp\.reuters\.com/', # 理由: 記事名の取得に失敗することが多く、かつ鉄道関連の記事が少ないため
|
14
|
-
%r'\Ahttp://mainichi\.jp/enta/sports/baseball/news/', # 理由: title要素に記事名が含まれていないため
|
14
|
+
%r'\Ahttp://mainichi\.jp/enta/sports/baseball/news/m', # 理由: title要素に記事名が含まれていないため
|
15
15
|
%r'\Ahttp://mainichi\.jp/life/money/kabu/nsj/news/', # 理由: title要素に記事名が含まれていないため
|
16
16
|
%r'\Ahttp://mainichi\.jp/select/.+?/news/m', # 理由: title要素に記事名が含まれていないため
|
17
17
|
%r'\Ahttp://mainichi\.pheedo\.jp/', # 理由: リダイレクト用URLであるため
|
18
18
|
%r'\Ahttp://markets\.nikkei\.co\.jp/', # 理由: title要素に記事名が含まれていないため
|
19
19
|
%r'\Ahttp://news\.ibc\.co\.jp/', # 理由: title要素に記事名が含まれていないため
|
20
|
+
%r'\Ahttp://news\.rkb\.ne\.jp/', # 理由: title要素に記事名が含まれていないため
|
20
21
|
%r'\Ahttp://news\.searchina\.ne\.jp/', # 理由: 記事の閲覧が有料であるため
|
21
22
|
%r'\Ahttp://news\.tbs\.co\.jp/newseye/', # 理由: 記事の閲覧可能期間が短いため
|
22
23
|
%r'\Ahttp://release\.nikkei\.co\.jp/', # 理由: title要素に記事名が含まれていないため
|
23
24
|
%r'\Ahttp://rkk\.jp/', # 理由: title要素に記事名が含まれていないため
|
24
25
|
%r'\Ahttp://rss\.asahi\.com/', # 理由: リダイレクト用URLであるため
|
25
26
|
%r'\Ahttp://rss\.rssad\.jp/', # 理由: リダイレクト用URLであるため
|
27
|
+
%r'\Ahttp://sports\.nikkei\.co\.jp/', # 理由: title要素に記事名が含まれていないため
|
26
28
|
%r'\Ahttp://www.pheedo.jp/', # 理由: リダイレクト用URLであるため
|
27
29
|
%r'\Ahttp://www2\.knb\.ne\.jp/', # 理由: title要素に記事名が含まれていないため
|
28
30
|
%r'\Ahttp://www\.asahi\.com/english/weekly/', # 理由: title要素に記事名が含まれていないため
|
@@ -53,7 +55,6 @@ module IronnewsUtility
|
|
53
55
|
%r'\Ahttp://www\.wbs\.co\.jp/', # 理由: title要素に記事名が含まれていないため
|
54
56
|
%r'\Ahttp://www\.worldtimes\.co\.jp/today/', # 理由: title要素に記事名が含まれていないため
|
55
57
|
%r'\Ahttp://www\.xinhua\.jp/', # 理由: 記事の閲覧が有料であるため
|
56
|
-
%r'\Ahttp://
|
57
|
-
%r'\Ahttp://news\.rkb\.ne\.jp/', # 理由: title要素に記事名が含まれていないため
|
58
|
+
%r'\Ahttp://mytown\.asahi\.com/.+/news\.php\Z', # 理由: 実体が存在しないため
|
58
59
|
].freeze
|
59
60
|
end
|
@@ -5,8 +5,8 @@ Gem::Specification.new do |s|
|
|
5
5
|
s.required_ruby_version = Gem::Requirement.new(">= 1.8.6")
|
6
6
|
|
7
7
|
s.name = "nayutaya-ironnews-utility"
|
8
|
-
s.version = "0.3.
|
9
|
-
s.date = "2010-
|
8
|
+
s.version = "0.3.7"
|
9
|
+
s.date = "2010-02-18"
|
10
10
|
|
11
11
|
s.authors = ["Yuya Kato"]
|
12
12
|
s.email = "yuyakato@gmail.com"
|
metadata
CHANGED
@@ -1,7 +1,7 @@
|
|
1
1
|
--- !ruby/object:Gem::Specification
|
2
2
|
name: nayutaya-ironnews-utility
|
3
3
|
version: !ruby/object:Gem::Version
|
4
|
-
version: 0.3.
|
4
|
+
version: 0.3.7
|
5
5
|
platform: ruby
|
6
6
|
authors:
|
7
7
|
- Yuya Kato
|
@@ -9,7 +9,7 @@ autorequire:
|
|
9
9
|
bindir: bin
|
10
10
|
cert_chain: []
|
11
11
|
|
12
|
-
date: 2010-
|
12
|
+
date: 2010-02-18 00:00:00 +09:00
|
13
13
|
default_executable:
|
14
14
|
dependencies: []
|
15
15
|
|