RubyGems - http_crawler - Versions diffs - 0.3.2.3 → 0.3.2.4 - Mend

http_crawler 0.3.2.3 → 0.3.2.4

Files changed (11) hide show

checksums.yaml CHANGED

@@ -1,7 +1,7 @@
 ---
 SHA256:
-  metadata.gz: ca9c6198f99bbedf3a650dc29d026500fe14a3d7bc67d3e01e5b46e9d51f0aec
-  data.tar.gz: 811e5b411aef0b5f6d9293ecd51624979b768584a48d14b3b916b48a7e143b3c
+  metadata.gz: 3ccf1f8dd94a975491c31e136eaaa74bd15fe2588d047a653847ee4f5899bdfb
+  data.tar.gz: d0669d6313fe3aa10c1eb8c9bafeb2707ca3a081de79b11171bb99e81657143d
 SHA512:
-  metadata.gz: fc8b3da5cab3e0e179a1ddff91dc0e5d35aa7bf8c41fd3842ca40ab28688c18efa92b1e9496d6a1e3956eef25c73cc296cd0a89041b4798f938e8bf8ad34940c
-  data.tar.gz: cbeba86210e6037ca968492b78eae4c47a492569db37e015d84ebae473c118954db386042bb14f6212ef211e0fe58dc408b860920a83c7e64990923ee708f037
+  metadata.gz: 176cbcffb613e41738ff51246fbf13270d19190498ecd933567d4610edc561760657ebfa6c5620ef2982a32374d7ea0a113b1d97eb8a63d584fd5f995abc05e1
+  data.tar.gz: 3a74d6abb7ef3577a1962614d79991290a90fc60b6be7654b730dec2b13553ce087a1544cf9091b2006cd6a07633290de08f65f3930fc7f9a69b7dd66848f02d

@@ -204,6 +204,20 @@ module HttpCrawler
     def init_cookies
       @cookies = {}
     end
+    # 创建时间: 2020/4/7 16:54
+    # 更新时间: 2020/4/7
+    # 作者: Jagger
+    # 方法名称: remove_traces
+    # 方法说明: 清除痕迹
+    # 调用方式: #remove_traces
+    #
+    # @return
+    #
+    def remove_traces
+      @response = nil
+      self.init_cookies
+    end
     # 创建时间: 2019/9/16 17:13
     # 更新时间: 2019/9/16

@@ -1,3 +1,3 @@
 module HttpCrawler
-  VERSION = "0.3.2.3"
+  VERSION = "0.3.2.4"
 end

@@ -8,4 +8,3 @@ module HttpCrawler
 end
-load File.dirname(__FILE__) + '/baidu/client.rb'

@@ -1,10 +1,10 @@
-# 示例：百度爬虫维护
+# 示例：httpbin爬虫维护
 ### 通过对象调用
 ```ruby
-client = HttpCrawler::Client::Baidu::Client.new
+client = HttpCrawler::Client::Httpbin::Client.new
 client.index  # 抓取首页
 ```

@@ -0,0 +1,25 @@
+module HttpCrawler
+  module Web
+    module Httpbin
+      class Client < HttpCrawler::Web::Client
+        def init_client
+          # 设置整体超时时间 3 秒
+          @all_timeout = 3
+        end
+        def init_uri
+          @uri = URI("http://httpbin.org/")
+        end
+        def ip(parameter = {})
+          r = get("ip")
+          r.extend(HttpCrawler::Web::Httpbin::Response::Ip)
+        end
+      end
+    end # module Baidu
+  end # module Web
+end # module HttpCrawler

@@ -2,7 +2,7 @@
 module HttpCrawler
   module Web
-    module Baidu
+    module Httpbin
       module Response
       end
     end

@@ -0,0 +1,31 @@
+# 查询
+module HttpCrawler
+  module Web
+    module Httpbin
+      module Response
+        module Ip
+          # 创建时间: 2019/4/28 21:03
+          # 作者: Jagger
+          # 方法名称: parsing
+          # 方法说明: 解析数据
+          # 调用方式: #results
+          #
+          # @option parameter [Hash]	Hash模式传参
+          # @param parameter [Hash]
+          #         {
+          #             "": ,  # 参数说明
+          #         }
+          #
+          # @return JSON
+          #
+          def parsing(parameter = {})
+            self.json
+          end
+        end # module Index
+      end # module Response
+    end # module Baidu
+  end # module Web
+end # module HttpCrawler

metadata CHANGED

@@ -1,14 +1,14 @@
 --- !ruby/object:Gem::Specification
 name: http_crawler
 version: !ruby/object:Gem::Version
-  version: 0.3.2.3
+  version: 0.3.2.4
 platform: ruby
 authors:
 - jagger
 autorequire:
 bindir: exe
 cert_chain: []
-date: 2019-12-27 00:00:00.000000000 Z
+date: 2020-04-07 00:00:00.000000000 Z
 dependencies:
 - !ruby/object:Gem::Dependency
   name: rspec
@@ -153,11 +153,11 @@ files:
 - lib/http_crawler/version.rb
 - lib/http_crawler/web.rb
 - lib/http_crawler/web/README.md
-- lib/http_crawler/web/baidu/README.md
-- lib/http_crawler/web/baidu/client.rb
-- lib/http_crawler/web/baidu/response.rb
-- lib/http_crawler/web/baidu/response/index.rb
 - lib/http_crawler/web/client.rb
+- lib/http_crawler/web/httpbin/README.md
+- lib/http_crawler/web/httpbin/client.rb
+- lib/http_crawler/web/httpbin/response.rb
+- lib/http_crawler/web/httpbin/response/ip.rb
 homepage: https://rubygems.org/gems/http_crawler
 licenses:
 - MIT

@@ -1,35 +0,0 @@
-module HttpCrawler
-  module Web
-    module Baidu
-      class Client < HttpCrawler::Web::Client
-        def init_client
-          # 设置整体超时时间 3 秒
-          @all_timeout = 3
-        end
-        def init_uri
-          @uri = URI("https://www.baidu.com")
-        end
-        def index(parameter = {})
-          r = get("/")
-          r.extend(HttpCrawler::Web::Baidu::Response::Index)
-        end
-        def search(parameter = {})
-          raise "parameter[:keyword] 不能为空" unless parameter[:keyword]
-          params = {
-              "wd": parameter[:keyword]
-          }
-          r = get("/s",params)
-          r
-        end
-      end
-    end # module Baidu
-  end # module Web
-end # module HttpCrawler
-load File.dirname(__FILE__) + '/response/index.rb'

@@ -1,16 +0,0 @@
-# 查询
-module HttpCrawler
-  module Web
-    module Baidu
-      module Response
-        module Index
-          def parsing(parameter = {})
-            html
-          end
-        end # module Index
-      end # module Response
-    end # module Baidu
-  end # module Web
-end # module HttpCrawler