RubyGems - twitterscraper-ruby - Versions diffs - 0.9.0 → 0.10.0 - Mend

twitterscraper-ruby 0.9.0 → 0.10.0

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (8) hide show

checksums.yaml +4 -4
data/Gemfile.lock +1 -1
data/README.md +1 -0
data/lib/twitterscraper.rb +1 -0
data/lib/twitterscraper/cli.rb +16 -2
data/lib/twitterscraper/template.rb +48 -0
data/lib/version.rb +1 -1
metadata +2 -1

checksums.yaml CHANGED

@@ -1,7 +1,7 @@
 ---
 SHA256:
-  metadata.gz: 59b71fc6129f6d8c5a441981dc1577fa9b761380ff119bed4985cfcd88ccb31b
-  data.tar.gz: 2de3fcadc334ee2689d3083ea9324127c3b22ec94cf1b08dec920f9c95771445
+  metadata.gz: c2429cf6172b5f19caede64ac35f5c796a7c8a67e76fff8dd2f08677fb15406b
+  data.tar.gz: 0f32ca6b559a18c4e3aac3205f6503149e372d4d7d1976b1e83db26036d9ff17
 SHA512:
-  metadata.gz: b1e392bc021f6f758b79b7bdcd099af2ac391863f8712dadb5fd19248946867cfd89f140b836532fb40554c82697b26ef3af00b7cbb2cb13b0d5a8e2a38c87e7
-  data.tar.gz: 8c0e81589202e4a094c17604354f0f23a08b4536fe60b58ffe616cf1233c0531547ef02b8e88b6f70b1870ce2d134e4518ee093a5349144e2edfce3b1088e06c
+  metadata.gz: a36ce6c91a363b64b36deeb3abbaaaebb725f3449f280b70be92532497a94dc5915ba449926acfacfc0d852d52471d258d41140a8891e64b6040bf262d0c347f
+  data.tar.gz: a737c7db151190a1493b1a2a92bea304cfcf7512b2ee03fc13c6f25794f5dc727fe548e52cb39eccc2a63261fee0d58fc005920a0e7cd7650d20600e184d79cb

data/Gemfile.lock CHANGED

@@ -1,7 +1,7 @@
 PATH
   remote: .
   specs:
-    twitterscraper-ruby (0.9.0)
+    twitterscraper-ruby (0.10.0)
       nokogiri
       parallel

data/README.md CHANGED

@@ -143,6 +143,7 @@ $ cat tweets.json | jq . | less
 | `--limit` | Stop scraping when *at least* the number of tweets indicated with --limit is scraped. | 100 |
 | `--threads` | Set the number of threads twitterscraper-ruby should initiate while scraping for your query. | 2 |
 | `--proxy` | Scrape https://twitter.com/search via proxies. | false |
+| `--format` | The format of the output. | json |
 | `--output` | The name of the output file. | tweets.json |

data/lib/twitterscraper.rb CHANGED

@@ -5,6 +5,7 @@ require 'twitterscraper/lang'
 require 'twitterscraper/query'
 require 'twitterscraper/client'
 require 'twitterscraper/tweet'
+require 'twitterscraper/template'
 require 'version'
 module Twitterscraper

data/lib/twitterscraper/cli.rb CHANGED

@@ -25,7 +25,19 @@ module Twitterscraper
       }
       client = Twitterscraper::Client.new
       tweets = client.query_tweets(options['query'], query_options)
-      File.write(options['output'], generate_json(tweets)) unless tweets.empty?
+      export(tweets) unless tweets.empty?
+    end
+    def export(tweets)
+      write_json = lambda { File.write(options['output'], generate_json(tweets)) }
+      if options['format'] == 'json'
+        write_json.call
+      elsif options['format'] == 'html'
+        File.write('tweets.html', Template.tweets_embedded_html(tweets))
+      else
+        write_json.call
+      end
     end
     def generate_json(tweets)
@@ -53,6 +65,7 @@ module Twitterscraper
           'limit:',
           'threads:',
           'output:',
+          'format:',
           'proxy',
           'pretty',
           'verbose',
@@ -61,7 +74,8 @@ module Twitterscraper
       options['lang'] ||= ''
       options['limit'] = (options['limit'] || 100).to_i
       options['threads'] = (options['threads'] || 2).to_i
-      options['output'] ||= 'tweets.json'
+      options['format'] ||= 'json'
+      options['output'] ||= "tweets.#{options['format']}"
       options
     end

data/lib/twitterscraper/template.rb ADDED

@@ -0,0 +1,48 @@
+module Twitterscraper
+  module Template
+    module_function
+    def tweets_embedded_html(tweets)
+      tweets_html = tweets.map { |t| EMBED_TWEET_HTML.sub('__TWEET_URL__', t.tweet_url) }
+      EMBED_TWEETS_HTML.sub('__TWEETS__', tweets_html.join)
+    end
+    EMBED_TWEET_HTML = <<~'HTML'
+      <blockquote class="twitter-tweet">
+        <a href="__TWEET_URL__"></a>
+      </blockquote>
+    HTML
+    EMBED_TWEETS_HTML = <<~'HTML'
+      <html>
+        <head>
+          <style type=text/css>
+            .twitter-tweet {
+              margin: 30px auto 0 auto !important;
+            }
+          </style>
+          <script>
+            window.twttr = (function(d, s, id) {
+              var js, fjs = d.getElementsByTagName(s)[0], t = window.twttr || {};
+              if (d.getElementById(id)) return t;
+              js = d.createElement(s);
+              js.id = id;
+              js.src = "https://platform.twitter.com/widgets.js";
+              fjs.parentNode.insertBefore(js, fjs);
+              t._e = [];
+              t.ready = function(f) {
+                  t._e.push(f);
+              };
+              return t;
+            }(document, "script", "twitter-wjs"));
+          </script>
+        </head>
+        <body>
+          __TWEETS__
+        </body>
+      </html>
+    HTML
+  end
+end

data/lib/version.rb CHANGED

@@ -1,3 +1,3 @@
 module Twitterscraper
-  VERSION = '0.9.0'
+  VERSION = '0.10.0'
 end

metadata CHANGED

@@ -1,7 +1,7 @@
 --- !ruby/object:Gem::Specification
 name: twitterscraper-ruby
 version: !ruby/object:Gem::Version
-  version: 0.9.0
+  version: 0.10.0
 platform: ruby
 authors:
 - ts-3156
@@ -68,6 +68,7 @@ files:
 - lib/twitterscraper/logger.rb
 - lib/twitterscraper/proxy.rb
 - lib/twitterscraper/query.rb
+- lib/twitterscraper/template.rb
 - lib/twitterscraper/tweet.rb
 - lib/version.rb
 - twitterscraper-ruby.gemspec