RubyGems - twitter_friendly - Versions diffs - 1.1.0 → 1.2.0 - Mend

twitter_friendly 1.1.0 → 1.2.0

Files changed (6) hide show

checksums.yaml +4 -4
data/Gemfile.lock +1 -1
data/lib/twitter_friendly/rest/api.rb +0 -5
data/lib/twitter_friendly/version.rb +1 -1
metadata +1 -2
data/lib/twitter_friendly/rest/extension/clusters.rb +0 -313

checksums.yaml CHANGED Viewed

@@ -1,7 +1,7 @@
 ---
 SHA256:
-  metadata.gz: 5611cd772b52ea39a00bb73218c52495d4934d3994fb5f471e37f8f9dc81cccc
-  data.tar.gz: 9e6a9094fe7f541d30de5281fa812fb273956645044acd69b755963f4235fe95
+  metadata.gz: 687792a2d0065ebefe3b95ad38f1df4558a644f0c07819619961dd85f4b7fa7c
+  data.tar.gz: ec86328550855e0f864daea0f3ab8bbfadf25cc71e217cda7d794c1d3eb52a2b
 SHA512:
-  metadata.gz: aa33d8279f915b94f5e43e96f2ce09ec32d0b019e18fbe214f207f403bbfcde773b45627d546f6177b7735a6f234954eb616f45f79b808f7322e0de775dad196
-  data.tar.gz: 848f0e69305824b7cf7d3fbe219fbd278957c9968ad619ec7e648ed641d60174f3475294a20b185a877de35de80dcfee6cf3c186bae6ff8e839e9f54d9f0ec2c
+  metadata.gz: b3029c832c6da171bedcd7a9a82e2c211e2be912913deed15d6a32ff4d2884f18d4b990ec8f902f4e97dcd684815a59c13a7f0f5e95e6134dc2043e343d43430
+  data.tar.gz: 36365cf299fab85c22859303652963185700c967023a558b7f16f1b289b6b563ccc32ed6f014d48d8383bf0beb3438c102fe9d43e0b34e42c964cec57f650db5

data/Gemfile.lock CHANGED Viewed

@@ -1,7 +1,7 @@
 PATH
   remote: .
   specs:
-    twitter_friendly (1.1.0)
+    twitter_friendly (1.2.0)
       activesupport (>= 4.2, < 6.0)
       oj (~> 3.7.6)
       parallel (~> 1.12.1)

data/lib/twitter_friendly/rest/api.rb CHANGED Viewed

@@ -9,9 +9,6 @@ require 'twitter_friendly/rest/favorites'
 require 'twitter_friendly/rest/lists'
 require 'twitter_friendly/rest/tweets'
-# 後方互換性のために残した
-require 'twitter_friendly/rest/extension/clusters'
 module TwitterFriendly
   module REST
     module API
@@ -25,8 +22,6 @@ module TwitterFriendly
       include TwitterFriendly::REST::Favorites
       include TwitterFriendly::REST::Lists
       include TwitterFriendly::REST::Tweets
-      include TwitterFriendly::REST::Extension::Clusters
     end
   end
 end

data/lib/twitter_friendly/version.rb CHANGED Viewed

@@ -1,3 +1,3 @@
 module TwitterFriendly
-  VERSION = "1.1.0"
+  VERSION = "1.2.0"
 end

metadata CHANGED Viewed

@@ -1,7 +1,7 @@
 --- !ruby/object:Gem::Specification
 name: twitter_friendly
 version: !ruby/object:Gem::Version
-  version: 1.1.0
+  version: 1.2.0
 platform: ruby
 authors:
 - ts-3156
@@ -188,7 +188,6 @@ files:
 - lib/twitter_friendly/rate_limit.rb
 - lib/twitter_friendly/rest/api.rb
 - lib/twitter_friendly/rest/collector.rb
-- lib/twitter_friendly/rest/extension/clusters.rb
 - lib/twitter_friendly/rest/favorites.rb
 - lib/twitter_friendly/rest/friends_and_followers.rb
 - lib/twitter_friendly/rest/lists.rb

data/lib/twitter_friendly/rest/extension/clusters.rb DELETED Viewed

@@ -1,313 +0,0 @@
-module TwitterFriendly
-  module REST
-    module Extension
-      module Clusters
-        PROFILE_SPECIAL_WORDS = %w(20↑ 成人済 腐女子)
-        PROFILE_SPECIAL_REGEXP = nil
-        PROFILE_EXCLUDE_WORDS = %w(in at of my to no er by is RT DM the and for you inc Inc com from info next gmail 好き こと 最近 紹介 連載 発売 依頼 情報 さん ちゃん くん 発言 関係 もの 活動 見解 所属 組織 代表 連絡 大好き サイト ブログ つぶやき 株式会社 最新 こちら 届け お仕事 ツイ 返信 プロ 今年 リプ ヘッダー アイコン アカ アカウント ツイート たま ブロック 無言 時間 お願い お願いします お願いいたします イベント フォロー フォロワー フォロバ スタッフ 自動 手動 迷言 名言 非公式 リリース 問い合わせ ツイッター)
-        PROFILE_EXCLUDE_REGEXP = Regexp.union(/\w+@\w+\.(com|co\.jp)/, %r[\d{2,4}(年|/)\d{1,2}(月|/)\d{1,2}日], %r[\d{1,2}/\d{1,2}], /\d{2}th/, URI.regexp)
-        def tweet_clusters(tweets, limit: 10, debug: false)
-          return {} if tweets.blank?
-          text = tweets.map(&:text).join(' ')
-          if defined?(Rails)
-            exclude_words = JSON.parse(File.read(Rails.configuration.x.constants['cluster_bad_words_path']))
-            special_words = JSON.parse(File.read(Rails.configuration.x.constants['cluster_good_words_path']))
-          else
-            exclude_words = JSON.parse(File.read('./cluster_bad_words.json'))
-            special_words = JSON.parse(File.read('./cluster_good_words.json'))
-          end
-          %w(べたら むっちゃ それとも たしかに さそう そんなに ったことある してるの しそうな おやくま ってますか これをやってるよ のせいか 面白い 可愛い).each { |w| exclude_words << w }
-          %w(面白い 可愛い 食べ物 宇多田ヒカル ご飯 面倒 体調悪くなる 空腹 頑張ってない 眼鏡 台風 沖縄 らんま1/2 女の子 怪我 足のむくみ 彼女欲しい 彼氏欲しい 吐き気 注射 海鮮チヂミ 出勤 価格ドットコム 幹事 雑談 パズドラ ビオフェルミン 餃子 お金 まんだらけ 結婚 焼肉 タッチペン).each { |w| special_words << w }
-          # クラスタ用の単語の出現回数を記録
-          frequency =
-            special_words.map { |sw| [sw, text.scan(sw)] }
-              .delete_if { |_, matched| matched.empty? }
-              .each_with_object(Hash.new(0)) { |(word, matched), memo| memo[word] = matched.size }
-          # 同一文字種の繰り返しを見付ける。漢字の繰り返し、ひらがなの繰り返し、カタカナの繰り返し、など
-          text.scan(/[一-龠〆ヵヶ々]+|[ぁ-んー～]+|[ァ-ヴー～]+|[ａ-ｚA-ZＡ-Ｚ０-９]+|[、。！!？?]+/).
-            # 複数回繰り返される文字を除去
-            map { |w| w.remove /[？！?!。、ｗ]|(ー{2,})/ }.
-            # 文字数の少なすぎる単語、除外単語を除去する
-            delete_if { |w| w.length <= 2 || exclude_words.include?(w) }.
-            # 出現回数を記録
-            each { |w| frequency[w] += 1 }
-          # 複数個以上見付かった単語のみを残し、出現頻度順にソート
-          frequency.select { |_, v| 2 < v }.sort_by { |k, v| [-v, -k.size] }.take(limit).to_h
-        end
-        def count_freq_hashtags(tweets, with_prefix: true, use_regexp: false, debug: false)
-          puts "tweets: #{tweets.size}" if debug
-          return {} if tweets.blank?
-          prefix = %w(# ＃)
-          regexp = /[#＃]([Ａ-Ｚａ-ｚA-Za-z_一-鿆0-9０-９ぁ-ヶｦ-ﾟー]+)/
-          tweets =
-            if use_regexp
-              tweets.select { |t| t.text && prefix.any? { |char| t.text.include?(char)} }
-            else
-              tweets.select { |t| include_hashtags?(t) }
-            end
-          puts "tweets with hashtag: #{tweets.size}" if debug
-          hashtags =
-            if use_regexp
-              tweets.map { |t| t.text.scan(regexp).flatten.map(&:strip) }
-            else
-              tweets.map { |t| extract_hashtags(t) }
-            end.flatten
-          hashtags = hashtags.map { |h| "#{prefix[0]}#{h}" } if with_prefix
-          hashtags.each_with_object(Hash.new(0)) { |h, memo| memo[h] += 1 }.sort_by { |k, v| [-v, -k.size] }.to_h
-        end
-        def hashtag_clusters(hashtags, limit: 10, debug: false)
-          puts "hashtags: #{hashtags.take(10)}" if debug
-          hashtag, count = hashtags.take(3).each_with_object(Hash.new(0)) do |tag, memo|
-            tweets = search(tag)
-            puts "tweets #{tag}: #{tweets.size}" if debug
-            memo[tag] = count_freq_hashtags(tweets).reject { |t, c| t == tag }.values.sum
-          end.max_by { |_, c| c }
-          hashtags = count_freq_hashtags(search(hashtag)).reject { |t, c| t == hashtag }.keys
-          queries = hashtags.take(3).combination(2).map { |ary| ary.join(' AND ') }
-          puts "selected #{hashtag}: #{queries.inspect}" if debug
-          tweets = queries.map { |q| search(q) }.flatten
-          puts "tweets #{queries.inspect}: #{tweets.size}" if debug
-          if tweets.empty?
-            tweets = search(hashtag)
-            puts "tweets #{hashtag}: #{tweets.size}" if debug
-          end
-          members = tweets.map { |t| t.user }
-          puts "members count: #{members.size}" if debug
-          count_freq_words(members.map { |m| m.description  }, special_words: PROFILE_SPECIAL_WORDS, exclude_words: PROFILE_EXCLUDE_WORDS, special_regexp: PROFILE_SPECIAL_REGEXP, exclude_regexp: PROFILE_EXCLUDE_REGEXP, debug: debug).take(limit)
-        end
-        def fetch_lists(user, debug: false)
-          memberships(user, count: 500, call_limit: 2).sort_by { |li| li.member_count }
-        rescue Twitter::Error::ServiceUnavailable => e
-          puts "#{__method__}: #{e.class} #{e.message} #{user.inspect}" if debug
-          []
-        end
-        def list_clusters(lists, shrink: false, shrink_limit: 100, list_member: 300, total_member: 3000, total_list: 50, rate: 0.3, limit: 10, debug: false)
-          lists = lists.sort_by { |li| li.member_count }
-          puts "lists: #{lists.size} (#{lists.map { |li| li.member_count }.join(', ')})" if debug
-          return {} if lists.empty?
-          open('lists.txt', 'w') {|f| f.write lists.map(&:full_name).join("\n") } if debug
-          list_special_words = %w()
-          list_exclude_regexp = %r(list[0-9]*|people-ive-faved|twizard-magic-list|my-favstar-fm-list|timeline-list|conversationlist|who-i-met)
-          list_exclude_words = %w(it list people who met)
-          # リスト名を - で分割 -> 1文字の単語を除去 -> 出現頻度の降順でソート
-          words = lists.map { |li| li.full_name.split('/')[1] }.
-            select { |n| !n.match(list_exclude_regexp) }.
-            map { |n| n.split('-') }.flatten.
-            delete_if { |w| w.size < 2 || list_exclude_words.include?(w) }.
-            map { |w| SYNONYM_WORDS.has_key?(w) ? SYNONYM_WORDS[w] : w }.
-            each_with_object(Hash.new(0)) { |w, memo| memo[w] += 1 }.
-            sort_by { |k, v| [-v, -k.size] }
-          puts "words: #{words.take(10)}" if debug
-          return {} if words.empty?
-          # 出現頻度の高い単語を名前に含むリストを抽出
-          _words = []
-          lists =
-            filter(lists, min: 2) do |li, i|
-              _words = words[0..i].map(&:first)
-              name = li.full_name.split('/')[1]
-              _words.any? { |w| name.include?(w) }
-            end
-          puts "lists include #{_words.inspect}: #{lists.size} (#{lists.map { |li| li.member_count }.join(', ')})" if debug
-          return {} if lists.empty?
-          # 中間の 25-75% のリストを抽出
-          while lists.size > shrink_limit
-            percentile25 = ((lists.length * 0.25).ceil) - 1
-            percentile75 = ((lists.length * 0.75).ceil) - 1
-            lists = lists[percentile25..percentile75]
-            puts "lists sliced by 25-75 percentile: #{lists.size} (#{lists.map { |li| li.member_count }.join(', ')})" if debug
-          end if shrink || lists.size > shrink_limit
-          # メンバー数がしきい値より少ないリストを抽出
-          _list_member = 0
-          _min_list_member = 10 < lists.size ? 10 : 0
-          _lists =
-            filter(lists, min: 2) do |li, i|
-              _list_member = list_member * (1.0 + 0.25 * i)
-              _min_list_member < li.member_count && li.member_count < _list_member
-            end
-          lists = _lists.empty? ? [lists[0]] : _lists
-          puts "lists limited by list member #{_min_list_member}..#{_list_member.round}: #{lists.size} (#{lists.map { |li| li.member_count }.join(', ')})" if debug
-          return {} if lists.empty?
-          # トータルメンバー数がしきい値より少なくなるリストを抽出
-          _lists = []
-          lists.size.times do |i|
-            _lists = lists[0..(-1 - i)]
-            if _lists.map { |li| li.member_count }.sum < total_member
-              break
-            else
-              _lists = []
-            end
-          end
-          lists = _lists.empty? ? [lists[0]] : _lists
-          puts "lists limited by total members #{total_member}: #{lists.size} (#{lists.map { |li| li.member_count }.join(', ')})" if debug
-          return {} if lists.empty?
-          # リスト数がしきい値より少なくなるリストを抽出
-          if lists.size > total_list
-            lists = lists[0..(total_list - 1)]
-          end
-          puts "lists limited by total lists #{total_list}: #{lists.size} (#{lists.map { |li| li.member_count }.join(', ')})" if debug
-          return {} if lists.empty?
-          members = lists.map do |li|
-            begin
-              list_members(li.id)
-            rescue Twitter::Error::NotFound => e
-              puts "#{__method__}: #{e.class} #{e.message} #{li.id} #{li.full_name} #{li.mode}" if debug
-              nil
-            end
-          end.compact.flatten
-          puts "candidate members: #{members.size}" if debug
-          return {} if members.empty?
-          open('members.txt', 'w') {|f| f.write members.map{ |m| m.description.gsub(/\R/, ' ') }.join("\n") } if debug
-          3.times do
-            _members = members.each_with_object(Hash.new(0)) { |member, memo| memo[member] += 1 }.
-              select { |_, v| lists.size * rate < v }.keys
-            if _members.size > 100
-              members = _members
-              break
-            else
-              rate -= 0.05
-            end
-          end
-          puts "members included multi lists #{rate.round(3)}: #{members.size}" if debug
-          count_freq_words(members.map { |m| m.description }, special_words: PROFILE_SPECIAL_WORDS, exclude_words: PROFILE_EXCLUDE_WORDS, special_regexp: PROFILE_SPECIAL_REGEXP, exclude_regexp: PROFILE_EXCLUDE_REGEXP, debug: debug).take(limit)
-        end
-        private
-        def filter(lists, min:)
-          min = [min, lists.size].min
-          _lists = []
-          3.times do |i|
-            _lists = lists.select { |li| yield(li, i) }
-            break if _lists.size >= min
-          end
-          _lists
-        end
-        def count_by_word(texts, delim: nil, tagger: nil, min_length: 2, max_length: 5, special_words: [], exclude_words: [], special_regexp: nil, exclude_regexp: nil)
-          texts = texts.dup
-          frequency = Hash.new(0)
-          if special_words.any?
-            texts.each do |text|
-              special_words.map { |sw| [sw, text.scan(sw)] }
-                .delete_if { |_, matched| matched.empty? }
-                .each_with_object(frequency) { |(word, matched), memo| memo[word] += matched.size }
-            end
-          end
-          if exclude_regexp
-            texts = texts.map { |t| t.remove(exclude_regexp) }
-          end
-          if delim
-            texts = texts.map { |t| t.split(delim) }.flatten.map(&:strip)
-          end
-          if tagger
-            texts = texts.map { |t| tagger.parse(t).split("\n") }.flatten.
-              select { |line| line.include?('名詞') }.
-              map { |line| line.split("\t")[0] }
-          end
-          texts.delete_if { |w| w.empty? || w.size < min_length || max_length < w.size || exclude_words.include?(w) || w.match(/\d{2}/) }.
-            each_with_object(frequency) { |word, memo| memo[word] += 1 }.
-            sort_by { |k, v| [-v, -k.size] }.to_h
-        end
-        def count_freq_words(texts, special_words: [], exclude_words: [], special_regexp: nil, exclude_regexp: nil, debug: false)
-          candidates, remains = texts.partition { |desc| desc.scan('/').size > 2 }
-          slash_freq = count_by_word(candidates, delim: '/', exclude_regexp: exclude_regexp)
-          puts "words splitted by /: #{slash_freq.take(10)}" if debug
-          candidates, remains = remains.partition { |desc| desc.scan('|').size > 2 }
-          pipe_freq = count_by_word(candidates, delim: '|', exclude_regexp: exclude_regexp)
-          puts "words splitted by |: #{pipe_freq.take(10)}" if debug
-          noun_freq = count_by_word(remains, tagger: build_tagger, special_words: special_words, exclude_words: exclude_words, special_regexp: special_regexp, exclude_regexp: exclude_regexp)
-          puts "words tagged as noun: #{noun_freq.take(10)}" if debug
-          slash_freq.merge(pipe_freq) { |_, old, neww| old + neww }.
-            merge(noun_freq) { |_, old, neww| old + neww }.sort_by { |k, v| [-v, -k.size] }
-        end
-        def build_tagger
-          require 'mecab'
-          MeCab::Tagger.new("-d #{`mecab-config --dicdir`.chomp}/mecab-ipadic-neologd/")
-        rescue => e
-          puts "Add gem 'mecab' to your Gemfile."
-          raise e
-        end
-        def include_hashtags?(tweet)
-          tweet.entities&.hashtags&.any?
-        end
-        def extract_hashtags(tweet)
-          tweet.entities.hashtags.map { |h| h.text }
-        end
-        SYNONYM_WORDS = (
-          %w(cosplay cosplayer cosplayers coser cos こすぷれ コスプレ レイヤ レイヤー コスプレイヤー レイヤーさん).map { |w| [w, 'coplay'] } +
-          %w(tsukuba tkb).map { |w| [w, 'tsukuba'] } +
-          %w(waseda 早稲田 早稲田大学).map { |w| [w, 'waseda'] } +
-          %w(keio 慶應 慶應義塾).map { |w| [w, 'keio'] } +
-          %w(gakusai gakuensai 学祭 学園祭).map { |w| [w, 'gakusai'] } +
-          %w(kosen kousen).map { |w| [w, 'kosen'] } +
-          %w(anime アニメ).map { |w| [w, 'anime'] } +
-          %w(photo photos).map { |w| [w, 'photo'] } +
-          %w(creator creater クリエイター).map { |w| [w, 'creator'] } +
-          %w(illustrator illustrater 絵師).map { |w| [w, 'illustrator'] } +
-          %w(artist art artists アート 芸術).map { |w| [w, 'artist'] } +
-          %w(design デザイン).map { |w| [w, 'design'] } +
-          %w(kawaii かわいい).map { |w| [w, 'kawaii'] } +
-          %w(idol あいどる アイドル 美人).map { |w| [w, 'idol'] } +
-          %w(music musician musicians dj netlabel label レーベル おんがく 音楽家 音楽).map { |w| [w, 'music'] } +
-          %w(engineer engineers engineering えんじにあ tech 技術 技術系 hacker coder programming programer programmer geek rubyist ruby scala java lisp).map { |w| [w, 'engineer'] } +
-          %w(internet インターネット).map { |w| [w, 'internet'] }
-        ).to_h
-        def normalize_synonym(words)
-          words.map { |w| SYNONYM_WORDS.has_key?(w) ? SYNONYM_WORDS[w] : w }
-        end
-      end
-    end
-  end
-end