RubyGems - panchira - Versions diffs - 0.2.0 → 1.2.0 - Mend

panchira 0.2.0 → 1.2.0

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (18) hide show

checksums.yaml +4 -4
data/CHANGELOG.md +43 -0
data/Gemfile.lock +3 -3
data/README.md +6 -4
data/lib/panchira.rb +6 -1
data/lib/panchira/extensions.rb +4 -1
data/lib/panchira/panchira_result.rb +13 -0
data/lib/panchira/resolvers/dlsite_resolver.rb +30 -0
data/lib/panchira/resolvers/fanza_resolver.rb +56 -0
data/lib/panchira/resolvers/image_resolver.rb +15 -0
data/lib/panchira/resolvers/komiflo_resolver.rb +11 -8
data/lib/panchira/resolvers/melonbooks_resolver.rb +37 -0
data/lib/panchira/resolvers/narou_resolver.rb +52 -9
data/lib/panchira/resolvers/nijie_resolver.rb +19 -0
data/lib/panchira/resolvers/pixiv_resolver.rb +15 -0
data/lib/panchira/resolvers/resolver.rb +65 -24
data/lib/panchira/version.rb +1 -1
metadata +5 -2

checksums.yaml CHANGED

@@ -1,7 +1,7 @@
 ---
 SHA256:
-  metadata.gz: f2715a3395e43d5ad43f35bedae84dbfe25a4cd533f964cbcc4cdaf953bc0c4b
-  data.tar.gz: '059e23e1ca4831bc58c62a4a7ccd4ed87010fee75b7e8997560fe49f43486f01'
+  metadata.gz: 066440e461b75b84a9df04fd76f1960243785b26bc7f4c61289029248e0a8bd9
+  data.tar.gz: 1fc1f712c6a8d88363cf3c4162be2681e08631c515ffbe6631fba3fd204b91c0
 SHA512:
-  metadata.gz: e5ed936514fec2e05dfcaeb727189d1bcc6328e1a27559bd925acba7dc3037c26c57c99fece2c88bad95c7d0d7ae7ffd6840f9e33dde58aef81db81ae600d829
-  data.tar.gz: 8383db6bdc9c78e2e845651e7206d702f5a8566475b8161c9e464364da7b6aa9c5f9886125771c636e0465e8eec7f1ee1dda3c0865a1f0d478131510451c4a74
+  metadata.gz: 63a914d286eaf909f4a2ab7c128f3725a96a6badbac71a878362e4a09a4e29f720f1f81fab2fa4b1f0ddeb513fac04b5c00597132012f5dbe42d783f54b221b2
+  data.tar.gz: af6085627c05532b7019a7134da472329c52b0f61b3329079694a2f59115e52f1c7b0bc0acc2c9cc3ea19814a33c3e2cd9116fcd7f692278e2150de7874bb424

data/CHANGELOG.md CHANGED

@@ -4,6 +4,46 @@ All notable changes to this project will be documented in this file.
 The format is based on [Keep a Changelog](http://keepachangelog.com/)
 and this project adheres to [Semantic Versioning](http://semver.org/).
+## 1.2.0 - 2020-10-31
+### Added
+- You can now fetch author and circle name in resolvers (Resolver#fetch_author, Resolver#fetch_circle).
+### Changed
+- Resolver#fetch_title returns the title of the content (not the original title of the page).
+## 1.1.1 - 2020-08-09
+### Added
+- Added support for Fanza Doujin.
+- Added support for description in Fanza Book.
+### Fixed
+- Fixed an issue that fetching image was not working in Fanza Book.
+## 1.1.0 - 2020-08-06
+### Added
+- Added support for Fanza Books.
+- Added support for direct links to an image.
+- You can now set cookie by overriding Resolver#cookie in individual resolvers.
+### Changed
+- Resolver::USER_AGENT changed to Resolver#user_agent.
+## 1.0.0 - 2020-06-23
+### Added
+- Added support for tags.
+### Fixed
+- Fixed some outdated documents.
+## 0.3.0 - 2020-06-04
+### Added
+- You can now register and use your own Resolver with this gem. (see Panchira::Extensions#register)
+- Added support for new Twitter UI.
+### Changed
+- Panchira::fetch now returns an instance of PanchiraResult instead of a hash.
+- Changed default User-Agent slightly.
 ## 0.2.0 - 2020-05-18
 ### Added
 - Added support for Shousetsuka Ni Narou (novel18.syosetu.com).
@@ -18,6 +58,9 @@ and this project adheres to [Semantic Versioning](http://semver.org/).
 ### Added
 - Released Panchira gem. At this time we can parse only 5 websites.
+[1.1.0]: https://github.com/nuita/panchira/releases/tag/v1.1.0
+[1.0.0]: https://github.com/nuita/panchira/releases/tag/v1.0.0
+[0.3.0]: https://github.com/nuita/panchira/releases/tag/v0.3.0
 [0.2.0]: https://github.com/nuita/panchira/releases/tag/v0.2.0
 [0.1.1]: https://github.com/nuita/panchira/releases/tag/v0.1.1
 [0.1.0]: https://github.com/nuita/panchira/releases/tag/v0.1.0

data/Gemfile.lock CHANGED

@@ -1,7 +1,7 @@
 PATH
   remote: .
   specs:
-    panchira (0.2.0)
+    panchira (1.2.0)
       fastimage (~> 2.1.7)
       nokogiri (~> 1.10.9)
@@ -10,8 +10,8 @@ GEM
   specs:
     fastimage (2.1.7)
     mini_portile2 (2.4.0)
-    minitest (5.14.0)
-    nokogiri (1.10.9)
+    minitest (5.14.2)
+    nokogiri (1.10.10)
       mini_portile2 (~> 2.4.0)
     rake (12.3.3)

data/README.md CHANGED

@@ -6,7 +6,7 @@
 Due to some legal or ethical issues, most hentai and NSFW platforms don't clarify their content on meta tags. As a result, most hentai platforms are rendered poorly on the card previews on social media.
-To solve this issue, Panchira is made to parse correct and uncensored metadata from such web platforms (at this time we cover **DLSite, Komiflo, Melonbooks, Nijie and Pixiv**).
+To solve this issue, Panchira is made to parse correct and uncensored metadata from such web platforms (at this time we cover **DLSite, Komiflo, Melonbooks, Nijie, Pixiv, Shousetsuka ni narou, Fanza and Twitter**).
 If you need card previews of hentai on your web application, but can't get them with simply parsing metatags, then it is time for Panchira.
@@ -16,7 +16,7 @@ This gem is derived from the [Nuita](https://github.com/nuita/nuita) project.
 **Please use this gem with appropriate censoring and age-restricting. Never violate local laws and copyrights.**
-If you are running one of the websites we cover and feel negative about it, please contact the community or the author([@kypkyp](https://github.com/kypkyp)).
+If you are running one of the websites we cover and feel negative about this gem, please contact the community or the author([@kypkyp](https://github.com/kypkyp)).
 ## Installation
@@ -39,10 +39,12 @@ Or install it yourself as:
 ```
 > Panchira.fetch("https://www.pixiv.net/artworks/61711172")
-=> {:canonical_url=>"https://pixiv.net/member_illust.php?mode=medium&illust_id=61711172", :title=>"#輿水幸子 すずしい顔で締め切りを破る幸子 - むらためのイラスト - pixiv", :description=>"(UTF16の)Pietで実行すると「すずしい」と出力する幸子(5色+白Pietカラーゴルフ)。解説記事は http://chy72.hatenablog.com/entry/2016/12/24/1", :image=>{:url=>"https://pixiv.cat/61711172.jpg", :width=>810, :height=>500}}
+=> #<Panchira::PanchiraResult:0x00007fb95d2c53f8 @canonical_url="https://pixiv.net/member_illust.php?mode=medium&illust_id=61711172", @title="#輿水幸子 すずしい顔で締め切りを破る幸子 - むらためのイラスト - pixiv", @description="(UTF16の)Pietで実行すると「すずしい」と出力する幸子(5色+白Pietカラーゴルフ)。解説記事は http://chy72.hatenablog.com/entry/2016/12/24/1", @image=#<Panchira::PanchiraImage:0x00007fb95f126ea0 @url="https://pixiv.cat/61711172.jpg", @width=810, @height=500>, @tags=["輿水幸子", "Piet", "プログラミング"]>
 ```
-Panchira is in beta at this time and doesn't have stable API documentation yet.
+In most situation you would call `Panchira#fetch`. It is a singular method that takes a URI and returns an instance of `PanchiraResult`, which is a simple class that stores the website's information, such as title, description and so on.
+Panchira has a special treatment for each website. `Resolver` classes are where those treatments take place, and you can use your own `Resolver` classes by registering it to Panchira. See `Panchira::Extensions` documentation in source code for further details.
 ## Development

data/lib/panchira.rb CHANGED

@@ -6,16 +6,21 @@ require 'fastimage'
 require 'json'
 require_relative 'panchira/version'
+require_relative 'panchira/panchira_result'
 require_relative 'panchira/resolvers/resolver'
 require_relative 'panchira/extensions'
 project_root = File.dirname(File.absolute_path(__FILE__))
 Dir.glob(project_root + '/panchira/resolvers/*_resolver.rb').sort.each { |file| require file }
+# register fallback ImageResolver at the end. (resolver is selected by registration order)
+::Panchira::Extensions.register(Panchira::ImageResolver)
 # Main Panchira code goes here.
+# If you simply want to get data from your URL, then ::Panchira::fetch() will do.
 module Panchira
   class << self
-    # Fetch the given URL and returns a hash that contains attributes of hentai.
+    # Return a PanchiraResult that contains the attributes of given url.
     def fetch(url)
       resolver = select_resolver(url)

data/lib/panchira/extensions.rb CHANGED

@@ -1,15 +1,18 @@
 # frozen_string_literal: true
 module Panchira
+  # This Module manages Resolver classes.
+  # To enable your own Resolver, you need to call Extensions::register().
   module Extensions
     @resolvers = []
     class << self
-      # Register a resolver class which extends Panchira::Resolver.
+      # Register a given Resolver to Extensions::Resolvers.
       def register(resolver)
         @resolvers.push(resolver) unless @resolvers.include?(resolver)
       end
+      # Panchira::fetch will find a correct Resolver based on this list.
       attr_reader :resolvers
     end
   end

data/lib/panchira/panchira_result.rb ADDED

@@ -0,0 +1,13 @@
+# frozen_string_literal: true
+module Panchira
+  # Image attributes in PanchiraResult.
+  class PanchiraImage
+    attr_accessor :url, :width, :height
+  end
+  # Result class for Panchira.fetch.
+  class PanchiraResult
+    attr_accessor :canonical_url, :title, :description, :image, :tags, :author, :circle
+  end
+end

data/lib/panchira/resolvers/dlsite_resolver.rb CHANGED

@@ -6,9 +6,39 @@ module Panchira
     private
+    # DLSiteのタイトルの[]に含まれている値はtitleタグだとサークル名 or 出版社名だが、
+    # Panchiraが優先するog:titleではサークル名 or 著者名 となる。
+    # 取得に際しては、以下の3パターンを考慮する必要があるため、titleタグとtableの解析が必要となる:
+    # 1) 同人系の一部, 特に音声など。タイトル[サークル名]. 本文中に著者・作者の記載なし
+    # 2) 同人系の一部, 特に一部の同人誌など。タイトル[サークル名]. 本文中に「作者」の記載あり
+    # 3) 商業系。タイトル[著者名]　サークル名なし
+    # 込み入った実装になってしまったため、parse自体をいじる必要があるかも
+    def parse_title
+      @title_md = super.match(/(.+) \[(\S+)\] \|.+/)
+      @title_md[1]
+    end
+    def parse_author
+      @page.css('table[id*="work_"] tr').each do |tr|
+        if tr.css('th').text =~ /(作|著)者/
+          return @author = tr.css('td > a').first.text.strip
+        end
+      end
+      @author = nil
+    end
+    def parse_circle
+      @title_md[2] if @author != @title_md[2]
+    end
     def parse_image_url
       @page.css('//meta[property="og:image"]/@content').first.to_s.sub(/sam/, 'main')
     end
+    def parse_tags
+      @page.css('.main_genre').children.children.map(&:text)
+    end
   end
   ::Panchira::Extensions.register(Panchira::DlsiteResolver)

data/lib/panchira/resolvers/fanza_resolver.rb ADDED

@@ -0,0 +1,56 @@
+# frozen_string_literal: true
+require 'net/https'
+module Panchira
+  module Fanza
+    FANZA_COOKIE = 'age_check_done=1;'
+    class FanzaResolver < Resolver
+      private
+      def cookie
+        ::Panchira::Fanza::FANZA_COOKIE
+      end
+    end
+    class FanzaBookResolver < FanzaResolver
+      URL_REGEXP = %r{book\.dmm\.co\.jp\/}.freeze
+      private
+      def parse_author
+        @page.css('.m-boxDetailProductInfoMainList__description__list__item > a').first&.text.to_s
+      end
+      def parse_image_url
+        @page.css('.m-imgDetailProductPack/@src').first.to_s
+      end
+      def parse_tags
+        @page.css('.m-boxDetailProductInfo__list__description__item > a').map(&:text)
+      end
+      def parse_description
+        @page.css('.m-boxDetailProduct__info__story').first&.text.to_s.gsub(/[\n\t]/, '')
+      end
+    end
+    class FanzaDoujinResolver < FanzaResolver
+      URL_REGEXP = %r{dmm\.co\.jp\/dc\/doujin\/}.freeze
+      private
+      def parse_circle
+        @page.css('a.circleName__txt').first.text
+      end
+      def parse_tags
+        @page.css('.genreTag__item').map { |t| t.text.strip }
+      end
+    end
+  end
+  ::Panchira::Extensions.register(Panchira::Fanza::FanzaBookResolver)
+  ::Panchira::Extensions.register(Panchira::Fanza::FanzaDoujinResolver)
+end

data/lib/panchira/resolvers/image_resolver.rb ADDED

@@ -0,0 +1,15 @@
+# frozen_string_literal: true
+module Panchira
+  class ImageResolver < Resolver
+    URL_REGEXP = %r{\.(png|gif|jpg|jpeg|webp)$}.freeze
+    def fetch
+      result = PanchiraResult.new
+      result.canonical_url = @url
+      result.image = PanchiraImage.new
+      result.image.url = @url
+      result
+    end
+  end
+end

data/lib/panchira/resolvers/komiflo_resolver.rb CHANGED

@@ -10,33 +10,36 @@ module Panchira
       @url = url
       @id = url.slice(URL_REGEXP, 1)
-      raw_json = URI.parse("https://api.komiflo.com/content/id/#{@id}").read('User-Agent' => USER_AGENT)
+      raw_json = URI.parse("https://api.komiflo.com/content/id/#{@id}").read('User-Agent' => user_agent)
       @json = JSON.parse(raw_json)
     end
     private
     def parse_title
-      comic_title = @json['content']['data']['title']
-      "#{comic_title} | Komiflo"
+      @json['content']['data']['title']
     end
     def parse_image_url
       'https://t.komiflo.com/564_mobile_large_3x/' + @json['content']['named_imgs']['cover']['filename']
     end
-    def parse_description
-      author = @json['content']['attributes']['artists']['children'][0]['data']['name']
+    def parse_author
+      @json['content']['attributes']['artists']['children'][0]['data']['name']
+    end
-      parent = @json['content']['parents'][0]['data']['title']
-      description = '著: ' + author if author
-      description += " / #{parent}" if parent
+    def parse_description
+      @json['content']['parents'][0]['data']['title']
     end
     def parse_canonical_url
       id = @url.slice(%r{komiflo\.com(?:/#!)?/comics/(\d+)}, 1)
       'https://komiflo.com/comics/' + id
     end
+    def parse_tags
+      @json['content']['attributes']['tags']['children'].map { |content| content['data']['name'] }
+    end
   end
   ::Panchira::Extensions.register(Panchira::KomifloResolver)

data/lib/panchira/resolvers/melonbooks_resolver.rb CHANGED

@@ -4,8 +4,41 @@ module Panchira
   class MelonbooksResolver < Resolver
     URL_REGEXP = %r{melonbooks.co.jp/detail/detail.php\?product_id=(\d+)}.freeze
+    def fetch
+      result = PanchiraResult.new
+      @page = fetch_page(@url)
+      result.canonical_url = parse_canonical_url
+      @page = fetch_page(result.canonical_url) if @url != result.canonical_url
+      result.title, result.author, result.circle = parse_table
+      result.description = parse_description
+      result.image = parse_image
+      result.tags = parse_tags
+      result
+    end
     private
+    def parse_table
+      title, author, circle = nil, nil, nil
+      @page.css('#description > table.stripe > tr').each do |tr|
+        case tr.css('th').text
+        when 'タイトル'
+          title = tr.css('td').text.strip
+        when 'サークル名'
+          circle = tr.css('td > a').text.match(/^(.+)\W\(作品数:/)&.values_at(1)[0]
+        when '作家名'
+          author = tr.css('td > a').text.strip
+        end
+      end
+      [title, author, circle]
+    end
     def parse_canonical_url
       product_id = @url.slice(URL_REGEXP, 1)
       'https://www.melonbooks.co.jp/detail/detail.php?product_id=' + product_id + '&adult_view=1'
@@ -25,6 +58,10 @@ module Panchira
     def parse_image_url
       @page.css('//meta[property="og:image"]/@content').first.to_s.sub(/&c=1/, '')
     end
+    def parse_tags
+      @page.css('#related_tags .clearfix').children.children.map(&:text)
+    end
   end
   ::Panchira::Extensions.register(Panchira::MelonbooksResolver)

data/lib/panchira/resolvers/narou_resolver.rb CHANGED

@@ -3,18 +3,61 @@
 require 'net/https'
 module Panchira
-  class NarouResolver < Resolver
-    URL_REGEXP = %r{novel18\.syosetu\.com/}.freeze
+  module Narou
+    class Novel18Resolver < Resolver
+      URL_REGEXP = %r{novel18\.syosetu\.com/}.freeze
+      ID_REGEXP = %{novel18\.syosetu\.com/(?<id>[^/]+)}
-    def fetch_page(uri)
-      u = URI.parse(uri)
-      http = Net::HTTP.new(u.host, u.port)
-      http.use_ssl = u.port == 443
-      res = http.get u.request_uri, { 'cookie' => 'over18=yes;' }
+      def initialize(url)
+        super(url)
-      Nokogiri::HTML.parse(res.body, uri)
+        if id = @url.match(ID_REGEXP)[:id]
+          @desc = fetch_page("https://novel18.syosetu.com/novelview/infotop/ncode/#{id}/")
+        end
+      end
+      def fetch_page(uri)
+        u = URI.parse(uri)
+        http = Net::HTTP.new(u.host, u.port)
+        http.use_ssl = u.port == 443
+        res = http.get u.request_uri, { 'cookie' => 'over18=yes;' }
+        Nokogiri::HTML.parse(res.body, uri)
+      end
+      def parse_author
+        @desc&.xpath('//*[@id="noveltable1"]/tr[2]/td')&.text&.strip
+      end
+      def parse_tags
+        # つらい。
+        @desc&.xpath('//*[@id="noveltable1"]/tr[3]')&.text&.split("\n\n\n")&.dig(1)&.split(' ')
+      end
+    end
+    class NcodeResolver < Resolver
+      URL_REGEXP = /ncode\.syosetu\.com/.freeze
+      ID_REGEXP = %{ncode\.syosetu\.com/(?<id>[^/]+)}
+      def initialize(url)
+        super(url)
+        if id = @url.match(ID_REGEXP)[:id]
+          @desc = fetch_page("https://novel18.syosetu.com/novelview/infotop/ncode/#{id}/")
+        end
+      end
+      def parse_author
+        @desc&.xpath('//*[@id="noveltable1"]/tr[2]/td')&.text&.strip
+      end
+      def parse_tags
+        # めっちゃつらい。
+        @desc&.xpath('//*[@id="noveltable1"]/tr[3]')&.text&.split("\n\n\n")&.dig(1)&.delete("\u00A0")&.split(' ')&.grep_v('')
+      end
     end
   end
-  ::Panchira::Extensions.register(Panchira::NarouResolver)
+  ::Panchira::Extensions.register(Panchira::Narou::NcodeResolver)
+  ::Panchira::Extensions.register(Panchira::Narou::Novel18Resolver)
 end

data/lib/panchira/resolvers/nijie_resolver.rb CHANGED

@@ -6,6 +6,21 @@ module Panchira
     private
+    def parse_title
+      full_title = super
+      @md = full_title.match(/\A(?<title>.+) \| (?<author>.+)\z/)
+      @md[:title]
+    end
+    def parse_author
+      @md[:author]
+    end
+    def parse_description
+      @page.css('p.illust_description')&.first&.text&.strip
+    end
     def parse_canonical_url
       @url.sub(/sp.nijie/, 'nijie').sub(/view_popup/, 'view')
     end
@@ -24,6 +39,10 @@ module Panchira
         @page.css('//meta[property="og:image"]/@content').first.to_s
       end
     end
+    def parse_tags
+      @page.css('#view-tag span.tag_name').map(&:text)
+    end
   end
   ::Panchira::Extensions.register(Panchira::NijieResolver)

data/lib/panchira/resolvers/pixiv_resolver.rb CHANGED

@@ -7,10 +7,21 @@ module Panchira
     def initialize(url)
       super(url)
       @illust_id = url.slice(URL_REGEXP, 2)
+      raw_json = URI.parse("https://www.pixiv.net/ajax/illust/#{@illust_id}").read('User-Agent' => user_agent)
+      @json = JSON.parse(raw_json)
     end
     private
+    def parse_title
+      @json['body']['title']
+    end
+    def parse_author
+      @json['body']['userName']
+    end
     def parse_canonical_url
       'https://pixiv.net/member_illust.php?mode=medium&illust_id=' + @illust_id
     end
@@ -27,6 +38,10 @@ module Panchira
     rescue StandardError
       @page.css('//meta[property="og:image"]/@content').first.to_s
     end
+    def parse_tags
+      @json['body']['tags']['tags'].map { |content| content['tag'] }
+    end
   end
   ::Panchira::Extensions.register(Panchira::PixivResolver)

data/lib/panchira/resolvers/resolver.rb CHANGED

@@ -1,39 +1,43 @@
 # frozen_string_literal: true
-# Resolver is a class that actually GET url and resolve attributes.
-# This class is the default resolver for pages,
-# and is inherited by the other resolvers.
 module Panchira
+  # Resolver is a class that actually get attributes by fetching designated url.
+  # This class is the default resolver for pages. <br>
+  # To create your own resolver, first you make a class that extends Resolver,
+  # and then register it by ::Panchira::Extensions::register().
+  # Then ::Panchira::fetch will pick up your resolver when Resolver::applicable?() is true.
   class Resolver
-    # The URL pattern that this resolver tries to resolve.
-    # Should be redefined in subclasses.
+    # URL pattern that a resolver tries to resolve.
+    # You must override this in subclasses to limit which urls to resolve.
     URL_REGEXP = URI::DEFAULT_PARSER.make_regexp
-    USER_AGENT = "Mozilla/5.0 (compatible; Panchira/#{VERSION}; +https://github.com/nuita/panchira)"
     def initialize(url)
       @url = url
     end
+    # This function is called right after this Resolver instance is made.
+    # Fetch page from @url and return PanchiraResult.
     def fetch
-      attributes = {}
+      result = PanchiraResult.new
       @page = fetch_page(@url)
-      attributes[:canonical_url] = parse_canonical_url
+      result.canonical_url = parse_canonical_url
-      if @url != attributes[:canonical_url]
-        @page = fetch_page(attributes[:canonical_url])
-      end
+      @page = fetch_page(result.canonical_url) if @url != result.canonical_url
-      attributes[:title] = parse_title
-      attributes[:description] = parse_description
-      attributes[:image] = parse_image
+      result.title = parse_title
+      result.description = parse_description
+      result.image = parse_image
+      result.tags = parse_tags
+      result.author = parse_author
+      result.circle = parse_circle
-      attributes
+      result
     end
     class << self
       # Tell whether the url is applicable for this resolver.
+      # ::Panchira::fetch uses this method to choose a Resolver for a URL.
       def applicable?(url)
         url =~ self::URL_REGEXP
       end
@@ -42,16 +46,33 @@ module Panchira
     private
     def fetch_page(url)
-      raw_page = URI.parse(url).read('User-Agent' => USER_AGENT)
+      read_options = {
+        'User-Agent' => user_agent,
+        'Cookie' => cookie
+      }
+      raw_page = URI.parse(url).read(read_options)
       charset = raw_page.charset
       Nokogiri::HTML.parse(raw_page, url, charset)
     end
     def parse_canonical_url
-      if (canonical_url = @page.css('//link[rel="canonical"]/@href')).any?
-        canonical_url.to_s
-      else
-        @url
+      history = []
+      # fetch page and refresh canonical_url until canonical_url converges.
+      loop do
+        url_in_res = @page.css('//link[rel="canonical"]/@href').to_s
+        if url_in_res.empty?
+          return history.last || @url
+        else
+          if history.include?(url_in_res) || history.length > 5
+            return url_in_res
+          else
+            history.push(url_in_res)
+            @page = fetch_page(url_in_res)
+          end
+        end
       end
     end
@@ -72,9 +93,9 @@ module Panchira
     end
     def parse_image
-      image = {}
-      image[:url] = parse_image_url
-      image[:width], image[:height] = FastImage.size(image[:url])
+      image = PanchiraImage.new
+      image.url = parse_image_url
+      image.width, image.height = FastImage.size(image.url)
       image
     end
@@ -82,5 +103,25 @@ module Panchira
     def parse_image_url
       @page.css('//meta[property="og:image"]/@content').first.to_s
     end
+    def parse_tags
+      []
+    end
+    def cookie
+      ''
+    end
+    def parse_author
+      @page.css('//meta[name="author"]/@content').first.to_s
+    end
+    def parse_circle
+      nil
+    end
+    def user_agent
+      "Mozilla/5.0 (compatible; PanchiraBot/#{VERSION}; +https://github.com/nuita/panchira)"
+    end
   end
 end

data/lib/panchira/version.rb CHANGED

@@ -1,5 +1,5 @@
 # frozen_string_literal: true
 module Panchira
-  VERSION = '0.2.0'
+  VERSION = '1.2.0'
 end

metadata CHANGED

@@ -1,14 +1,14 @@
 --- !ruby/object:Gem::Specification
 name: panchira
 version: !ruby/object:Gem::Version
-  version: 0.2.0
+  version: 1.2.0
 platform: ruby
 authors:
 - kyp
 autorequire:
 bindir: exe
 cert_chain: []
-date: 2020-05-18 00:00:00.000000000 Z
+date: 2020-10-31 00:00:00.000000000 Z
 dependencies:
 - !ruby/object:Gem::Dependency
   name: bundler
@@ -101,7 +101,10 @@ files:
 - bin/setup
 - lib/panchira.rb
 - lib/panchira/extensions.rb
+- lib/panchira/panchira_result.rb
 - lib/panchira/resolvers/dlsite_resolver.rb
+- lib/panchira/resolvers/fanza_resolver.rb
+- lib/panchira/resolvers/image_resolver.rb
 - lib/panchira/resolvers/komiflo_resolver.rb
 - lib/panchira/resolvers/melonbooks_resolver.rb
 - lib/panchira/resolvers/narou_resolver.rb