PyPI - novel-downloader - Versions diffs - 1.5.0__py3-none-any.whl → 2.0.0__py3-none-any.whl - Mend

novel-downloader 1.5.0py3-none-any.whl → 2.0.0py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (241) hide show

novel_downloader/__init__.py +1 -1
novel_downloader/cli/__init__.py +1 -3
novel_downloader/cli/clean.py +21 -88
novel_downloader/cli/config.py +26 -21
novel_downloader/cli/download.py +77 -64
novel_downloader/cli/export.py +16 -20
novel_downloader/cli/main.py +1 -1
novel_downloader/cli/search.py +62 -65
novel_downloader/cli/ui.py +156 -0
novel_downloader/config/__init__.py +8 -5
novel_downloader/config/adapter.py +65 -105
novel_downloader/config/{loader.py → file_io.py} +53 -26
novel_downloader/core/__init__.py +1 -0
novel_downloader/core/archived/deqixs/fetcher.py +115 -0
novel_downloader/core/archived/deqixs/parser.py +132 -0
novel_downloader/core/archived/deqixs/searcher.py +89 -0
novel_downloader/core/{searchers/qidian.py → archived/qidian/searcher.py} +12 -20
novel_downloader/core/archived/wanbengo/searcher.py +98 -0
novel_downloader/core/archived/xshbook/searcher.py +93 -0
novel_downloader/core/downloaders/__init__.py +3 -24
novel_downloader/core/downloaders/base.py +49 -23
novel_downloader/core/downloaders/common.py +191 -137
novel_downloader/core/downloaders/qianbi.py +187 -146
novel_downloader/core/downloaders/qidian.py +187 -141
novel_downloader/core/downloaders/registry.py +4 -2
novel_downloader/core/downloaders/signals.py +46 -0
novel_downloader/core/exporters/__init__.py +3 -20
novel_downloader/core/exporters/base.py +33 -37
novel_downloader/core/exporters/common/__init__.py +1 -2
novel_downloader/core/exporters/common/epub.py +15 -10
novel_downloader/core/exporters/common/main_exporter.py +19 -12
novel_downloader/core/exporters/common/txt.py +14 -9
novel_downloader/core/exporters/epub_util.py +59 -29
novel_downloader/core/exporters/linovelib/__init__.py +1 -0
novel_downloader/core/exporters/linovelib/epub.py +23 -25
novel_downloader/core/exporters/linovelib/main_exporter.py +8 -12
novel_downloader/core/exporters/linovelib/txt.py +17 -11
novel_downloader/core/exporters/qidian.py +2 -8
novel_downloader/core/exporters/registry.py +4 -2
novel_downloader/core/exporters/txt_util.py +7 -7
novel_downloader/core/fetchers/__init__.py +54 -48
novel_downloader/core/fetchers/aaatxt.py +83 -0
novel_downloader/core/fetchers/{biquge/session.py → b520.py} +6 -11
novel_downloader/core/fetchers/{base/session.py → base.py} +37 -46
novel_downloader/core/fetchers/{biquge/browser.py → biquyuedu.py} +12 -17
novel_downloader/core/fetchers/dxmwx.py +110 -0
novel_downloader/core/fetchers/eightnovel.py +139 -0
novel_downloader/core/fetchers/{esjzone/session.py → esjzone.py} +19 -12
novel_downloader/core/fetchers/guidaye.py +85 -0
novel_downloader/core/fetchers/hetushu.py +92 -0
novel_downloader/core/fetchers/{qianbi/browser.py → i25zw.py} +19 -28
novel_downloader/core/fetchers/ixdzs8.py +113 -0
novel_downloader/core/fetchers/jpxs123.py +101 -0
novel_downloader/core/fetchers/lewenn.py +83 -0
novel_downloader/core/fetchers/{linovelib/session.py → linovelib.py} +12 -13
novel_downloader/core/fetchers/piaotia.py +105 -0
novel_downloader/core/fetchers/qbtr.py +101 -0
novel_downloader/core/fetchers/{qianbi/session.py → qianbi.py} +5 -10
novel_downloader/core/fetchers/{qidian/session.py → qidian.py} +46 -39
novel_downloader/core/fetchers/quanben5.py +92 -0
novel_downloader/core/fetchers/{base/rate_limiter.py → rate_limiter.py} +2 -2
novel_downloader/core/fetchers/registry.py +5 -16
novel_downloader/core/fetchers/{sfacg/session.py → sfacg.py} +7 -10
novel_downloader/core/fetchers/shencou.py +106 -0
novel_downloader/core/fetchers/shuhaige.py +84 -0
novel_downloader/core/fetchers/tongrenquan.py +84 -0
novel_downloader/core/fetchers/ttkan.py +95 -0
novel_downloader/core/fetchers/wanbengo.py +83 -0
novel_downloader/core/fetchers/xiaoshuowu.py +106 -0
novel_downloader/core/fetchers/xiguashuwu.py +177 -0
novel_downloader/core/fetchers/xs63b.py +171 -0
novel_downloader/core/fetchers/xshbook.py +85 -0
novel_downloader/core/fetchers/{yamibo/session.py → yamibo.py} +19 -12
novel_downloader/core/fetchers/yibige.py +114 -0
novel_downloader/core/interfaces/__init__.py +1 -9
novel_downloader/core/interfaces/downloader.py +6 -2
novel_downloader/core/interfaces/exporter.py +7 -7
novel_downloader/core/interfaces/fetcher.py +4 -17
novel_downloader/core/interfaces/parser.py +5 -6
novel_downloader/core/interfaces/searcher.py +9 -1
novel_downloader/core/parsers/__init__.py +49 -12
novel_downloader/core/parsers/aaatxt.py +132 -0
novel_downloader/core/parsers/b520.py +116 -0
novel_downloader/core/parsers/base.py +63 -12
novel_downloader/core/parsers/biquyuedu.py +133 -0
novel_downloader/core/parsers/dxmwx.py +162 -0
novel_downloader/core/parsers/eightnovel.py +224 -0
novel_downloader/core/parsers/esjzone.py +61 -66
novel_downloader/core/parsers/guidaye.py +128 -0
novel_downloader/core/parsers/hetushu.py +139 -0
novel_downloader/core/parsers/i25zw.py +137 -0
novel_downloader/core/parsers/ixdzs8.py +186 -0
novel_downloader/core/parsers/jpxs123.py +137 -0
novel_downloader/core/parsers/lewenn.py +142 -0
novel_downloader/core/parsers/linovelib.py +48 -64
novel_downloader/core/parsers/piaotia.py +189 -0
novel_downloader/core/parsers/qbtr.py +136 -0
novel_downloader/core/parsers/qianbi.py +48 -50
novel_downloader/core/parsers/qidian/book_info_parser.py +58 -59
novel_downloader/core/parsers/qidian/chapter_encrypted.py +272 -330
novel_downloader/core/parsers/qidian/chapter_normal.py +24 -55
novel_downloader/core/parsers/qidian/main_parser.py +11 -38
novel_downloader/core/parsers/qidian/utils/__init__.py +1 -0
novel_downloader/core/parsers/qidian/utils/decryptor_fetcher.py +1 -1
novel_downloader/core/parsers/qidian/utils/fontmap_recover.py +143 -0
novel_downloader/core/parsers/qidian/utils/helpers.py +0 -4
novel_downloader/core/parsers/quanben5.py +103 -0
novel_downloader/core/parsers/registry.py +5 -16
novel_downloader/core/parsers/sfacg.py +38 -45
novel_downloader/core/parsers/shencou.py +215 -0
novel_downloader/core/parsers/shuhaige.py +111 -0
novel_downloader/core/parsers/tongrenquan.py +116 -0
novel_downloader/core/parsers/ttkan.py +132 -0
novel_downloader/core/parsers/wanbengo.py +191 -0
novel_downloader/core/parsers/xiaoshuowu.py +173 -0
novel_downloader/core/parsers/xiguashuwu.py +435 -0
novel_downloader/core/parsers/xs63b.py +161 -0
novel_downloader/core/parsers/xshbook.py +134 -0
novel_downloader/core/parsers/yamibo.py +87 -131
novel_downloader/core/parsers/yibige.py +166 -0
novel_downloader/core/searchers/__init__.py +34 -3
novel_downloader/core/searchers/aaatxt.py +107 -0
novel_downloader/core/searchers/{biquge.py → b520.py} +29 -28
novel_downloader/core/searchers/base.py +112 -36
novel_downloader/core/searchers/dxmwx.py +105 -0
novel_downloader/core/searchers/eightnovel.py +84 -0
novel_downloader/core/searchers/esjzone.py +43 -25
novel_downloader/core/searchers/hetushu.py +92 -0
novel_downloader/core/searchers/i25zw.py +93 -0
novel_downloader/core/searchers/ixdzs8.py +107 -0
novel_downloader/core/searchers/jpxs123.py +107 -0
novel_downloader/core/searchers/piaotia.py +100 -0
novel_downloader/core/searchers/qbtr.py +106 -0
novel_downloader/core/searchers/qianbi.py +74 -40
novel_downloader/core/searchers/quanben5.py +144 -0
novel_downloader/core/searchers/registry.py +24 -8
novel_downloader/core/searchers/shuhaige.py +124 -0
novel_downloader/core/searchers/tongrenquan.py +110 -0
novel_downloader/core/searchers/ttkan.py +92 -0
novel_downloader/core/searchers/xiaoshuowu.py +122 -0
novel_downloader/core/searchers/xiguashuwu.py +95 -0
novel_downloader/core/searchers/xs63b.py +104 -0
novel_downloader/locales/en.json +31 -82
novel_downloader/locales/zh.json +32 -83
novel_downloader/models/__init__.py +21 -22
novel_downloader/models/book.py +44 -0
novel_downloader/models/config.py +4 -37
novel_downloader/models/login.py +1 -1
novel_downloader/models/search.py +5 -0
novel_downloader/resources/config/settings.toml +8 -70
novel_downloader/resources/json/xiguashuwu.json +718 -0
novel_downloader/utils/__init__.py +13 -22
novel_downloader/utils/chapter_storage.py +3 -2
novel_downloader/utils/constants.py +4 -29
novel_downloader/utils/cookies.py +6 -18
novel_downloader/utils/crypto_utils/__init__.py +13 -0
novel_downloader/utils/crypto_utils/aes_util.py +90 -0
novel_downloader/utils/crypto_utils/aes_v1.py +619 -0
novel_downloader/utils/crypto_utils/aes_v2.py +1143 -0
novel_downloader/utils/{crypto_utils.py → crypto_utils/rc4.py} +3 -10
novel_downloader/utils/epub/__init__.py +1 -1
novel_downloader/utils/epub/constants.py +57 -16
novel_downloader/utils/epub/documents.py +88 -194
novel_downloader/utils/epub/models.py +0 -14
novel_downloader/utils/epub/utils.py +63 -96
novel_downloader/utils/file_utils/__init__.py +2 -23
novel_downloader/utils/file_utils/io.py +3 -113
novel_downloader/utils/file_utils/sanitize.py +0 -4
novel_downloader/utils/fontocr.py +207 -0
novel_downloader/utils/logger.py +8 -16
novel_downloader/utils/network.py +2 -2
novel_downloader/utils/state.py +4 -90
novel_downloader/utils/text_utils/__init__.py +1 -7
novel_downloader/utils/text_utils/diff_display.py +5 -7
novel_downloader/utils/time_utils/__init__.py +5 -11
novel_downloader/utils/time_utils/datetime_utils.py +20 -29
novel_downloader/utils/time_utils/sleep_utils.py +4 -8
novel_downloader/web/__init__.py +13 -0
novel_downloader/web/components/__init__.py +11 -0
novel_downloader/web/components/navigation.py +35 -0
novel_downloader/web/main.py +66 -0
novel_downloader/web/pages/__init__.py +17 -0
novel_downloader/web/pages/download.py +78 -0
novel_downloader/web/pages/progress.py +147 -0
novel_downloader/web/pages/search.py +329 -0
novel_downloader/web/services/__init__.py +17 -0
novel_downloader/web/services/client_dialog.py +164 -0
novel_downloader/web/services/cred_broker.py +113 -0
novel_downloader/web/services/cred_models.py +35 -0
novel_downloader/web/services/task_manager.py +264 -0
novel_downloader-2.0.0.dist-info/METADATA +171 -0
novel_downloader-2.0.0.dist-info/RECORD +210 -0
{novel_downloader-1.5.0.dist-info → novel_downloader-2.0.0.dist-info}/entry_points.txt +1 -1
novel_downloader/core/downloaders/biquge.py +0 -29
novel_downloader/core/downloaders/esjzone.py +0 -29
novel_downloader/core/downloaders/linovelib.py +0 -29
novel_downloader/core/downloaders/sfacg.py +0 -29
novel_downloader/core/downloaders/yamibo.py +0 -29
novel_downloader/core/exporters/biquge.py +0 -22
novel_downloader/core/exporters/esjzone.py +0 -22
novel_downloader/core/exporters/qianbi.py +0 -22
novel_downloader/core/exporters/sfacg.py +0 -22
novel_downloader/core/exporters/yamibo.py +0 -22
novel_downloader/core/fetchers/base/__init__.py +0 -14
novel_downloader/core/fetchers/base/browser.py +0 -422
novel_downloader/core/fetchers/biquge/__init__.py +0 -14
novel_downloader/core/fetchers/esjzone/__init__.py +0 -14
novel_downloader/core/fetchers/esjzone/browser.py +0 -209
novel_downloader/core/fetchers/linovelib/__init__.py +0 -14
novel_downloader/core/fetchers/linovelib/browser.py +0 -198
novel_downloader/core/fetchers/qianbi/__init__.py +0 -14
novel_downloader/core/fetchers/qidian/__init__.py +0 -14
novel_downloader/core/fetchers/qidian/browser.py +0 -326
novel_downloader/core/fetchers/sfacg/__init__.py +0 -14
novel_downloader/core/fetchers/sfacg/browser.py +0 -194
novel_downloader/core/fetchers/yamibo/__init__.py +0 -14
novel_downloader/core/fetchers/yamibo/browser.py +0 -234
novel_downloader/core/parsers/biquge.py +0 -139
novel_downloader/models/chapter.py +0 -25
novel_downloader/models/types.py +0 -13
novel_downloader/tui/__init__.py +0 -7
novel_downloader/tui/app.py +0 -32
novel_downloader/tui/main.py +0 -17
novel_downloader/tui/screens/__init__.py +0 -14
novel_downloader/tui/screens/home.py +0 -198
novel_downloader/tui/screens/login.py +0 -74
novel_downloader/tui/styles/home_layout.tcss +0 -79
novel_downloader/tui/widgets/richlog_handler.py +0 -24
novel_downloader/utils/cache.py +0 -24
novel_downloader/utils/fontocr/__init__.py +0 -22
novel_downloader/utils/fontocr/hash_store.py +0 -280
novel_downloader/utils/fontocr/hash_utils.py +0 -103
novel_downloader/utils/fontocr/model_loader.py +0 -69
novel_downloader/utils/fontocr/ocr_v1.py +0 -315
novel_downloader/utils/fontocr/ocr_v2.py +0 -764
novel_downloader/utils/fontocr/ocr_v3.py +0 -744
novel_downloader-1.5.0.dist-info/METADATA +0 -196
novel_downloader-1.5.0.dist-info/RECORD +0 -164
{novel_downloader-1.5.0.dist-info → novel_downloader-2.0.0.dist-info}/WHEEL +0 -0
{novel_downloader-1.5.0.dist-info → novel_downloader-2.0.0.dist-info}/licenses/LICENSE +0 -0
{novel_downloader-1.5.0.dist-info → novel_downloader-2.0.0.dist-info}/top_level.txt +0 -0

novel_downloader/core/searchers/esjzone.py CHANGED Viewed

@@ -21,63 +21,81 @@ logger = logging.getLogger(__name__)
 )
 class EsjzoneSearcher(BaseSearcher):
     site_name = "esjzone"
-    priority = 3
+    priority = 30
+    BASE_URL = "https://www.esjzone.cc"
     SEARCH_URL = "https://www.esjzone.cc/tags/{query}/"
     @classmethod
-    def _fetch_html(cls, keyword: str) -> str:
-        """
-        Fetch raw HTML from Esjzone's search page.
-        :param keyword: The search term to query on Esjzone.
-        :return: HTML text of the search results page, or an empty string on fail.
-        """
+    async def _fetch_html(cls, keyword: str) -> str:
         url = cls.SEARCH_URL.format(query=cls._quote(keyword))
         try:
-            response = cls._http_get(url)
-            return response.text
+            async with (await cls._http_get(url)) as resp:
+                return await cls._response_to_str(resp)
         except Exception:
             logger.error(
                 "Failed to fetch HTML for keyword '%s' from '%s'",
                 keyword,
                 url,
-                exc_info=True,
             )
             return ""
     @classmethod
     def _parse_html(cls, html_str: str, limit: int | None = None) -> list[SearchResult]:
-        """
-        Parse raw HTML from Esjzone search results into list of SearchResult.
-        :param html_str: Raw HTML string from Esjzone search results page.
-        :param limit: Maximum number of results to return, or None for all.
-        :return: List of SearchResult dicts.
-        """
         doc = html.fromstring(html_str)
         cards = doc.xpath('//div[contains(@class,"card-body")]')
         results: list[SearchResult] = []
         for idx, card in enumerate(cards):
+            href = cls._first_str(
+                card.xpath(".//h5[contains(@class,'card-title')]/a[1]/@href")
+            )
+            if not href:
+                continue
             if limit is not None and idx >= limit:
                 break
-            # Title and book_id
-            link = card.xpath('.//h5[@class="card-title"]/a')[0]
-            title = link.text_content().strip()
-            href = link.get("href", "")
             # href format: /detail/<book_id>.html
-            book_id = href.strip("/").replace("detail/", "").replace(".html", "")
+            book_id = href.split("/")[-1].split(".")[0]
+            book_url = cls._abs_url(href)
+            title = cls._first_str(
+                card.xpath(".//h5[contains(@class,'card-title')]/a[1]//text()")
+            )
+            latest_chapter = (
+                cls._first_str(
+                    card.xpath(".//div[contains(@class,'card-ep')]//a[1]//text()")
+                )
+                or "-"
+            )
             # Author
-            author_link = card.xpath('.//div[@class="card-author"]/a')[0]
-            author = author_link.text_content().strip()
+            author = cls._first_str(
+                card.xpath(".//div[contains(@class,'card-author')]//a[1]//text()")
+            ) or cls._first_str(
+                card.xpath(".//div[contains(@class,'card-author')]//text()")
+            )
+            cover_data = card.xpath(
+                './preceding-sibling::a[contains(@class,"card-img-tiles")]'
+                '//div[contains(@class,"lazyload")]/@data-src'
+            )
+            cover_url = cover_data[0].strip() if cover_data else ""
             # Compute priority incrementally
             prio = cls.priority + idx
             results.append(
                 SearchResult(
                     site=cls.site_name,
                     book_id=book_id,
+                    book_url=book_url,
+                    cover_url=cover_url,
                     title=title,
                     author=author,
+                    latest_chapter=latest_chapter,
+                    update_date="-",
+                    word_count="-",
                     priority=prio,
                 )
             )

novel_downloader/core/searchers/hetushu.py ADDED Viewed

@@ -0,0 +1,92 @@
+#!/usr/bin/env python3
+"""
+novel_downloader.core.searchers.hetushu
+---------------------------------------
+"""
+import logging
+from lxml import html
+from novel_downloader.core.searchers.base import BaseSearcher
+from novel_downloader.core.searchers.registry import register_searcher
+from novel_downloader.models import SearchResult
+logger = logging.getLogger(__name__)
+@register_searcher(
+    site_keys=["hetushu"],
+)
+class HetushuSearcher(BaseSearcher):
+    site_name = "hetushu"
+    priority = 5
+    SEARCH_URL = "https://www.hetushu.com/search/"
+    BASE_URL = "https://www.hetushu.com"
+    @classmethod
+    async def _fetch_html(cls, keyword: str) -> str:
+        params = {"keyword": keyword}
+        headers = {
+            "Referer": "https://www.hetushu.com/",
+        }
+        try:
+            async with (
+                await cls._http_get(cls.SEARCH_URL, params=params, headers=headers)
+            ) as resp:
+                return await cls._response_to_str(resp)
+        except Exception:
+            logger.error(
+                "Failed to fetch HTML for keyword '%s' from '%s'",
+                keyword,
+                cls.SEARCH_URL,
+            )
+            return ""
+    @classmethod
+    def _parse_html(cls, html_str: str, limit: int | None = None) -> list[SearchResult]:
+        doc = html.fromstring(html_str)
+        rows = doc.xpath('//dl[@class="list" and @id="body"]/dd')
+        results: list[SearchResult] = []
+        for idx, row in enumerate(rows):
+            href = cls._first_str(row.xpath(".//h4/a/@href"))
+            if not href:
+                continue
+            if limit is not None and idx >= limit:
+                break
+            # "/book/7631/index.html" -> "7631"
+            book_id = href.rstrip("/index.html").split("/")[-1]
+            book_url = cls._abs_url(href)
+            title = cls._first_str(row.xpath(".//h4/a/text()"))
+            # Author from the adjacent <span>, strip "/" delimiters
+            # e.x. " / 风行云亦行 / "
+            author_raw = cls._first_str(row.xpath(".//h4/span/text()"))
+            author = author_raw.strip("/").strip()
+            cover_rel = cls._first_str(row.xpath(".//a/img/@src"))
+            cover_url = cls._abs_url(cover_rel) if cover_rel else ""
+            # Compute priority
+            prio = cls.priority + idx
+            results.append(
+                SearchResult(
+                    site=cls.site_name,
+                    book_id=book_id,
+                    book_url=book_url,
+                    cover_url=cover_url,
+                    title=title,
+                    author=author,
+                    latest_chapter="-",
+                    update_date="-",
+                    word_count="-",
+                    priority=prio,
+                )
+            )
+        return results

novel_downloader/core/searchers/i25zw.py ADDED Viewed

@@ -0,0 +1,93 @@
+#!/usr/bin/env python3
+"""
+novel_downloader.core.searchers.i25zw
+-------------------------------------
+"""
+import logging
+from lxml import html
+from novel_downloader.core.searchers.base import BaseSearcher
+from novel_downloader.core.searchers.registry import register_searcher
+from novel_downloader.models import SearchResult
+logger = logging.getLogger(__name__)
+@register_searcher(
+    site_keys=["i25zw"],
+)
+class I25zwSearcher(BaseSearcher):
+    site_name = "i25zw"
+    priority = 30
+    SEARCH_URL = "https://www.i25zw.com/search.html"
+    @classmethod
+    async def _fetch_html(cls, keyword: str) -> str:
+        payload = {
+            "searchkey": keyword,
+            "searchtype": "all",
+            "Submit": "",
+        }
+        try:
+            async with (await cls._http_post(cls.SEARCH_URL, data=payload)) as resp:
+                return await cls._response_to_str(resp)
+        except Exception:
+            logger.error(
+                "Failed to fetch HTML for keyword '%s' from '%s'",
+                keyword,
+                cls.SEARCH_URL,
+            )
+            return ""
+    @classmethod
+    def _parse_html(cls, html_str: str, limit: int | None = None) -> list[SearchResult]:
+        doc = html.fromstring(html_str)
+        rows = doc.xpath("//div[@id='alistbox']")
+        results: list[SearchResult] = []
+        for idx, row in enumerate(rows):
+            book_url = cls._first_str(row.xpath(".//div[@class='pic']/a/@href"))
+            if not book_url:
+                continue
+            if limit is not None and idx >= limit:
+                break
+            # 'https://www.i25zw.com/book/309209.html' -> "309209"
+            book_id = book_url.split("/")[-1].split(".")[0]
+            title = cls._first_str(row.xpath(".//div[@class='title']/h2/a/text()"))
+            author = cls._first_str(
+                row.xpath(".//div[@class='title']/span/text()"),
+                replaces=[("作者：", "")],
+            )
+            cover_rel = cls._first_str(row.xpath(".//div[@class='pic']//img/@src"))
+            cover_url = cls._abs_url(cover_rel) if cover_rel else ""
+            # Latest chapter
+            latest_chapter = (
+                cls._first_str(row.xpath(".//div[@class='sys']//li[1]/a/text()")) or "-"
+            )
+            prio = cls.priority + idx
+            results.append(
+                SearchResult(
+                    site=cls.site_name,
+                    book_id=book_id,
+                    book_url=book_url,
+                    cover_url=cover_url,
+                    title=title,
+                    author=author,
+                    latest_chapter=latest_chapter,
+                    update_date="-",
+                    word_count="-",
+                    priority=prio,
+                )
+            )
+        return results

novel_downloader/core/searchers/ixdzs8.py ADDED Viewed

@@ -0,0 +1,107 @@
+#!/usr/bin/env python3
+"""
+novel_downloader.core.searchers.ixdzs8
+--------------------------------------
+"""
+import logging
+from lxml import html
+from novel_downloader.core.searchers.base import BaseSearcher
+from novel_downloader.core.searchers.registry import register_searcher
+from novel_downloader.models import SearchResult
+logger = logging.getLogger(__name__)
+@register_searcher(
+    site_keys=["ixdzs8"],
+)
+class Ixdzs8Searcher(BaseSearcher):
+    site_name = "ixdzs8"
+    priority = 30
+    BASE_URL = "https://ixdzs8.com"
+    SEARCH_URL = "https://ixdzs8.com/bsearch"
+    @classmethod
+    async def _fetch_html(cls, keyword: str) -> str:
+        params = {"q": keyword}
+        try:
+            async with (await cls._http_get(cls.SEARCH_URL, params=params)) as resp:
+                return await cls._response_to_str(resp)
+        except Exception:
+            logger.error(
+                "Failed to fetch HTML for keyword '%s' from '%s'",
+                keyword,
+                cls.SEARCH_URL,
+            )
+            return ""
+    @classmethod
+    def _parse_html(cls, html_str: str, limit: int | None = None) -> list[SearchResult]:
+        doc = html.fromstring(html_str)
+        rows = doc.xpath("//ul[contains(@class,'u-list')]/li[contains(@class,'burl')]")
+        results: list[SearchResult] = []
+        for idx, row in enumerate(rows):
+            book_path = cls._first_str(row.xpath("./@data-url"))
+            if not book_path:
+                book_path = cls._first_str(
+                    row.xpath(".//h3[contains(@class,'bname')]/a/@href")
+                )
+            if not book_path:
+                continue
+            if limit is not None and idx >= limit:
+                break
+            book_id = book_path.strip("/").split("/")[-1]
+            book_url = cls._abs_url(book_path)
+            cover_rel = cls._first_str(
+                row.xpath(".//div[contains(@class,'l-img')]//img/@src")
+            )
+            cover_url = cls._abs_url(cover_rel) if cover_rel else ""
+            title = cls._first_str(
+                row.xpath(".//h3[contains(@class,'bname')]/a/@title")
+            ) or cls._first_str(row.xpath(".//h3[contains(@class,'bname')]/a/text()"))
+            author = cls._first_str(
+                row.xpath(".//span[contains(@class,'bauthor')]//a/text()")
+            )
+            word_count = cls._first_str(
+                row.xpath(".//span[contains(@class,'size')]/text()")
+            )
+            latest_chapter = cls._first_str(
+                row.xpath(
+                    ".//p[contains(@class,'l-last')]//span[contains(@class,'l-chapter')]/text()"
+                )
+            )
+            update_date = cls._first_str(
+                row.xpath(
+                    ".//p[contains(@class,'l-last')]//span[contains(@class,'l-time')]/text()"
+                )
+            )
+            # Compute priority
+            prio = cls.priority + idx
+            results.append(
+                SearchResult(
+                    site=cls.site_name,
+                    book_id=book_id,
+                    book_url=book_url,
+                    cover_url=cover_url,
+                    title=title,
+                    author=author,
+                    latest_chapter=latest_chapter,
+                    update_date=update_date,
+                    word_count=word_count,
+                    priority=prio,
+                )
+            )
+        return results

novel_downloader/core/searchers/jpxs123.py ADDED Viewed

@@ -0,0 +1,107 @@
+#!/usr/bin/env python3
+"""
+novel_downloader.core.searchers.jpxs123
+---------------------------------------
+"""
+import logging
+from lxml import html
+from novel_downloader.core.searchers.base import BaseSearcher
+from novel_downloader.core.searchers.registry import register_searcher
+from novel_downloader.models import SearchResult
+logger = logging.getLogger(__name__)
+@register_searcher(
+    site_keys=["jpxs123"],
+)
+class Jpxs123Searcher(BaseSearcher):
+    site_name = "jpxs123"
+    priority = 30
+    BASE_URL = "https://www.jpxs123.com"
+    SEARCH_URL = "https://www.jpxs123.com/e/search/indexsearch.php"
+    @classmethod
+    async def _fetch_html(cls, keyword: str) -> str:
+        keyboard = cls._quote(keyword, encoding="gbk", errors="replace")
+        show = "title"
+        classid = "0"
+        body = f"keyboard={keyboard}&show={show}&classid={classid}"
+        headers = {
+            "Origin": "https://www.jpxs123.com",
+            "Referer": "https://www.jpxs123.com/",
+            "Content-Type": "application/x-www-form-urlencoded",
+        }
+        try:
+            async with (
+                await cls._http_post(cls.SEARCH_URL, data=body, headers=headers)
+            ) as resp:
+                return await cls._response_to_str(resp)
+        except Exception:
+            logger.error(
+                "Failed to fetch HTML for keyword '%s' from '%s'",
+                keyword,
+                cls.SEARCH_URL,
+            )
+            return ""
+    @classmethod
+    def _parse_html(cls, html_str: str, limit: int | None = None) -> list[SearchResult]:
+        doc = html.fromstring(html_str)
+        rows = doc.xpath('//div[@class="books m-cols"]/div[@class="bk"]')
+        results: list[SearchResult] = []
+        for idx, row in enumerate(rows):
+            href = cls._first_str(row.xpath(".//h3/a/@href"))
+            if not href:
+                continue
+            if limit is not None and idx >= limit:
+                break
+            book_id = href.strip("/").split(".", 1)[0].replace("/", "-")
+            book_url = cls._abs_url(href)
+            title = cls._first_str(row.xpath(".//h3/a//text()"))
+            cover_rel = cls._first_str(
+                row.xpath(".//div[contains(@class,'pic')]//a//img/@src")
+            )
+            cover_url = cls._abs_url(cover_rel) if cover_rel else ""
+            author = (
+                cls._first_str(
+                    row.xpath(".//div[contains(@class,'booknews')]/text()"),
+                    replaces=[("作者：", "")],
+                )
+                or "-"
+            )
+            update_date = cls._first_str(
+                row.xpath(
+                    ".//div[contains(@class,'booknews')]/label[contains(@class,'date')]/text()"
+                )
+            )
+            # Compute priority
+            prio = cls.priority + idx
+            results.append(
+                SearchResult(
+                    site=cls.site_name,
+                    book_id=book_id,
+                    book_url=book_url,
+                    cover_url=cover_url,
+                    title=title,
+                    author=author,
+                    latest_chapter="-",
+                    update_date=update_date,
+                    word_count="-",
+                    priority=prio,
+                )
+            )
+        return results

novel_downloader/core/searchers/piaotia.py ADDED Viewed

@@ -0,0 +1,100 @@
+#!/usr/bin/env python3
+"""
+novel_downloader.core.searchers.piaotia
+---------------------------------------
+"""
+import logging
+from lxml import html
+from novel_downloader.core.searchers.base import BaseSearcher
+from novel_downloader.core.searchers.registry import register_searcher
+from novel_downloader.models import SearchResult
+logger = logging.getLogger(__name__)
+@register_searcher(
+    site_keys=["piaotia"],
+)
+class PiaotiaSearcher(BaseSearcher):
+    site_name = "piaotia"
+    priority = 30
+    SEARCH_URL = "https://www.piaotia.com/modules/article/search.php"
+    @classmethod
+    async def _fetch_html(cls, keyword: str) -> str:
+        # data = {
+        #     "searchtype": "articlename",
+        #     # "searchtype": "author",
+        #     # "searchtype": "keywords",
+        #     "searchkey": cls._quote(keyword, encoding="gbk", errors='replace'),
+        #     "Submit": cls._quote(" 搜 索 ", encoding="gbk", errors='replace'),
+        # }
+        searchtype = "articlename"
+        searchkey = cls._quote(keyword, encoding="gbk", errors="replace")
+        submit = cls._quote(" 搜 索 ", encoding="gbk", errors="replace")
+        body = f"searchtype={searchtype}&searchkey={searchkey}&Submit={submit}"
+        headers = {
+            "Origin": "https://www.piaotia.com",
+            "Referer": "https://www.piaotia.com",
+            "Content-Type": "application/x-www-form-urlencoded",
+        }
+        try:
+            async with (
+                await cls._http_post(cls.SEARCH_URL, data=body, headers=headers)
+            ) as resp:
+                return await cls._response_to_str(resp, encoding="gbk")
+        except Exception:
+            logger.error(
+                "Failed to fetch HTML for keyword '%s' from '%s'",
+                keyword,
+                cls.SEARCH_URL,
+            )
+            return ""
+    @classmethod
+    def _parse_html(cls, html_str: str, limit: int | None = None) -> list[SearchResult]:
+        doc = html.fromstring(html_str)
+        rows = doc.xpath('//table[@class="grid"]//tr[td]')
+        results: list[SearchResult] = []
+        for idx, row in enumerate(rows):
+            href = cls._first_str(row.xpath("./td[1]/a[1]/@href"))
+            if not href:
+                continue
+            if limit is not None and idx >= limit:
+                break
+            # "https://www.piaotia.com/bookinfo/14/14767.html" -> "14-14767"
+            book_id = href.rstrip(".html").split("bookinfo/")[-1].replace("/", "-")
+            book_url = cls._abs_url(href)
+            title = cls._first_str(row.xpath("./td[1]/a[1]//text()"))
+            latest_chapter = cls._first_str(row.xpath("./td[2]/a[1]//text()")) or "-"
+            author = cls._first_str(row.xpath("./td[3]//text()")) or "-"
+            word_count = cls._first_str(row.xpath("./td[4]//text()")) or "-"
+            update_date = cls._first_str(row.xpath("./td[5]//text()")) or "-"
+            # Compute priority incrementally
+            prio = cls.priority + idx
+            results.append(
+                SearchResult(
+                    site=cls.site_name,
+                    book_id=book_id,
+                    book_url=book_url,
+                    cover_url="",
+                    title=title,
+                    author=author,
+                    latest_chapter=latest_chapter,
+                    update_date=update_date,
+                    word_count=word_count,
+                    priority=prio,
+                )
+            )
+        return results

novel-downloader 1.5.0__py3-none-any.whl → 2.0.0__py3-none-any.whl

novel-downloader 1.5.0py3-none-any.whl → 2.0.0py3-none-any.whl