PyPI - novel-downloader - Versions diffs - 1.4.5__py3-none-any.whl → 2.0.0__py3-none-any.whl - Mend

novel-downloader 1.4.5py3-none-any.whl → 2.0.0py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (276) hide show

novel_downloader/__init__.py +1 -1
novel_downloader/cli/__init__.py +2 -4
novel_downloader/cli/clean.py +21 -88
novel_downloader/cli/config.py +27 -104
novel_downloader/cli/download.py +78 -66
novel_downloader/cli/export.py +20 -21
novel_downloader/cli/main.py +3 -1
novel_downloader/cli/search.py +120 -0
novel_downloader/cli/ui.py +156 -0
novel_downloader/config/__init__.py +10 -14
novel_downloader/config/adapter.py +195 -99
novel_downloader/config/{loader.py → file_io.py} +53 -27
novel_downloader/core/__init__.py +14 -13
novel_downloader/core/archived/deqixs/fetcher.py +115 -0
novel_downloader/core/archived/deqixs/parser.py +132 -0
novel_downloader/core/archived/deqixs/searcher.py +89 -0
novel_downloader/core/archived/qidian/searcher.py +79 -0
novel_downloader/core/archived/wanbengo/searcher.py +98 -0
novel_downloader/core/archived/xshbook/searcher.py +93 -0
novel_downloader/core/downloaders/__init__.py +8 -30
novel_downloader/core/downloaders/base.py +182 -30
novel_downloader/core/downloaders/common.py +217 -384
novel_downloader/core/downloaders/qianbi.py +332 -4
novel_downloader/core/downloaders/qidian.py +250 -290
novel_downloader/core/downloaders/registry.py +69 -0
novel_downloader/core/downloaders/signals.py +46 -0
novel_downloader/core/exporters/__init__.py +8 -26
novel_downloader/core/exporters/base.py +107 -31
novel_downloader/core/exporters/common/__init__.py +3 -4
novel_downloader/core/exporters/common/epub.py +92 -171
novel_downloader/core/exporters/common/main_exporter.py +14 -67
novel_downloader/core/exporters/common/txt.py +90 -86
novel_downloader/core/exporters/epub_util.py +184 -1327
novel_downloader/core/exporters/linovelib/__init__.py +3 -2
novel_downloader/core/exporters/linovelib/epub.py +165 -222
novel_downloader/core/exporters/linovelib/main_exporter.py +10 -71
novel_downloader/core/exporters/linovelib/txt.py +76 -66
novel_downloader/core/exporters/qidian.py +15 -11
novel_downloader/core/exporters/registry.py +55 -0
novel_downloader/core/exporters/txt_util.py +67 -0
novel_downloader/core/fetchers/__init__.py +57 -56
novel_downloader/core/fetchers/aaatxt.py +83 -0
novel_downloader/core/fetchers/{biquge/session.py → b520.py} +10 -10
novel_downloader/core/fetchers/{base/session.py → base.py} +63 -47
novel_downloader/core/fetchers/biquyuedu.py +83 -0
novel_downloader/core/fetchers/dxmwx.py +110 -0
novel_downloader/core/fetchers/eightnovel.py +139 -0
novel_downloader/core/fetchers/{esjzone/session.py → esjzone.py} +23 -11
novel_downloader/core/fetchers/guidaye.py +85 -0
novel_downloader/core/fetchers/hetushu.py +92 -0
novel_downloader/core/fetchers/{qianbi/browser.py → i25zw.py} +22 -26
novel_downloader/core/fetchers/ixdzs8.py +113 -0
novel_downloader/core/fetchers/jpxs123.py +101 -0
novel_downloader/core/fetchers/{biquge/browser.py → lewenn.py} +15 -15
novel_downloader/core/fetchers/{linovelib/session.py → linovelib.py} +16 -12
novel_downloader/core/fetchers/piaotia.py +105 -0
novel_downloader/core/fetchers/qbtr.py +101 -0
novel_downloader/core/fetchers/{qianbi/session.py → qianbi.py} +9 -9
novel_downloader/core/fetchers/{qidian/session.py → qidian.py} +55 -40
novel_downloader/core/fetchers/quanben5.py +92 -0
novel_downloader/core/fetchers/{base/rate_limiter.py → rate_limiter.py} +2 -2
novel_downloader/core/fetchers/registry.py +60 -0
novel_downloader/core/fetchers/{sfacg/session.py → sfacg.py} +11 -9
novel_downloader/core/fetchers/shencou.py +106 -0
novel_downloader/core/fetchers/{common/browser.py → shuhaige.py} +24 -19
novel_downloader/core/fetchers/tongrenquan.py +84 -0
novel_downloader/core/fetchers/ttkan.py +95 -0
novel_downloader/core/fetchers/{common/session.py → wanbengo.py} +21 -17
novel_downloader/core/fetchers/xiaoshuowu.py +106 -0
novel_downloader/core/fetchers/xiguashuwu.py +177 -0
novel_downloader/core/fetchers/xs63b.py +171 -0
novel_downloader/core/fetchers/xshbook.py +85 -0
novel_downloader/core/fetchers/{yamibo/session.py → yamibo.py} +23 -11
novel_downloader/core/fetchers/yibige.py +114 -0
novel_downloader/core/interfaces/__init__.py +8 -14
novel_downloader/core/interfaces/downloader.py +6 -2
novel_downloader/core/interfaces/exporter.py +7 -7
novel_downloader/core/interfaces/fetcher.py +4 -17
novel_downloader/core/interfaces/parser.py +5 -6
novel_downloader/core/interfaces/searcher.py +26 -0
novel_downloader/core/parsers/__init__.py +58 -22
novel_downloader/core/parsers/aaatxt.py +132 -0
novel_downloader/core/parsers/b520.py +116 -0
novel_downloader/core/parsers/base.py +63 -12
novel_downloader/core/parsers/biquyuedu.py +133 -0
novel_downloader/core/parsers/dxmwx.py +162 -0
novel_downloader/core/parsers/eightnovel.py +224 -0
novel_downloader/core/parsers/{esjzone/main_parser.py → esjzone.py} +67 -67
novel_downloader/core/parsers/guidaye.py +128 -0
novel_downloader/core/parsers/hetushu.py +139 -0
novel_downloader/core/parsers/i25zw.py +137 -0
novel_downloader/core/parsers/ixdzs8.py +186 -0
novel_downloader/core/parsers/jpxs123.py +137 -0
novel_downloader/core/parsers/lewenn.py +142 -0
novel_downloader/core/parsers/{linovelib/main_parser.py → linovelib.py} +54 -65
novel_downloader/core/parsers/piaotia.py +189 -0
novel_downloader/core/parsers/qbtr.py +136 -0
novel_downloader/core/parsers/{qianbi/main_parser.py → qianbi.py} +54 -51
novel_downloader/core/parsers/qidian/__init__.py +2 -2
novel_downloader/core/parsers/qidian/book_info_parser.py +58 -59
novel_downloader/core/parsers/qidian/chapter_encrypted.py +290 -346
novel_downloader/core/parsers/qidian/chapter_normal.py +25 -56
novel_downloader/core/parsers/qidian/main_parser.py +19 -57
novel_downloader/core/parsers/qidian/utils/__init__.py +12 -11
novel_downloader/core/parsers/qidian/utils/decryptor_fetcher.py +6 -7
novel_downloader/core/parsers/qidian/utils/fontmap_recover.py +143 -0
novel_downloader/core/parsers/qidian/utils/helpers.py +0 -4
novel_downloader/core/parsers/qidian/utils/node_decryptor.py +2 -2
novel_downloader/core/parsers/quanben5.py +103 -0
novel_downloader/core/parsers/registry.py +57 -0
novel_downloader/core/parsers/{sfacg/main_parser.py → sfacg.py} +46 -48
novel_downloader/core/parsers/shencou.py +215 -0
novel_downloader/core/parsers/shuhaige.py +111 -0
novel_downloader/core/parsers/tongrenquan.py +116 -0
novel_downloader/core/parsers/ttkan.py +132 -0
novel_downloader/core/parsers/wanbengo.py +191 -0
novel_downloader/core/parsers/xiaoshuowu.py +173 -0
novel_downloader/core/parsers/xiguashuwu.py +435 -0
novel_downloader/core/parsers/xs63b.py +161 -0
novel_downloader/core/parsers/xshbook.py +134 -0
novel_downloader/core/parsers/yamibo.py +155 -0
novel_downloader/core/parsers/yibige.py +166 -0
novel_downloader/core/searchers/__init__.py +51 -0
novel_downloader/core/searchers/aaatxt.py +107 -0
novel_downloader/core/searchers/b520.py +84 -0
novel_downloader/core/searchers/base.py +168 -0
novel_downloader/core/searchers/dxmwx.py +105 -0
novel_downloader/core/searchers/eightnovel.py +84 -0
novel_downloader/core/searchers/esjzone.py +102 -0
novel_downloader/core/searchers/hetushu.py +92 -0
novel_downloader/core/searchers/i25zw.py +93 -0
novel_downloader/core/searchers/ixdzs8.py +107 -0
novel_downloader/core/searchers/jpxs123.py +107 -0
novel_downloader/core/searchers/piaotia.py +100 -0
novel_downloader/core/searchers/qbtr.py +106 -0
novel_downloader/core/searchers/qianbi.py +165 -0
novel_downloader/core/searchers/quanben5.py +144 -0
novel_downloader/core/searchers/registry.py +79 -0
novel_downloader/core/searchers/shuhaige.py +124 -0
novel_downloader/core/searchers/tongrenquan.py +110 -0
novel_downloader/core/searchers/ttkan.py +92 -0
novel_downloader/core/searchers/xiaoshuowu.py +122 -0
novel_downloader/core/searchers/xiguashuwu.py +95 -0
novel_downloader/core/searchers/xs63b.py +104 -0
novel_downloader/locales/en.json +36 -79
novel_downloader/locales/zh.json +37 -80
novel_downloader/models/__init__.py +23 -50
novel_downloader/models/book.py +44 -0
novel_downloader/models/config.py +16 -43
novel_downloader/models/login.py +1 -1
novel_downloader/models/search.py +21 -0
novel_downloader/resources/config/settings.toml +39 -74
novel_downloader/resources/css_styles/intro.css +83 -0
novel_downloader/resources/css_styles/main.css +30 -89
novel_downloader/resources/json/xiguashuwu.json +718 -0
novel_downloader/utils/__init__.py +43 -0
novel_downloader/utils/chapter_storage.py +247 -226
novel_downloader/utils/constants.py +5 -50
novel_downloader/utils/cookies.py +6 -18
novel_downloader/utils/crypto_utils/__init__.py +13 -0
novel_downloader/utils/crypto_utils/aes_util.py +90 -0
novel_downloader/utils/crypto_utils/aes_v1.py +619 -0
novel_downloader/utils/crypto_utils/aes_v2.py +1143 -0
novel_downloader/utils/{crypto_utils.py → crypto_utils/rc4.py} +3 -10
novel_downloader/utils/epub/__init__.py +34 -0
novel_downloader/utils/epub/builder.py +377 -0
novel_downloader/utils/epub/constants.py +118 -0
novel_downloader/utils/epub/documents.py +297 -0
novel_downloader/utils/epub/models.py +120 -0
novel_downloader/utils/epub/utils.py +179 -0
novel_downloader/utils/file_utils/__init__.py +5 -30
novel_downloader/utils/file_utils/io.py +9 -150
novel_downloader/utils/file_utils/normalize.py +2 -2
novel_downloader/utils/file_utils/sanitize.py +2 -7
novel_downloader/utils/fontocr.py +207 -0
novel_downloader/utils/i18n.py +2 -0
novel_downloader/utils/logger.py +10 -16
novel_downloader/utils/network.py +111 -252
novel_downloader/utils/state.py +5 -90
novel_downloader/utils/text_utils/__init__.py +16 -21
novel_downloader/utils/text_utils/diff_display.py +6 -9
novel_downloader/utils/text_utils/numeric_conversion.py +253 -0
novel_downloader/utils/text_utils/text_cleaner.py +179 -0
novel_downloader/utils/text_utils/truncate_utils.py +62 -0
novel_downloader/utils/time_utils/__init__.py +6 -12
novel_downloader/utils/time_utils/datetime_utils.py +23 -33
novel_downloader/utils/time_utils/sleep_utils.py +5 -10
novel_downloader/web/__init__.py +13 -0
novel_downloader/web/components/__init__.py +11 -0
novel_downloader/web/components/navigation.py +35 -0
novel_downloader/web/main.py +66 -0
novel_downloader/web/pages/__init__.py +17 -0
novel_downloader/web/pages/download.py +78 -0
novel_downloader/web/pages/progress.py +147 -0
novel_downloader/web/pages/search.py +329 -0
novel_downloader/web/services/__init__.py +17 -0
novel_downloader/web/services/client_dialog.py +164 -0
novel_downloader/web/services/cred_broker.py +113 -0
novel_downloader/web/services/cred_models.py +35 -0
novel_downloader/web/services/task_manager.py +264 -0
novel_downloader-2.0.0.dist-info/METADATA +171 -0
novel_downloader-2.0.0.dist-info/RECORD +210 -0
{novel_downloader-1.4.5.dist-info → novel_downloader-2.0.0.dist-info}/entry_points.txt +1 -1
novel_downloader/config/site_rules.py +0 -94
novel_downloader/core/downloaders/biquge.py +0 -25
novel_downloader/core/downloaders/esjzone.py +0 -25
novel_downloader/core/downloaders/linovelib.py +0 -25
novel_downloader/core/downloaders/sfacg.py +0 -25
novel_downloader/core/downloaders/yamibo.py +0 -25
novel_downloader/core/exporters/biquge.py +0 -25
novel_downloader/core/exporters/esjzone.py +0 -25
novel_downloader/core/exporters/qianbi.py +0 -25
novel_downloader/core/exporters/sfacg.py +0 -25
novel_downloader/core/exporters/yamibo.py +0 -25
novel_downloader/core/factory/__init__.py +0 -20
novel_downloader/core/factory/downloader.py +0 -73
novel_downloader/core/factory/exporter.py +0 -58
novel_downloader/core/factory/fetcher.py +0 -96
novel_downloader/core/factory/parser.py +0 -86
novel_downloader/core/fetchers/base/__init__.py +0 -14
novel_downloader/core/fetchers/base/browser.py +0 -403
novel_downloader/core/fetchers/biquge/__init__.py +0 -14
novel_downloader/core/fetchers/common/__init__.py +0 -14
novel_downloader/core/fetchers/esjzone/__init__.py +0 -14
novel_downloader/core/fetchers/esjzone/browser.py +0 -204
novel_downloader/core/fetchers/linovelib/__init__.py +0 -14
novel_downloader/core/fetchers/linovelib/browser.py +0 -193
novel_downloader/core/fetchers/qianbi/__init__.py +0 -14
novel_downloader/core/fetchers/qidian/__init__.py +0 -14
novel_downloader/core/fetchers/qidian/browser.py +0 -318
novel_downloader/core/fetchers/sfacg/__init__.py +0 -14
novel_downloader/core/fetchers/sfacg/browser.py +0 -189
novel_downloader/core/fetchers/yamibo/__init__.py +0 -14
novel_downloader/core/fetchers/yamibo/browser.py +0 -229
novel_downloader/core/parsers/biquge/__init__.py +0 -10
novel_downloader/core/parsers/biquge/main_parser.py +0 -134
novel_downloader/core/parsers/common/__init__.py +0 -13
novel_downloader/core/parsers/common/helper.py +0 -323
novel_downloader/core/parsers/common/main_parser.py +0 -106
novel_downloader/core/parsers/esjzone/__init__.py +0 -10
novel_downloader/core/parsers/linovelib/__init__.py +0 -10
novel_downloader/core/parsers/qianbi/__init__.py +0 -10
novel_downloader/core/parsers/sfacg/__init__.py +0 -10
novel_downloader/core/parsers/yamibo/__init__.py +0 -10
novel_downloader/core/parsers/yamibo/main_parser.py +0 -194
novel_downloader/models/browser.py +0 -21
novel_downloader/models/chapter.py +0 -25
novel_downloader/models/site_rules.py +0 -99
novel_downloader/models/tasks.py +0 -33
novel_downloader/models/types.py +0 -15
novel_downloader/resources/css_styles/volume-intro.css +0 -56
novel_downloader/resources/json/replace_word_map.json +0 -4
novel_downloader/resources/text/blacklist.txt +0 -22
novel_downloader/tui/__init__.py +0 -7
novel_downloader/tui/app.py +0 -32
novel_downloader/tui/main.py +0 -17
novel_downloader/tui/screens/__init__.py +0 -14
novel_downloader/tui/screens/home.py +0 -198
novel_downloader/tui/screens/login.py +0 -74
novel_downloader/tui/styles/home_layout.tcss +0 -79
novel_downloader/tui/widgets/richlog_handler.py +0 -24
novel_downloader/utils/cache.py +0 -24
novel_downloader/utils/fontocr/__init__.py +0 -22
novel_downloader/utils/fontocr/model_loader.py +0 -69
novel_downloader/utils/fontocr/ocr_v1.py +0 -303
novel_downloader/utils/fontocr/ocr_v2.py +0 -752
novel_downloader/utils/hash_store.py +0 -279
novel_downloader/utils/hash_utils.py +0 -103
novel_downloader/utils/text_utils/chapter_formatting.py +0 -46
novel_downloader/utils/text_utils/font_mapping.py +0 -28
novel_downloader/utils/text_utils/text_cleaning.py +0 -107
novel_downloader-1.4.5.dist-info/METADATA +0 -196
novel_downloader-1.4.5.dist-info/RECORD +0 -165
{novel_downloader-1.4.5.dist-info → novel_downloader-2.0.0.dist-info}/WHEEL +0 -0
{novel_downloader-1.4.5.dist-info → novel_downloader-2.0.0.dist-info}/licenses/LICENSE +0 -0
{novel_downloader-1.4.5.dist-info → novel_downloader-2.0.0.dist-info}/top_level.txt +0 -0

novel_downloader/core/searchers/ixdzs8.py ADDED Viewed

@@ -0,0 +1,107 @@
+#!/usr/bin/env python3
+"""
+novel_downloader.core.searchers.ixdzs8
+--------------------------------------
+"""
+import logging
+from lxml import html
+from novel_downloader.core.searchers.base import BaseSearcher
+from novel_downloader.core.searchers.registry import register_searcher
+from novel_downloader.models import SearchResult
+logger = logging.getLogger(__name__)
+@register_searcher(
+    site_keys=["ixdzs8"],
+)
+class Ixdzs8Searcher(BaseSearcher):
+    site_name = "ixdzs8"
+    priority = 30
+    BASE_URL = "https://ixdzs8.com"
+    SEARCH_URL = "https://ixdzs8.com/bsearch"
+    @classmethod
+    async def _fetch_html(cls, keyword: str) -> str:
+        params = {"q": keyword}
+        try:
+            async with (await cls._http_get(cls.SEARCH_URL, params=params)) as resp:
+                return await cls._response_to_str(resp)
+        except Exception:
+            logger.error(
+                "Failed to fetch HTML for keyword '%s' from '%s'",
+                keyword,
+                cls.SEARCH_URL,
+            )
+            return ""
+    @classmethod
+    def _parse_html(cls, html_str: str, limit: int | None = None) -> list[SearchResult]:
+        doc = html.fromstring(html_str)
+        rows = doc.xpath("//ul[contains(@class,'u-list')]/li[contains(@class,'burl')]")
+        results: list[SearchResult] = []
+        for idx, row in enumerate(rows):
+            book_path = cls._first_str(row.xpath("./@data-url"))
+            if not book_path:
+                book_path = cls._first_str(
+                    row.xpath(".//h3[contains(@class,'bname')]/a/@href")
+                )
+            if not book_path:
+                continue
+            if limit is not None and idx >= limit:
+                break
+            book_id = book_path.strip("/").split("/")[-1]
+            book_url = cls._abs_url(book_path)
+            cover_rel = cls._first_str(
+                row.xpath(".//div[contains(@class,'l-img')]//img/@src")
+            )
+            cover_url = cls._abs_url(cover_rel) if cover_rel else ""
+            title = cls._first_str(
+                row.xpath(".//h3[contains(@class,'bname')]/a/@title")
+            ) or cls._first_str(row.xpath(".//h3[contains(@class,'bname')]/a/text()"))
+            author = cls._first_str(
+                row.xpath(".//span[contains(@class,'bauthor')]//a/text()")
+            )
+            word_count = cls._first_str(
+                row.xpath(".//span[contains(@class,'size')]/text()")
+            )
+            latest_chapter = cls._first_str(
+                row.xpath(
+                    ".//p[contains(@class,'l-last')]//span[contains(@class,'l-chapter')]/text()"
+                )
+            )
+            update_date = cls._first_str(
+                row.xpath(
+                    ".//p[contains(@class,'l-last')]//span[contains(@class,'l-time')]/text()"
+                )
+            )
+            # Compute priority
+            prio = cls.priority + idx
+            results.append(
+                SearchResult(
+                    site=cls.site_name,
+                    book_id=book_id,
+                    book_url=book_url,
+                    cover_url=cover_url,
+                    title=title,
+                    author=author,
+                    latest_chapter=latest_chapter,
+                    update_date=update_date,
+                    word_count=word_count,
+                    priority=prio,
+                )
+            )
+        return results

novel_downloader/core/searchers/jpxs123.py ADDED Viewed

@@ -0,0 +1,107 @@
+#!/usr/bin/env python3
+"""
+novel_downloader.core.searchers.jpxs123
+---------------------------------------
+"""
+import logging
+from lxml import html
+from novel_downloader.core.searchers.base import BaseSearcher
+from novel_downloader.core.searchers.registry import register_searcher
+from novel_downloader.models import SearchResult
+logger = logging.getLogger(__name__)
+@register_searcher(
+    site_keys=["jpxs123"],
+)
+class Jpxs123Searcher(BaseSearcher):
+    site_name = "jpxs123"
+    priority = 30
+    BASE_URL = "https://www.jpxs123.com"
+    SEARCH_URL = "https://www.jpxs123.com/e/search/indexsearch.php"
+    @classmethod
+    async def _fetch_html(cls, keyword: str) -> str:
+        keyboard = cls._quote(keyword, encoding="gbk", errors="replace")
+        show = "title"
+        classid = "0"
+        body = f"keyboard={keyboard}&show={show}&classid={classid}"
+        headers = {
+            "Origin": "https://www.jpxs123.com",
+            "Referer": "https://www.jpxs123.com/",
+            "Content-Type": "application/x-www-form-urlencoded",
+        }
+        try:
+            async with (
+                await cls._http_post(cls.SEARCH_URL, data=body, headers=headers)
+            ) as resp:
+                return await cls._response_to_str(resp)
+        except Exception:
+            logger.error(
+                "Failed to fetch HTML for keyword '%s' from '%s'",
+                keyword,
+                cls.SEARCH_URL,
+            )
+            return ""
+    @classmethod
+    def _parse_html(cls, html_str: str, limit: int | None = None) -> list[SearchResult]:
+        doc = html.fromstring(html_str)
+        rows = doc.xpath('//div[@class="books m-cols"]/div[@class="bk"]')
+        results: list[SearchResult] = []
+        for idx, row in enumerate(rows):
+            href = cls._first_str(row.xpath(".//h3/a/@href"))
+            if not href:
+                continue
+            if limit is not None and idx >= limit:
+                break
+            book_id = href.strip("/").split(".", 1)[0].replace("/", "-")
+            book_url = cls._abs_url(href)
+            title = cls._first_str(row.xpath(".//h3/a//text()"))
+            cover_rel = cls._first_str(
+                row.xpath(".//div[contains(@class,'pic')]//a//img/@src")
+            )
+            cover_url = cls._abs_url(cover_rel) if cover_rel else ""
+            author = (
+                cls._first_str(
+                    row.xpath(".//div[contains(@class,'booknews')]/text()"),
+                    replaces=[("作者：", "")],
+                )
+                or "-"
+            )
+            update_date = cls._first_str(
+                row.xpath(
+                    ".//div[contains(@class,'booknews')]/label[contains(@class,'date')]/text()"
+                )
+            )
+            # Compute priority
+            prio = cls.priority + idx
+            results.append(
+                SearchResult(
+                    site=cls.site_name,
+                    book_id=book_id,
+                    book_url=book_url,
+                    cover_url=cover_url,
+                    title=title,
+                    author=author,
+                    latest_chapter="-",
+                    update_date=update_date,
+                    word_count="-",
+                    priority=prio,
+                )
+            )
+        return results

novel_downloader/core/searchers/piaotia.py ADDED Viewed

@@ -0,0 +1,100 @@
+#!/usr/bin/env python3
+"""
+novel_downloader.core.searchers.piaotia
+---------------------------------------
+"""
+import logging
+from lxml import html
+from novel_downloader.core.searchers.base import BaseSearcher
+from novel_downloader.core.searchers.registry import register_searcher
+from novel_downloader.models import SearchResult
+logger = logging.getLogger(__name__)
+@register_searcher(
+    site_keys=["piaotia"],
+)
+class PiaotiaSearcher(BaseSearcher):
+    site_name = "piaotia"
+    priority = 30
+    SEARCH_URL = "https://www.piaotia.com/modules/article/search.php"
+    @classmethod
+    async def _fetch_html(cls, keyword: str) -> str:
+        # data = {
+        #     "searchtype": "articlename",
+        #     # "searchtype": "author",
+        #     # "searchtype": "keywords",
+        #     "searchkey": cls._quote(keyword, encoding="gbk", errors='replace'),
+        #     "Submit": cls._quote(" 搜 索 ", encoding="gbk", errors='replace'),
+        # }
+        searchtype = "articlename"
+        searchkey = cls._quote(keyword, encoding="gbk", errors="replace")
+        submit = cls._quote(" 搜 索 ", encoding="gbk", errors="replace")
+        body = f"searchtype={searchtype}&searchkey={searchkey}&Submit={submit}"
+        headers = {
+            "Origin": "https://www.piaotia.com",
+            "Referer": "https://www.piaotia.com",
+            "Content-Type": "application/x-www-form-urlencoded",
+        }
+        try:
+            async with (
+                await cls._http_post(cls.SEARCH_URL, data=body, headers=headers)
+            ) as resp:
+                return await cls._response_to_str(resp, encoding="gbk")
+        except Exception:
+            logger.error(
+                "Failed to fetch HTML for keyword '%s' from '%s'",
+                keyword,
+                cls.SEARCH_URL,
+            )
+            return ""
+    @classmethod
+    def _parse_html(cls, html_str: str, limit: int | None = None) -> list[SearchResult]:
+        doc = html.fromstring(html_str)
+        rows = doc.xpath('//table[@class="grid"]//tr[td]')
+        results: list[SearchResult] = []
+        for idx, row in enumerate(rows):
+            href = cls._first_str(row.xpath("./td[1]/a[1]/@href"))
+            if not href:
+                continue
+            if limit is not None and idx >= limit:
+                break
+            # "https://www.piaotia.com/bookinfo/14/14767.html" -> "14-14767"
+            book_id = href.rstrip(".html").split("bookinfo/")[-1].replace("/", "-")
+            book_url = cls._abs_url(href)
+            title = cls._first_str(row.xpath("./td[1]/a[1]//text()"))
+            latest_chapter = cls._first_str(row.xpath("./td[2]/a[1]//text()")) or "-"
+            author = cls._first_str(row.xpath("./td[3]//text()")) or "-"
+            word_count = cls._first_str(row.xpath("./td[4]//text()")) or "-"
+            update_date = cls._first_str(row.xpath("./td[5]//text()")) or "-"
+            # Compute priority incrementally
+            prio = cls.priority + idx
+            results.append(
+                SearchResult(
+                    site=cls.site_name,
+                    book_id=book_id,
+                    book_url=book_url,
+                    cover_url="",
+                    title=title,
+                    author=author,
+                    latest_chapter=latest_chapter,
+                    update_date=update_date,
+                    word_count=word_count,
+                    priority=prio,
+                )
+            )
+        return results

novel_downloader/core/searchers/qbtr.py ADDED Viewed

@@ -0,0 +1,106 @@
+#!/usr/bin/env python3
+"""
+novel_downloader.core.searchers.qbtr
+------------------------------------
+"""
+import logging
+from lxml import html
+from novel_downloader.core.searchers.base import BaseSearcher
+from novel_downloader.core.searchers.registry import register_searcher
+from novel_downloader.models import SearchResult
+logger = logging.getLogger(__name__)
+@register_searcher(
+    site_keys=["qbtr"],
+)
+class QbtrSearcher(BaseSearcher):
+    site_name = "qbtr"
+    priority = 30
+    BASE_URL = "https://www.qbtr.cc"
+    SEARCH_URL = "https://www.qbtr.cc/e/search/index.php"
+    @classmethod
+    async def _fetch_html(cls, keyword: str) -> str:
+        keyboard = cls._quote(keyword, encoding="gbk", errors="replace")
+        show = "title"
+        classid = "0"
+        body = f"keyboard={keyboard}&show={show}&classid={classid}"
+        headers = {
+            "Origin": "https://www.qbtr.cc",
+            "Referer": "https://www.qbtr.cc/",
+            "Content-Type": "application/x-www-form-urlencoded",
+        }
+        try:
+            async with (
+                await cls._http_post(cls.SEARCH_URL, data=body, headers=headers)
+            ) as resp:
+                return await cls._response_to_str(resp)
+        except Exception:
+            logger.error(
+                "Failed to fetch HTML for keyword '%s' from '%s'",
+                keyword,
+                cls.SEARCH_URL,
+            )
+            return ""
+    @classmethod
+    def _parse_html(cls, html_str: str, limit: int | None = None) -> list[SearchResult]:
+        doc = html.fromstring(html_str)
+        rows = doc.xpath('//div[@class="books m-cols"]/div[@class="bk"]')
+        results: list[SearchResult] = []
+        for idx, row in enumerate(rows):
+            href = cls._first_str(row.xpath(".//h3/a[1]/@href"))
+            if not href:
+                continue
+            if limit is not None and idx >= limit:
+                break
+            # '/tongren/8850.html' -> "tongren-8850"
+            book_id = href.strip("/").split(".")[0].replace("/", "-")
+            book_url = cls._abs_url(href)
+            title = cls._first_str(row.xpath(".//h3/a[1]//text()"))
+            author = (
+                cls._first_str(
+                    row.xpath(".//div[contains(@class,'booknews')]/text()"),
+                    replaces=[("作者：", "")],
+                )
+                or "-"
+            )
+            update_date = (
+                cls._first_str(
+                    row.xpath(
+                        ".//div[contains(@class,'booknews')]/label[contains(@class,'date')]/text()"
+                    )
+                )
+                or "-"
+            )
+            # Compute priority
+            prio = cls.priority + idx
+            results.append(
+                SearchResult(
+                    site=cls.site_name,
+                    book_id=book_id,
+                    book_url=book_url,
+                    cover_url="",
+                    title=title,
+                    author=author,
+                    latest_chapter="-",
+                    update_date=update_date,
+                    word_count="-",
+                    priority=prio,
+                )
+            )
+        return results

novel_downloader/core/searchers/qianbi.py ADDED Viewed

@@ -0,0 +1,165 @@
+#!/usr/bin/env python3
+"""
+novel_downloader.core.searchers.qianbi
+--------------------------------------
+"""
+import logging
+from lxml import html
+from novel_downloader.core.searchers.base import BaseSearcher
+from novel_downloader.core.searchers.registry import register_searcher
+from novel_downloader.models import SearchResult
+logger = logging.getLogger(__name__)
+@register_searcher(
+    site_keys=["qianbi"],
+)
+class QianbiSearcher(BaseSearcher):
+    site_name = "qianbi"
+    priority = 10
+    BASE_URL = "https://www.23qb.com/"
+    SEARCH_URL = "https://www.23qb.com/search.html"
+    @classmethod
+    async def _fetch_html(cls, keyword: str) -> str:
+        params = {"searchkey": keyword}
+        try:
+            async with (await cls._http_get(cls.SEARCH_URL, params=params)) as resp:
+                return await cls._response_to_str(resp)
+        except Exception:
+            logger.error(
+                "Failed to fetch HTML for keyword '%s' from '%s'",
+                keyword,
+                cls.SEARCH_URL,
+            )
+            return ""
+    @classmethod
+    def _parse_html(cls, html_str: str, limit: int | None = None) -> list[SearchResult]:
+        if html_str.find('<meta property="og:url"') != -1:
+            return cls._parse_detail_html(html_str)
+        return cls._parse_search_list_html(html_str, limit)
+    @classmethod
+    def _parse_detail_html(cls, html_str: str) -> list[SearchResult]:
+        """
+        Parse a single-book detail page, detected via <meta property="og:url">.
+        :param html_str: Raw HTML of the book detail page.
+        :return: A single-element list with the book's SearchResult.
+        """
+        doc = html.fromstring(html_str)
+        book_url = cls._first_str(doc.xpath("//meta[@property='og:url']/@content"))
+        if not book_url:
+            return []
+        # 'https://www.23qb.com/book/9268/' -> "9268"
+        book_id = book_url.split("book/", 1)[-1].strip("/")
+        cover_rel = cls._first_str(
+            doc.xpath("//div[contains(@class,'novel-cover')]//img/@data-src")
+        ) or cls._first_str(
+            doc.xpath("//div[contains(@class,'novel-cover')]//img/@src")
+        )
+        cover_url = cls._abs_url(cover_rel) if cover_rel else ""
+        title = cls._first_str(doc.xpath("//h1[@class='page-title']/text()"))
+        author = cls._first_str(doc.xpath("//a[contains(@href, '/author/')]/@title"))
+        latest_chapter = (
+            cls._first_str(
+                doc.xpath(
+                    "//div[@class='module-row-info']//a[@class='module-row-text']/@title"
+                )
+            )
+            or "-"
+        )
+        update_date = (
+            cls._first_str(
+                doc.xpath("//div[@class='module-heading newchapter']/time/text()"),
+                replaces=[("更新时间：", "")],
+            )
+            or "-"
+        )
+        word_count = cls._first_str(doc.xpath("//span[contains(text(), '字')]/text()"))
+        return [
+            SearchResult(
+                site=cls.site_name,
+                book_id=book_id,
+                book_url=book_url,
+                cover_url=cover_url,
+                title=title,
+                author=author,
+                latest_chapter=latest_chapter,
+                update_date=update_date,
+                word_count=word_count,
+                priority=cls.priority,
+            )
+        ]
+    @classmethod
+    def _parse_search_list_html(
+        cls, html_str: str, limit: int | None
+    ) -> list[SearchResult]:
+        """
+        Parse a multi-item search result page.
+        :param html_str: Raw HTML of the search-results page.
+        :param limit: Maximum number of items to return, or None for all.
+        :return: List of SearchResult.
+        """
+        doc = html.fromstring(html_str)
+        items = doc.xpath('//div[contains(@class,"module-search-item")]')
+        results: list[SearchResult] = []
+        for idx, item in enumerate(items):
+            href = cls._first_str(
+                item.xpath(".//div[@class='novel-info-header']/h3/a/@href")
+            )
+            if not href:
+                continue
+            if limit is not None and idx >= limit:
+                break
+            # '/book/9138/' -> "9138"
+            book_id = href.rstrip("/").split("/")[-1]
+            book_url = cls._abs_url(href)
+            title = cls._first_str(
+                item.xpath(".//div[@class='novel-info-header']/h3/a//text()")
+            )
+            cover_rel = cls._first_str(
+                item.xpath(".//div[contains(@class,'module-item-pic')]//img/@data-src")
+            ) or cls._first_str(
+                item.xpath(".//div[contains(@class,'module-item-pic')]//img/@src")
+            )
+            cover_url = cls._abs_url(cover_rel) if cover_rel else ""
+            # Compute priority
+            prio = cls.priority + idx
+            results.append(
+                SearchResult(
+                    site=cls.site_name,
+                    book_id=book_id,
+                    book_url=book_url,
+                    cover_url=cover_url,
+                    title=title,
+                    author="-",  # Author is not present on the page
+                    latest_chapter="-",
+                    update_date="-",
+                    word_count="-",
+                    priority=prio,
+                )
+            )
+        return results

novel-downloader 1.4.5__py3-none-any.whl → 2.0.0__py3-none-any.whl

novel-downloader 1.4.5py3-none-any.whl → 2.0.0py3-none-any.whl