PyPI - ohmyscrapper - Versions diffs - 0.7.0__py3-none-any.whl → 0.8.2__py3-none-any.whl - Mend

ohmyscrapper 0.7.0py3-none-any.whl → 0.8.2py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (16) hide show

ohmyscrapper/__init__.py +44 -4
ohmyscrapper/core/config.py +8 -2
ohmyscrapper/core/config_files.py +33 -3
ohmyscrapper/core/default_files/config.yaml +6 -0
ohmyscrapper/core/default_files/url_sniffing.yaml +4 -0
ohmyscrapper/models/urls_manager.py +16 -2
ohmyscrapper/modules/browser.py +27 -0
ohmyscrapper/modules/load_txt.py +7 -3
ohmyscrapper/modules/scrap_urls.py +25 -10
ohmyscrapper/modules/seed.py +4 -1
ohmyscrapper/modules/sniff_url.py +67 -18
{ohmyscrapper-0.7.0.dist-info → ohmyscrapper-0.8.2.dist-info}/METADATA +7 -3
ohmyscrapper-0.8.2.dist-info/RECORD +22 -0
ohmyscrapper-0.7.0.dist-info/RECORD +0 -21
{ohmyscrapper-0.7.0.dist-info → ohmyscrapper-0.8.2.dist-info}/WHEEL +0 -0
{ohmyscrapper-0.7.0.dist-info → ohmyscrapper-0.8.2.dist-info}/entry_points.txt +0 -0

ohmyscrapper/__init__.py CHANGED Viewed

@@ -20,7 +20,7 @@ from ohmyscrapper.core.config import update
 def main():
     parser = argparse.ArgumentParser(prog="ohmyscrapper")
-    parser.add_argument("--version", action="version", version="%(prog)s v0.7.0")
+    parser.add_argument("--version", action="version", version="%(prog)s v0.8.2")
     update()
     subparsers = parser.add_subparsers(dest="command", help="Available commands")
@@ -28,6 +28,9 @@ def main():
         "start",
         help="Make the entire process of 📦 loading, 🐶 scraping and 📜🖋️ exporting with the default configuration.",
     )
+    start_parser.add_argument(
+        "-input", default=None, help="File/Folder path or url for pre-loading."
+    )
     start_parser.add_argument(
         "--ai",
@@ -50,6 +53,14 @@ def main():
         help="Add all `url_types` from the bank to the `/ohmyscrapper/url_types.yaml` file.",
         action="store_true",
     )
+    seed_parser.add_argument(
+        "--reset",
+        default=False,
+        help="Reset all `url_types`.",
+        action="store_true",
+    )
     untouch_parser = subparsers.add_parser(
         "untouch-all", help="Untouch all urls. That resets classification"
     )
@@ -85,11 +96,24 @@ def main():
     scrap_urls_parser.add_argument(
         "--verbose", default=False, help="Run in verbose mode", action="store_true"
     )
+    scrap_urls_parser.add_argument(
+        "-input", default=None, help="File/Folder path or url for pre-loading."
+    )
     sniff_url_parser = subparsers.add_parser("sniff-url", help="🐕 Sniff/Check url")
     sniff_url_parser.add_argument(
         "url", default="https://cesarcardoso.cc/", help="Url to sniff"
     )
+    sniff_url_parser.add_argument(
+        "--metatags",
+        default="mt",
+        help="Meta tags you want to watch separated by comma ','",
+    )
+    sniff_url_parser.add_argument(
+        "--bodytags",
+        default="bd",
+        help="Body tags you want to watch separated by comma ','",
+    )
     show_urls_parser = subparsers.add_parser("show", help="Show urls and prefixes")
     show_urls_parser.add_argument(
@@ -131,7 +155,7 @@ def main():
         if args.export:
             export_url_types_to_file()
         else:
-            seed()
+            seed(args.reset)
         return
     if args.command == "untouch-all":
@@ -139,10 +163,21 @@ def main():
         return
     if args.command == "sniff-url":
-        sniff_url(args.url)
+        sniffing_config = {}
+        if len(args.metatags) > 0:
+            sniffing_config["metatags"] = str(args.metatags).split(",")
+        if len(args.bodytags) > 0:
+            sniffing_config["bodytags"] = str(args.bodytags).split(",")
+        sniff_url(args.url, sniffing_config=sniffing_config)
         return
     if args.command == "scrap-urls":
+        if args.input != None:
+            load_txt(file_name=args.input, verbose=args.verbose)
         scrap_urls(
             recursive=args.recursive,
             ignore_valid_prefix=args.ignore_type,
@@ -182,7 +217,12 @@ def main():
         return
     if args.command == "start":
-        load_txt()
+        seed()
+        if args.input != None:
+            load_txt(file_name=args.input)
+        else:
+            load_txt()
         scrap_urls(
             recursive=True,
             ignore_valid_prefix=True,

ohmyscrapper/core/config.py CHANGED Viewed

@@ -39,6 +39,12 @@ def get_ai(param):
     )
+def get_sniffing(param):
+    return config_files.get_param(
+        parent_param="sniffing", param=param, default_app_dir=default_app_dir
+    )
 def load_config(force_default=False):
     config_file_name = "config.yaml"
     config_params = config_files.create_and_read_config_file(
@@ -63,14 +69,14 @@ def url_types_file_exists():
 def get_url_types():
     url_types_file = get_files("url_types")
     return config_files.create_and_read_config_file(
-        url_types_file, default_app_dir=default_app_dir
+        url_types_file, default_app_dir=default_app_dir, complete_file=False
     )
 def get_url_sniffing():
     file = get_files("url_sniffing")
     return config_files.create_and_read_config_file(
-        file, default_app_dir=default_app_dir
+        file, default_app_dir=default_app_dir, complete_file=False
     )

ohmyscrapper/core/config_files.py CHANGED Viewed

@@ -2,16 +2,34 @@ import os
 import yaml
-def create_and_read_config_file(file_name, default_app_dir, force_default=False):
+def create_and_read_config_file(
+    file_name, default_app_dir, force_default=False, complete_file=True
+):
     config_file = config_file_path(file_name, default_app_dir)
+    default_config_params = _get_default_file(default_file=file_name)
     if force_default or not os.path.exists(config_file):
-        config_params = _get_default_file(default_file=file_name)
         overwrite_config_file(
-            data=config_params, file_name=file_name, default_app_dir=default_app_dir
+            data=default_config_params,
+            file_name=file_name,
+            default_app_dir=default_app_dir,
         )
+        config_params = default_config_params
     else:
         with open(config_file, "r") as f:
             config_params = yaml.safe_load(f.read())
+        if complete_file:
+            if complete_config_file(
+                config_params=config_params,
+                default_config_params=default_config_params,
+                file_name=file_name,
+                default_app_dir=default_app_dir,
+            ):
+                config_params = create_and_read_config_file(
+                    file_name=file_name,
+                    default_app_dir=default_app_dir,
+                    force_default=force_default,
+                )
     if config_params is None:
         config_params = create_and_read_config_file(
             file_name=file_name, default_app_dir=default_app_dir, force_default=True
@@ -19,6 +37,18 @@ def create_and_read_config_file(file_name, default_app_dir, force_default=False)
     return config_params
+def complete_config_file(
+    config_params, default_config_params, file_name, default_app_dir
+):
+    has_updated = False
+    for key, values in default_config_params.items():
+        if key not in config_params.keys():
+            has_updated = True
+            data = {key: values}
+            append_config_file(data, file_name, default_app_dir)
+    return has_updated
 def overwrite_config_file(data, file_name, default_app_dir):
     config_file = config_file_path(file_name, default_app_dir)
     with open(config_file, "+w") as f:

ohmyscrapper/core/default_files/config.yaml CHANGED Viewed

@@ -14,3 +14,9 @@ default_files:
 ai:
   default_prompt_file: prompt.md
+sniffing:
+  timeout: 10
+  use-browser: false
+  browser-waiting-time: 5
+  round-sleeping: 10

ohmyscrapper/core/default_files/url_sniffing.yaml CHANGED Viewed

@@ -23,3 +23,7 @@ linkedin_redirect:
     og:url: url_destiny
   atags:
     first-tag-as-url_destiny: 5
+read_all_a_tags:
+  atags:
+    load_links: True

ohmyscrapper/models/urls_manager.py CHANGED Viewed

@@ -69,6 +69,14 @@ def seeds(seeds={}):
     return True
+@use_connection
+def reset_seeds():
+    sql = "DELETE FROM urls_valid_prefix WHERE 1 = 1"
+    c = conn.cursor()
+    c.execute(sql)
+    conn.commit()
 @use_connection
 def add_urls_valid_prefix(url_prefix, url_type):
@@ -198,6 +206,8 @@ def get_url_like_unclassified(like_condition):
 @use_connection
 def add_url(url, title=None, parent_url=None):
+    if url[:1] == "/":
+        return
     url = clean_url(url)
     c = conn.cursor()
@@ -340,7 +350,9 @@ def set_url_error(url, value):
 @use_connection
 def set_url_type_by_id(url_id, url_type):
     c = conn.cursor()
-    c.execute(f"UPDATE urls SET url_type = '{url_type}' WHERE id = {url_id}")
+    c.execute(
+        f"UPDATE urls SET url_type = '{url_type}', last_touch = NULL WHERE id = {url_id}"
+    )
     conn.commit()
@@ -392,8 +404,10 @@ def touch_url(url):
 @use_connection
 def untouch_url(url):
     url = clean_url(url)
+    url = str(url.strip())
     c = conn.cursor()
-    c.execute("UPDATE urls SET last_touch = NULL WHERE url = ?", (url))
+    c.execute(f"UPDATE urls SET last_touch = NULL, url_type = NULL WHERE url = '{url}'")
     conn.commit()

ohmyscrapper/modules/browser.py ADDED Viewed

@@ -0,0 +1,27 @@
+from selenium import webdriver
+from ohmyscrapper.core.config import get_sniffing
+def get_driver():
+    if get_sniffing("use-browser") == "safari":
+        from selenium.webdriver.safari.options import Options
+        options = Options()
+        driver = webdriver.Safari(options=options)
+    elif get_sniffing("use-browser") == "firefox":
+        from selenium.webdriver.firefox.options import Options
+        options = Options()
+        driver = webdriver.Firefox(options=options)
+    elif get_sniffing("use-browser") == "ie":
+        from selenium.webdriver.ie.options import Options
+        options = Options()
+        driver = webdriver.Ie(options=options)
+    else:  # default: chrome
+        from selenium.webdriver.chrome.options import Options
+        options = Options()
+        driver = webdriver.Chrome(options=options)
+    return driver

ohmyscrapper/modules/load_txt.py CHANGED Viewed

@@ -19,14 +19,16 @@ def load_txt(file_name="input", verbose=False):
     text_file_content = ""
     if file_name is not None and not os.path.isdir(file_name):
-        print(f"📖 reading file `{file_name}`... ")
         if not os.path.exists(file_name):
             if file_name.startswith("https://") or file_name.startswith("http://"):
+                print(f"📖 reading url `{file_name}`... ")
                 text_file_content = " " + file_name + " "
+                urls_manager.untouch_url(url=file_name)
             else:
                 print(f"\n file `{file_name}` not found.")
                 return
         else:
+            print(f"📖 reading file `{file_name}`... ")
             text_file_content = _increment_file_name(
                 text_file_content=text_file_content, file_name=file_name
             )
@@ -51,13 +53,15 @@ def load_txt(file_name="input", verbose=False):
                 file_name=os.path.join(dir_files, text_files[0]),
             )
         else:
-            print("\nChoose a text file. Use `*` for process all and `q` to quit:")
+            print("\nFiles list:")
             for index, file in enumerate(text_files):
                 print(f"[{index}]:", os.path.join(dir_files, file))
             text_file_option = -1
             while text_file_option < 0 or text_file_option >= len(text_files):
-                text_file_option = input("Enter the file number: ")
+                text_file_option = input(
+                    "Choose a text file. Use `*` for process all and `q` to quit. Enter the file number: "
+                )
                 if text_file_option == "*":
                     for file in text_files:
                         text_file_content = _increment_file_name(

ohmyscrapper/modules/scrap_urls.py CHANGED Viewed

@@ -2,13 +2,14 @@ import ohmyscrapper.models.urls_manager as urls_manager
 import ohmyscrapper.modules.sniff_url as sniff_url
 import ohmyscrapper.modules.load_txt as load_txt
 import ohmyscrapper.modules.classify_urls as classify_urls
+import ohmyscrapper.modules.browser as browser
 from ohmyscrapper.core import config
 import time
 import random
-def scrap_url(url, verbose=False):
+def scrap_url(url, verbose=False, driver=None):
     if url["url_type"] is None:
         url["url_type"] = "generic"
@@ -21,18 +22,18 @@ def scrap_url(url, verbose=False):
         if url_type not in sniffing_config:
             default_type_sniffing = {
-                "bodytags": [{"h1": "title"}],
-                "metatags": [
-                    {"og:title": "title"},
-                    {"og:description": "description"},
-                    {"description": "description"},
-                ],
+                "bodytags": {"h1": "title"},
+                "metatags": {
+                    "og:title": "title",
+                    "og:description": "description",
+                    "description": "description",
+                },
             }
             config.append_url_sniffing({url_type: default_type_sniffing})
             sniffing_config = config.get_url_sniffing()
         url_report = sniff_url.get_tags(
-            url=url["url"], sniffing_config=sniffing_config[url_type]
+            url=url["url"], sniffing_config=sniffing_config[url_type], driver=driver
         )
     except Exception as e:
         urls_manager.set_url_error(url=url["url"], value="error on scrapping")
@@ -104,6 +105,12 @@ def process_sniffed_url(url_report, url, sniffing_config, verbose=False):
         ):
             if "first-a-link" in url_report.keys():
                 db_fields["url_destiny"] = url_report["first-a-link"]
+    if (
+        "atags" in sniffing_config.keys()
+        and "load_links" in sniffing_config["atags"].keys()
+    ):
+        for a_link in url_report["a_links"]:
+            urls_manager.add_url(url=a_link["href"], parent_url=url["url"])
     if db_fields["title"] is not None:
         urls_manager.set_url_title(url=url["url"], value=db_fields["title"])
@@ -141,6 +148,7 @@ def scrap_urls(
     only_parents=True,
     verbose=False,
     n_urls=0,
+    driver=None,
 ):
     limit = 10
     classify_urls.classify_urls()
@@ -164,13 +172,19 @@ def scrap_urls(
         time.sleep(wait)
         print("🐕 Scrapper is sniffing the url...")
-        scrap_url(url=url, verbose=verbose)
+        if driver is None and config.get_sniffing("use-browser"):
+            driver = browser.get_driver()
+        scrap_url(url=url, verbose=verbose, driver=driver)
     n_urls = n_urls + len(urls)
     print(f"-- 🗃️ {n_urls} scraped urls...")
     classify_urls.classify_urls()
     if recursive:
-        wait = random.randint(5, 10)
+        wait = random.randint(
+            int(config.get_sniffing("round-sleeping") / 2),
+            int(config.get_sniffing("round-sleeping")),
+        )
         print(
             f"🐶 Scrapper is sleeping for {wait} seconds before next round of {limit} urls"
         )
@@ -182,6 +196,7 @@ def scrap_urls(
             only_parents=only_parents,
             verbose=verbose,
             n_urls=n_urls,
+            driver=driver,
         )
     else:
         print("scrapping is over...")

ohmyscrapper/modules/seed.py CHANGED Viewed

@@ -2,7 +2,10 @@ import ohmyscrapper.models.urls_manager as urls_manager
 from ohmyscrapper.core import config
-def seed():
+def seed(reset=False):
+    if reset:
+        urls_manager.reset_seeds()
     if not config.url_types_file_exists():
         db_url_types = urls_manager.get_urls_valid_prefix()
         if len(db_url_types) > 0:

ohmyscrapper/modules/sniff_url.py CHANGED Viewed

@@ -1,13 +1,18 @@
 import requests
 from bs4 import BeautifulSoup
 import json
+from ohmyscrapper.core import config
+import ohmyscrapper.modules.browser as browser
+import time
 def sniff_url(
     url="https://www.linkedin.com/in/cesardesouzacardoso/",
     silent=False,
     sniffing_config={},
+    driver=None,
 ):
+    final_report = {}
     if "metatags" in sniffing_config:
         metatags_to_search = sniffing_config["metatags"]
     else:
@@ -41,10 +46,18 @@ def sniff_url(
     if not silent:
         print("checking url:", url)
-    r = requests.get(url=url)
-    soup = BeautifulSoup(r.text, "html.parser")
+    try:
+        r = get_url(url=url, driver=driver)
+        soup = BeautifulSoup(r, "html.parser")
+    except requests.exceptions.ReadTimeout:
+        url_domain = url.split("/")[2]
+        final_report["error"] = (
+            f"!!! timeout (10 seconds) while checking the url with domain: `{url_domain}` !!!"
+        )
+        print(f"\n\n{final_report['error']}\n\n")
+        soup = BeautifulSoup("", "html.parser")
-    final_report = {}
     final_report["scrapped-url"] = url
     if len(metatags_to_search) > 0:
         final_report.update(
@@ -59,14 +72,14 @@ def sniff_url(
                 soup=soup, silent=silent, body_tags_to_search=body_tags_to_search
             )
         )
-    final_report["a_links"] = _extract_a_tags(soup=soup, silent=silent)
+    final_report["a_links"] = _extract_a_tags(soup=soup, silent=silent, url=url)
     final_report = _complementary_report(final_report, soup, silent).copy()
     final_report["json"] = json.dumps(final_report)
     return final_report
-def _extract_a_tags(soup, silent):
+def _extract_a_tags(soup, silent, url=None):
     a_links = []
     if not silent:
         print("\n\n\n\n---- all <a> links ---")
@@ -74,12 +87,18 @@ def _extract_a_tags(soup, silent):
     i = 0
     for a_tag in soup.find_all("a"):
         i = i + 1
-        a_links.append({"text": a_tag.text, "href": a_tag.get("href")})
+        href = a_tag.get("href")
+        if url is not None and href[:1] == "/":
+            domain = url.split("//")[0] + "//" + url.split("//")[1].split("/")[0]
+            href = domain + href
+        a_links.append({"text": a_tag.text, "href": href})
         if not silent:
             print("\n-- <a> link", i, "-- ")
             print("target:", a_tag.get("target"))
             print("text:", str(a_tag.text).strip())
-            print("href:", a_tag.get("href"))
+            print("href:", href)
             print("-------------- ")
     return a_links
@@ -114,18 +133,30 @@ def _extract_text_tags(soup, silent, body_tags_to_search):
         print("\n\n\n\n---- all <text> tags ---\n")
     i = 0
     for text_tag, separator in body_tags_to_search.items():
-        if len(soup.find_all(text_tag)) > 0:
+        tag = text_tag
+        tag_class = None
+        tag_id = None
+        if len(text_tag.split(".")) > 1:
+            tag = text_tag.split(".")[0]
+            tag_class = text_tag.split(".")[1]
+        if len(text_tag.split("#")) > 1:
+            tag = text_tag.split("#")[0]
+            tag_id = text_tag.split("#")[1]
+        if len(soup.find_all(tag, class_=tag_class, id=tag_id)) > 0:
             valid_text_tags[text_tag] = []
-            for obj_tag in soup.find_all(text_tag):
+            for obj_tag in soup.find_all(tag, class_=tag_class, id=tag_id):
                 valid_text_tags[text_tag].append(obj_tag.text.strip())
             valid_text_tags[text_tag] = separator.join(valid_text_tags[text_tag])
-        i = i + 1
-        if not silent:
-            print("-- text tag", i, "--")
-            print("name:", text_tag)
-            print("separator:", separator)
-            print("texts:", valid_text_tags[text_tag])
-            print("---------------- \n")
+            i = i + 1
+            if not silent:
+                print("-- text tag", i, "--")
+                print("name:", text_tag)
+                print("separator:", separator)
+                print("texts:", valid_text_tags[text_tag])
+                print("---------------- \n")
     return valid_text_tags
@@ -151,5 +182,23 @@ def _complementary_report(final_report, soup, silent):
     return final_report
-def get_tags(url, sniffing_config={}):
-    return sniff_url(url=url, silent=True, sniffing_config=sniffing_config)
+def get_tags(url, sniffing_config={}, driver=None):
+    return sniff_url(
+        url=url, silent=True, sniffing_config=sniffing_config, driver=driver
+    )
+def get_url(url, driver=None):
+    if driver is None and config.get_sniffing("use-browser"):
+        driver = browser.get_driver()
+    if driver is not None:
+        try:
+            driver.get(url)
+            time.sleep(config.get_sniffing("browser-waiting-time"))
+            driver.implicitly_wait(config.get_sniffing("browser-waiting-time"))
+            return driver.page_source
+        except:
+            print("error")
+            pass
+    return requests.get(url=url, timeout=config.get_sniffing("timeout")).text

{ohmyscrapper-0.7.0.dist-info → ohmyscrapper-0.8.2.dist-info}/METADATA RENAMED Viewed

@@ -1,9 +1,10 @@
-Metadata-Version: 2.3
+Metadata-Version: 2.4
 Name: ohmyscrapper
-Version: 0.7.0
+Version: 0.8.2
 Summary: OhMyScrapper scrapes texts and urls looking for links and jobs-data to create a final report with general information about job positions.
 Author: Cesar Cardoso
 Author-email: Cesar Cardoso <hello@cesarcardoso.cc>
+License-Expression: MIT
 Requires-Dist: beautifulsoup4>=4.14.3
 Requires-Dist: google-genai>=1.55.0
 Requires-Dist: markdown>=3.10
@@ -12,11 +13,14 @@ Requires-Dist: python-dotenv>=1.2.1
 Requires-Dist: pyyaml>=6.0.3
 Requires-Dist: requests>=2.32.5
 Requires-Dist: rich>=14.2.0
+Requires-Dist: selenium>=4.39.0
 Requires-Dist: urlextract>=1.9.0
 Requires-Python: >=3.11
+Project-URL: Changelog, https://github.com/bouli/ohmyscrapper/releases/latest
+Project-URL: Repository, https://github.com/bouli/ohmyscrapper
 Description-Content-Type: text/markdown
-# 🐶 OhMyScrapper - v0.7.0
+# 🐶 OhMyScrapper - v0.8.2
 OhMyScrapper scrapes texts and urls looking for links and jobs-data to create a
 final report with general information about job positions.

ohmyscrapper-0.8.2.dist-info/RECORD ADDED Viewed

@@ -0,0 +1,22 @@
+ohmyscrapper/__init__.py,sha256=WzXXhhlVkyAPbqeo7NgezLb6TbEJcuFf8JYAdcf3zBE,7678
+ohmyscrapper/__main__.py,sha256=5BjNuyet8AY-POwoF5rGt722rHQ7tJ0Vf0UFUfzzi-I,58
+ohmyscrapper/core/config.py,sha256=bfmoTr1j4SnIhKFZC_F9fh4Y90VqSPFf_g6Rm-aNui4,3184
+ohmyscrapper/core/config_files.py,sha256=3mIXVxurmyXCpKueyyGsZ6lUnV8VJ2gnLU2QaqhWhhI,3410
+ohmyscrapper/core/default_files/config.yaml,sha256=y54QAjOnogpl8LEzhmn89tAfRzle4ZWWtIbYRjxX8Rk,341
+ohmyscrapper/core/default_files/url_sniffing.yaml,sha256=HUwmGUwuJy7t97bJHgNiZOl1thvD9bLaelPgbEr5bMY,465
+ohmyscrapper/core/default_files/url_types.yaml,sha256=20kvv8_iWRT-pLa014RXYpAmPSonn6tDnG302rx7l-o,228
+ohmyscrapper/models/urls_manager.py,sha256=sP2T4k1HOj8ccaVGWbuhfw1BDfOUSVL4_WR9vRyHjOA,12115
+ohmyscrapper/modules/browser.py,sha256=6AaNFQ7jV91DvHqbsBT6It_-tNbVN2qJC_c1vXTweJY,856
+ohmyscrapper/modules/classify_urls.py,sha256=GhiosAQUITy1DQe_PksYV9QRKVTgpkSE28dkutzbWVA,1038
+ohmyscrapper/modules/load_txt.py,sha256=pkWBIdh6vORPfENDZ6wGM89vswnOnc1flqKfkLs9RD8,4138
+ohmyscrapper/modules/merge_dbs.py,sha256=0pK3PPUGSbnaDkdpQUGCHemOVaKO37bfHwnsy_EVpWQ,115
+ohmyscrapper/modules/process_with_ai.py,sha256=kl39Jzl-PUwh6AfmTZ9SLFUYs9Sk4biqgt8rNz3X1FA,7255
+ohmyscrapper/modules/scrap_urls.py,sha256=_e4jT7eBWGP6cqI6RaD0xzNX1vCFBx96JIBPGW3mAV4,6627
+ohmyscrapper/modules/seed.py,sha256=hHEGSoPXsmclTaRPeIcK2oC1Xpg3_JqBv_YFMD0m5Jw,1044
+ohmyscrapper/modules/show.py,sha256=jsAs4g8ouA9wymkBfkDCbpVWKD-m_20uKG-m1cZAUGA,3877
+ohmyscrapper/modules/sniff_url.py,sha256=BZphbr2V7MDyFPW7APlh7_CLTtc_u3kcB7DY2QjVVQo,6579
+ohmyscrapper/modules/untouch_all.py,sha256=DAwWYfqMFifHPtFCxSamu0AxHCgk6aJbTnBy6wLucXM,167
+ohmyscrapper-0.8.2.dist-info/WHEEL,sha256=xDCZ-UyfvkGuEHPeI7BcJzYKIZzdqN8A8o1M5Om8IyA,79
+ohmyscrapper-0.8.2.dist-info/entry_points.txt,sha256=BZud6D16XkfjelDa4Z33mji-KJbbZXgq2FoLrzjru5I,52
+ohmyscrapper-0.8.2.dist-info/METADATA,sha256=2OnXXefFcRT_ChEVdL6LKZoe6iNKyFqjoN10LBUBB34,4293
+ohmyscrapper-0.8.2.dist-info/RECORD,,

ohmyscrapper-0.7.0.dist-info/RECORD DELETED Viewed

@@ -1,21 +0,0 @@
-ohmyscrapper/__init__.py,sha256=w5Ty9eszf8tEv72IQrFov0YbZWMqsraq448xhX3YGQs,6493
-ohmyscrapper/__main__.py,sha256=5BjNuyet8AY-POwoF5rGt722rHQ7tJ0Vf0UFUfzzi-I,58
-ohmyscrapper/core/config.py,sha256=i_RA-zReNQIWWmsFar85qzRUqdqvTFMPeCP7Hya7ltU,2996
-ohmyscrapper/core/config_files.py,sha256=KC3yChTnlclclU9EKTqFBoAu9p6XdOKuegub5NPYDDY,2434
-ohmyscrapper/core/default_files/config.yaml,sha256=bgPBVlze2tOCbyrA47h_5BJ35UsXnqsjQszzy0vn-Pw,248
-ohmyscrapper/core/default_files/url_sniffing.yaml,sha256=MKdVR5HQ1i2yTRw2ijzxPSmIyhUno_R4L2k17r3EBBc,417
-ohmyscrapper/core/default_files/url_types.yaml,sha256=20kvv8_iWRT-pLa014RXYpAmPSonn6tDnG302rx7l-o,228
-ohmyscrapper/models/urls_manager.py,sha256=FC1j72M1gzNwC_PzPqnew986b-BI6s7zUv8Z7HiM1M0,11849
-ohmyscrapper/modules/classify_urls.py,sha256=GhiosAQUITy1DQe_PksYV9QRKVTgpkSE28dkutzbWVA,1038
-ohmyscrapper/modules/load_txt.py,sha256=dNkUZ2ehBiPx-q4fPczRiHFvnpzCrjeycFtexhWGmEE,3967
-ohmyscrapper/modules/merge_dbs.py,sha256=0pK3PPUGSbnaDkdpQUGCHemOVaKO37bfHwnsy_EVpWQ,115
-ohmyscrapper/modules/process_with_ai.py,sha256=kl39Jzl-PUwh6AfmTZ9SLFUYs9Sk4biqgt8rNz3X1FA,7255
-ohmyscrapper/modules/scrap_urls.py,sha256=CNoEC-d1r-u4qxnEVimm4ctP6MJGdU8y8VI2Nx0bBdM,6033
-ohmyscrapper/modules/seed.py,sha256=qDUE7TWx9iNQEzqThK4p7g8pTZjdpkmoqI8kOo_zdtk,983
-ohmyscrapper/modules/show.py,sha256=jsAs4g8ouA9wymkBfkDCbpVWKD-m_20uKG-m1cZAUGA,3877
-ohmyscrapper/modules/sniff_url.py,sha256=zJ2Uox2aUdQibL4UFLxg3t7GqJ7WwWEl0q3QSUbMEbc,4960
-ohmyscrapper/modules/untouch_all.py,sha256=DAwWYfqMFifHPtFCxSamu0AxHCgk6aJbTnBy6wLucXM,167
-ohmyscrapper-0.7.0.dist-info/WHEEL,sha256=xDCZ-UyfvkGuEHPeI7BcJzYKIZzdqN8A8o1M5Om8IyA,79
-ohmyscrapper-0.7.0.dist-info/entry_points.txt,sha256=BZud6D16XkfjelDa4Z33mji-KJbbZXgq2FoLrzjru5I,52
-ohmyscrapper-0.7.0.dist-info/METADATA,sha256=Doakf4oDT6oskPGdSlEoRJHBxUmm9FhWaHfDlNIfNuM,4096
-ohmyscrapper-0.7.0.dist-info/RECORD,,

{ohmyscrapper-0.7.0.dist-info → ohmyscrapper-0.8.2.dist-info}/WHEEL RENAMED Viewed

File without changes

{ohmyscrapper-0.7.0.dist-info → ohmyscrapper-0.8.2.dist-info}/entry_points.txt RENAMED Viewed

File without changes

ohmyscrapper 0.7.0__py3-none-any.whl → 0.8.2__py3-none-any.whl

ohmyscrapper 0.7.0py3-none-any.whl → 0.8.2py3-none-any.whl