PyPI - ohmyscrapper - Versions diffs - 0.7.4__py3-none-any.whl → 0.8.4__py3-none-any.whl - Mend

ohmyscrapper 0.7.4py3-none-any.whl → 0.8.4py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (19) hide show

ohmyscrapper/__init__.py +32 -9
ohmyscrapper/core/config.py +3 -2
ohmyscrapper/core/config_files.py +14 -10
ohmyscrapper/core/default_files/config.yaml +9 -5
ohmyscrapper/core/default_files/url_sniffing.yaml +1 -1
ohmyscrapper/models/urls_manager.py +5 -3
ohmyscrapper/modules/browser.py +28 -0
ohmyscrapper/modules/cache.py +100 -0
ohmyscrapper/modules/classify_urls.py +4 -2
ohmyscrapper/modules/load_txt.py +2 -0
ohmyscrapper/modules/process_with_ai.py +10 -11
ohmyscrapper/modules/scrap_urls.py +18 -9
ohmyscrapper/modules/show.py +4 -2
ohmyscrapper/modules/sniff_url.py +67 -12
{ohmyscrapper-0.7.4.dist-info → ohmyscrapper-0.8.4.dist-info}/METADATA +4 -3
ohmyscrapper-0.8.4.dist-info/RECORD +23 -0
{ohmyscrapper-0.7.4.dist-info → ohmyscrapper-0.8.4.dist-info}/WHEEL +2 -2
ohmyscrapper-0.7.4.dist-info/RECORD +0 -21
{ohmyscrapper-0.7.4.dist-info → ohmyscrapper-0.8.4.dist-info}/entry_points.txt +0 -0

ohmyscrapper/__init__.py CHANGED Viewed

@@ -1,26 +1,27 @@
 import argparse
+from ohmyscrapper.core.config import update
+from ohmyscrapper.modules import cache
 from ohmyscrapper.modules.classify_urls import classify_urls
-from ohmyscrapper.modules.sniff_url import sniff_url
 from ohmyscrapper.modules.load_txt import load_txt
-from ohmyscrapper.modules.seed import seed, export_url_types_to_file
+from ohmyscrapper.modules.merge_dbs import merge_dbs
+from ohmyscrapper.modules.process_with_ai import process_with_ai, reprocess_ai_history
 from ohmyscrapper.modules.scrap_urls import scrap_urls
+from ohmyscrapper.modules.seed import export_url_types_to_file, seed
 from ohmyscrapper.modules.show import (
+    export_report,
+    export_urls,
     show_url,
     show_urls,
     show_urls_valid_prefix,
-    export_urls,
-    export_report,
 )
+from ohmyscrapper.modules.sniff_url import sniff_url
 from ohmyscrapper.modules.untouch_all import untouch_all
-from ohmyscrapper.modules.process_with_ai import process_with_ai, reprocess_ai_history
-from ohmyscrapper.modules.merge_dbs import merge_dbs
-from ohmyscrapper.core.config import update
 def main():
     parser = argparse.ArgumentParser(prog="ohmyscrapper")
-    parser.add_argument("--version", action="version", version="%(prog)s v0.7.4")
+    parser.add_argument("--version", action="version", version="%(prog)s v0.8.4")
     update()
     subparsers = parser.add_subparsers(dest="command", help="Available commands")
@@ -104,6 +105,16 @@ def main():
     sniff_url_parser.add_argument(
         "url", default="https://cesarcardoso.cc/", help="Url to sniff"
     )
+    sniff_url_parser.add_argument(
+        "--metatags",
+        default="mt",
+        help="Meta tags you want to watch separated by comma ','",
+    )
+    sniff_url_parser.add_argument(
+        "--bodytags",
+        default="bd",
+        help="Body tags you want to watch separated by comma ','",
+    )
     show_urls_parser = subparsers.add_parser("show", help="Show urls and prefixes")
     show_urls_parser.add_argument(
@@ -131,6 +142,7 @@ def main():
     )
     merge_parser = subparsers.add_parser("merge_dbs", help="Merge databases.")
+    clean_cache_parser = subparsers.add_parser("cleancache", help="Clean cache.")
     args = parser.parse_args()
     if args.command == "classify-urls":
@@ -153,7 +165,15 @@ def main():
         return
     if args.command == "sniff-url":
-        sniff_url(args.url)
+        sniffing_config = {}
+        if len(args.metatags) > 0:
+            sniffing_config["metatags"] = str(args.metatags).split(",")
+        if len(args.bodytags) > 0:
+            sniffing_config["bodytags"] = str(args.bodytags).split(",")
+        sniff_url(args.url, sniffing_config=sniffing_config)
         return
     if args.command == "scrap-urls":
@@ -218,6 +238,9 @@ def main():
         export_report()
         return
+    if args.command == "cleancache":
+        cache.clean()
 if __name__ == "__main__":
     main()

ohmyscrapper/core/config.py CHANGED Viewed

@@ -1,4 +1,5 @@
 import os
 from ohmyscrapper.core import config_files
 default_app_dir = "ohmyscrapper"
@@ -69,14 +70,14 @@ def url_types_file_exists():
 def get_url_types():
     url_types_file = get_files("url_types")
     return config_files.create_and_read_config_file(
-        url_types_file, default_app_dir=default_app_dir
+        url_types_file, default_app_dir=default_app_dir, complete_file=False
     )
 def get_url_sniffing():
     file = get_files("url_sniffing")
     return config_files.create_and_read_config_file(
-        file, default_app_dir=default_app_dir
+        file, default_app_dir=default_app_dir, complete_file=False
     )

ohmyscrapper/core/config_files.py CHANGED Viewed

@@ -1,8 +1,11 @@
 import os
 import yaml
-def create_and_read_config_file(file_name, default_app_dir, force_default=False):
+def create_and_read_config_file(
+    file_name, default_app_dir, force_default=False, complete_file=True
+):
     config_file = config_file_path(file_name, default_app_dir)
     default_config_params = _get_default_file(default_file=file_name)
     if force_default or not os.path.exists(config_file):
@@ -15,17 +18,18 @@ def create_and_read_config_file(file_name, default_app_dir, force_default=False)
     else:
         with open(config_file, "r") as f:
             config_params = yaml.safe_load(f.read())
-        if complete_config_file(
-            config_params=config_params,
-            default_config_params=default_config_params,
-            file_name=file_name,
-            default_app_dir=default_app_dir,
-        ):
-            config_params = create_and_read_config_file(
+        if complete_file:
+            if complete_config_file(
+                config_params=config_params,
+                default_config_params=default_config_params,
                 file_name=file_name,
                 default_app_dir=default_app_dir,
-                force_default=force_default,
-            )
+            ):
+                config_params = create_and_read_config_file(
+                    file_name=file_name,
+                    default_app_dir=default_app_dir,
+                    force_default=force_default,
+                )
     if config_params is None:
         config_params = create_and_read_config_file(

ohmyscrapper/core/default_files/config.yaml CHANGED Viewed

@@ -2,11 +2,12 @@ db:
   db_file: local.db
 default_dirs:
-  db: ./db
-  input: ./input
-  output: ./output
-  prompts: ./prompts
-  templates: ./templates
+  db: ./ohmyscrapper_db
+  input: ./ohmyscrapper_input
+  output: ./ohmyscrapper_output
+  prompts: ./ohmyscrapper_prompts
+  templates: ./ohmyscrapper_templates
+  cache: ./ohmyscrapper_cache
 default_files:
   url_types: url_types.yaml
@@ -17,3 +18,6 @@ ai:
 sniffing:
   timeout: 10
+  use-browser: false
+  browser-waiting-time: 5
+  round-sleeping: 10

ohmyscrapper/core/default_files/url_sniffing.yaml CHANGED Viewed

@@ -26,4 +26,4 @@ linkedin_redirect:
 read_all_a_tags:
   atags:
-    load_atags: True
+    load_links: True

ohmyscrapper/models/urls_manager.py CHANGED Viewed

@@ -1,9 +1,11 @@
+import glob
 import os
 import sqlite3
 import time
-import glob
-import pandas as pd
 from urllib.parse import urlparse, urlunparse
+import pandas as pd
 from ohmyscrapper.core import config
@@ -71,7 +73,7 @@ def seeds(seeds={}):
 @use_connection
 def reset_seeds():
-    sql = "DELETE FROM urls_valid_prefix"
+    sql = "DELETE FROM urls_valid_prefix WHERE 1 = 1"
     c = conn.cursor()
     c.execute(sql)
     conn.commit()

ohmyscrapper/modules/browser.py ADDED Viewed

@@ -0,0 +1,28 @@
+from selenium import webdriver
+from ohmyscrapper.core.config import get_sniffing
+def get_driver():
+    if get_sniffing("use-browser") == "safari":
+        from selenium.webdriver.safari.options import Options
+        options = Options()
+        driver = webdriver.Safari(options=options)
+    elif get_sniffing("use-browser") == "firefox":
+        from selenium.webdriver.firefox.options import Options
+        options = Options()
+        driver = webdriver.Firefox(options=options)
+    elif get_sniffing("use-browser") == "ie":
+        from selenium.webdriver.ie.options import Options
+        options = Options()
+        driver = webdriver.Ie(options=options)
+    else:  # default: chrome
+        from selenium.webdriver.chrome.options import Options
+        options = Options()
+        driver = webdriver.Chrome(options=options)
+    return driver

ohmyscrapper/modules/cache.py ADDED Viewed

@@ -0,0 +1,100 @@
+import os
+from ohmyscrapper.core import config
+def safe_cache_id(func):
+    def _filter_cache_id(*args, **kwargs):
+        if "cache_id" in args:
+            args["cache_id"] = filter_cache_id(args["cache_id"])
+        if "cache_id" in kwargs:
+            kwargs["cache_id"] = filter_cache_id(kwargs["cache_id"])
+        return func(*args, **kwargs)
+    return _filter_cache_id
+def filter_cache_id(cache_id):
+    cache_id = cache_id.replace('"', "").replace("\\", "")
+    cache_id = f'"{cache_id}"'
+    return cache_id
+cache_files_extension = "html"
+@safe_cache_id
+def set(text: str, cache_id: str):
+    cache_folder = config.get_dir("cache")
+    cache_index_file_path = get_cache_index_path()
+    cache_folder_files = os.listdir(cache_folder)
+    cached_file_index = get_index_from_file_index(_safe_cache_id=cache_id)
+    if cached_file_index is not None:
+        new_file_index = cached_file_index
+    else:
+        new_file_index = len(cache_folder_files)
+        with open(cache_index_file_path, "a") as cache_index_file_writer:
+            cache_index_file_writer.write(f"\n{new_file_index}: {cache_id}")
+    new_file_name = f"{new_file_index}.{cache_files_extension}"
+    new_file_path = os.path.join(cache_folder, new_file_name)
+    with open(new_file_path, "w+") as new_file_writer:
+        new_file_writer.write(text)
+@safe_cache_id
+def get(cache_id: str) -> str:
+    cached_file_index = get_index_from_file_index(_safe_cache_id=cache_id)
+    code = get_cached_file_by_index(cached_file_index=cached_file_index)
+    return code
+def get_index_from_file_index(_safe_cache_id):
+    cache_index_file = get_cache_index_file()
+    if cache_index_file.find(_safe_cache_id) < 1:
+        return None
+    cache_index_file = cache_index_file[: cache_index_file.find(_safe_cache_id) - 2]
+    cached_file_index = int(cache_index_file.split("\n")[-1].strip())
+    return cached_file_index
+def get_cache_index_path() -> str:
+    cache_index_file_name = "cache_index.yaml"
+    cache_folder = config.get_dir("cache")
+    cache_index_file_path = os.path.join(cache_folder, cache_index_file_name)
+    if not os.path.exists(cache_index_file_path):
+        with open(cache_index_file_path, "w+") as cache_index_file_writer:
+            cache_index_file_writer.write(f"0: {cache_index_file_name}")
+    return cache_index_file_path
+def get_cache_index_file() -> str:
+    with open(get_cache_index_path(), "r") as f:
+        cache_index_file_content = f.read()
+    return cache_index_file_content
+def get_cached_file_by_index(cached_file_index: int) -> str:
+    code = None
+    cache_folder = config.get_dir("cache")
+    cached_file_name = f"{cached_file_index}.{cache_files_extension}"
+    cached_file_path = os.path.join(cache_folder, cached_file_name)
+    if not os.path.exists(cached_file_path):
+        return None
+    with open(cached_file_path, "r") as cached_file_reader:
+        code = cached_file_reader.read()
+    return code
+def clean():
+    cache_folder = config.get_dir("cache")
+    cache_folder_files = os.listdir(cache_folder)
+    for file in cache_folder_files:
+        file_to_clean = os.path.join(cache_folder, file)
+        if os.path.exists(file_to_clean):
+            os.remove(file_to_clean)

ohmyscrapper/modules/classify_urls.py CHANGED Viewed

@@ -1,7 +1,9 @@
+import time
+import pandas as pd
 import ohmyscrapper.models.urls_manager as urls_manager
 from ohmyscrapper.modules import seed
-import pandas as pd
-import time
 def classify_urls(recursive=False):

ohmyscrapper/modules/load_txt.py CHANGED Viewed

@@ -1,5 +1,7 @@
 import os
 from urlextract import URLExtract
 import ohmyscrapper.models.urls_manager as urls_manager
 from ohmyscrapper.core import config

ohmyscrapper/modules/process_with_ai.py CHANGED Viewed

@@ -1,13 +1,15 @@
-import ohmyscrapper.models.urls_manager as urls_manager
-from ohmyscrapper.core import config
-from bs4 import BeautifulSoup
-from google import genai
-from dotenv import load_dotenv
+import json
+import os
 import random
 import time
-import os
 import yaml
-import json
+from bs4 import BeautifulSoup
+from dotenv import load_dotenv
+from google import genai
+import ohmyscrapper.models.urls_manager as urls_manager
+from ohmyscrapper.core import config
 # TODO: !!! REFACTOR !!!
 load_dotenv()
@@ -85,15 +87,12 @@ def process_with_ai(recursive=True, triggered_times=0):
     texts = ""
     for index, row in df.iterrows():
-        texts = (
-            texts
-            + f"""
+        texts = texts + f"""
         <text>
         <id>{str(row['id'])}</id>
         {row['description']}
         </text>
         """
-        )
     if texts == "":
         print("no urls to process")
         return

ohmyscrapper/modules/scrap_urls.py CHANGED Viewed

@@ -1,14 +1,15 @@
+import random
+import time
 import ohmyscrapper.models.urls_manager as urls_manager
-import ohmyscrapper.modules.sniff_url as sniff_url
-import ohmyscrapper.modules.load_txt as load_txt
+import ohmyscrapper.modules.browser as browser
 import ohmyscrapper.modules.classify_urls as classify_urls
+import ohmyscrapper.modules.load_txt as load_txt
+import ohmyscrapper.modules.sniff_url as sniff_url
 from ohmyscrapper.core import config
-import time
-import random
-def scrap_url(url, verbose=False):
+def scrap_url(url, verbose=False, driver=None):
     if url["url_type"] is None:
         url["url_type"] = "generic"
@@ -32,7 +33,7 @@ def scrap_url(url, verbose=False):
             sniffing_config = config.get_url_sniffing()
         url_report = sniff_url.get_tags(
-            url=url["url"], sniffing_config=sniffing_config[url_type]
+            url=url["url"], sniffing_config=sniffing_config[url_type], driver=driver
         )
     except Exception as e:
         urls_manager.set_url_error(url=url["url"], value="error on scrapping")
@@ -147,6 +148,7 @@ def scrap_urls(
     only_parents=True,
     verbose=False,
     n_urls=0,
+    driver=None,
 ):
     limit = 10
     classify_urls.classify_urls()
@@ -170,13 +172,19 @@ def scrap_urls(
         time.sleep(wait)
         print("🐕 Scrapper is sniffing the url...")
-        scrap_url(url=url, verbose=verbose)
+        if driver is None and config.get_sniffing("use-browser"):
+            driver = browser.get_driver()
+        scrap_url(url=url, verbose=verbose, driver=driver)
     n_urls = n_urls + len(urls)
     print(f"-- 🗃️ {n_urls} scraped urls...")
     classify_urls.classify_urls()
     if recursive:
-        wait = random.randint(5, 10)
+        wait = random.randint(
+            int(config.get_sniffing("round-sleeping") / 2),
+            int(config.get_sniffing("round-sleeping")),
+        )
         print(
             f"🐶 Scrapper is sleeping for {wait} seconds before next round of {limit} urls"
         )
@@ -188,6 +196,7 @@ def scrap_urls(
             only_parents=only_parents,
             verbose=verbose,
             n_urls=n_urls,
+            driver=driver,
         )
     else:
         print("scrapping is over...")

ohmyscrapper/modules/show.py CHANGED Viewed

@@ -1,10 +1,12 @@
-import ohmyscrapper.models.urls_manager as urls_manager
-from ohmyscrapper.core import config
 import math
 import os
 from rich.console import Console
 from rich.table import Table
+import ohmyscrapper.models.urls_manager as urls_manager
+from ohmyscrapper.core import config
 def export_urls(limit=0, csv_file="output/urls.csv", simplify=False):
     output_folder = config.get_dir("output")

ohmyscrapper/modules/sniff_url.py CHANGED Viewed

@@ -1,16 +1,22 @@
+import json
+import os
+import time
 import requests
 from bs4 import BeautifulSoup
-import json
+import ohmyscrapper.modules.browser as browser
 from ohmyscrapper.core import config
+from ohmyscrapper.modules import cache
 def sniff_url(
     url="https://www.linkedin.com/in/cesardesouzacardoso/",
     silent=False,
     sniffing_config={},
+    driver=None,
 ):
     final_report = {}
-    final_report["error"] = None
     if "metatags" in sniffing_config:
         metatags_to_search = sniffing_config["metatags"]
     else:
@@ -45,13 +51,14 @@ def sniff_url(
         print("checking url:", url)
     try:
-        r = requests.get(url=url, timeout=config.get_sniffing("timeout"))
-        soup = BeautifulSoup(r.text, "html.parser")
+        r = get_url(url=url, driver=driver)
+        soup = BeautifulSoup(r, "html.parser")
     except requests.exceptions.ReadTimeout:
         url_domain = url.split("/")[2]
         final_report["error"] = (
             f"!!! timeout (10 seconds) while checking the url with domain: `{url_domain}` !!!"
         )
         print(f"\n\n{final_report['error']}\n\n")
         soup = BeautifulSoup("", "html.parser")
@@ -69,14 +76,14 @@ def sniff_url(
                 soup=soup, silent=silent, body_tags_to_search=body_tags_to_search
             )
         )
-    final_report["a_links"] = _extract_a_tags(soup=soup, silent=silent)
+    final_report["a_links"] = _extract_a_tags(soup=soup, silent=silent, url=url)
     final_report = _complementary_report(final_report, soup, silent).copy()
     final_report["json"] = json.dumps(final_report)
     return final_report
-def _extract_a_tags(soup, silent):
+def _extract_a_tags(soup, silent, url=None):
     a_links = []
     if not silent:
         print("\n\n\n\n---- all <a> links ---")
@@ -84,12 +91,19 @@ def _extract_a_tags(soup, silent):
     i = 0
     for a_tag in soup.find_all("a"):
         i = i + 1
-        a_links.append({"text": a_tag.text, "href": a_tag.get("href")})
+        href = a_tag.get("href")
+        if href is not None:
+            if url is not None and href[:1] == "/":
+                domain = url.split("//")[0] + "//" + url.split("//")[1].split("/")[0]
+                href = domain + href
+        a_links.append({"text": a_tag.text, "href": href})
         if not silent:
             print("\n-- <a> link", i, "-- ")
             print("target:", a_tag.get("target"))
             print("text:", str(a_tag.text).strip())
-            print("href:", a_tag.get("href"))
+            print("href:", href)
             print("-------------- ")
     return a_links
@@ -124,9 +138,21 @@ def _extract_text_tags(soup, silent, body_tags_to_search):
         print("\n\n\n\n---- all <text> tags ---\n")
     i = 0
     for text_tag, separator in body_tags_to_search.items():
-        if len(soup.find_all(text_tag)) > 0:
+        tag = text_tag
+        tag_class = None
+        tag_id = None
+        if len(text_tag.split(".")) > 1:
+            tag = text_tag.split(".")[0]
+            tag_class = text_tag.split(".")[1]
+        if len(text_tag.split("#")) > 1:
+            tag = text_tag.split("#")[0]
+            tag_id = text_tag.split("#")[1]
+        if len(soup.find_all(tag, class_=tag_class, id=tag_id)) > 0:
             valid_text_tags[text_tag] = []
-            for obj_tag in soup.find_all(text_tag):
+            for obj_tag in soup.find_all(tag, class_=tag_class, id=tag_id):
                 valid_text_tags[text_tag].append(obj_tag.text.strip())
             valid_text_tags[text_tag] = separator.join(valid_text_tags[text_tag])
             i = i + 1
@@ -161,5 +187,34 @@ def _complementary_report(final_report, soup, silent):
     return final_report
-def get_tags(url, sniffing_config={}):
-    return sniff_url(url=url, silent=True, sniffing_config=sniffing_config)
+def get_tags(url, sniffing_config={}, driver=None):
+    return sniff_url(
+        url=url, silent=True, sniffing_config=sniffing_config, driver=driver
+    )
+def get_url(url, driver=None):
+    cache_prefix = "sniff-urf:"
+    cached_code = cache.get(cache_id=cache_prefix + url)
+    if cached_code is not None:
+        print("You used the cache for this URL.")
+        return cached_code
+    if driver is None and config.get_sniffing("use-browser"):
+        driver = browser.get_driver()
+    if driver is not None:
+        try:
+            driver.get(url)
+            time.sleep(config.get_sniffing("browser-waiting-time"))
+            driver.implicitly_wait(config.get_sniffing("browser-waiting-time"))
+            code = driver.page_source
+            cache.set(text=code, cache_id=cache_prefix + url)
+            return code
+        except:
+            print("error")
+            pass
+    code = requests.get(url=url, timeout=config.get_sniffing("timeout")).text
+    cache.set(text=code, cache_id=cache_prefix + url)
+    return code

{ohmyscrapper-0.7.4.dist-info → ohmyscrapper-0.8.4.dist-info}/METADATA RENAMED Viewed

@@ -1,6 +1,6 @@
 Metadata-Version: 2.4
 Name: ohmyscrapper
-Version: 0.7.4
+Version: 0.8.4
 Summary: OhMyScrapper scrapes texts and urls looking for links and jobs-data to create a final report with general information about job positions.
 Author: Cesar Cardoso
 Author-email: Cesar Cardoso <hello@cesarcardoso.cc>
@@ -13,13 +13,14 @@ Requires-Dist: python-dotenv>=1.2.1
 Requires-Dist: pyyaml>=6.0.3
 Requires-Dist: requests>=2.32.5
 Requires-Dist: rich>=14.2.0
+Requires-Dist: selenium>=4.39.0
 Requires-Dist: urlextract>=1.9.0
 Requires-Python: >=3.11
-Project-URL: Changelog, https://github.com/bouli/ohmyscrapper/releases/latest
 Project-URL: Repository, https://github.com/bouli/ohmyscrapper
+Project-URL: Changelog, https://github.com/bouli/ohmyscrapper/releases/latest
 Description-Content-Type: text/markdown
-# 🐶 OhMyScrapper - v0.7.4
+# 🐶 OhMyScrapper - v0.8.4
 OhMyScrapper scrapes texts and urls looking for links and jobs-data to create a
 final report with general information about job positions.

ohmyscrapper-0.8.4.dist-info/RECORD ADDED Viewed

@@ -0,0 +1,23 @@
+ohmyscrapper/__init__.py,sha256=C_nhLCKrLogCLQVVHlTJNMEOSFiLDTR0bBCtW8T8kXE,7859
+ohmyscrapper/__main__.py,sha256=5BjNuyet8AY-POwoF5rGt722rHQ7tJ0Vf0UFUfzzi-I,58
+ohmyscrapper/core/config.py,sha256=2S8iYMdN5-fCX4EW1cmSd4-XabzqxIgbupBuymV3yjY,3185
+ohmyscrapper/core/config_files.py,sha256=5FyPFpN7WQrlgQWr85s5NF-UbnzbyFsWEVVMOs8iyaw,3411
+ohmyscrapper/core/default_files/config.yaml,sha256=ETuTyFM1fedjehM9cZRoKxRKcYDH0LlPFAZ3vLj0uxU,436
+ohmyscrapper/core/default_files/url_sniffing.yaml,sha256=HUwmGUwuJy7t97bJHgNiZOl1thvD9bLaelPgbEr5bMY,465
+ohmyscrapper/core/default_files/url_types.yaml,sha256=20kvv8_iWRT-pLa014RXYpAmPSonn6tDnG302rx7l-o,228
+ohmyscrapper/models/urls_manager.py,sha256=XC8HODdsCEo_nn1j7nH_jy9AUTb4PpmkGlaFWV048TM,12117
+ohmyscrapper/modules/browser.py,sha256=pH41NVqYgay_zEIZfncJbtwz_13REX5HVH8uk581sM4,857
+ohmyscrapper/modules/cache.py,sha256=3EQnv9VYJWrE5fdLwkGEUOAHV16nprhyid6MlBpa9Gg,3228
+ohmyscrapper/modules/classify_urls.py,sha256=oK_UhQPF976cexlarqi14pSw8tWLGYfaIMCXzbAhnpI,1040
+ohmyscrapper/modules/load_txt.py,sha256=Gpob1W_LLfkBnNbtqxgCRNGeyufmHECreDqTlj9O_Mk,4140
+ohmyscrapper/modules/merge_dbs.py,sha256=0pK3PPUGSbnaDkdpQUGCHemOVaKO37bfHwnsy_EVpWQ,115
+ohmyscrapper/modules/process_with_ai.py,sha256=TqebqC3_rCx6cbvq3oQhaXLZxGUYpKvhyH3I3zjsA94,7221
+ohmyscrapper/modules/scrap_urls.py,sha256=affq5Vx5BKrl7uL2mpcThDBOXznq0d5fz1if5xAttOA,6627
+ohmyscrapper/modules/seed.py,sha256=hHEGSoPXsmclTaRPeIcK2oC1Xpg3_JqBv_YFMD0m5Jw,1044
+ohmyscrapper/modules/show.py,sha256=i5l8_Zooj6vg1JLqWtvGPWHv7wL53aHZ43-SKS1sF9Y,3879
+ohmyscrapper/modules/sniff_url.py,sha256=NpIMJxNEUzmDkFGVqDJXgVtTWEGKRE_dSiJHNz-vXoE,7027
+ohmyscrapper/modules/untouch_all.py,sha256=DAwWYfqMFifHPtFCxSamu0AxHCgk6aJbTnBy6wLucXM,167
+ohmyscrapper-0.8.4.dist-info/WHEEL,sha256=fAguSjoiATBe7TNBkJwOjyL1Tt4wwiaQGtNtjRPNMQA,80
+ohmyscrapper-0.8.4.dist-info/entry_points.txt,sha256=BZud6D16XkfjelDa4Z33mji-KJbbZXgq2FoLrzjru5I,52
+ohmyscrapper-0.8.4.dist-info/METADATA,sha256=h2Agb2KCKiBkX-HEj_8f9EuV3NOq6AJ9h1WrnPQ79iU,4293
+ohmyscrapper-0.8.4.dist-info/RECORD,,

{ohmyscrapper-0.7.4.dist-info → ohmyscrapper-0.8.4.dist-info}/WHEEL RENAMED Viewed

@@ -1,4 +1,4 @@
 Wheel-Version: 1.0
-Generator: uv 0.9.17
+Generator: uv 0.9.28
 Root-Is-Purelib: true
-Tag: py3-none-any
+Tag: py3-none-any

ohmyscrapper-0.7.4.dist-info/RECORD DELETED Viewed

@@ -1,21 +0,0 @@
-ohmyscrapper/__init__.py,sha256=x3wLMhIU744W9DRtXoTrPpWghb7UdC3UJSYZh_gpzlw,7095
-ohmyscrapper/__main__.py,sha256=5BjNuyet8AY-POwoF5rGt722rHQ7tJ0Vf0UFUfzzi-I,58
-ohmyscrapper/core/config.py,sha256=aaSLxk6Fuzp88EMax6MAOX3WszH4OfYLz_dJoXlu0ME,3142
-ohmyscrapper/core/config_files.py,sha256=C79-Vgz1E5_jUWtob-yrCyBxsqWEXxqPI_r6TL7D1_Q,3314
-ohmyscrapper/core/default_files/config.yaml,sha256=gi8tqhSumQYJIl8QDisJ6eaib2tdcBNT-GFU-e6Dtns,273
-ohmyscrapper/core/default_files/url_sniffing.yaml,sha256=RU5GYWmC1PdBl4nn7HUfRBwuXz8Rlap75d4W3zWDzPM,465
-ohmyscrapper/core/default_files/url_types.yaml,sha256=20kvv8_iWRT-pLa014RXYpAmPSonn6tDnG302rx7l-o,228
-ohmyscrapper/models/urls_manager.py,sha256=k0N1If4YoRUWHX80OyBNEeJNIzDROc2ur6j8q2OBlqo,12103
-ohmyscrapper/modules/classify_urls.py,sha256=GhiosAQUITy1DQe_PksYV9QRKVTgpkSE28dkutzbWVA,1038
-ohmyscrapper/modules/load_txt.py,sha256=pkWBIdh6vORPfENDZ6wGM89vswnOnc1flqKfkLs9RD8,4138
-ohmyscrapper/modules/merge_dbs.py,sha256=0pK3PPUGSbnaDkdpQUGCHemOVaKO37bfHwnsy_EVpWQ,115
-ohmyscrapper/modules/process_with_ai.py,sha256=kl39Jzl-PUwh6AfmTZ9SLFUYs9Sk4biqgt8rNz3X1FA,7255
-ohmyscrapper/modules/scrap_urls.py,sha256=uN5j0dychVMGu7n1rcpYdba4sqc47ssyCn0tVaiz-Ic,6264
-ohmyscrapper/modules/seed.py,sha256=hHEGSoPXsmclTaRPeIcK2oC1Xpg3_JqBv_YFMD0m5Jw,1044
-ohmyscrapper/modules/show.py,sha256=jsAs4g8ouA9wymkBfkDCbpVWKD-m_20uKG-m1cZAUGA,3877
-ohmyscrapper/modules/sniff_url.py,sha256=1QnxEdCWLjLh0uM72dlPzst64qglqg2MHA_xYlNcLSA,5435
-ohmyscrapper/modules/untouch_all.py,sha256=DAwWYfqMFifHPtFCxSamu0AxHCgk6aJbTnBy6wLucXM,167
-ohmyscrapper-0.7.4.dist-info/WHEEL,sha256=xDCZ-UyfvkGuEHPeI7BcJzYKIZzdqN8A8o1M5Om8IyA,79
-ohmyscrapper-0.7.4.dist-info/entry_points.txt,sha256=BZud6D16XkfjelDa4Z33mji-KJbbZXgq2FoLrzjru5I,52
-ohmyscrapper-0.7.4.dist-info/METADATA,sha256=CVE8WUcraUtONy9UVIU0y8Y7wjsk4zEmMVfpA_al1CU,4261
-ohmyscrapper-0.7.4.dist-info/RECORD,,

{ohmyscrapper-0.7.4.dist-info → ohmyscrapper-0.8.4.dist-info}/entry_points.txt RENAMED Viewed

File without changes

ohmyscrapper 0.7.4__py3-none-any.whl → 0.8.4__py3-none-any.whl

ohmyscrapper 0.7.4py3-none-any.whl → 0.8.4py3-none-any.whl