PyPI - firecrawl-py - Versions diffs - 3.3.0__py3-none-any.whl → 3.3.2__py3-none-any.whl - Mend

firecrawl-py 3.3.0py3-none-any.whl → 3.3.2py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Potentially problematic release.

This version of firecrawl-py might be problematic. Click here for more details.

Files changed (82) hide show

firecrawl/__init__.py +1 -1
firecrawl/v2/client.py +3 -0
{firecrawl_py-3.3.0.dist-info → firecrawl_py-3.3.2.dist-info}/METADATA +1 -1
firecrawl_py-3.3.2.dist-info/RECORD +79 -0
{firecrawl_py-3.3.0.dist-info → firecrawl_py-3.3.2.dist-info}/top_level.txt +0 -2
build/lib/firecrawl/__init__.py +0 -87
build/lib/firecrawl/__tests__/e2e/v2/aio/test_aio_batch_scrape.py +0 -79
build/lib/firecrawl/__tests__/e2e/v2/aio/test_aio_crawl.py +0 -188
build/lib/firecrawl/__tests__/e2e/v2/aio/test_aio_extract.py +0 -38
build/lib/firecrawl/__tests__/e2e/v2/aio/test_aio_map.py +0 -40
build/lib/firecrawl/__tests__/e2e/v2/aio/test_aio_scrape.py +0 -137
build/lib/firecrawl/__tests__/e2e/v2/aio/test_aio_search.py +0 -248
build/lib/firecrawl/__tests__/e2e/v2/aio/test_aio_usage.py +0 -35
build/lib/firecrawl/__tests__/e2e/v2/aio/test_aio_watcher.py +0 -43
build/lib/firecrawl/__tests__/e2e/v2/conftest.py +0 -73
build/lib/firecrawl/__tests__/e2e/v2/test_async.py +0 -73
build/lib/firecrawl/__tests__/e2e/v2/test_batch_scrape.py +0 -105
build/lib/firecrawl/__tests__/e2e/v2/test_crawl.py +0 -276
build/lib/firecrawl/__tests__/e2e/v2/test_extract.py +0 -54
build/lib/firecrawl/__tests__/e2e/v2/test_map.py +0 -60
build/lib/firecrawl/__tests__/e2e/v2/test_scrape.py +0 -154
build/lib/firecrawl/__tests__/e2e/v2/test_search.py +0 -269
build/lib/firecrawl/__tests__/e2e/v2/test_usage.py +0 -26
build/lib/firecrawl/__tests__/e2e/v2/test_watcher.py +0 -65
build/lib/firecrawl/__tests__/unit/v2/methods/aio/test_aio_crawl_params.py +0 -12
build/lib/firecrawl/__tests__/unit/v2/methods/aio/test_aio_crawl_request_preparation.py +0 -61
build/lib/firecrawl/__tests__/unit/v2/methods/aio/test_aio_crawl_validation.py +0 -12
build/lib/firecrawl/__tests__/unit/v2/methods/aio/test_aio_map_request_preparation.py +0 -19
build/lib/firecrawl/__tests__/unit/v2/methods/aio/test_aio_scrape_request_preparation.py +0 -50
build/lib/firecrawl/__tests__/unit/v2/methods/aio/test_aio_search_request_preparation.py +0 -63
build/lib/firecrawl/__tests__/unit/v2/methods/aio/test_batch_request_preparation_async.py +0 -28
build/lib/firecrawl/__tests__/unit/v2/methods/aio/test_ensure_async.py +0 -117
build/lib/firecrawl/__tests__/unit/v2/methods/test_batch_request_preparation.py +0 -90
build/lib/firecrawl/__tests__/unit/v2/methods/test_crawl_params.py +0 -70
build/lib/firecrawl/__tests__/unit/v2/methods/test_crawl_request_preparation.py +0 -240
build/lib/firecrawl/__tests__/unit/v2/methods/test_crawl_validation.py +0 -107
build/lib/firecrawl/__tests__/unit/v2/methods/test_map_request_preparation.py +0 -53
build/lib/firecrawl/__tests__/unit/v2/methods/test_scrape_request_preparation.py +0 -92
build/lib/firecrawl/__tests__/unit/v2/methods/test_search_request_preparation.py +0 -167
build/lib/firecrawl/__tests__/unit/v2/methods/test_search_validation.py +0 -236
build/lib/firecrawl/__tests__/unit/v2/methods/test_usage_types.py +0 -18
build/lib/firecrawl/__tests__/unit/v2/methods/test_webhook.py +0 -123
build/lib/firecrawl/__tests__/unit/v2/utils/test_validation.py +0 -290
build/lib/firecrawl/__tests__/unit/v2/watcher/test_ws_watcher.py +0 -332
build/lib/firecrawl/client.py +0 -242
build/lib/firecrawl/firecrawl.backup.py +0 -4635
build/lib/firecrawl/types.py +0 -161
build/lib/firecrawl/v1/__init__.py +0 -14
build/lib/firecrawl/v1/client.py +0 -4653
build/lib/firecrawl/v2/__init__.py +0 -4
build/lib/firecrawl/v2/client.py +0 -802
build/lib/firecrawl/v2/client_async.py +0 -250
build/lib/firecrawl/v2/methods/aio/__init__.py +0 -1
build/lib/firecrawl/v2/methods/aio/batch.py +0 -85
build/lib/firecrawl/v2/methods/aio/crawl.py +0 -171
build/lib/firecrawl/v2/methods/aio/extract.py +0 -126
build/lib/firecrawl/v2/methods/aio/map.py +0 -59
build/lib/firecrawl/v2/methods/aio/scrape.py +0 -33
build/lib/firecrawl/v2/methods/aio/search.py +0 -172
build/lib/firecrawl/v2/methods/aio/usage.py +0 -42
build/lib/firecrawl/v2/methods/batch.py +0 -417
build/lib/firecrawl/v2/methods/crawl.py +0 -469
build/lib/firecrawl/v2/methods/extract.py +0 -131
build/lib/firecrawl/v2/methods/map.py +0 -77
build/lib/firecrawl/v2/methods/scrape.py +0 -64
build/lib/firecrawl/v2/methods/search.py +0 -197
build/lib/firecrawl/v2/methods/usage.py +0 -41
build/lib/firecrawl/v2/types.py +0 -665
build/lib/firecrawl/v2/utils/__init__.py +0 -9
build/lib/firecrawl/v2/utils/error_handler.py +0 -107
build/lib/firecrawl/v2/utils/get_version.py +0 -15
build/lib/firecrawl/v2/utils/http_client.py +0 -153
build/lib/firecrawl/v2/utils/http_client_async.py +0 -65
build/lib/firecrawl/v2/utils/normalize.py +0 -107
build/lib/firecrawl/v2/utils/validation.py +0 -324
build/lib/firecrawl/v2/watcher.py +0 -301
build/lib/firecrawl/v2/watcher_async.py +0 -242
build/lib/tests/test_change_tracking.py +0 -98
build/lib/tests/test_timeout_conversion.py +0 -117
firecrawl_py-3.3.0.dist-info/RECORD +0 -153
{firecrawl_py-3.3.0.dist-info → firecrawl_py-3.3.2.dist-info}/LICENSE +0 -0
{firecrawl_py-3.3.0.dist-info → firecrawl_py-3.3.2.dist-info}/WHEEL +0 -0

build/lib/firecrawl/v2/methods/aio/map.py DELETED Viewed

@@ -1,59 +0,0 @@
-from typing import Optional, Dict, Any
-from ...types import MapOptions, MapData, LinkResult
-from ...utils.http_client_async import AsyncHttpClient
-from ...utils.error_handler import handle_response_error
-def _prepare_map_request(url: str, options: Optional[MapOptions] = None) -> Dict[str, Any]:
-    if not url or not url.strip():
-        raise ValueError("URL cannot be empty")
-    payload: Dict[str, Any] = {"url": url.strip()}
-    if options is not None:
-        data: Dict[str, Any] = {}
-        if getattr(options, "sitemap", None) is not None:
-            data["sitemap"] = options.sitemap
-        if options.search is not None:
-            data["search"] = options.search
-        if options.include_subdomains is not None:
-            data["includeSubdomains"] = options.include_subdomains
-        if options.limit is not None:
-            data["limit"] = options.limit
-        if options.timeout is not None:
-            data["timeout"] = options.timeout
-        payload.update(data)
-    return payload
-async def map(client: AsyncHttpClient, url: str, options: Optional[MapOptions] = None) -> MapData:
-    request_data = _prepare_map_request(url, options)
-    response = await client.post("/v2/map", request_data)
-    if response.status_code >= 400:
-        handle_response_error(response, "map")
-    body = response.json()
-    if not body.get("success"):
-        raise Exception(body.get("error", "Unknown error occurred"))
-    # data = body.get("data", {})
-    # result_links: list[LinkResult] = []
-    # for item in data.get("links", []):
-    #     if isinstance(item, dict):
-    #         result_links.append(
-    #             LinkResult(
-    #                 url=item.get("url", ""),
-    #                 title=item.get("title"),
-    #                 description=item.get("description"),
-    #             )
-    #         )
-    #     elif isinstance(item, str):
-    #         result_links.append(LinkResult(url=item))
-    result_links: list[LinkResult] = []
-    for item in body.get("links", []):
-        if isinstance(item, dict):
-            result_links.append(LinkResult(url=item.get("url", ""), title=item.get("title"), description=item.get("description")))
-        elif isinstance(item, str):
-            result_links.append(LinkResult(url=item))
-    return MapData(links=result_links)

build/lib/firecrawl/v2/methods/aio/scrape.py DELETED Viewed

@@ -1,33 +0,0 @@
-from typing import Optional, Dict, Any
-from ...types import ScrapeOptions, Document
-from ...utils.normalize import normalize_document_input
-from ...utils.error_handler import handle_response_error
-from ...utils.validation import prepare_scrape_options, validate_scrape_options
-from ...utils.http_client_async import AsyncHttpClient
-async def _prepare_scrape_request(url: str, options: Optional[ScrapeOptions] = None) -> Dict[str, Any]:
-    if not url or not url.strip():
-        raise ValueError("URL cannot be empty")
-    payload: Dict[str, Any] = {"url": url.strip()}
-    if options is not None:
-        validated = validate_scrape_options(options)
-        if validated is not None:
-            opts = prepare_scrape_options(validated)
-            if opts:
-                payload.update(opts)
-    return payload
-async def scrape(client: AsyncHttpClient, url: str, options: Optional[ScrapeOptions] = None) -> Document:
-    payload = await _prepare_scrape_request(url, options)
-    response = await client.post("/v2/scrape", payload)
-    if response.status_code >= 400:
-        handle_response_error(response, "scrape")
-    body = response.json()
-    if not body.get("success"):
-        raise Exception(body.get("error", "Unknown error occurred"))
-    document_data = body.get("data", {})
-    normalized = normalize_document_input(document_data)
-    return Document(**normalized)

build/lib/firecrawl/v2/methods/aio/search.py DELETED Viewed

@@ -1,172 +0,0 @@
-import re
-from typing import Dict, Any, Union, List, TypeVar, Type
-from ...types import (
-    SearchRequest,
-    SearchData,
-    Document,
-    SearchResultWeb,
-    SearchResultNews,
-    SearchResultImages,
-)
-from ...utils.http_client_async import AsyncHttpClient
-from ...utils.error_handler import handle_response_error
-from ...utils.validation import validate_scrape_options, prepare_scrape_options
-T = TypeVar("T")
-async def search(
-    client: AsyncHttpClient,
-    request: SearchRequest
-) -> SearchData:
-    """
-    Async search for documents.
-    Args:
-        client: Async HTTP client instance
-        request: Search request
-    Returns:
-        SearchData with search results grouped by source type
-    Raises:
-        FirecrawlError: If the search operation fails
-    """
-    request_data = _prepare_search_request(request)
-    try:
-        response = await client.post("/v2/search", request_data)
-        if response.status_code != 200:
-            handle_response_error(response, "search")
-        response_data = response.json()
-        if not response_data.get("success"):
-            handle_response_error(response, "search")
-        data = response_data.get("data", {}) or {}
-        out = SearchData()
-        if "web" in data:
-            out.web = _transform_array(data["web"], SearchResultWeb)
-        if "news" in data:
-            out.news = _transform_array(data["news"], SearchResultNews)
-        if "images" in data:
-            out.images = _transform_array(data["images"], SearchResultImages)
-        return out
-    except Exception as err:
-        if hasattr(err, "response"):
-            handle_response_error(getattr(err, "response"), "search")
-        raise err
-def _transform_array(arr: List[Any], result_type: Type[T]) -> List[Union[T, Document]]:
-    """
-    Transforms an array of items into a list of result_type or Document.
-    If the item dict contains any of the special keys, it is treated as a Document.
-    Otherwise, it is treated as result_type.
-    If the item is not a dict, it is wrapped as result_type with url=item.
-    """
-    results: List[Union[T, Document]] = []
-    for item in arr:
-        if item and isinstance(item, dict):
-            if (
-                "markdown" in item or
-                "html" in item or
-                "rawHtml" in item or
-                "links" in item or
-                "screenshot" in item or
-                "changeTracking" in item or
-                "summary" in item or
-                "json" in item
-            ):
-                results.append(Document(**item))
-            else:
-                results.append(result_type(**item))
-        else:
-            results.append(result_type(url=item))
-    return results
-def _validate_search_request(request: SearchRequest) -> SearchRequest:
-    """
-    Validate and normalize search request.
-    Args:
-        request: Search request to validate
-    Returns:
-        Validated request
-    Raises:
-        ValueError: If request is invalid
-    """
-    if not request.query or not request.query.strip():
-        raise ValueError("Query cannot be empty")
-    if request.limit is not None:
-        if request.limit <= 0:
-            raise ValueError("Limit must be positive")
-        if request.limit > 100:
-            raise ValueError("Limit cannot exceed 100")
-    if request.timeout is not None:
-        if request.timeout <= 0:
-            raise ValueError("Timeout must be positive")
-        if request.timeout > 300000:
-            raise ValueError("Timeout cannot exceed 300000ms (5 minutes)")
-    if request.sources is not None:
-        valid_sources = {"web", "news", "images"}
-        for source in request.sources:
-            if isinstance(source, str):
-                if source not in valid_sources:
-                    raise ValueError(f"Invalid source type: {source}. Valid types: {valid_sources}")
-            elif hasattr(source, 'type'):
-                if source.type not in valid_sources:
-                    raise ValueError(f"Invalid source type: {source.type}. Valid types: {valid_sources}")
-    if request.location is not None:
-        if not isinstance(request.location, str) or len(request.location.strip()) == 0:
-            raise ValueError("Location must be a non-empty string")
-    if request.tbs is not None:
-        valid_tbs_values = {
-            "qdr:h", "qdr:d", "qdr:w", "qdr:m", "qdr:y",
-            "d", "w", "m", "y"
-        }
-        if request.tbs in valid_tbs_values:
-            pass
-        elif request.tbs.startswith("cdr:"):
-            custom_date_pattern = r"^cdr:1,cd_min:\d{1,2}/\d{1,2}/\d{4},cd_max:\d{1,2}/\d{1,2}/\d{4}$"
-            if not re.match(custom_date_pattern, request.tbs):
-                raise ValueError(f"Invalid custom date range format: {request.tbs}. Expected format: cdr:1,cd_min:MM/DD/YYYY,cd_max:MM/DD/YYYY")
-        else:
-            raise ValueError(f"Invalid tbs value: {request.tbs}. Valid values: {valid_tbs_values} or custom date range format: cdr:1,cd_min:MM/DD/YYYY,cd_max:MM/DD/YYYY")
-    if request.scrape_options is not None:
-        validate_scrape_options(request.scrape_options)
-    return request
-def _prepare_search_request(request: SearchRequest) -> Dict[str, Any]:
-    """
-    Prepare a search request payload.
-    Args:
-        request: Search request
-    Returns:
-        Request payload dictionary
-    """
-    validated_request = _validate_search_request(request)
-    data = validated_request.model_dump(exclude_none=True, by_alias=True)
-    if "limit" not in data and validated_request.limit is not None:
-        data["limit"] = validated_request.limit
-    if "timeout" not in data and validated_request.timeout is not None:
-        data["timeout"] = validated_request.timeout
-    if validated_request.ignore_invalid_urls is not None:
-        data["ignoreInvalidURLs"] = validated_request.ignore_invalid_urls
-        data.pop("ignore_invalid_urls", None)
-    if validated_request.scrape_options is not None:
-        scrape_data = prepare_scrape_options(validated_request.scrape_options)
-        if scrape_data:
-            data["scrapeOptions"] = scrape_data
-        data.pop("scrape_options", None)
-    return data

build/lib/firecrawl/v2/methods/aio/usage.py DELETED Viewed

@@ -1,42 +0,0 @@
-from ...utils.http_client_async import AsyncHttpClient
-from ...utils.error_handler import handle_response_error
-from ...types import ConcurrencyCheck, CreditUsage, TokenUsage
-async def get_concurrency(client: AsyncHttpClient) -> ConcurrencyCheck:
-    resp = await client.get("/v2/concurrency-check")
-    if resp.status_code >= 400:
-        handle_response_error(resp, "get concurrency")
-    body = resp.json()
-    if not body.get("success"):
-        raise Exception(body.get("error", "Unknown error"))
-    data = body.get("data", body)
-    return ConcurrencyCheck(
-        concurrency=data.get("concurrency"),
-        max_concurrency=data.get("maxConcurrency", data.get("max_concurrency")),
-    )
-async def get_credit_usage(client: AsyncHttpClient) -> CreditUsage:
-    resp = await client.get("/v2/team/credit-usage")
-    if resp.status_code >= 400:
-        handle_response_error(resp, "get credit usage")
-    body = resp.json()
-    if not body.get("success"):
-        raise Exception(body.get("error", "Unknown error"))
-    data = body.get("data", body)
-    return CreditUsage(remaining_credits=data.get("remainingCredits", data.get("remaining_credits", 0)))
-async def get_token_usage(client: AsyncHttpClient) -> TokenUsage:
-    resp = await client.get("/v2/team/token-usage")
-    if resp.status_code >= 400:
-        handle_response_error(resp, "get token usage")
-    body = resp.json()
-    if not body.get("success"):
-        raise Exception(body.get("error", "Unknown error"))
-    data = body.get("data", body)
-    return TokenUsage(
-        remaining_tokens=data.get("remainingTokens", 0)
-    )

firecrawl-py 3.3.0__py3-none-any.whl → 3.3.2__py3-none-any.whl

Potentially problematic release.

firecrawl-py 3.3.0py3-none-any.whl → 3.3.2py3-none-any.whl