PyPI - hyperbrowser - Versions diffs - 0.33.0__tar.gz → 0.35.0__tar.gz - Mend

hyperbrowser 0.33.0tar.gz → 0.35.0tar.gz

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Potentially problematic release.

This version of hyperbrowser might be problematic. Click here for more details.

Files changed (44) hide show

{hyperbrowser-0.33.0 → hyperbrowser-0.35.0}/PKG-INFO RENAMED Viewed

@@ -1,6 +1,6 @@
 Metadata-Version: 2.3
 Name: hyperbrowser
-Version: 0.33.0
+Version: 0.35.0
 Summary: Python SDK for hyperbrowser
 License: MIT
 Author: Nikhil Shahi
@@ -15,6 +15,7 @@ Classifier: Programming Language :: Python :: 3.11
 Classifier: Programming Language :: Python :: 3.12
 Classifier: Programming Language :: Python :: 3.13
 Requires-Dist: httpx (>=0.23.0,<1)
+Requires-Dist: jsonref (>=1.1.0)
 Requires-Dist: pydantic (>=2.0,<3)
 Project-URL: Homepage, https://github.com/hyperbrowserai/python-sdk
 Project-URL: Repository, https://github.com/hyperbrowserai/python-sdk

{hyperbrowser-0.33.0 → hyperbrowser-0.35.0}/hyperbrowser/client/async_client.py RENAMED Viewed

@@ -1,15 +1,15 @@
 from typing import Optional
+from ..config import ClientConfig
+from ..transport.async_transport import AsyncTransport
+from .base import HyperbrowserBase
+from .managers.async_manager.agents import Agents
+from .managers.async_manager.crawl import CrawlManager
+from .managers.async_manager.extension import ExtensionManager
 from .managers.async_manager.extract import ExtractManager
 from .managers.async_manager.profile import ProfileManager
-from .managers.async_manager.session import SessionManager
 from .managers.async_manager.scrape import ScrapeManager
-from .managers.async_manager.crawl import CrawlManager
-from .managers.async_manager.extension import ExtensionManager
-from .managers.async_manager.beta import Beta
-from .base import HyperbrowserBase
-from ..transport.async_transport import AsyncTransport
-from ..config import ClientConfig
+from .managers.async_manager.session import SessionManager
 class AsyncHyperbrowser(HyperbrowserBase):
@@ -30,7 +30,7 @@ class AsyncHyperbrowser(HyperbrowserBase):
         self.extract = ExtractManager(self)
         self.profiles = ProfileManager(self)
         self.extensions = ExtensionManager(self)
-        self.beta = Beta(self)
+        self.agents = Agents(self)
     async def close(self) -> None:
         await self.transport.close()

{hyperbrowser-0.33.0/hyperbrowser/client/managers/async_manager/beta → hyperbrowser-0.35.0/hyperbrowser/client/managers/async_manager}/agents/__init__.py RENAMED Viewed

@@ -1,5 +1,6 @@
+from .browser_use import BrowserUseManager
 class Agents:
     def __init__(self, client):
-        from .browser_use import BrowserUseManager
         self.browser_use = BrowserUseManager(client)

{hyperbrowser-0.33.0/hyperbrowser/client/managers/async_manager/beta → hyperbrowser-0.35.0/hyperbrowser/client/managers/async_manager}/agents/browser_use.py RENAMED Viewed

@@ -1,12 +1,14 @@
 import asyncio
 from hyperbrowser.exceptions import HyperbrowserError
-from ......models import (
+from .....models import (
     POLLING_ATTEMPTS,
     BasicResponse,
+    BrowserUseTaskResponse,
+    BrowserUseTaskStatusResponse,
     StartBrowserUseTaskParams,
     StartBrowserUseTaskResponse,
-    BrowserUseTaskStatusResponse,
-    BrowserUseTaskResponse,
 )

{hyperbrowser-0.33.0 → hyperbrowser-0.35.0}/hyperbrowser/client/managers/async_manager/crawl.py RENAMED Viewed

@@ -3,6 +3,8 @@ import asyncio
 from hyperbrowser.models.consts import POLLING_ATTEMPTS
 from ....models.crawl import (
     CrawlJobResponse,
+    CrawlJobStatus,
+    CrawlJobStatusResponse,
     GetCrawlJobParams,
     StartCrawlJobParams,
     StartCrawlJobResponse,
@@ -21,11 +23,18 @@ class CrawlManager:
         )
         return StartCrawlJobResponse(**response.data)
+    async def get_status(self, job_id: str) -> CrawlJobStatusResponse:
+        response = await self._client.transport.get(
+            self._client._build_url(f"/crawl/{job_id}/status")
+        )
+        return CrawlJobStatusResponse(**response.data)
     async def get(
         self, job_id: str, params: GetCrawlJobParams = GetCrawlJobParams()
     ) -> CrawlJobResponse:
         response = await self._client.transport.get(
-            self._client._build_url(f"/crawl/{job_id}"), params=params.__dict__
+            self._client._build_url(f"/crawl/{job_id}"),
+            params=params.model_dump(exclude_none=True, by_alias=True),
         )
         return CrawlJobResponse(**response.data)
@@ -37,18 +46,13 @@ class CrawlManager:
         if not job_id:
             raise HyperbrowserError("Failed to start crawl job")
-        job_response: CrawlJobResponse
+        job_status: CrawlJobStatus = "pending"
         failures = 0
         while True:
             try:
-                job_response = await self.get(
-                    job_id,
-                    params=GetCrawlJobParams(batch_size=1),
-                )
-                if (
-                    job_response.status == "completed"
-                    or job_response.status == "failed"
-                ):
+                job_status_resp = await self.get_status(job_id)
+                job_status = job_status_resp.status
+                if job_status == "completed" or job_status == "failed":
                     break
             except Exception as e:
                 failures += 1
@@ -62,8 +66,7 @@ class CrawlManager:
         if not return_all_pages:
             while True:
                 try:
-                    job_response = await self.get(job_id)
-                    return job_response
+                    return await self.get(job_id)
                 except Exception as e:
                     failures += 1
                     if failures >= POLLING_ATTEMPTS:
@@ -73,9 +76,20 @@ class CrawlManager:
                 await asyncio.sleep(0.5)
         failures = 0
-        job_response.current_page_batch = 0
-        job_response.data = []
-        while job_response.current_page_batch < job_response.total_page_batches:
+        job_response = CrawlJobResponse(
+            jobId=job_id,
+            status=job_status,
+            data=[],
+            currentPageBatch=0,
+            totalPageBatches=0,
+            totalCrawledPages=0,
+            batchSize=100,
+        )
+        first_check = True
+        while (
+            first_check
+            or job_response.current_page_batch < job_response.total_page_batches
+        ):
             try:
                 tmp_job_response = await self.get(
                     job_start_resp.job_id,
@@ -90,6 +104,7 @@ class CrawlManager:
                 job_response.total_page_batches = tmp_job_response.total_page_batches
                 job_response.batch_size = tmp_job_response.batch_size
                 failures = 0
+                first_check = False
             except Exception as e:
                 failures += 1
                 if failures >= POLLING_ATTEMPTS:

{hyperbrowser-0.33.0 → hyperbrowser-0.35.0}/hyperbrowser/client/managers/async_manager/extract.py RENAMED Viewed

@@ -3,9 +3,11 @@ from hyperbrowser.exceptions import HyperbrowserError
 from hyperbrowser.models.consts import POLLING_ATTEMPTS
 from hyperbrowser.models.extract import (
     ExtractJobResponse,
+    ExtractJobStatusResponse,
     StartExtractJobParams,
     StartExtractJobResponse,
 )
+import jsonref
 class ExtractManager:
@@ -17,7 +19,9 @@ class ExtractManager:
             raise HyperbrowserError("Either schema or prompt must be provided")
         if params.schema_:
             if hasattr(params.schema_, "model_json_schema"):
-                params.schema_ = params.schema_.model_json_schema()
+                params.schema_ = jsonref.replace_refs(
+                    params.schema_.model_json_schema(), proxies=False, lazy_load=False
+                )
         response = await self._client.transport.post(
             self._client._build_url("/extract"),
@@ -25,6 +29,12 @@ class ExtractManager:
         )
         return StartExtractJobResponse(**response.data)
+    async def get_status(self, job_id: str) -> ExtractJobStatusResponse:
+        response = await self._client.transport.get(
+            self._client._build_url(f"/extract/{job_id}/status")
+        )
+        return ExtractJobStatusResponse(**response.data)
     async def get(self, job_id: str) -> ExtractJobResponse:
         response = await self._client.transport.get(
             self._client._build_url(f"/extract/{job_id}")
@@ -40,12 +50,10 @@ class ExtractManager:
         failures = 0
         while True:
             try:
-                job_response = await self.get(job_id)
-                if (
-                    job_response.status == "completed"
-                    or job_response.status == "failed"
-                ):
-                    return job_response
+                job_status_resp = await self.get_status(job_id)
+                job_status = job_status_resp.status
+                if job_status == "completed" or job_status == "failed":
+                    return await self.get(job_id)
                 failures = 0
             except Exception as e:
                 failures += 1

{hyperbrowser-0.33.0 → hyperbrowser-0.35.0}/hyperbrowser/client/managers/async_manager/profile.py RENAMED Viewed

@@ -33,6 +33,7 @@ class ProfileManager:
         self, params: ProfileListParams = ProfileListParams()
     ) -> ProfileListResponse:
         response = await self._client.transport.get(
-            self._client._build_url("/profiles"), params=params.__dict__
+            self._client._build_url("/profiles"),
+            params=params.model_dump(exclude_none=True, by_alias=True),
         )
         return ProfileListResponse(**response.data)

{hyperbrowser-0.33.0 → hyperbrowser-0.35.0}/hyperbrowser/client/managers/async_manager/scrape.py RENAMED Viewed

@@ -4,8 +4,11 @@ from typing import Optional
 from hyperbrowser.models.consts import POLLING_ATTEMPTS
 from ....models.scrape import (
     BatchScrapeJobResponse,
+    BatchScrapeJobStatusResponse,
     GetBatchScrapeJobParams,
     ScrapeJobResponse,
+    ScrapeJobStatus,
+    ScrapeJobStatusResponse,
     StartBatchScrapeJobParams,
     StartBatchScrapeJobResponse,
     StartScrapeJobParams,
@@ -27,11 +30,18 @@ class BatchScrapeManager:
         )
         return StartBatchScrapeJobResponse(**response.data)
+    async def get_status(self, job_id: str) -> BatchScrapeJobStatusResponse:
+        response = await self._client.transport.get(
+            self._client._build_url(f"/scrape/batch/{job_id}/status")
+        )
+        return BatchScrapeJobStatusResponse(**response.data)
     async def get(
         self, job_id: str, params: GetBatchScrapeJobParams = GetBatchScrapeJobParams()
     ) -> BatchScrapeJobResponse:
         response = await self._client.transport.get(
-            self._client._build_url(f"/scrape/batch/{job_id}"), params=params.__dict__
+            self._client._build_url(f"/scrape/batch/{job_id}"),
+            params=params.model_dump(exclude_none=True, by_alias=True),
         )
         return BatchScrapeJobResponse(**response.data)
@@ -43,19 +53,14 @@ class BatchScrapeManager:
         if not job_id:
             raise HyperbrowserError("Failed to start batch scrape job")
-        job_response: BatchScrapeJobResponse
+        job_status: ScrapeJobStatus = "pending"
         failures = 0
         while True:
             try:
-                job_response = await self.get(
-                    job_id, params=GetBatchScrapeJobParams(batch_size=1)
-                )
-                if (
-                    job_response.status == "completed"
-                    or job_response.status == "failed"
-                ):
+                job_status_resp = await self.get_status(job_id)
+                job_status = job_status_resp.status
+                if job_status == "completed" or job_status == "failed":
                     break
-                failures = 0
             except Exception as e:
                 failures += 1
                 if failures >= POLLING_ATTEMPTS:
@@ -68,8 +73,7 @@ class BatchScrapeManager:
         if not return_all_pages:
             while True:
                 try:
-                    job_response = await self.get(job_id)
-                    return job_response
+                    return await self.get(job_id)
                 except Exception as e:
                     failures += 1
                     if failures >= POLLING_ATTEMPTS:
@@ -79,9 +83,21 @@ class BatchScrapeManager:
                 await asyncio.sleep(0.5)
         failures = 0
-        job_response.current_page_batch = 0
-        job_response.data = []
-        while job_response.current_page_batch < job_response.total_page_batches:
+        job_response = BatchScrapeJobResponse(
+            jobId=job_id,
+            status=job_status,
+            data=[],
+            currentPageBatch=0,
+            totalPageBatches=0,
+            totalScrapedPages=0,
+            batchSize=100,
+        )
+        first_check = True
+        while (
+            first_check
+            or job_response.current_page_batch < job_response.total_page_batches
+        ):
             try:
                 tmp_job_response = await self.get(
                     job_id,
@@ -96,6 +112,7 @@ class BatchScrapeManager:
                 job_response.total_page_batches = tmp_job_response.total_page_batches
                 job_response.batch_size = tmp_job_response.batch_size
                 failures = 0
+                first_check = False
             except Exception as e:
                 failures += 1
                 if failures >= POLLING_ATTEMPTS:
@@ -119,6 +136,12 @@ class ScrapeManager:
         )
         return StartScrapeJobResponse(**response.data)
+    async def get_status(self, job_id: str) -> ScrapeJobStatusResponse:
+        response = await self._client.transport.get(
+            self._client._build_url(f"/scrape/{job_id}/status")
+        )
+        return ScrapeJobStatusResponse(**response.data)
     async def get(self, job_id: str) -> ScrapeJobResponse:
         response = await self._client.transport.get(
             self._client._build_url(f"/scrape/{job_id}")
@@ -134,12 +157,10 @@ class ScrapeManager:
         failures = 0
         while True:
             try:
-                job_response = await self.get(job_id)
-                if (
-                    job_response.status == "completed"
-                    or job_response.status == "failed"
-                ):
-                    return job_response
+                job_status_resp = await self.get_status(job_id)
+                job_status = job_status_resp.status
+                if job_status == "completed" or job_status == "failed":
+                    return await self.get(job_id)
                 failures = 0
             except Exception as e:
                 failures += 1

{hyperbrowser-0.33.0 → hyperbrowser-0.35.0}/hyperbrowser/client/managers/async_manager/session.py RENAMED Viewed

@@ -42,7 +42,8 @@ class SessionManager:
         self, params: SessionListParams = SessionListParams()
     ) -> SessionListResponse:
         response = await self._client.transport.get(
-            self._client._build_url("/sessions"), params=params.__dict__
+            self._client._build_url("/sessions"),
+            params=params.model_dump(exclude_none=True, by_alias=True),
         )
         return SessionListResponse(**response.data)

{hyperbrowser-0.33.0/hyperbrowser/client/managers/sync_manager/beta → hyperbrowser-0.35.0/hyperbrowser/client/managers/sync_manager}/agents/__init__.py RENAMED Viewed

@@ -1,5 +1,6 @@
+from .browser_use import BrowserUseManager
 class Agents:
     def __init__(self, client):
-        from .browser_use import BrowserUseManager
         self.browser_use = BrowserUseManager(client)

{hyperbrowser-0.33.0/hyperbrowser/client/managers/sync_manager/beta → hyperbrowser-0.35.0/hyperbrowser/client/managers/sync_manager}/agents/browser_use.py RENAMED Viewed

@@ -1,12 +1,14 @@
 import time
 from hyperbrowser.exceptions import HyperbrowserError
-from ......models import (
+from .....models import (
     POLLING_ATTEMPTS,
     BasicResponse,
+    BrowserUseTaskResponse,
+    BrowserUseTaskStatusResponse,
     StartBrowserUseTaskParams,
     StartBrowserUseTaskResponse,
-    BrowserUseTaskStatusResponse,
-    BrowserUseTaskResponse,
 )

{hyperbrowser-0.33.0 → hyperbrowser-0.35.0}/hyperbrowser/client/managers/sync_manager/crawl.py RENAMED Viewed

@@ -4,6 +4,8 @@ from typing import Optional
 from hyperbrowser.models.consts import POLLING_ATTEMPTS
 from ....models.crawl import (
     CrawlJobResponse,
+    CrawlJobStatus,
+    CrawlJobStatusResponse,
     GetCrawlJobParams,
     StartCrawlJobParams,
     StartCrawlJobResponse,
@@ -22,11 +24,18 @@ class CrawlManager:
         )
         return StartCrawlJobResponse(**response.data)
+    def get_status(self, job_id: str) -> CrawlJobStatusResponse:
+        response = self._client.transport.get(
+            self._client._build_url(f"/crawl/{job_id}/status")
+        )
+        return CrawlJobStatusResponse(**response.data)
     def get(
         self, job_id: str, params: GetCrawlJobParams = GetCrawlJobParams()
     ) -> CrawlJobResponse:
         response = self._client.transport.get(
-            self._client._build_url(f"/crawl/{job_id}"), params=params.__dict__
+            self._client._build_url(f"/crawl/{job_id}"),
+            params=params.model_dump(exclude_none=True, by_alias=True),
         )
         return CrawlJobResponse(**response.data)
@@ -38,18 +47,13 @@ class CrawlManager:
         if not job_id:
             raise HyperbrowserError("Failed to start crawl job")
-        job_response: CrawlJobResponse
+        job_status: CrawlJobStatus = "pending"
         failures = 0
         while True:
             try:
-                job_response = self.get(
-                    job_id,
-                    params=GetCrawlJobParams(batch_size=1),
-                )
-                if (
-                    job_response.status == "completed"
-                    or job_response.status == "failed"
-                ):
+                job_status_resp = self.get_status(job_id)
+                job_status = job_status_resp.status
+                if job_status == "completed" or job_status == "failed":
                     break
             except Exception as e:
                 failures += 1
@@ -63,8 +67,7 @@ class CrawlManager:
         if not return_all_pages:
             while True:
                 try:
-                    job_response = self.get(job_id)
-                    return job_response
+                    return self.get(job_id)
                 except Exception as e:
                     failures += 1
                     if failures >= POLLING_ATTEMPTS:
@@ -74,12 +77,23 @@ class CrawlManager:
                 time.sleep(0.5)
         failures = 0
-        job_response.current_page_batch = 0
-        job_response.data = []
-        while job_response.current_page_batch < job_response.total_page_batches:
+        job_response = CrawlJobResponse(
+            jobId=job_id,
+            status=job_status,
+            data=[],
+            currentPageBatch=0,
+            totalPageBatches=0,
+            totalCrawledPages=0,
+            batchSize=100,
+        )
+        first_check = True
+        while (
+            first_check
+            or job_response.current_page_batch < job_response.total_page_batches
+        ):
             try:
                 tmp_job_response = self.get(
-                    job_id,
+                    job_start_resp.job_id,
                     GetCrawlJobParams(
                         page=job_response.current_page_batch + 1, batch_size=100
                     ),
@@ -91,6 +105,7 @@ class CrawlManager:
                 job_response.total_page_batches = tmp_job_response.total_page_batches
                 job_response.batch_size = tmp_job_response.batch_size
                 failures = 0
+                first_check = False
             except Exception as e:
                 failures += 1
                 if failures >= POLLING_ATTEMPTS:

{hyperbrowser-0.33.0 → hyperbrowser-0.35.0}/hyperbrowser/client/managers/sync_manager/extract.py RENAMED Viewed

@@ -3,9 +3,11 @@ from hyperbrowser.exceptions import HyperbrowserError
 from hyperbrowser.models.consts import POLLING_ATTEMPTS
 from hyperbrowser.models.extract import (
     ExtractJobResponse,
+    ExtractJobStatusResponse,
     StartExtractJobParams,
     StartExtractJobResponse,
 )
+import jsonref
 class ExtractManager:
@@ -17,7 +19,9 @@ class ExtractManager:
             raise HyperbrowserError("Either schema or prompt must be provided")
         if params.schema_:
             if hasattr(params.schema_, "model_json_schema"):
-                params.schema_ = params.schema_.model_json_schema()
+                params.schema_ = jsonref.replace_refs(
+                    params.schema_.model_json_schema(), proxies=False, lazy_load=False
+                )
         response = self._client.transport.post(
             self._client._build_url("/extract"),
@@ -25,6 +29,12 @@ class ExtractManager:
         )
         return StartExtractJobResponse(**response.data)
+    def get_status(self, job_id: str) -> ExtractJobStatusResponse:
+        response = self._client.transport.get(
+            self._client._build_url(f"/extract/{job_id}/status")
+        )
+        return ExtractJobStatusResponse(**response.data)
     def get(self, job_id: str) -> ExtractJobResponse:
         response = self._client.transport.get(
             self._client._build_url(f"/extract/{job_id}")
@@ -40,12 +50,10 @@ class ExtractManager:
         failures = 0
         while True:
             try:
-                job_response = self.get(job_start_resp.job_id)
-                if (
-                    job_response.status == "completed"
-                    or job_response.status == "failed"
-                ):
-                    return job_response
+                job_status_resp = self.get_status(job_id)
+                job_status = job_status_resp.status
+                if job_status == "completed" or job_status == "failed":
+                    return self.get(job_id)
             except Exception as e:
                 failures += 1
                 if failures >= POLLING_ATTEMPTS:

{hyperbrowser-0.33.0 → hyperbrowser-0.35.0}/hyperbrowser/client/managers/sync_manager/profile.py RENAMED Viewed

@@ -33,6 +33,7 @@ class ProfileManager:
         self, params: ProfileListParams = ProfileListParams()
     ) -> ProfileListResponse:
         response = self._client.transport.get(
-            self._client._build_url("/profiles"), params=params.__dict__
+            self._client._build_url("/profiles"),
+            params=params.model_dump(exclude_none=True, by_alias=True),
         )
         return ProfileListResponse(**response.data)

hyperbrowser 0.33.0__tar.gz → 0.35.0__tar.gz

Potentially problematic release.

hyperbrowser 0.33.0tar.gz → 0.35.0tar.gz