PyPI - pydocket - Versions diffs - 0.0.1__py3-none-any.whl → 0.1.0__py3-none-any.whl - Mend

pydocket 0.0.1py3-none-any.whl → 0.1.0py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Potentially problematic release.

This version of pydocket might be problematic. Click here for more details.

Files changed (16) hide show

docket/__init__.py +15 -1
docket/annotations.py +30 -0
docket/cli.py +673 -7
docket/dependencies.py +79 -1
docket/docket.py +453 -36
docket/execution.py +300 -4
docket/instrumentation.py +121 -0
docket/tasks.py +57 -0
docket/worker.py +365 -113
pydocket-0.1.0.dist-info/METADATA +388 -0
pydocket-0.1.0.dist-info/RECORD +16 -0
pydocket-0.0.1.dist-info/METADATA +0 -31
pydocket-0.0.1.dist-info/RECORD +0 -13
{pydocket-0.0.1.dist-info → pydocket-0.1.0.dist-info}/WHEEL +0 -0
{pydocket-0.0.1.dist-info → pydocket-0.1.0.dist-info}/entry_points.txt +0 -0
{pydocket-0.0.1.dist-info → pydocket-0.1.0.dist-info}/licenses/LICENSE +0 -0

docket/worker.py CHANGED Viewed

@@ -1,21 +1,48 @@
+import asyncio
+import inspect
 import logging
 import sys
-from datetime import datetime, timezone
+from datetime import datetime, timedelta, timezone
 from types import TracebackType
-from typing import TYPE_CHECKING, Any, Protocol, Self, Sequence, TypeVar, cast
+from typing import (
+    TYPE_CHECKING,
+    Any,
+    Protocol,
+    Self,
+    TypeVar,
+    cast,
+)
 from uuid import uuid4
-from redis import RedisError
-from .docket import Docket, Execution
+import redis.exceptions
+from opentelemetry import propagate, trace
+from opentelemetry.trace import Tracer
+from .docket import (
+    Docket,
+    Execution,
+    RedisMessage,
+    RedisMessageID,
+    RedisMessages,
+    RedisReadGroupResponse,
+)
+from .instrumentation import (
+    REDIS_DISRUPTIONS,
+    TASK_DURATION,
+    TASK_PUNCTUALITY,
+    TASKS_COMPLETED,
+    TASKS_FAILED,
+    TASKS_RETRIED,
+    TASKS_RUNNING,
+    TASKS_STARTED,
+    TASKS_STRICKEN,
+    TASKS_SUCCEEDED,
+    message_getter,
+)
 logger: logging.Logger = logging.getLogger(__name__)
+tracer: Tracer = trace.get_tracer(__name__)
-RedisStreamID = bytes
-RedisMessageID = bytes
-RedisMessage = dict[bytes, bytes]
-RedisStream = tuple[RedisStreamID, Sequence[tuple[RedisMessageID, RedisMessage]]]
-RedisReadGroupResponse = Sequence[RedisStream]
 if TYPE_CHECKING:  # pragma: no cover
     from .dependencies import Dependency
@@ -30,26 +57,27 @@ class _stream_due_tasks(Protocol):
 class Worker:
-    name: str
     docket: Docket
+    name: str
-    prefetch_count: int = 10
-    def __init__(self, docket: Docket) -> None:
-        self.name = f"worker:{uuid4()}"
+    def __init__(
+        self,
+        docket: Docket,
+        name: str | None = None,
+        concurrency: int = 10,
+        redelivery_timeout: timedelta = timedelta(minutes=5),
+        reconnection_delay: timedelta = timedelta(seconds=5),
+        minimum_check_interval: timedelta = timedelta(milliseconds=10),
+    ) -> None:
         self.docket = docket
+        self.name = name or f"worker:{uuid4()}"
+        self.concurrency = concurrency
+        self.redelivery_timeout = redelivery_timeout
+        self.reconnection_delay = reconnection_delay
+        self.minimum_check_interval = minimum_check_interval
     async def __aenter__(self) -> Self:
-        async with self.docket.redis() as redis:
-            try:
-                await redis.xgroup_create(
-                    groupname=self.consumer_group_name,
-                    name=self.docket.stream_key,
-                    id="0-0",
-                    mkstream=True,
-                )
-            except RedisError as e:
-                assert "BUSYGROUP" in repr(e)
+        self._heartbeat_task = asyncio.create_task(self._heartbeat())
         return self
@@ -59,11 +87,12 @@ class Worker:
         exc_value: BaseException | None,
         traceback: TracebackType | None,
     ) -> None:
-        pass
-    @property
-    def consumer_group_name(self) -> str:
-        return "docket"
+        self._heartbeat_task.cancel()
+        try:
+            await self._heartbeat_task
+        except asyncio.CancelledError:
+            pass
+        del self._heartbeat_task
     @property
     def _log_context(self) -> dict[str, str]:
@@ -72,7 +101,63 @@ class Worker:
             "stream_key": self.docket.stream_key,
         }
-    async def run_until_current(self) -> None:
+    @classmethod
+    async def run(
+        cls,
+        docket_name: str = "docket",
+        url: str = "redis://localhost:6379/0",
+        name: str | None = None,
+        concurrency: int = 10,
+        redelivery_timeout: timedelta = timedelta(minutes=5),
+        reconnection_delay: timedelta = timedelta(seconds=5),
+        until_finished: bool = False,
+        tasks: list[str] = ["docket.tasks:standard_tasks"],
+    ) -> None:
+        async with Docket(name=docket_name, url=url) as docket:
+            for task_path in tasks:
+                docket.register_collection(task_path)
+            async with Worker(
+                docket=docket,
+                name=name,
+                concurrency=concurrency,
+                redelivery_timeout=redelivery_timeout,
+                reconnection_delay=reconnection_delay,
+            ) as worker:
+                if until_finished:
+                    await worker.run_until_finished()
+                else:
+                    await worker.run_forever()  # pragma: no cover
+    async def run_until_finished(self) -> None:
+        """Run the worker until there are no more tasks to process."""
+        return await self._run(forever=False)
+    async def run_forever(self) -> None:
+        """Run the worker indefinitely."""
+        return await self._run(forever=True)  # pragma: no cover
+    async def _run(self, forever: bool = False) -> None:
+        logger.info("Starting worker %r with the following tasks:", self.name)
+        for task_name, task in self.docket.tasks.items():
+            signature = inspect.signature(task)
+            logger.info("* %s%s", task_name, signature)
+        while True:
+            try:
+                return await self._worker_loop(forever=forever)
+            except redis.exceptions.ConnectionError:
+                REDIS_DISRUPTIONS.add(
+                    1, {"docket": self.docket.name, "worker": self.name}
+                )
+                logger.warning(
+                    "Error connecting to redis, retrying in %s...",
+                    self.reconnection_delay,
+                    exc_info=True,
+                )
+                await asyncio.sleep(self.reconnection_delay.total_seconds())
+    async def _worker_loop(self, forever: bool = False):
         async with self.docket.redis() as redis:
             stream_due_tasks: _stream_due_tasks = cast(
                 _stream_due_tasks,
@@ -119,84 +204,198 @@ class Worker:
                 ),
             )
-            total_work, due_work = sys.maxsize, 0
-            while total_work:
-                now = datetime.now(timezone.utc)
-                total_work, due_work = await stream_due_tasks(
-                    keys=[self.docket.queue_key, self.docket.stream_key],
-                    args=[now.timestamp(), self.docket.name],
-                )
-                logger.info(
-                    "Moved %d/%d due tasks from %s to %s",
-                    due_work,
-                    total_work,
-                    self.docket.queue_key,
-                    self.docket.stream_key,
-                    extra=self._log_context,
-                )
+            active_tasks: dict[asyncio.Task[None], RedisMessageID] = {}
-                response: RedisReadGroupResponse = await redis.xreadgroup(
-                    groupname=self.consumer_group_name,
-                    consumername=self.name,
-                    streams={self.docket.stream_key: ">"},
-                    count=self.prefetch_count,
-                    block=10,
-                )
-                for _, messages in response:
-                    for message_id, message in messages:
-                        await self._execute(message)
-                        # When executing a task, there's always a chance that it was
-                        # either retried or it scheduled another task, so let's give
-                        # ourselves one more iteration of the loop to handle that.
-                        total_work += 1
-                        async with redis.pipeline() as pipe:
-                            pipe.xack(
-                                self.docket.stream_key,
-                                self.consumer_group_name,
-                                message_id,
-                            )
-                            pipe.xdel(
-                                self.docket.stream_key,
-                                message_id,
-                            )
-                            await pipe.execute()
+            async def process_completed_tasks() -> None:
+                completed_tasks = {task for task in active_tasks if task.done()}
+                for task in completed_tasks:
+                    message_id = active_tasks.pop(task)
+                    await task
+                    async with redis.pipeline() as pipeline:
+                        pipeline.xack(
+                            self.docket.stream_key,
+                            self.docket.worker_group_name,
+                            message_id,
+                        )
+                        pipeline.xdel(
+                            self.docket.stream_key,
+                            message_id,
+                        )
+                        await pipeline.execute()
+            future_work, due_work = sys.maxsize, 0
+            try:
+                while forever or future_work or active_tasks:
+                    await process_completed_tasks()
+                    available_slots = self.concurrency - len(active_tasks)
+                    def start_task(
+                        message_id: RedisMessageID, message: RedisMessage
+                    ) -> None:
+                        task = asyncio.create_task(self._execute(message))
+                        active_tasks[task] = message_id
+                        nonlocal available_slots, future_work
+                        available_slots -= 1
+                        future_work += 1
+                    if available_slots <= 0:
+                        await asyncio.sleep(self.minimum_check_interval.total_seconds())
+                        continue
+                    future_work, due_work = await stream_due_tasks(
+                        keys=[self.docket.queue_key, self.docket.stream_key],
+                        args=[datetime.now(timezone.utc).timestamp(), self.docket.name],
+                    )
+                    if due_work > 0:
+                        logger.debug(
+                            "Moved %d/%d due tasks from %s to %s",
+                            due_work,
+                            future_work,
+                            self.docket.queue_key,
+                            self.docket.stream_key,
+                            extra=self._log_context,
+                        )
+                    redeliveries: RedisMessages
+                    _, redeliveries, _ = await redis.xautoclaim(
+                        name=self.docket.stream_key,
+                        groupname=self.docket.worker_group_name,
+                        consumername=self.name,
+                        min_idle_time=int(
+                            self.redelivery_timeout.total_seconds() * 1000
+                        ),
+                        start_id="0-0",
+                        count=available_slots,
+                    )
+                    for message_id, message in redeliveries:
+                        start_task(message_id, message)
+                        if available_slots <= 0:
+                            break
+                    if available_slots <= 0:
+                        continue
+                    new_deliveries: RedisReadGroupResponse = await redis.xreadgroup(
+                        groupname=self.docket.worker_group_name,
+                        consumername=self.name,
+                        streams={self.docket.stream_key: ">"},
+                        block=(
+                            int(self.minimum_check_interval.total_seconds() * 1000)
+                            if forever or active_tasks
+                            else None
+                        ),
+                        count=available_slots,
+                    )
+                    for _, messages in new_deliveries:
+                        for message_id, message in messages:
+                            start_task(message_id, message)
+                            if available_slots <= 0:
+                                break
+            except asyncio.CancelledError:
+                if active_tasks:  # pragma: no cover
+                    logger.info(
+                        "Shutdown requested, finishing %d active tasks...",
+                        len(active_tasks),
+                        extra=self._log_context,
+                    )
+            finally:
+                if active_tasks:
+                    await asyncio.gather(*active_tasks, return_exceptions=True)
+                    await process_completed_tasks()
     async def _execute(self, message: RedisMessage) -> None:
-        execution = Execution.from_message(
-            self.docket.tasks[message[b"function"].decode()],
-            message,
-        )
-        logger.info(
-            "Executing task %s with args %s and kwargs %s",
-            execution.key,
-            execution.args,
-            execution.kwargs,
-            extra={
-                **self._log_context,
-                "function": execution.function.__name__,
-            },
-        )
+        function_name = message[b"function"].decode()
+        function = self.docket.tasks.get(function_name)
+        if function is None:
+            logger.warning(
+                "Task function %r not found", function_name, extra=self._log_context
+            )
+            return
+        execution = Execution.from_message(function, message)
+        name = execution.function.__name__
+        key = execution.key
+        log_context: dict[str, str | float] = {
+            **self._log_context,
+            "task": name,
+            "key": key,
+        }
+        counter_labels = {
+            "docket": self.docket.name,
+            "worker": self.name,
+            "task": name,
+        }
+        arrow = "↬" if execution.attempt > 1 else "↪"
+        call = execution.call_repr()
+        if self.docket.strike_list.is_stricken(execution):
+            arrow = "🗙"
+            logger.warning("%s %s", arrow, call, extra=log_context)
+            TASKS_STRICKEN.add(1, counter_labels | {"where": "worker"})
+            return
         dependencies = self._get_dependencies(execution)
+        context = propagate.extract(message, getter=message_getter)
+        initiating_context = trace.get_current_span(context).get_span_context()
+        links = [trace.Link(initiating_context)] if initiating_context.is_valid else []
+        start = datetime.now(timezone.utc)
+        punctuality = start - execution.when
+        log_context["punctuality"] = punctuality.total_seconds()
+        duration = timedelta(0)
+        TASKS_STARTED.add(1, counter_labels)
+        TASKS_RUNNING.add(1, counter_labels)
+        TASK_PUNCTUALITY.record(punctuality.total_seconds(), counter_labels)
+        logger.info("%s [%s] %s", arrow, punctuality, call, extra=log_context)
         try:
-            await execution.function(
-                *execution.args,
-                **{
-                    **execution.kwargs,
-                    **dependencies,
+            with tracer.start_as_current_span(
+                execution.function.__name__,
+                kind=trace.SpanKind.CONSUMER,
+                attributes={
+                    "docket.name": self.docket.name,
+                    "docket.execution.when": execution.when.isoformat(),
+                    "docket.execution.key": execution.key,
+                    "docket.execution.attempt": execution.attempt,
+                    "docket.execution.punctuality": punctuality.total_seconds(),
+                    "code.function.name": execution.function.__name__,
                 },
-            )
+                links=links,
+            ):
+                await execution.function(
+                    *execution.args,
+                    **{
+                        **execution.kwargs,
+                        **dependencies,
+                    },
+                )
+            TASKS_SUCCEEDED.add(1, counter_labels)
+            duration = datetime.now(timezone.utc) - start
+            log_context["duration"] = duration.total_seconds()
+            logger.info("%s [%s] %s", "↩", duration, call, extra=log_context)
         except Exception:
-            logger.exception(
-                "Error executing task %s",
-                execution.key,
-                extra=self._log_context,
-            )
-            await self._retry_if_requested(execution, dependencies)
+            TASKS_FAILED.add(1, counter_labels)
+            duration = datetime.now(timezone.utc) - start
+            log_context["duration"] = duration.total_seconds()
+            retried = await self._retry_if_requested(execution, dependencies)
+            arrow = "↫" if retried else "↩"
+            logger.exception("%s [%s] %s", arrow, duration, call, extra=log_context)
+        finally:
+            TASKS_RUNNING.add(-1, counter_labels)
+            TASKS_COMPLETED.add(1, counter_labels)
+            TASK_DURATION.record(duration.total_seconds(), counter_labels)
     def _get_dependencies(
         self,
@@ -208,14 +407,14 @@ class Worker:
         dependencies: dict[str, Any] = {}
-        for param_name, dependency in parameters.items():
+        for parameter_name, dependency in parameters.items():
             # If the argument is already provided, skip it, which allows users to call
             # the function directly with the arguments they want.
-            if param_name in execution.kwargs:
-                dependencies[param_name] = execution.kwargs[param_name]
+            if parameter_name in execution.kwargs:
+                dependencies[parameter_name] = execution.kwargs[parameter_name]
                 continue
-            dependencies[param_name] = dependency(self.docket, self, execution)
+            dependencies[parameter_name] = dependency(self.docket, self, execution)
         return dependencies
@@ -223,22 +422,75 @@ class Worker:
         self,
         execution: Execution,
         dependencies: dict[str, Any],
-    ) -> None:
+    ) -> bool:
         from .dependencies import Retry
         retries = [retry for retry in dependencies.values() if isinstance(retry, Retry)]
         if not retries:
-            return
+            return False
         retry = retries[0]
-        if execution.attempt < retry.attempts:
+        if retry.attempts is None or execution.attempt < retry.attempts:
             execution.when = datetime.now(timezone.utc) + retry.delay
             execution.attempt += 1
             await self.docket.schedule(execution)
-        else:
-            logger.error(
-                "Task %s failed after %d attempts",
-                execution.key,
-                retry.attempts,
-            )
+            counter_labels = {
+                "docket": self.docket.name,
+                "worker": self.name,
+                "task": execution.function.__name__,
+            }
+            TASKS_RETRIED.add(1, counter_labels)
+            return True
+        return False
+    @property
+    def workers_set(self) -> str:
+        return self.docket.workers_set
+    def worker_tasks_set(self, worker_name: str) -> str:
+        return self.docket.worker_tasks_set(worker_name)
+    def task_workers_set(self, task_name: str) -> str:
+        return self.docket.task_workers_set(task_name)
+    async def _heartbeat(self) -> None:
+        while True:
+            await asyncio.sleep(self.docket.heartbeat_interval.total_seconds())
+            try:
+                now = datetime.now(timezone.utc).timestamp()
+                maximum_age = (
+                    self.docket.heartbeat_interval * self.docket.missed_heartbeats
+                )
+                oldest = now - maximum_age.total_seconds()
+                task_names = list(self.docket.tasks)
+                async with self.docket.redis() as r:
+                    async with r.pipeline() as pipeline:
+                        pipeline.zremrangebyscore(self.workers_set, 0, oldest)
+                        pipeline.zadd(self.workers_set, {self.name: now})
+                        for task_name in task_names:
+                            task_workers_set = self.task_workers_set(task_name)
+                            pipeline.zremrangebyscore(task_workers_set, 0, oldest)
+                            pipeline.zadd(task_workers_set, {self.name: now})
+                        pipeline.sadd(self.worker_tasks_set(self.name), *task_names)
+                        pipeline.expire(
+                            self.worker_tasks_set(self.name),
+                            max(maximum_age, timedelta(seconds=1)),
+                        )
+                        await pipeline.execute()
+            except asyncio.CancelledError:  # pragma: no cover
+                return
+            except redis.exceptions.ConnectionError:
+                REDIS_DISRUPTIONS.add(
+                    1, {"docket": self.docket.name, "worker": self.name}
+                )
+                logger.exception("Error sending worker heartbeat", exc_info=True)
+            except Exception:
+                logger.exception("Error sending worker heartbeat", exc_info=True)

pydocket 0.0.1__py3-none-any.whl → 0.1.0__py3-none-any.whl

Potentially problematic release.

pydocket 0.0.1py3-none-any.whl → 0.1.0py3-none-any.whl