PyPI - mrd-python - Versions diffs - 2.0.0rc1__py3-none-any.whl - Mend

mrd-python 2.0.0rc1__py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (19) hide show

mrd/__init__.py +96 -0
mrd/_binary.py +1339 -0
mrd/_dtypes.py +89 -0
mrd/_ndjson.py +1194 -0
mrd/binary.py +680 -0
mrd/ndjson.py +2716 -0
mrd/protocols.py +180 -0
mrd/tools/export_png_images.py +39 -0
mrd/tools/phantom.py +161 -0
mrd/tools/simulation.py +173 -0
mrd/tools/stream_recon.py +184 -0
mrd/tools/transform.py +37 -0
mrd/types.py +1714 -0
mrd/yardl_types.py +303 -0
mrd_python-2.0.0rc1.dist-info/LICENSE +8 -0
mrd_python-2.0.0rc1.dist-info/METADATA +28 -0
mrd_python-2.0.0rc1.dist-info/RECORD +19 -0
mrd_python-2.0.0rc1.dist-info/WHEEL +5 -0
mrd_python-2.0.0rc1.dist-info/top_level.txt +1 -0

mrd/_binary.py ADDED Viewed

@@ -0,0 +1,1339 @@
+# Copyright (c) Microsoft Corporation.
+# Licensed under the MIT License.
+# pyright: reportUnnecessaryIsInstance=false
+import datetime
+from enum import Enum
+from io import BufferedIOBase, BufferedReader, BytesIO
+from typing import (
+    BinaryIO,
+    Iterable,
+    Protocol,
+    TypeVar,
+    Generic,
+    Any,
+    Optional,
+    Tuple,
+    cast,
+)
+from abc import ABC, abstractmethod
+import struct
+import sys
+import numpy as np
+from numpy.lib import recfunctions
+import numpy.typing as npt
+from .yardl_types import *
+if sys.byteorder != "little":
+    raise RuntimeError("Only little-endian systems are currently supported")
+MAGIC_BYTES: bytes = b"yardl"
+CURRENT_BINARY_FORMAT_VERSION: int = 1
+INT8_MIN: int = np.iinfo(np.int8).min
+INT8_MAX: int = np.iinfo(np.int8).max
+UINT8_MAX: int = np.iinfo(np.uint8).max
+INT16_MIN: int = np.iinfo(np.int16).min
+INT16_MAX: int = np.iinfo(np.int16).max
+UINT16_MAX: int = np.iinfo(np.uint16).max
+INT32_MIN: int = np.iinfo(np.int32).min
+INT32_MAX: int = np.iinfo(np.int32).max
+UINT32_MAX: int = np.iinfo(np.uint32).max
+INT64_MIN: int = np.iinfo(np.int64).min
+INT64_MAX: int = np.iinfo(np.int64).max
+UINT64_MAX: int = np.iinfo(np.uint64).max
+class BinaryProtocolWriter(ABC):
+    def __init__(self, stream: Union[BinaryIO, str], schema: str) -> None:
+        self._stream = CodedOutputStream(stream)
+        self._stream.write_bytes(MAGIC_BYTES)
+        write_fixed_int32(self._stream, CURRENT_BINARY_FORMAT_VERSION)
+        string_serializer.write(self._stream, schema)
+    def _close(self) -> None:
+        self._stream.close()
+    def _end_stream(self) -> None:
+        self._stream.ensure_capacity(1)
+        self._stream.write_byte_no_check(0)
+class BinaryProtocolReader(ABC):
+    def __init__(
+        self,
+        stream: Union[BufferedReader, BytesIO, BinaryIO, str],
+        expected_schema: Optional[str],
+    ) -> None:
+        self._stream = CodedInputStream(stream)
+        magic_bytes = self._stream.read_view(len(MAGIC_BYTES))
+        if magic_bytes != MAGIC_BYTES:  # pyright: ignore [reportUnnecessaryComparison]
+            raise RuntimeError("Invalid magic bytes")
+        version = read_fixed_int32(self._stream)
+        if version != CURRENT_BINARY_FORMAT_VERSION:
+            raise RuntimeError("Invalid binary format version")
+        self._schema = string_serializer.read(self._stream)
+        if expected_schema and self._schema != expected_schema:
+            raise RuntimeError("Invalid schema")
+    def _close(self) -> None:
+        self._stream.close()
+class CodedOutputStream:
+    def __init__(
+        self, stream: Union[BinaryIO, str], *, buffer_size: int = 65536
+    ) -> None:
+        if isinstance(stream, str):
+            self._stream = cast(BinaryIO, open(stream, "wb"))
+            self._owns_stream = True
+        else:
+            self._stream = stream
+            self._owns_stream = False
+        self._buffer = bytearray(buffer_size)
+        self._offset = 0
+    def close(self) -> None:
+        self.flush()
+        if self._owns_stream:
+            self._stream.close()
+    def ensure_capacity(self, size: int) -> None:
+        if (len(self._buffer) - self._offset) < size:
+            self.flush()
+    def flush(self) -> None:
+        if self._offset > 0:
+            self._stream.write(self._buffer[: self._offset])
+            self._stream.flush()
+            self._offset = 0
+    def write(self, formatter: struct.Struct, *args: Any) -> None:
+        size = formatter.size
+        if (len(self._buffer) - self._offset) < size:
+            self.flush()
+        formatter.pack_into(self._buffer, self._offset, *args)
+        self._offset += size
+    def write_bytes(self, data: Union[bytes, bytearray]) -> None:
+        if len(data) > (len(self._buffer) - self._offset):
+            self.flush()
+            self._stream.write(data)
+        else:
+            self._buffer[self._offset : self._offset + len(data)] = data
+            self._offset += len(data)
+    def write_bytes_directly(self, data: Union[bytes, bytearray, memoryview]) -> None:
+        self.flush()
+        self._stream.write(data)
+    def write_byte_no_check(self, value: int) -> None:
+        assert 0 <= value <= UINT8_MAX
+        self._buffer[self._offset] = value
+        self._offset += 1
+    def write_unsigned_varint(
+        self,
+        value: Union[int, np.uint8, np.uint16, np.uint32, np.uint64],
+    ) -> None:
+        if (len(self._buffer) - self._offset) < 10:
+            self.flush()
+        int_val = int(value)  # bitwise ops not supported on numpy types
+        while True:
+            if int_val < 0x80:
+                self.write_byte_no_check(int_val)
+                return
+            self.write_byte_no_check((int_val & 0x7F) | 0x80)
+            int_val >>= 7
+    def zigzag_encode(
+        self,
+        value: Union[int, np.int8, np.int16, np.int32, np.int64],
+    ) -> int:
+        int_val = int(value)
+        return (int_val << 1) ^ (int_val >> 63)
+    def write_signed_varint(
+        self,
+        value: Union[int, np.int8, np.int16, np.int32, np.int64],
+    ) -> None:
+        self.write_unsigned_varint(self.zigzag_encode(value))
+class CodedInputStream:
+    def __init__(
+        self,
+        stream: Union[BufferedReader, BytesIO, BinaryIO, str],
+        *,
+        buffer_size: int = 65536,
+    ) -> None:
+        if isinstance(stream, str):
+            self._stream = open(stream, "rb")
+            self._owns_stream = True
+        else:
+            if not isinstance(stream, BufferedIOBase):
+                self._stream = BufferedReader(stream)  # type: ignore
+            else:
+                self._stream = stream
+            self._owns_stream = False
+        self._last_read_count = 0
+        self._buffer = bytearray(buffer_size)
+        self._view = memoryview(self._buffer)
+        self._offset = 0
+        self._at_end = False
+    def close(self) -> None:
+        if self._owns_stream:
+            self._stream.close()
+    def read(self, formatter: struct.Struct) -> tuple[Any, ...]:
+        if self._last_read_count - self._offset < formatter.size:
+            self._fill_buffer(formatter.size)
+        result = formatter.unpack_from(self._buffer, self._offset)
+        self._offset += formatter.size
+        return result
+    def read_byte(self) -> int:
+        if self._last_read_count - self._offset < 1:
+            self._fill_buffer(1)
+        result = self._buffer[self._offset]
+        self._offset += 1
+        return result
+    def read_unsigned_varint(self) -> int:
+        result = 0
+        shift = 0
+        while True:
+            if self._last_read_count - self._offset < 1:
+                self._fill_buffer(1)
+            byte = self._buffer[self._offset]
+            self._offset += 1
+            result |= (byte & 0x7F) << shift
+            if byte < 0x80:
+                return result
+            shift += 7
+    def zigzag_decode(self, value: int) -> int:
+        return (value >> 1) ^ -(value & 1)
+    def read_signed_varint(self) -> int:
+        return self.zigzag_decode(self.read_unsigned_varint())
+    def read_view(self, count: int) -> memoryview:
+        if count <= (self._last_read_count - self._offset):
+            res = self._view[self._offset : self._offset + count]
+            self._offset += count
+            return res
+        if count > len(self._buffer):
+            local_buf = bytearray(count)
+            local_view = memoryview(local_buf)
+            remaining = self._last_read_count - self._offset
+            local_view[:remaining] = self._view[self._offset : self._last_read_count]
+            self._offset = self._last_read_count
+            if self._stream.readinto(local_view[remaining:]) < count - remaining:
+                raise EOFError("Unexpected EOF")
+            return local_view
+        self._fill_buffer(count)
+        result = self._view[self._offset : self._offset + count]
+        self._offset += count
+        return result
+    def read_bytearray(self, count: int) -> bytearray:
+        if count <= (self._last_read_count - self._offset):
+            res = bytearray(self._view[self._offset : self._offset + count])
+            self._offset += count
+            return res
+        if count > len(self._buffer):
+            local_buf = bytearray(count)
+            local_view = memoryview(local_buf)
+            remaining = self._last_read_count - self._offset
+            local_view[:remaining] = self._view[self._offset : self._last_read_count]
+            self._offset = self._last_read_count
+            if self._stream.readinto(local_view[remaining:]) < count - remaining:
+                raise EOFError("Unexpected EOF")
+            return local_buf
+        self._fill_buffer(count)
+        result = self._view[self._offset : self._offset + count]
+        self._offset += count
+        return bytearray(result)
+    def _fill_buffer(self, min_count: int = 0) -> None:
+        remaining = self._last_read_count - self._offset
+        if remaining > 0:
+            remaining_view = memoryview(self._buffer)[
+                self._offset : self._offset + remaining + 1
+            ]
+            self._buffer[:remaining] = remaining_view
+        slice = memoryview(self._buffer)[remaining:]
+        self._last_read_count = self._stream.readinto(slice) + remaining
+        self._offset = 0
+        if self._last_read_count == 0:
+            self._at_end = True
+        if min_count > 0 and (self._last_read_count) < min_count:
+            raise EOFError("Unexpected EOF")
+T = TypeVar("T")
+T_NP = TypeVar("T_NP", bound=np.generic)
+class TypeSerializer(Generic[T, T_NP], ABC):
+    def __init__(self, dtype: npt.DTypeLike) -> None:
+        self._dtype: np.dtype[Any] = np.dtype(dtype)
+    def overall_dtype(self) -> np.dtype[Any]:
+        return self._dtype
+    def struct_format_str(self) -> Optional[str]:
+        return None
+    @abstractmethod
+    def write(self, stream: CodedOutputStream, value: T) -> None:
+        raise NotImplementedError
+    @abstractmethod
+    def write_numpy(self, stream: CodedOutputStream, value: T_NP) -> None:
+        raise NotImplementedError
+    @abstractmethod
+    def read(self, stream: CodedInputStream) -> T:
+        raise NotImplementedError
+    @abstractmethod
+    def read_numpy(self, stream: CodedInputStream) -> T_NP:
+        raise NotImplementedError
+    def is_trivially_serializable(self) -> bool:
+        return False
+class StructSerializer(TypeSerializer[T, T_NP]):
+    def __init__(self, numpy_type: type, format_string: str) -> None:
+        super().__init__(numpy_type)
+        self._struct = struct.Struct(format_string)
+        self._numpy_type = numpy_type
+    def write(self, stream: CodedOutputStream, value: T) -> None:
+        stream.write(self._struct, value)
+    def write_numpy(self, stream: CodedOutputStream, value: T_NP) -> None:
+        stream.write(self._struct, value)
+    def read(self, stream: CodedInputStream) -> T:
+        return cast(T, stream.read(self._struct)[0])
+    def read_numpy(self, stream: CodedInputStream) -> T_NP:
+        return cast(T_NP, self._numpy_type(stream.read(self._struct)[0]))
+    def struct_format_str(self) -> str:
+        return self._struct.format
+class BoolSerializer(StructSerializer[bool, np.bool_]):
+    def __init__(self) -> None:
+        super().__init__(np.bool_, "<?")
+    def read(self, stream: CodedInputStream) -> bool:
+        return super().read(stream)
+    def read_numpy(self, stream: CodedInputStream) -> np.bool_:
+        return super().read_numpy(stream)
+bool_serializer = BoolSerializer()
+class Int8Serializer(StructSerializer[Int8, np.int8]):
+    def __init__(self) -> None:
+        super().__init__(np.int8, "<b")
+    def read(self, stream: CodedInputStream) -> Int8:
+        return super().read(stream)
+    def is_trivially_serializable(self) -> bool:
+        return True
+int8_serializer = Int8Serializer()
+class UInt8Serializer(StructSerializer[UInt8, np.uint8]):
+    def __init__(self) -> None:
+        super().__init__(np.uint8, "<B")
+    def read(self, stream: CodedInputStream) -> UInt8:
+        return super().read(stream)
+    def is_trivially_serializable(self) -> bool:
+        return True
+uint8_serializer = UInt8Serializer()
+class Int16Serializer(TypeSerializer[Int16, np.int16]):
+    def __init__(self) -> None:
+        super().__init__(np.int16)
+    def write(self, stream: CodedOutputStream, value: Int16) -> None:
+        if isinstance(value, int):
+            if value < INT16_MIN or value > INT16_MAX:
+                raise ValueError(
+                    f"Value {value} is outside the range of a signed 16-bit integer"
+                )
+        elif not isinstance(value, cast(type, np.int16)):
+            raise ValueError(f"Value is not a signed 16-bit integer: {value}")
+        stream.write_signed_varint(value)
+    def write_numpy(self, stream: CodedOutputStream, value: np.int16) -> None:
+        stream.write_signed_varint(value)
+    def read(self, stream: CodedInputStream) -> Int16:
+        return stream.read_signed_varint()
+    def read_numpy(self, stream: CodedInputStream) -> np.int16:
+        return np.int16(stream.read_signed_varint())
+int16_serializer = Int16Serializer()
+class UInt16Serializer(TypeSerializer[UInt16, np.uint16]):
+    def __init__(self) -> None:
+        super().__init__(np.uint16)
+    def write(self, stream: CodedOutputStream, value: UInt16) -> None:
+        if isinstance(value, int):
+            if value < 0 or value > UINT16_MAX:
+                raise ValueError(
+                    f"Value {value} is outside the range of an unsigned 16-bit integer"
+                )
+        elif not isinstance(value, cast(type, np.uint16)):
+            raise ValueError(f"Value is not an unsigned 16-bit integer: {value}")
+        stream.write_unsigned_varint(value)
+    def write_numpy(self, stream: CodedOutputStream, value: np.uint16) -> None:
+        stream.write_unsigned_varint(value)
+    def read(self, stream: CodedInputStream) -> UInt16:
+        return stream.read_unsigned_varint()
+    def read_numpy(self, stream: CodedInputStream) -> np.uint16:
+        return np.uint16(stream.read_unsigned_varint())
+uint16_serializer = UInt16Serializer()
+class Int32Serializer(TypeSerializer[Int32, np.int32]):
+    def __init__(self) -> None:
+        super().__init__(np.int32)
+    def write(self, stream: CodedOutputStream, value: Int32) -> None:
+        if isinstance(value, int):
+            if value < INT32_MIN or value > INT32_MAX:
+                raise ValueError(
+                    f"Value {value} is outside the range of a signed 32-bit integer"
+                )
+        elif not isinstance(value, cast(type, np.int32)):
+            raise ValueError(f"Value is not a signed 32-bit integer: {value}")
+        stream.write_signed_varint(value)
+    def write_numpy(self, stream: CodedOutputStream, value: np.int32) -> None:
+        stream.write_signed_varint(value)
+    def read(self, stream: CodedInputStream) -> Int32:
+        return stream.read_signed_varint()
+    def read_numpy(self, stream: CodedInputStream) -> np.int32:
+        return np.int32(stream.read_signed_varint())
+int32_serializer = Int32Serializer()
+class UInt32Serializer(TypeSerializer[UInt32, np.uint32]):
+    def __init__(self) -> None:
+        super().__init__(np.uint32)
+    def write(self, stream: CodedOutputStream, value: UInt32) -> None:
+        if isinstance(value, int):
+            if value < 0 or value > UINT32_MAX:
+                raise ValueError(
+                    f"Value {value} is outside the range of an unsigned 32-bit integer"
+                )
+        elif not isinstance(value, cast(type, np.uint32)):
+            raise ValueError(f"Value is not an unsigned 32-bit integer: {value}")
+        stream.write_unsigned_varint(value)
+    def write_numpy(self, stream: CodedOutputStream, value: np.uint32) -> None:
+        stream.write_unsigned_varint(value)
+    def read(self, stream: CodedInputStream) -> UInt32:
+        return stream.read_unsigned_varint()
+    def read_numpy(self, stream: CodedInputStream) -> np.uint32:
+        return np.uint32(stream.read_unsigned_varint())
+uint32_serializer = UInt32Serializer()
+class Int64Serializer(TypeSerializer[Int64, np.int64]):
+    def __init__(self) -> None:
+        super().__init__(np.int64)
+    def write(self, stream: CodedOutputStream, value: Int64) -> None:
+        if isinstance(value, int):
+            if value < INT64_MIN or value > INT64_MAX:
+                raise ValueError(
+                    f"Value {value} is outside the range of a signed 64-bit integer"
+                )
+        elif not isinstance(value, cast(type, np.int64)):
+            raise ValueError(f"Value is not a signed 64-bit integer: {value}")
+        stream.write_signed_varint(value)
+    def write_numpy(self, stream: CodedOutputStream, value: np.int64) -> None:
+        stream.write_signed_varint(value)
+    def read(self, stream: CodedInputStream) -> Int64:
+        return stream.read_signed_varint()
+    def read_numpy(self, stream: CodedInputStream) -> np.int64:
+        return np.int64(stream.read_signed_varint())
+int64_serializer = Int64Serializer()
+class UInt64Serializer(TypeSerializer[UInt64, np.uint64]):
+    def __init__(self) -> None:
+        super().__init__(np.uint64)
+    def write(self, stream: CodedOutputStream, value: UInt64) -> None:
+        if isinstance(value, int):
+            if value < 0 or value > UINT64_MAX:
+                raise ValueError(
+                    f"Value {value} is outside the range of an unsigned 64-bit integer"
+                )
+        elif not isinstance(value, cast(type, np.uint64)):
+            raise ValueError(f"Value is not an unsigned 64-bit integer: {value}")
+        stream.write_unsigned_varint(value)
+    def write_numpy(self, stream: CodedOutputStream, value: np.uint64) -> None:
+        stream.write_unsigned_varint(value)
+    def read(self, stream: CodedInputStream) -> UInt64:
+        return stream.read_unsigned_varint()
+    def read_numpy(self, stream: CodedInputStream) -> np.uint64:
+        return np.uint64(stream.read_unsigned_varint())
+uint64_serializer = UInt64Serializer()
+class SizeSerializer(TypeSerializer[Size, np.uint64]):
+    def __init__(self) -> None:
+        super().__init__(np.uint64)
+    def write(self, stream: CodedOutputStream, value: Size) -> None:
+        if isinstance(value, int):
+            if value < 0 or value > UINT64_MAX:
+                raise ValueError(
+                    f"Value {value} is outside the range of an unsigned 64-bit integer"
+                )
+        elif not isinstance(value, cast(type, np.uint64)):
+            raise ValueError(f"Value is not an unsigned 64-bit integer: {value}")
+        stream.write_unsigned_varint(value)
+    def write_numpy(self, stream: CodedOutputStream, value: np.uint64) -> None:
+        stream.write_unsigned_varint(value)
+    def read(self, stream: CodedInputStream) -> Size:
+        return stream.read_unsigned_varint()
+    def read_numpy(self, stream: CodedInputStream) -> np.uint64:
+        return np.uint64(stream.read_unsigned_varint())
+size_serializer = SizeSerializer()
+class Float32Serializer(StructSerializer[Float32, np.float32]):
+    def __init__(self) -> None:
+        super().__init__(np.float32, "<f")
+    def read(self, stream: CodedInputStream) -> Float32:
+        return super().read(stream)
+    def is_trivially_serializable(self) -> bool:
+        return True
+float32_serializer = Float32Serializer()
+class Float64Serializer(StructSerializer[Float64, np.float64]):
+    def __init__(self) -> None:
+        super().__init__(np.float64, "<d")
+    def read(self, stream: CodedInputStream) -> Float64:
+        return super().read(stream)
+    def is_trivially_serializable(self) -> bool:
+        return True
+float64_serializer = Float64Serializer()
+class Complex32Serializer(StructSerializer[ComplexFloat, np.complex64]):
+    def __init__(self) -> None:
+        super().__init__(np.complex64, "<ff")
+    def write(self, stream: CodedOutputStream, value: ComplexFloat) -> None:
+        stream.write(self._struct, value.real, value.imag)
+    def read(self, stream: CodedInputStream) -> ComplexFloat:
+        return ComplexFloat(*stream.read(self._struct))
+    def read_numpy(self, stream: CodedInputStream) -> np.complex64:
+        real, imag = stream.read(self._struct)
+        return np.complex64(complex(real, imag))
+    def is_trivially_serializable(self) -> bool:
+        return True
+complexfloat32_serializer = Complex32Serializer()
+class Complex64Serializer(StructSerializer[ComplexDouble, np.complex128]):
+    def __init__(self) -> None:
+        super().__init__(np.complex128, "<dd")
+    def write(self, stream: CodedOutputStream, value: ComplexDouble) -> None:
+        stream.write(self._struct, value.real, value.imag)
+    def read(self, stream: CodedInputStream) -> ComplexDouble:
+        return ComplexDouble(*stream.read(self._struct))
+    def read_numpy(self, stream: CodedInputStream) -> np.complex128:
+        real, imag = stream.read(self._struct)
+        return np.complex128(complex(real, imag))
+    def is_trivially_serializable(self) -> bool:
+        return True
+complexfloat64_serializer = Complex64Serializer()
+class StringSerializer(TypeSerializer[str, np.object_]):
+    def __init__(self) -> None:
+        super().__init__(np.object_)
+    def write(self, stream: CodedOutputStream, value: str) -> None:
+        b = value.encode("utf-8")
+        stream.write_unsigned_varint(len(b))
+        stream.write_bytes(b)
+    def write_numpy(self, stream: CodedOutputStream, value: np.object_) -> None:
+        self.write(stream, cast(str, value))
+    def read(self, stream: CodedInputStream) -> str:
+        length = stream.read_unsigned_varint()
+        view = stream.read_view(length)
+        return str(view, "utf-8")
+    def read_numpy(self, stream: CodedInputStream) -> np.object_:
+        return np.object_(self.read(stream))
+string_serializer = StringSerializer()
+EPOCH_ORDINAL_DAYS = datetime.date(1970, 1, 1).toordinal()
+DATETIME_DAYS_DTYPE = np.dtype("datetime64[D]")
+class DateSerializer(TypeSerializer[datetime.date, np.datetime64]):
+    def __init__(self) -> None:
+        super().__init__(DATETIME_DAYS_DTYPE)
+    def write(self, stream: CodedOutputStream, value: datetime.date) -> None:
+        if isinstance(value, datetime.date):
+            stream.write_signed_varint(value.toordinal() - EPOCH_ORDINAL_DAYS)
+        else:
+            if not isinstance(value, np.datetime64):
+                raise ValueError(
+                    f"Expected datetime.date or numpy.datetime64, got {type(value)}"
+                )
+            self.write_numpy(stream, value)
+    def write_numpy(self, stream: CodedOutputStream, value: np.datetime64) -> None:
+        if value.dtype == DATETIME_DAYS_DTYPE:
+            stream.write_signed_varint(value.astype(np.int32))
+        else:
+            stream.write_signed_varint(
+                value.astype(DATETIME_DAYS_DTYPE).astype(np.int32)
+            )
+    def read(self, stream: CodedInputStream) -> datetime.date:
+        days_since_epoch = stream.read_signed_varint()
+        return datetime.date.fromordinal(days_since_epoch + EPOCH_ORDINAL_DAYS)
+    def read_numpy(self, stream: CodedInputStream) -> np.datetime64:
+        days_since_epoch = stream.read_signed_varint()
+        return np.datetime64(days_since_epoch, "D")
+date_serializer = DateSerializer()
+TIMEDELTA_NANOSECONDS_DTYPE = np.dtype("timedelta64[ns]")
+class TimeSerializer(TypeSerializer[Time, np.timedelta64]):
+    def __init__(self) -> None:
+        super().__init__(TIMEDELTA_NANOSECONDS_DTYPE)
+    def write(self, stream: CodedOutputStream, value: Time) -> None:
+        if isinstance(value, Time):
+            self.write_numpy(stream, value.numpy_value)
+        elif isinstance(value, datetime.time):
+            self.write_numpy(stream, Time.from_time(value).numpy_value)
+        else:
+            if not isinstance(value, np.timedelta64):
+                raise ValueError(
+                    f"Expected a Time, datetime.time or np.timedelta64, got {type(value)}"
+                )
+            self.write_numpy(stream, value)
+    def write_numpy(self, stream: CodedOutputStream, value: np.timedelta64) -> None:
+        if value.dtype == TIMEDELTA_NANOSECONDS_DTYPE:
+            stream.write_signed_varint(value.astype(np.int64))
+        else:
+            stream.write_signed_varint(
+                value.astype(DATETIME_NANOSECONDS_DTYPE).astype(np.int64)
+            )
+    def read(self, stream: CodedInputStream) -> Time:
+        nanoseconds_since_midnight = stream.read_signed_varint()
+        return Time(nanoseconds_since_midnight)
+    def read_numpy(self, stream: CodedInputStream) -> np.timedelta64:
+        nanoseconds_since_midnight = stream.read_signed_varint()
+        return np.timedelta64(nanoseconds_since_midnight, "ns")
+time_serializer = TimeSerializer()
+DATETIME_NANOSECONDS_DTYPE = np.dtype("datetime64[ns]")
+EPOCH_DATETIME = datetime.datetime.utcfromtimestamp(0)
+class DateTimeSerializer(TypeSerializer[DateTime, np.datetime64]):
+    def __init__(self) -> None:
+        super().__init__(DATETIME_NANOSECONDS_DTYPE)
+    def write(self, stream: CodedOutputStream, value: DateTime) -> None:
+        if isinstance(value, DateTime):
+            self.write_numpy(stream, value.numpy_value)
+        elif isinstance(value, datetime.datetime):
+            self.write_numpy(stream, DateTime.from_datetime(value).numpy_value)
+        else:
+            if not isinstance(value, np.datetime64):
+                raise ValueError(
+                    f"Expected datetime.datetime or numpy.datetime64, got {type(value)}"
+                )
+            self.write_numpy(stream, value)
+    def write_numpy(self, stream: CodedOutputStream, value: np.datetime64) -> None:
+        if value.dtype == DATETIME_NANOSECONDS_DTYPE:
+            stream.write_signed_varint(value.astype(np.int64))
+        else:
+            stream.write_signed_varint(
+                value.astype(DATETIME_NANOSECONDS_DTYPE).astype(np.int64)
+            )
+    def read(self, stream: CodedInputStream) -> DateTime:
+        nanoseconds_since_epoch = stream.read_signed_varint()
+        return DateTime(nanoseconds_since_epoch)
+    def read_numpy(self, stream: CodedInputStream) -> np.datetime64:
+        nanoseconds_since_epoch = stream.read_signed_varint()
+        return np.datetime64(nanoseconds_since_epoch, "ns")
+datetime_serializer = DateTimeSerializer()
+class NoneSerializer(TypeSerializer[None, Any]):
+    def __init__(self) -> None:
+        super().__init__(np.object_)
+    def write(self, stream: CodedOutputStream, value: None) -> None:
+        pass
+    def write_numpy(self, stream: CodedOutputStream, value: Any) -> None:
+        pass
+    def read(self, stream: CodedInputStream) -> None:
+        return None
+    def read_numpy(self, stream: CodedInputStream) -> Any:
+        return np.object_()
+none_serializer = NoneSerializer()
+TEnum = TypeVar("TEnum", bound=Enum)
+class EnumSerializer(Generic[TEnum, T, T_NP], TypeSerializer[TEnum, T_NP]):
+    def __init__(
+        self, integer_serializer: TypeSerializer[T, T_NP], enum_type: type
+    ) -> None:
+        super().__init__(integer_serializer.overall_dtype())
+        self._integer_serializer = integer_serializer
+        self._enum_type = enum_type
+    def write(self, stream: CodedOutputStream, value: TEnum) -> None:
+        self._integer_serializer.write(stream, value.value)
+    def write_numpy(self, stream: CodedOutputStream, value: T_NP) -> None:
+        return self._integer_serializer.write_numpy(stream, value)
+    def read(self, stream: CodedInputStream) -> TEnum:
+        int_value = self._integer_serializer.read(stream)
+        return self._enum_type(int_value)
+    def read_numpy(self, stream: CodedInputStream) -> T_NP:
+        return self._integer_serializer.read_numpy(stream)
+    def is_trivially_serializable(self) -> bool:
+        return self._integer_serializer.is_trivially_serializable()
+class OptionalSerializer(Generic[T, T_NP], TypeSerializer[Optional[T], np.void]):
+    def __init__(self, element_serializer: TypeSerializer[T, T_NP]) -> None:
+        super().__init__(
+            np.dtype(
+                [("has_value", np.bool_), ("value", element_serializer.overall_dtype())]
+            )
+        )
+        self._element_serializer = element_serializer
+        self._none = cast(np.void, np.zeros((), dtype=self.overall_dtype())[()])
+    def write(self, stream: CodedOutputStream, value: Optional[T]) -> None:
+        stream.ensure_capacity(1)
+        if value is None:
+            stream.write_byte_no_check(0)
+        else:
+            stream.write_byte_no_check(1)
+            self._element_serializer.write(stream, value)
+    def write_numpy(self, stream: CodedOutputStream, value: np.void) -> None:
+        stream.ensure_capacity(1)
+        if not value["has_value"]:
+            stream.write_byte_no_check(0)
+        else:
+            stream.write_byte_no_check(1)
+            self._element_serializer.write_numpy(stream, value["value"])
+    def read(self, stream: CodedInputStream) -> Optional[T]:
+        has_value = stream.read_byte()
+        if has_value == 0:
+            return None
+        else:
+            return self._element_serializer.read(stream)
+    def read_numpy(self, stream: CodedInputStream) -> np.void:
+        has_value = stream.read_byte()
+        if has_value == 0:
+            return self._none
+        else:
+            return cast(np.void, (True, self._element_serializer.read_numpy(stream)))
+    def is_trivially_serializable(self) -> bool:
+        return super().is_trivially_serializable()
+class UnionCaseProtocol(Protocol):
+    index: int
+    value: Any
+class UnionSerializer(TypeSerializer[T, np.object_]):
+    def __init__(
+        self,
+        union_type: type,
+        cases: list[Optional[tuple[type, TypeSerializer[Any, Any]]]],
+    ) -> None:
+        super().__init__(np.object_)
+        self._union_type = union_type
+        self._cases = cases
+        self._offset = 1 if cases[0] is None else 0
+    def write(self, stream: CodedOutputStream, value: T) -> None:
+        if value is None:
+            if self._cases[0] is None:
+                stream.write_byte_no_check(0)
+                return
+            else:
+                raise ValueError("None is not a valid for this union type")
+        if not isinstance(value, self._union_type):
+            raise ValueError(
+                f"Expected union value of type {self._union_type} but got {type(value)}"
+            )
+        union_value = cast(UnionCaseProtocol, value)
+        tag_index = union_value.index + self._offset
+        stream.ensure_capacity(1)
+        stream.write_byte_no_check(tag_index)
+        type_case = self._cases[tag_index]
+        assert type_case is not None
+        type_case[1].write(stream, union_value.value)
+    def write_numpy(self, stream: CodedOutputStream, value: np.object_) -> None:
+        self.write(stream, cast(T, value))
+    def read(self, stream: CodedInputStream) -> T:
+        case_index = stream.read_byte()
+        if case_index == 0 and self._offset == 1:
+            return None  # type: ignore
+        case_type, case_serializer = self._cases[case_index]  # type: ignore
+        return case_type(case_serializer.read(stream))  # type: ignore
+    def read_numpy(self, stream: CodedInputStream) -> np.object_:
+        return self.read(stream)  # type: ignore
+class StreamSerializer(TypeSerializer[Iterable[T], Any]):
+    def __init__(self, element_serializer: TypeSerializer[T, T_NP]) -> None:
+        super().__init__(np.object_)
+        self._element_serializer = element_serializer
+    def write(self, stream: CodedOutputStream, value: Iterable[T]) -> None:
+        # Note that the final 0 is missing and will be added before the next protocol step
+        # or the protocol is closed.
+        if isinstance(value, list) and len(value) > 0:
+            stream.write_unsigned_varint(len(value))
+            for element in value:
+                self._element_serializer.write(stream, element)
+        else:
+            for element in value:
+                stream.write_byte_no_check(1)
+                self._element_serializer.write(stream, element)
+    def write_numpy(self, stream: CodedOutputStream, value: Any) -> None:
+        raise NotImplementedError()
+    def read(self, stream: CodedInputStream) -> Iterable[T]:
+        while (i := stream.read_unsigned_varint()) > 0:
+            for _ in range(i):
+                yield self._element_serializer.read(stream)
+    def read_numpy(self, stream: CodedInputStream) -> np.object_:
+        raise NotImplementedError()
+class FixedVectorSerializer(Generic[T, T_NP], TypeSerializer[list[T], np.object_]):
+    def __init__(
+        self, element_serializer: TypeSerializer[T, T_NP], length: int
+    ) -> None:
+        super().__init__(np.dtype((element_serializer.overall_dtype(), length)))
+        self.element_serializer = element_serializer
+        self._length = length
+    def write(self, stream: CodedOutputStream, value: list[T]) -> None:
+        if len(value) != self._length:
+            raise ValueError(
+                f"Expected a list of length {self._length}, got {len(value)}"
+            )
+        for element in value:
+            self.element_serializer.write(stream, element)
+    def write_numpy(self, stream: CodedOutputStream, value: np.object_) -> None:
+        raise NotImplementedError("Internal error: expected this to be a subarray")
+    def read(self, stream: CodedInputStream) -> list[T]:
+        return [self.element_serializer.read(stream) for _ in range(self._length)]
+    def read_numpy(self, stream: CodedInputStream) -> np.object_:
+        raise NotImplementedError("Internal error: expected this to be a subarray")
+    def is_trivially_serializable(self) -> bool:
+        return self.element_serializer.is_trivially_serializable()
+class VectorSerializer(Generic[T, T_NP], TypeSerializer[list[T], np.object_]):
+    def __init__(self, element_serializer: TypeSerializer[T, T_NP]) -> None:
+        super().__init__(np.object_)
+        self._element_serializer = element_serializer
+    def write(self, stream: CodedOutputStream, value: list[T]) -> None:
+        stream.write_unsigned_varint(len(value))
+        for element in value:
+            self._element_serializer.write(stream, element)
+    def write_numpy(self, stream: CodedOutputStream, value: np.object_) -> None:
+        if not isinstance(value, list):
+            raise ValueError(f"Expected a list, got {type(value)}")
+        stream.write_unsigned_varint(len(value))
+        for element in cast(list[T], value):
+            self._element_serializer.write(stream, element)
+    def read(self, stream: CodedInputStream) -> list[T]:
+        length = stream.read_unsigned_varint()
+        return [self._element_serializer.read(stream) for _ in range(length)]
+    def read_numpy(self, stream: CodedInputStream) -> np.object_:
+        return np.object_(self.read(stream))
+TKey = TypeVar("TKey")
+TKey_NP = TypeVar("TKey_NP", bound=np.generic)
+TValue = TypeVar("TValue")
+TValue_NP = TypeVar("TValue_NP", bound=np.generic)
+class MapSerializer(
+    Generic[TKey, TKey_NP, TValue, TValue_NP],
+    TypeSerializer[dict[TKey, TValue], np.object_],
+):
+    def __init__(
+        self,
+        key_serializer: TypeSerializer[TKey, TKey_NP],
+        value_serializer: TypeSerializer[TValue, TValue_NP],
+    ) -> None:
+        super().__init__(np.object_)
+        self._key_serializer = key_serializer
+        self._value_serializer = value_serializer
+    def write(self, stream: CodedOutputStream, value: dict[TKey, TValue]) -> None:
+        stream.write_unsigned_varint(len(value))
+        for k, v in value.items():
+            self._key_serializer.write(stream, k)
+            self._value_serializer.write(stream, v)
+    def write_numpy(self, stream: CodedOutputStream, value: np.object_) -> None:
+        self.write(stream, cast(dict[TKey, TValue], value))
+    def read(self, stream: CodedInputStream) -> dict[TKey, TValue]:
+        length = stream.read_unsigned_varint()
+        return {
+            self._key_serializer.read(stream): self._value_serializer.read(stream)
+            for _ in range(length)
+        }
+    def read_numpy(self, stream: CodedInputStream) -> np.object_:
+        return np.object_(self.read(stream))
+class NDArraySerializerBase(
+    Generic[T, T_NP], TypeSerializer[npt.NDArray[Any], np.object_]
+):
+    def __init__(
+        self,
+        overall_dtype: npt.DTypeLike,
+        element_serializer: TypeSerializer[T, T_NP],
+        dtype: npt.DTypeLike,
+    ) -> None:
+        super().__init__(overall_dtype)
+        self.element_serializer = element_serializer
+        (
+            self._array_dtype,
+            self._subarray_shape,
+        ) = NDArraySerializerBase._get_dtype_and_subarray_shape(
+            dtype
+            if isinstance(dtype, np.dtype)
+            else np.dtype(dtype)  # pyright: ignore [reportUnknownArgumentType]
+        )
+        if self._subarray_shape == ():
+            self._subarray_shape = None
+        else:
+            if isinstance(element_serializer, FixedNDArraySerializer) or isinstance(
+                element_serializer, FixedVectorSerializer
+            ):
+                self.element_serializer = cast(
+                    TypeSerializer[T, T_NP],
+                    element_serializer.element_serializer,  # pyright: ignore [reportUnknownMemberType]
+                )
+    @staticmethod
+    def _get_dtype_and_subarray_shape(
+        dtype: np.dtype[Any],
+    ) -> tuple[np.dtype[Any], tuple[int, ...]]:
+        if dtype.subdtype is None:
+            return dtype, ()
+        subres = NDArraySerializerBase._get_dtype_and_subarray_shape(dtype.subdtype[0])
+        return (subres[0], dtype.subdtype[1] + subres[1])
+    def _write_data(self, stream: CodedOutputStream, value: npt.NDArray[Any]) -> None:
+        if value.dtype != self._array_dtype:
+            # see if it's the same dtype but packed, not aligned
+            packed_dtype = recfunctions.repack_fields(self._array_dtype, align=False, recurse=True)  # type: ignore
+            if packed_dtype != value.dtype:
+                if packed_dtype == self._array_dtype:
+                    message = f"Expected dtype {self._array_dtype}, got {value.dtype}"
+                else:
+                    message = f"Expected dtype {self._array_dtype} or {packed_dtype}, got {value.dtype}"
+                raise ValueError(message)
+        if self._is_current_array_trivially_serializable(value):
+            stream.write_bytes_directly(value.data)
+        else:
+            for element in value.flat:
+                self.element_serializer.write_numpy(stream, element)
+    def _read_data(
+        self, stream: CodedInputStream, shape: tuple[int, ...]
+    ) -> npt.NDArray[Any]:
+        flat_length = int(np.prod(shape))  # type: ignore
+        if self.element_serializer.is_trivially_serializable():
+            flat_byte_length = flat_length * self._array_dtype.itemsize
+            byte_array = stream.read_bytearray(flat_byte_length)
+            return np.frombuffer(byte_array, dtype=self._array_dtype).reshape(shape)
+        result: npt.NDArray[T_NP] = np.ndarray((flat_length,), dtype=self._array_dtype)
+        for i in range(flat_length):
+            result[i] = self.element_serializer.read_numpy(stream)
+        return result.reshape(shape)
+    def _is_current_array_trivially_serializable(self, value: npt.NDArray[Any]) -> bool:
+        return (
+            self.element_serializer.is_trivially_serializable()
+            and value.flags.c_contiguous
+            and (
+                self._array_dtype.fields is None
+                or all(f != "" for f in self._array_dtype.fields)
+            )
+        )
+class DynamicNDArraySerializer(NDArraySerializerBase[T, T_NP]):
+    def __init__(
+        self,
+        element_serializer: TypeSerializer[T, T_NP],
+    ) -> None:
+        super().__init__(
+            np.object_, element_serializer, element_serializer.overall_dtype()
+        )
+    def write(self, stream: CodedOutputStream, value: npt.NDArray[Any]) -> None:
+        if self._subarray_shape is None:
+            stream.write_unsigned_varint(value.ndim)
+            for dim in value.shape:
+                stream.write_unsigned_varint(dim)
+        else:
+            if len(value.shape) < len(self._subarray_shape) or (
+                value.shape[-len(self._subarray_shape) :] != self._subarray_shape
+            ):
+                raise ValueError(
+                    f"The array is required to have shape (..., {(', '.join((str(i) for i in self._subarray_shape)))})"
+                )
+            stream.write_unsigned_varint(value.ndim - len(self._subarray_shape))
+            for dim in value.shape[: -len(self._subarray_shape)]:
+                stream.write_unsigned_varint(dim)
+        self._write_data(stream, value)
+    def write_numpy(self, stream: CodedOutputStream, value: np.object_) -> None:
+        self.write(stream, cast(npt.NDArray[Any], value))
+    def read(self, stream: CodedInputStream) -> npt.NDArray[Any]:
+        if self._subarray_shape is None:
+            ndims = stream.read_unsigned_varint()
+            shape = tuple(stream.read_unsigned_varint() for _ in range(ndims))
+        else:
+            ndims = stream.read_unsigned_varint()
+            shape = (
+                tuple(stream.read_unsigned_varint() for _ in range(ndims))
+                + self._subarray_shape
+            )
+        return self._read_data(stream, shape)
+    def read_numpy(self, stream: CodedInputStream) -> np.object_:
+        return cast(np.object_, self.read(stream))
+class NDArraySerializer(Generic[T, T_NP], NDArraySerializerBase[T, T_NP]):
+    def __init__(
+        self,
+        element_serializer: TypeSerializer[T, T_NP],
+        ndims: int,
+    ) -> None:
+        super().__init__(
+            np.object_, element_serializer, element_serializer.overall_dtype()
+        )
+        self._ndims = ndims
+    def write(self, stream: CodedOutputStream, value: npt.NDArray[Any]) -> None:
+        if self._subarray_shape is None:
+            if value.ndim != self._ndims:
+                raise ValueError(f"Expected {self._ndims} dimensions, got {value.ndim}")
+            for dim in value.shape:
+                stream.write_unsigned_varint(dim)
+        else:
+            total_dims = len(self._subarray_shape) + self._ndims
+            if value.ndim != total_dims:
+                raise ValueError(f"Expected {total_dims} dimensions, got {value.ndim}")
+            if value.shape[-len(self._subarray_shape) :] != self._subarray_shape:
+                raise ValueError(
+                    f"The array is required to have shape (..., {(', '.join((str(i) for i in self._subarray_shape)))})"
+                )
+            for dim in value.shape[: -len(self._subarray_shape)]:
+                stream.write_unsigned_varint(dim)
+        self._write_data(stream, value)
+    def write_numpy(self, stream: CodedOutputStream, value: np.object_) -> None:
+        self.write(stream, cast(npt.NDArray[Any], value))
+    def read(self, stream: CodedInputStream) -> npt.NDArray[Any]:
+        shape = tuple(stream.read_unsigned_varint() for _ in range(self._ndims))
+        if self._subarray_shape is not None:
+            shape += self._subarray_shape
+        return self._read_data(stream, shape)
+    def read_numpy(self, stream: CodedInputStream) -> np.object_:
+        return cast(np.object_, self.read(stream))
+class FixedNDArraySerializer(Generic[T, T_NP], NDArraySerializerBase[T, T_NP]):
+    def __init__(
+        self,
+        element_serializer: TypeSerializer[T, T_NP],
+        shape: tuple[int, ...],
+    ) -> None:
+        dtype = element_serializer.overall_dtype()
+        super().__init__(np.dtype((dtype, shape)), element_serializer, dtype)
+        self._shape = shape
+    def write(self, stream: CodedOutputStream, value: npt.NDArray[Any]) -> None:
+        required_shape = (
+            self._shape
+            if self._subarray_shape is None
+            else self._shape + self._subarray_shape
+        )
+        if value.shape != required_shape:
+            raise ValueError(f"Expected shape {required_shape}, got {value.shape}")
+        self._write_data(stream, value)
+    def write_numpy(self, stream: CodedOutputStream, value: np.object_) -> None:
+        self.write(stream, cast(npt.NDArray[Any], value))
+    def read(self, stream: CodedInputStream) -> npt.NDArray[Any]:
+        full_shape = (
+            self._shape
+            if self._subarray_shape is None
+            else self._shape + self._subarray_shape
+        )
+        return self._read_data(stream, full_shape)
+    def read_numpy(self, stream: CodedInputStream) -> np.object_:
+        return cast(np.object_, self.read(stream))
+    def is_trivially_serializable(self) -> bool:
+        return self.element_serializer.is_trivially_serializable()
+class RecordSerializer(TypeSerializer[T, np.void]):
+    def __init__(
+        self, field_serializers: list[Tuple[str, TypeSerializer[Any, Any]]]
+    ) -> None:
+        super().__init__(
+            np.dtype(
+                [
+                    (name, serializer.overall_dtype())
+                    for name, serializer in field_serializers
+                ],
+                align=True,
+            )
+        )
+        self._field_serializers = field_serializers
+    def is_trivially_serializable(self) -> bool:
+        return all(
+            serializer.is_trivially_serializable()
+            for _, serializer in self._field_serializers
+        )
+    def _write(self, stream: CodedOutputStream, *values: Any) -> None:
+        for i, (_, serializer) in enumerate(self._field_serializers):
+            serializer.write(stream, values[i])
+    def _read(self, stream: CodedInputStream) -> tuple[Any, ...]:
+        return tuple(
+            serializer.read(stream) for _, serializer in self._field_serializers
+        )
+    def read_numpy(self, stream: CodedInputStream) -> np.void:
+        return cast(np.void, self._read(stream))
+# Only used in the header
+int32_struct = struct.Struct("<i")
+assert int32_struct.size == 4
+def write_fixed_int32(stream: CodedOutputStream, value: int) -> None:
+    if value < INT32_MIN or value > INT32_MAX:
+        raise ValueError(
+            f"Value {value} is outside the range of a signed 32-bit integer"
+        )
+    stream.write(int32_struct, value)
+def read_fixed_int32(stream: CodedInputStream) -> int:
+    return stream.read(int32_struct)[0]