PyPI - vision-agents-plugins-kokoro - Versions diffs - 0.1.9__py3-none-any.whl → 0.1.12__py3-none-any.whl - Mend

vision-agents-plugins-kokoro 0.1.9py3-none-any.whl → 0.1.12py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Potentially problematic release.

This version of vision-agents-plugins-kokoro might be problematic. Click here for more details.

Files changed (7) hide show

.gitignore CHANGED Viewed

@@ -84,3 +84,4 @@ stream-py/
 # Artifacts / assets
 *.pt
 *.kef
+*.onnx

PKG-INFO CHANGED Viewed

@@ -1,6 +1,6 @@
 Metadata-Version: 2.4
 Name: vision-agents-plugins-kokoro
-Version: 0.1.9
+Version: 0.1.12
 Summary: Kokoro TTS integration for Vision Agents
 Project-URL: Documentation, https://visionagents.ai/
 Project-URL: Website, https://visionagents.ai/

vision_agents/plugins/kokoro/tts.py CHANGED Viewed

@@ -2,12 +2,12 @@ from __future__ import annotations
 import asyncio
 import logging
+from typing import AsyncIterator, Iterator, List, Optional
 import numpy as np
-from typing import AsyncIterator, List, Optional
 from vision_agents.core import tts
-from getstream.video.rtc.audio_track import AudioStreamTrack
+from getstream.video.rtc.track_util import PcmData, AudioFormat
 try:
     from kokoro import KPipeline  # type: ignore
@@ -15,6 +15,9 @@ except ModuleNotFoundError:  # pragma: no cover – mocked during CI
     KPipeline = None  # type: ignore  # noqa: N816
+logger = logging.getLogger(__name__)
 class TTS(tts.TTS):
     """Text-to-Speech plugin backed by the Kokoro-82M model."""
@@ -44,22 +47,9 @@ class TTS(tts.TTS):
         self.sample_rate = sample_rate
         self.client = client if client is not None else self._pipeline
-    def get_required_framerate(self) -> int:
-        """Get the required framerate for Kokoro TTS."""
-        return self.sample_rate
-    def get_required_stereo(self) -> bool:
-        """Get whether Kokoro TTS requires stereo audio."""
-        return False  # Kokoro returns mono audio
-    def set_output_track(self, track: AudioStreamTrack) -> None:  # noqa: D401
-        if track.framerate != self.sample_rate:
-            raise TypeError(
-                f"Invalid framerate {track.framerate}, Kokoro requires {self.sample_rate} Hz"
-            )
-        super().set_output_track(track)
-    async def stream_audio(self, text: str, *_, **__) -> AsyncIterator[bytes]:  # noqa: D401
+    async def stream_audio(
+        self, text: str, *_, **__
+    ) -> PcmData | Iterator[PcmData] | AsyncIterator[PcmData]:  # noqa: D401
         loop = asyncio.get_event_loop()
         chunks: List[bytes] = await loop.run_in_executor(
             None, lambda: list(self._generate_chunks(text))
@@ -67,7 +57,12 @@ class TTS(tts.TTS):
         async def _aiter():
             for chunk in chunks:
-                yield chunk
+                yield PcmData.from_bytes(
+                    chunk,
+                    sample_rate=self.sample_rate,
+                    channels=1,
+                    format=AudioFormat.S16,
+                )
         return _aiter()
@@ -76,11 +71,7 @@ class TTS(tts.TTS):
         Clears the queue and stops playing audio.
         """
-        try:
-            await self.track.flush()
-            return
-        except Exception as e:
-            logging.error(f"Error flushing audio track: {e}")
+        logger.info("🎤 Kokoro TTS stop requested (no-op)")
     def _generate_chunks(self, text: str):
         for _gs, _ps, audio in self._pipeline(

{vision_agents_plugins_kokoro-0.1.9.dist-info → vision_agents_plugins_kokoro-0.1.12.dist-info}/METADATA RENAMED Viewed

@@ -1,6 +1,6 @@
 Metadata-Version: 2.4
 Name: vision-agents-plugins-kokoro
-Version: 0.1.9
+Version: 0.1.12
 Summary: Kokoro TTS integration for Vision Agents
 Project-URL: Documentation, https://visionagents.ai/
 Project-URL: Website, https://visionagents.ai/

vision_agents_plugins_kokoro-0.1.12.dist-info/RECORD ADDED Viewed

@@ -0,0 +1,9 @@
+./.gitignore,sha256=ye7v72rmcYcz93U_u9IyYUvYJKEXGElBsTevPVyASo0,923
+./PKG-INFO,sha256=f4jj6wXm6Avw3NcTzQODNFTkCM1cwR3vMgzV1ULQges,2045
+./README.md,sha256=2olMbGoMYj07OyGlDj_AG2G42o61Tl-Ml4AMINXj4LM,1486
+./pyproject.toml,sha256=tKF8yoc19e21FLXZcomo17LEHGH929kFwX9EIXkRBQA,999
+./vision_agents/plugins/kokoro/__init__.py,sha256=hq4qcv6VHIM24dB_NZEhxogAKD04jX35ngeXhn2M-zQ,158
+./vision_agents/plugins/kokoro/tts.py,sha256=_vCCRgMOnYj5IlibxfOnvZf_3wYJcdTurswRtdSGRhs,2510
+vision_agents_plugins_kokoro-0.1.12.dist-info/METADATA,sha256=f4jj6wXm6Avw3NcTzQODNFTkCM1cwR3vMgzV1ULQges,2045
+vision_agents_plugins_kokoro-0.1.12.dist-info/WHEEL,sha256=qtCwoSJWgHk21S1Kb4ihdzI2rlJ1ZKaIurTj_ngOhyQ,87
+vision_agents_plugins_kokoro-0.1.12.dist-info/RECORD,,

vision_agents_plugins_kokoro-0.1.9.dist-info/RECORD DELETED Viewed

@@ -1,9 +0,0 @@
-./.gitignore,sha256=S6wPCu4rBDB_yyTYoXbMIR-pn4OPv6b3Ulnx1n5RWvo,916
-./PKG-INFO,sha256=459Q3UkPTN25M6CwXOwe2YTNA99gh9CeXx8g4G7z6bA,2044
-./README.md,sha256=2olMbGoMYj07OyGlDj_AG2G42o61Tl-Ml4AMINXj4LM,1486
-./pyproject.toml,sha256=tKF8yoc19e21FLXZcomo17LEHGH929kFwX9EIXkRBQA,999
-./vision_agents/plugins/kokoro/__init__.py,sha256=hq4qcv6VHIM24dB_NZEhxogAKD04jX35ngeXhn2M-zQ,158
-./vision_agents/plugins/kokoro/tts.py,sha256=-XjGD0riPnXsCGpVWo9EO42B1a9mV3CmvUVPhqTnyKA,2921
-vision_agents_plugins_kokoro-0.1.9.dist-info/METADATA,sha256=459Q3UkPTN25M6CwXOwe2YTNA99gh9CeXx8g4G7z6bA,2044
-vision_agents_plugins_kokoro-0.1.9.dist-info/WHEEL,sha256=qtCwoSJWgHk21S1Kb4ihdzI2rlJ1ZKaIurTj_ngOhyQ,87
-vision_agents_plugins_kokoro-0.1.9.dist-info/RECORD,,

{vision_agents_plugins_kokoro-0.1.9.dist-info → vision_agents_plugins_kokoro-0.1.12.dist-info}/WHEEL RENAMED Viewed

File without changes

vision-agents-plugins-kokoro 0.1.9__py3-none-any.whl → 0.1.12__py3-none-any.whl

Potentially problematic release.

vision-agents-plugins-kokoro 0.1.9py3-none-any.whl → 0.1.12py3-none-any.whl