PyPI - realtimex-deeptutor - Versions diffs - 0.5.0.post4__py3-none-any.whl → 0.5.0.post6__py3-none-any.whl - Mend

realtimex-deeptutor 0.5.0.post4py3-none-any.whl → 0.5.0.post6py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (11) hide show

{realtimex_deeptutor-0.5.0.post4.dist-info → realtimex_deeptutor-0.5.0.post6.dist-info}/METADATA RENAMED Viewed

@@ -1,6 +1,6 @@
 Metadata-Version: 2.4
 Name: realtimex-deeptutor
-Version: 0.5.0.post4
+Version: 0.5.0.post6
 Summary: RealTimeX DeepTutor - Intelligent learning companion with multi-agent collaboration and LightRAG
 License: Apache-2.0
 Requires-Python: >=3.10

{realtimex_deeptutor-0.5.0.post4.dist-info → realtimex_deeptutor-0.5.0.post6.dist-info}/RECORD RENAMED Viewed

@@ -1,5 +1,5 @@
 realtimex_deeptutor/__init__.py,sha256=sSfuCLjJa6BnayszcU4azNl_sr1OzuKgLP10BAtdoh8,1567
-realtimex_deeptutor-0.5.0.post4.dist-info/licenses/LICENSE,sha256=hIahDEOTzuHCU5J2nd07LWwkLW7Hko4UFO__ffsvB-8,34523
+realtimex_deeptutor-0.5.0.post6.dist-info/licenses/LICENSE,sha256=hIahDEOTzuHCU5J2nd07LWwkLW7Hko4UFO__ffsvB-8,34523
 scripts/__init__.py,sha256=mxMsCbci-Qon3qWU1JIi93-tYlHAy0NIUbDRmAPVcg0,54
 scripts/audit_prompts.py,sha256=Ltuk7tvsjpKhiobVbYq1volgVFKiVLgSTaE_Is4MGaM,5651
 scripts/check_install.py,sha256=GbApEcDLJ6r0QmYrCVHAFCOK4wolpSLwL3eBRmmD3og,13929
@@ -19,7 +19,7 @@ src/agents/chat/prompts/en/chat_agent.yaml,sha256=K19crF4jLrtGeZYZ7_LSzlpOFljCJ_
 src/agents/chat/prompts/zh/chat_agent.yaml,sha256=dUudCfMKj_75pGdh1rjVUmWlHf8hzUhHia7qfEwmntU,929
 src/agents/co_writer/__init__.py,sha256=47DEQpj8HBSa-_TImW-5JCeuQeRkm5NMpJWZG3hSuFU,0
 src/agents/co_writer/edit_agent.py,sha256=5NCTQtReO7S9A3jD8TefeUNv6LFSCojvo7dUyPJAc9s,9147
-src/agents/co_writer/narrator_agent.py,sha256=RyulrOgvVz1ZXS4njhzPed-li5wKAoJaui1MLe5ZnJ0,15397
+src/agents/co_writer/narrator_agent.py,sha256=h9hjIsWvWJBXsQxPkuwBlHgAMBKFvwXyUprlvh0SXbc,16425
 src/agents/co_writer/prompts/en/edit_agent.yaml,sha256=wGGk_IBq5DlIoDAl7sSHn-xFt6jx07NWv1NbXFBQE2g,4085
 src/agents/co_writer/prompts/en/narrator_agent.yaml,sha256=zUhgsE64uTQPxOBHE34YvDxMq1a7wav1NVMP1XDYMkg,4259
 src/agents/co_writer/prompts/zh/edit_agent.yaml,sha256=Sg6RnG660LvglIaW5bqAH8yqc6EQl2xmE_wHGrixX38,3617
@@ -139,7 +139,7 @@ src/api/routers/ideagen.py,sha256=UFgQ0LjKjGwKc-wVjdNi-R-TC7RhU8kZrWxLKBuiCls,16
 src/api/routers/knowledge.py,sha256=gW6Ol6cRMqZ-reRQ30JfJHf51Wg4gNg5vvf0Zpt5MQ8,32056
 src/api/routers/notebook.py,sha256=NwLf2MPaT_rsF6cDlsZG85o3z7JMHXatl-FuWIKYaJw,6098
 src/api/routers/question.py,sha256=aAAY5nz3PRgsww75Ph1ZWY_9_Hey2uudTxdsQlMZzPA,20876
-src/api/routers/realtimex.py,sha256=nMmSWYyIDRoRdeQTFpTrGnpaf87jSiwvJ4zRkyEaW00,3998
+src/api/routers/realtimex.py,sha256=AX4dna8tbScf0W_AWtzxqlXm0WRgPMMqmVTh7fYOZp8,4464
 src/api/routers/research.py,sha256=ZZJRNi1xhmoi8Shg8gBln_1uL1_XEW9Hxo0IM5RsOKo,16520
 src/api/routers/settings.py,sha256=7Q2edffDgD0PeiBJ0emd3kFc3i3qn1rFrTbbIm9LsXI,4549
 src/api/routers/solve.py,sha256=lLyPd_R1o-Yxe9I685nGj_SfyCeGBS74023tbDNpZGI,15939
@@ -184,7 +184,7 @@ src/services/__init__.py,sha256=91ZEKiPyPtwFgYRtmkKBrdYAZKVnREUw43itPM5n-WM,1851
 src/services/config/__init__.py,sha256=Vjt0TORUt358yZvNCgoIVnuWJWVPuYiNA6ge9DV-Dyo,1792
 src/services/config/knowledge_base_config.py,sha256=l6QlAivVCBf1Q23YaEkHIHvq3TmsowPJmjDASezBf8c,7266
 src/services/config/loader.py,sha256=1PXImuGe8RpJ8UQpyGcsRhkq_YL9kWJq2f1ylQE4N3Y,8068
-src/services/config/unified_config.py,sha256=3sPs06oU0j6BjPZObh5Zoc1eLDusa1qa8HPGU9rncdY,32338
+src/services/config/unified_config.py,sha256=oIPUJ2lVhcREf2V8PdQBwvPoBHhpcuuaWoPvoc6gBt8,34238
 src/services/embedding/__init__.py,sha256=ljDq50as6CkKNHK2sSQtX_iXu9TyOMhzzFNs2f7QYKs,1338
 src/services/embedding/client.py,sha256=X5iUbGuXjtk_6Nkl7N4eRXjbL5hPY46JcTfi65UZWus,6003
 src/services/embedding/config.py,sha256=vBJjsTcYLsIpy0bmR7V8etu8eAXdRShjQIYIMcqwIgU,5368
@@ -269,7 +269,7 @@ src/services/settings/interface_settings.py,sha256=xyiJl_N2eYWmQVufQE63wEZJftgCx
 src/services/setup/__init__.py,sha256=9AyQ8c-3ViiKpylTzqw4_qle0Y8MBo0GBPzTNP4vT_4,711
 src/services/setup/init.py,sha256=fsLMcgZ_LQRI4EoPwfbrmnI9p2lU26lgQwR6QmZW01A,10779
 src/services/tts/__init__.py,sha256=sLKSM4WvthMajSCVKWSK5hi8FOf0xmx_zpE471n97FI,343
-src/services/tts/config.py,sha256=by4OWjPwA16AtL2d3805Y_w3Z_UrmF9I3zfN028twWY,3088
+src/services/tts/config.py,sha256=nVDC_ukWLPE8ZvWOqYA9eHQhqpjjbH23zg-BkJ4sQf8,3166
 src/tools/__init__.py,sha256=Zn9-uR4OqkAUq5oXm8Mwd3I4O_Qpg5GUJkrwEN47QLA,2777
 src/tools/code_executor.py,sha256=Tb8R2Cp-4_q1XfxUYsBUW52UDUwdQxLIwBMukjkEMXk,19436
 src/tools/paper_search_tool.py,sha256=f-CynXbOYo9-DLIaTIlc-odGYo8j3hx4sHb0sFktQF8,4745
@@ -287,10 +287,10 @@ src/utils/document_validator.py,sha256=ogNk0KvMZPQKi9zHoeQzhUxCVsYFpkP9-pjO8kC71
 src/utils/error_rate_tracker.py,sha256=MIhaNaStdrhinVFIKHNOgQMPdbrddjKJy2ok_jK8WX4,3942
 src/utils/error_utils.py,sha256=ME_9q-DlmxFl-Xvv3ETPZE_iP705x6MXiuAREgWYsjM,2262
 src/utils/json_parser.py,sha256=M_KfrsrNvQPSiFvpKHQV79Aj85_MEcLVc6hnKzvTV58,3243
-src/utils/realtimex.py,sha256=WlGeZ7d-ymXIJ6ZYK2nhjqxArV_7rVHHJLCqaNkcOUw,8648
+src/utils/realtimex.py,sha256=vs7fAEnJJ4zpAyyBn-7vUmGWiiQvpTWQCRgax1MLTDw,9769
 src/utils/network/circuit_breaker.py,sha256=BtjogK5R3tG8fuJniS5-PJKZMtwD5P2SkP2JFiQ9sRA,2722
-realtimex_deeptutor-0.5.0.post4.dist-info/METADATA,sha256=Jjy3Gnux_cDuNru960f4mpCvK3kz1OJWaD7vrd_413k,58304
-realtimex_deeptutor-0.5.0.post4.dist-info/WHEEL,sha256=wUyA8OaulRlbfwMtmQsvNngGrxQHAvkKcvRmdizlJi0,92
-realtimex_deeptutor-0.5.0.post4.dist-info/entry_points.txt,sha256=slNAzwRLUpqiMtDRZBQIkXbU2vGMHL_om6-o19gYdh8,134
-realtimex_deeptutor-0.5.0.post4.dist-info/top_level.txt,sha256=zUAd6V7jDYhdL7bvg2S38YCM-gVhvd36WqkjxrT-02I,32
-realtimex_deeptutor-0.5.0.post4.dist-info/RECORD,,
+realtimex_deeptutor-0.5.0.post6.dist-info/METADATA,sha256=ZHgtwKQVopSxjI2xUxf27e-HiHVkrPtObk6b35e2zlk,58304
+realtimex_deeptutor-0.5.0.post6.dist-info/WHEEL,sha256=wUyA8OaulRlbfwMtmQsvNngGrxQHAvkKcvRmdizlJi0,92
+realtimex_deeptutor-0.5.0.post6.dist-info/entry_points.txt,sha256=slNAzwRLUpqiMtDRZBQIkXbU2vGMHL_om6-o19gYdh8,134
+realtimex_deeptutor-0.5.0.post6.dist-info/top_level.txt,sha256=zUAd6V7jDYhdL7bvg2S38YCM-gVhvd36WqkjxrT-02I,32
+realtimex_deeptutor-0.5.0.post6.dist-info/RECORD,,

src/agents/co_writer/narrator_agent.py CHANGED Viewed

@@ -315,30 +315,54 @@ class NarratorAgent(BaseAgent):
         self.logger.info(f"Starting TTS audio generation - ID: {audio_id}, Voice: {voice}")
         try:
-            binding = os.getenv("TTS_BINDING", "openai")
-            api_version = self.tts_config.get("api_version")
-            # Only use Azure client if binding is explicitly Azure,
-            # OR if binding is generic 'openai' but an Azure-specific api_version is present.
-            if binding == "azure_openai" or (binding == "openai" and api_version):
-                client = AsyncAzureOpenAI(
-                    api_key=self.tts_config["api_key"],
-                    azure_endpoint=self.tts_config["base_url"],
-                    api_version=api_version,
+            # Check if using RealTimeX SDK
+            if self.tts_config.get("source") == "realtimex":
+                from src.utils.realtimex import get_realtimex_sdk
+                sdk = get_realtimex_sdk()
+                # Use SDK to generate audio
+                audio_bytes = await sdk.tts.speak(
+                    text=script,
+                    voice=voice,
+                    model=self.tts_config.get("model"),
+                    provider=self.tts_config.get("provider")
+                    if self.tts_config.get("provider") != "realtimexai"
+                    else None,
+                    speed=self.tts_config.get("speed"),
+                    num_inference_steps=self.tts_config.get("quality"),
                 )
+                # Save bytes to file
+                with open(audio_path, "wb") as f:
+                    f.write(audio_bytes)
             else:
-                # Create OpenAI client with custom base_url
-                client = AsyncOpenAI(
-                    base_url=self.tts_config["base_url"], api_key=self.tts_config["api_key"]
+                # Standard OpenAI/Azure implementation
+                binding = os.getenv("TTS_BINDING", "openai")
+                api_version = self.tts_config.get("api_version")
+                # Only use Azure client if binding is explicitly Azure,
+                # OR if binding is generic 'openai' but an Azure-specific api_version is present.
+                if binding == "azure_openai" or (binding == "openai" and api_version):
+                    client = AsyncAzureOpenAI(
+                        api_key=self.tts_config["api_key"],
+                        azure_endpoint=self.tts_config["base_url"],
+                        api_version=api_version,
+                    )
+                else:
+                    # Create OpenAI client with custom base_url
+                    client = AsyncOpenAI(
+                        base_url=self.tts_config["base_url"], api_key=self.tts_config["api_key"]
+                    )
+                # Call OpenAI TTS API
+                response = await client.audio.speech.create(
+                    model=self.tts_config["model"], voice=voice, input=script
                 )
-            # Call OpenAI TTS API
-            response = await client.audio.speech.create(
-                model=self.tts_config["model"], voice=voice, input=script
-            )
-            # Save audio to file
-            await response.stream_to_file(audio_path)
+                # Save audio to file
+                await response.stream_to_file(audio_path)
             self.logger.info(f"Audio saved to: {audio_path}")

src/api/routers/realtimex.py CHANGED Viewed

@@ -83,12 +83,16 @@ async def get_providers():
 from pydantic import BaseModel
+from typing import Optional
 class RTXConfigApplyRequest(BaseModel):
-    config_type: str  # "llm" or "embedding"
+    config_type: str  # "llm", "embedding" or "tts"
     provider: str
     model: str
+    voice: Optional[str] = None
+    speed: Optional[float] = None
+    quality: Optional[int] = None
 @router.post("/realtimex/config/apply")
@@ -113,11 +117,20 @@ async def apply_rtx_config(request: RTXConfigApplyRequest):
             config_type_enum = ConfigType.LLM
         elif request.config_type == "embedding":
             config_type_enum = ConfigType.EMBEDDING
+        elif request.config_type == "tts":
+            config_type_enum = ConfigType.TTS
         else:
             raise HTTPException(400, f"Invalid config type: {request.config_type}")
         # Save RTX selection to rtx_active.json
-        if not set_rtx_active_config(request.config_type, request.provider, request.model):
+        if not set_rtx_active_config(
+            request.config_type,
+            request.provider,
+            request.model,
+            request.voice,
+            request.speed,
+            request.quality,
+        ):
             raise HTTPException(500, "Failed to save RTX configuration")
         # Set 'rtx' as the active config in unified config manager
@@ -129,6 +142,9 @@ async def apply_rtx_config(request: RTXConfigApplyRequest):
             "config_type": request.config_type,
             "provider": request.provider,
             "model": request.model,
+            "voice": request.voice,
+            "speed": request.speed,
+            "quality": request.quality,
         }
     except HTTPException:

src/services/config/unified_config.py CHANGED Viewed

@@ -190,6 +190,22 @@ class UnifiedConfigManager:
                 self.set_active_config(ConfigType.EMBEDDING, "rtx")
                 logger.info("Auto-activated RealTimeX for Embedding")
+            # Auto-activate for TTS
+            tts_data = self._load_configs(ConfigType.TTS)
+            tts_active_id = tts_data.get("active_id", "default")
+            # Only auto-activate if still using default
+            if tts_active_id == "default":
+                rtx_tts_config = get_rtx_active_config("tts")
+                if not rtx_tts_config:
+                    # Set default RTX TTS config
+                    set_rtx_active_config("tts", "realtimexai", "tts-1")
+                    logger.info("Auto-configured RealTimeX TTS with default model: tts-1")
+                # Activate RTX for TTS
+                self.set_active_config(ConfigType.TTS, "rtx")
+                logger.info("Auto-activated RealTimeX for TTS")
         except ImportError:
             # RTX utilities not available
             pass
@@ -472,8 +488,8 @@ class UnifiedConfigManager:
             if not should_use_realtimex_sdk():
                 return None
-            # Only LLM and Embedding are supported via RTX
-            if config_type not in (ConfigType.LLM, ConfigType.EMBEDDING):
+            # Only LLM, Embedding, and TTS are supported via RTX
+            if config_type not in (ConfigType.LLM, ConfigType.EMBEDDING, ConfigType.TTS):
                 return None
             # Get user's active selection (or use defaults)
@@ -482,15 +498,23 @@ class UnifiedConfigManager:
             if active:
                 provider = active.get("provider", "realtimexai")
                 model = active.get("model", "")
+                voice = active.get("voice")
+                speed = active.get("speed")
+                quality = active.get("quality")
             else:
                 # Use defaults
                 provider = "realtimexai"
+                voice = None
+                speed = None
+                quality = None
                 if config_type == ConfigType.LLM:
                     model = "gpt-4o-mini"
-                else:  # Embedding
+                elif config_type == ConfigType.EMBEDDING:
                     model = "text-embedding-3-small"
+                elif config_type == ConfigType.TTS:
+                    model = "tts-1"
-            return {
+            config = {
                 "id": "rtx",
                 "name": "RealTimeX",
                 "is_default": False,
@@ -500,6 +524,16 @@ class UnifiedConfigManager:
                 "api_key": "—",  # No API key needed
                 "base_url": "—",  # Uses SDK proxy
             }
+            # Add TTS-specific fields if present
+            if voice:
+                config["voice"] = voice
+            if speed is not None:
+                config["speed"] = speed
+            if quality is not None:
+                config["quality"] = quality
+            return config
         except ImportError:
             return None
@@ -602,15 +636,22 @@ class UnifiedConfigManager:
                             "id": "rtx",
                             "provider": rtx_active.get("provider", "realtimexai"),
                             "model": rtx_active.get("model", ""),
+                            "voice": rtx_active.get("voice"),  # Include voice for TTS
+                            "speed": rtx_active.get("speed"),  # Include speed for TTS
+                            "quality": rtx_active.get("quality"),  # Include quality for TTS
                             "source": "realtimex",  # This tells services to use SDK
                         }
                     else:
                         # Return defaults when no selection exists yet
-                        default_model = (
-                            "gpt-4o-mini"
-                            if config_type == ConfigType.LLM
-                            else "text-embedding-3-small"
-                        )
+                        if config_type == ConfigType.LLM:
+                            default_model = "gpt-4o-mini"
+                        elif config_type == ConfigType.EMBEDDING:
+                            default_model = "text-embedding-3-small"
+                        elif config_type == ConfigType.TTS:
+                            default_model = "tts-1"
+                        else:
+                            default_model = ""
                         return {
                             "id": "rtx",
                             "provider": "realtimexai",

src/services/tts/config.py CHANGED Viewed

@@ -60,6 +60,7 @@ def get_tts_config() -> dict:
                 "base_url": config.get("base_url", ""),
                 "api_version": config.get("api_version"),
                 "voice": config.get("voice", "alloy"),
+                "source": config.get("source"),  # "realtimex" when using RTX
             }
     except ImportError:
         # Unified config service not yet available, fall back to env

src/utils/realtimex.py CHANGED Viewed

@@ -45,6 +45,8 @@ def get_realtimex_sdk() -> "RealtimeXSDK":
                         "llm.chat",  # For LLM completions
                         "llm.providers",  # For listing available providers
                         "llm.embed",  # For embeddings
+                        "tts.speak",  # For TTS
+                        "tts.providers",  # For listing TTS providers
                     ]
                 )
             )
@@ -160,21 +162,34 @@ async def get_cached_providers() -> dict:
     try:
         sdk = get_realtimex_sdk()
-        # Fetch both in parallel (conceptually, though await is sequential here)
-        # In a real async environment we might use asyncio.gather, but sequential is safe
+        # Fetch all providers in parallel (conceptually)
         llm_result = await sdk.llm.chat_providers()
         embed_result = await sdk.llm.embed_providers()
+        tts_result = await sdk.tts.list_providers()
         def serialize_provider(p):
-            return {
+            # Handle both object and dict responses (SDK might return dicts for TTS)
+            if isinstance(p, dict):
+                # Normalize: ensure 'provider' key exists (SDK uses 'id' for TTS)
+                if "provider" not in p and "id" in p:
+                    p["provider"] = p["id"]
+                return p
+            data = {
                 "provider": p.provider,
                 "models": [{"id": m.id, "name": m.name} for m in p.models],
             }
+            # Add config metadata if available (for TTS advanced options)
+            if hasattr(p, "config"):
+                data["config"] = p.config
+            return data
         _providers_cache = {
             "rtx_enabled": True,
             "llm": [serialize_provider(p) for p in llm_result.providers],
             "embedding": [serialize_provider(p) for p in embed_result.providers],
+            "tts": [serialize_provider(p) for p in tts_result],
         }
         _providers_cache_time = time.time()
@@ -247,23 +262,41 @@ def get_rtx_active_config(config_type: str) -> Optional[dict]:
     return data.get(config_type)
-def set_rtx_active_config(config_type: str, provider: str, model: str) -> bool:
+def set_rtx_active_config(
+    config_type: str,
+    provider: str,
+    model: str,
+    voice: Optional[str] = None,
+    speed: Optional[float] = None,
+    quality: Optional[int] = None,
+) -> bool:
     """
     Set the active RTX config for a specific config type.
     Args:
-        config_type: "llm" or "embedding"
+        config_type: "llm", "embedding" or "tts"
         provider: Provider name (e.g., "openai")
         model: Model ID (e.g., "gpt-4o")
+        voice: Optional voice ID (for TTS)
+        speed: Optional speed multiplier (for TTS)
+        quality: Optional quality/inference steps (for TTS)
     Returns:
         True if saved successfully
     """
     data = _load_rtx_active_config()
-    data[config_type] = {
+    config = {
         "provider": provider,
         "model": model,
     }
+    if voice:
+        config["voice"] = voice
+    if speed is not None:
+        config["speed"] = speed
+    if quality is not None:
+        config["quality"] = quality
+    data[config_type] = config
     return _save_rtx_active_config(data)

{realtimex_deeptutor-0.5.0.post4.dist-info → realtimex_deeptutor-0.5.0.post6.dist-info}/WHEEL RENAMED Viewed

File without changes

{realtimex_deeptutor-0.5.0.post4.dist-info → realtimex_deeptutor-0.5.0.post6.dist-info}/entry_points.txt RENAMED Viewed

File without changes

{realtimex_deeptutor-0.5.0.post4.dist-info → realtimex_deeptutor-0.5.0.post6.dist-info}/licenses/LICENSE RENAMED Viewed

File without changes

{realtimex_deeptutor-0.5.0.post4.dist-info → realtimex_deeptutor-0.5.0.post6.dist-info}/top_level.txt RENAMED Viewed

File without changes

realtimex-deeptutor 0.5.0.post4__py3-none-any.whl → 0.5.0.post6__py3-none-any.whl

realtimex-deeptutor 0.5.0.post4py3-none-any.whl → 0.5.0.post6py3-none-any.whl