npm - @rookiestar/eng-lang-tutor - Versions diffs - 1.1.3 → 1.1.5 - Mend

@rookiestar/eng-lang-tutor 1.1.3 → 1.1.5

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Potentially problematic release.

This version of @rookiestar/eng-lang-tutor might be problematic. Click here for more details.

Files changed (6) hide show

package/README.md +20 -2
package/README_EN.md +20 -2
package/package.json +1 -1
package/scripts/audio/tts/manager.py +13 -10
package/scripts/audio/tts/providers/__init__.py +2 -0
package/scripts/audio/tts/providers/edge.py +111 -0

package/README.md CHANGED Viewed

@@ -103,7 +103,16 @@ openclaw pairing approve discord YOUR_PAIRING_CODE
 3. 选择导师风格（幽默/严谨/随意/专业）
 4. 设置口语/书面语比例
 5. 配置推送时间（知识点和测验时间）
-6. 选择是否启用语音教学，如启用可调节语速
+6. **语音教学配置** - 选择是否启用语音版知识点
+   - 如启用，选择语速（0.5-1.7，默认 0.9）
+   - 默认使用 Edge-TTS（免费，无需配置）
+   - 如需使用讯飞，请先在服务器上设置环境变量：
+     ```bash
+     export TTS_PROVIDER=xunfei
+     export XUNFEI_APPID=your_appid
+     export XUNFEI_API_KEY=your_api_key
+     export XUNFEI_API_SECRET=your_api_secret
+     ```
 7. 确认您的设置并创建定时任务
 ## TTS 语音配置
@@ -255,7 +264,16 @@ eng-lang-tutor/
 │   ├── constants.py            # 共享常量（等级阈值）
 │   ├── utils.py                # 工具函数（安全除法、深度合并）
 │   ├── cli.py                  # CLI 入口点
-│   └── tts/                    # TTS 语音合成模块
+│   └── audio/                  # 音频模块
+│       ├── tts/                # TTS 语音合成
+│       │   ├── base.py         # TTS 抽象基类
+│       │   ├── manager.py      # TTS 管理器
+│       │   └── providers/      # TTS 提供者
+│       │       ├── edge.py     # Edge-TTS (默认)
+│       │       └── xunfei.py   # 讯飞 TTS
+│       ├── composer.py         # 音频合成
+│       ├── converter.py        # 格式转换
+│       └── feishu_voice.py     # 飞书语音发送
 ├── templates/
 │   ├── state_schema.json       # 状态 JSON Schema
 │   ├── keypoint_schema.json    # 知识点 JSON Schema

package/README_EN.md CHANGED Viewed

@@ -103,7 +103,16 @@ When you first interact with the bot, it will guide you through a 7-step onboard
 3. Select tutor style (humorous/rigorous/casual/professional)
 4. Set oral vs written focus
 5. Configure schedule (keypoint and quiz times)
-6. Choose whether to enable voice teaching, adjust speed if enabled
+6. **Voice Teaching Configuration** - Choose whether to enable audio keypoints
+   - If enabled, select speech speed (0.5-1.7, default 0.9)
+   - Edge-TTS is used by default (free, no configuration needed)
+   - To use XunFei, set environment variables on your server first:
+     ```bash
+     export TTS_PROVIDER=xunfei
+     export XUNFEI_APPID=your_appid
+     export XUNFEI_API_KEY=your_api_key
+     export XUNFEI_API_SECRET=your_api_secret
+     ```
 7. Confirm your settings and create cron jobs
 ## TTS Voice Configuration
@@ -255,7 +264,16 @@ eng-lang-tutor/
 │   ├── constants.py            # Shared constants (level thresholds)
 │   ├── utils.py                # Utility functions (safe divide, deep merge)
 │   ├── cli.py                  # CLI entry point
-│   └── tts/                    # TTS module
+│   └── audio/                  # Audio module
+│       ├── tts/                # TTS voice synthesis
+│       │   ├── base.py         # TTS abstract base class
+│       │   ├── manager.py      # TTS manager
+│       │   └── providers/      # TTS providers
+│       │       ├── edge.py     # Edge-TTS (default)
+│       │       └── xunfei.py   # XunFei TTS
+│       ├── composer.py         # Audio composition
+│       ├── converter.py        # Format conversion
+│       └── feishu_voice.py     # Feishu voice sender
 ├── templates/
 │   ├── state_schema.json       # State JSON Schema
 │   ├── keypoint_schema.json    # Keypoint JSON Schema

package/package.json CHANGED Viewed

@@ -1,6 +1,6 @@
 {
   "name": "@rookiestar/eng-lang-tutor",
-  "version": "1.1.3",
+  "version": "1.1.5",
   "description": "English language tutor skill for OpenClaw - Learn authentic American English expressions with gamification",
   "keywords": [
     "english",

package/scripts/audio/tts/manager.py CHANGED Viewed

@@ -10,7 +10,7 @@ TTS 管理器 - 通用入口，支持多 Provider
     # 方式 2：直接传入讯飞密钥
     manager = TTSManager(
-        provider="xunfei",
+        provider="edge-tts",
         appid="xxx",
         api_key="xxx",
         api_secret="xxx"
@@ -33,6 +33,7 @@ import sys
 sys.path.insert(0, str(Path(__file__).parent.parent.parent))
 from .base import TTSProvider, TTSConfig, TTSResult
+from .providers.edge import EdgeTTSProvider
 from .providers.xunfei import XunFeiProvider
 try:
@@ -43,10 +44,8 @@ except ImportError:
 # Provider 注册表
 PROVIDERS: Dict[str, Type[TTSProvider]] = {
+    "edge-tts": EdgeTTSProvider,
     "xunfei": XunFeiProvider,
-    # 可扩展更多 provider
-    # "edge-tts": EdgeTTSProvider,
-    # "minimax": MiniMaxProvider,
 }
@@ -65,7 +64,7 @@ class TTSManager:
     def __init__(
         self,
-        provider: str = "xunfei",
+        provider: str = "edge-tts",
         data_dir: str = None,
         config: Optional[TTSConfig] = None,
         **credentials
@@ -74,16 +73,16 @@ class TTSManager:
         初始化 TTS 管理器
         Args:
-            provider: Provider 名称（目前仅支持 "xunfei"）
+            provider: Provider 名称（支持 "edge-tts" 或 "xunfei"）
             data_dir: 数据目录（默认使用 OPENCLAW_STATE_DIR 或 ~/.openclaw/state/eng-lang-tutor/）
             config: TTS 配置
             **credentials: Provider 认证信息
         示例:
-            # 讯飞（使用默认数据目录）
-            manager = TTSManager(provider="xunfei")
+            # Edge-TTS（免费，无需密钥）
+            manager = TTSManager(provider="edge-tts")
-            # 讯飞（直接传入密钥）
+            # 讯飞（国内稳定）
             manager = TTSManager(
                 provider="xunfei",
                 appid="xxx",
@@ -121,6 +120,10 @@ class TTSManager:
         从环境变量创建 TTS 管理器
         环境变量格式：
+            # Edge-TTS（默认，免费无需配置）
+            TTS_PROVIDER=edge-tts
+            # 讯飞（需配置密钥）
             TTS_PROVIDER=xunfei
             XUNFEI_APPID=xxx
             XUNFEI_API_KEY=xxx
@@ -133,7 +136,7 @@ class TTSManager:
         Returns:
             TTSManager 实例
         """
-        provider = provider or os.getenv("TTS_PROVIDER", "xunfei")
+        provider = provider or os.getenv("TTS_PROVIDER", "edge-tts")
         return cls(provider=provider, **kwargs)
     def switch_provider(self, provider: str, **credentials) -> None:

package/scripts/audio/tts/providers/__init__.py CHANGED Viewed

@@ -3,8 +3,10 @@
 TTS Providers - TTS 服务提供者实现
 """
+from .edge import EdgeTTSProvider
 from .xunfei import XunFeiProvider
 __all__ = [
+    "EdgeTTSProvider",
     "XunFeiProvider",
 ]

package/scripts/audio/tts/providers/edge.py ADDED Viewed

@@ -0,0 +1,111 @@
+#!/usr/bin/env python3
+"""
+Edge-TTS Provider 实现
+Microsoft Edge TTS 服务：
+- 完全免费，无需 API 密钥
+- 高质量 24kHz 神经语音
+- 支持多种美式英语发音人
+- 国内网络可能需要代理
+"""
+import asyncio
+import edge_tts
+from pathlib import Path
+from typing import Optional, ClassVar, Dict
+from ..base import TTSProvider, TTSConfig, TTSResult
+class EdgeTTSProvider(TTSProvider):
+    """
+    Microsoft Edge TTS Provider
+    支持的美式英语发音人：
+    - en-US-JennyNeural: 女声，友好亲切（推荐）
+    - en-US-AriaNeural: 女声，自信清晰
+    - en-US-EricNeural: 男声，专业理性（推荐）
+    - en-US-GuyNeural: 男声，热情活力
+    - en-US-AnaNeural: 女声，可爱随和
+    - en-US-ChristopherNeural: 男声，权威可靠
+    无需认证信息，直接使用。
+    """
+    PROVIDER_NAME: ClassVar[str] = "edge-tts"
+    DEFAULT_FEMALE_VOICE: ClassVar[str] = "en-US-JennyNeural"  # 友好亲切
+    DEFAULT_MALE_VOICE: ClassVar[str] = "en-US-EricNeural"     # 专业理性
+    # 角色音色映射：旁白-女声，对话A-男声，对话B-女声
+    DEFAULT_NARRATOR_VOICE: ClassVar[str] = "en-US-JennyNeural"    # 旁白 - 女声
+    DEFAULT_DIALOGUE_A_VOICE: ClassVar[str] = "en-US-EricNeural"   # 对话 A - 男声
+    DEFAULT_DIALOGUE_B_VOICE: ClassVar[str] = "en-US-JennyNeural"  # 对话 B - 女声
+    SUPPORTED_VOICES: ClassVar[Dict[str, str]] = {
+        "en-US-JennyNeural": "美式英语女声，友好亲切（推荐）",
+        "en-US-AriaNeural": "美式英语女声，自信清晰",
+        "en-US-EricNeural": "美式英语男声，专业理性（推荐）",
+        "en-US-GuyNeural": "美式英语男声，热情活力",
+        "en-US-AnaNeural": "美式英语女声，可爱随和",
+        "en-US-ChristopherNeural": "美式英语男声，权威可靠",
+        "en-US-MichelleNeural": "美式英语女声，友好舒适",
+        "en-US-RogerNeural": "美式英语男声，生动活泼",
+        "en-US-AndrewNeural": "美式英语男声，友好积极",
+        "en-US-BrianNeural": "美式英语男声，友好积极",
+        "en-US-EmmaNeural": "美式英语女声，友好积极",
+        "en-US-AvaNeural": "美式英语女声，友好积极",
+    }
+    def _validate_credentials(self) -> None:
+        """
+        验证认证信息
+        Edge-TTS 不需要认证信息，直接通过。
+        """
+        # Edge-TTS 不需要任何认证信息
+        pass
+    def synthesize(
+        self,
+        text: str,
+        output_path: Path,
+        voice: Optional[str] = None,
+        speed: Optional[float] = None
+    ) -> TTSResult:
+        """
+        合成语音
+        Args:
+            text: 要合成的文本
+            output_path: 输出文件路径（.mp3）
+            voice: 语音 ID（可选，默认使用女声）
+            speed: 语速（可选，0.5-2.0，1.0 = 正常）
+        Returns:
+            TTSResult: 合成结果
+        """
+        voice = voice or self.get_voice("female")
+        speed_val = speed or self.config.speed
+        # 将 speed (0.5-2.0) 转换为 edge-tts 的 rate 格式
+        # speed=1.0 -> rate="+0%"
+        # speed=0.7 -> rate="-30%" (更慢，适合学习)
+        # speed=1.5 -> rate="+50%" (更快)
+        rate_percent = int((speed_val - 1.0) * 100)
+        rate = f"{rate_percent:+d}%"
+        # 确保输出目录存在
+        output_path = Path(output_path)
+        output_path.parent.mkdir(parents=True, exist_ok=True)
+        async def _synthesize_async():
+            """异步合成语音"""
+            communicate = edge_tts.Communicate(text, voice, rate=rate)
+            await communicate.save(str(output_path))
+        try:
+            # 在同步上下文中运行异步代码
+            asyncio.run(_synthesize_async())
+            return TTSResult(success=True, audio_path=output_path)
+        except Exception as e:
+            return TTSResult(success=False, error_message=str(e))