npm - univoice - Versions diffs - 0.2.0 → 0.3.0-beta.0 - Mend

univoice 0.2.0 → 0.3.0-beta.0

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (34) hide show

package/README.md +69 -4
package/dist/base--1Nj-ls3.d.ts +85 -0
package/dist/base-R8jvH4Ko.d.ts +84 -0
package/dist/chunk-7QVYU63E.js +2 -3
package/dist/chunk-7QVYU63E.js.map +1 -1
package/dist/{chunk-IL5MVEN6.js → chunk-J2ZVBKXK.js} +98 -224
package/dist/chunk-J2ZVBKXK.js.map +1 -0
package/dist/{chunk-ED5YYFDV.js → chunk-NDNOETWJ.js} +145 -171
package/dist/chunk-NDNOETWJ.js.map +1 -0
package/dist/chunk-QWT6LQKM.js +134 -0
package/dist/chunk-QWT6LQKM.js.map +1 -0
package/dist/chunk-XKOFZUYW.js +38 -0
package/dist/chunk-XKOFZUYW.js.map +1 -0
package/dist/save-Cbjwiunv.d.ts +42 -0
package/dist/src/asr/index.d.ts +4 -107
package/dist/src/asr/index.js +4 -35
package/dist/src/asr/index.js.map +1 -1
package/dist/src/asr/providers/index.d.ts +52 -0
package/dist/src/asr/providers/index.js +12 -0
package/dist/src/asr/providers/index.js.map +1 -0
package/dist/src/index.d.ts +4 -2
package/dist/src/index.js +6 -57
package/dist/src/index.js.map +1 -1
package/dist/src/tts/index.d.ts +3 -1
package/dist/src/tts/index.js +4 -25
package/dist/src/tts/index.js.map +1 -1
package/dist/src/tts/providers/index.d.ts +45 -0
package/dist/src/tts/providers/index.js +12 -0
package/dist/src/tts/providers/index.js.map +1 -0
package/dist/tee-DEtN5C9m.d.ts +38 -0
package/package.json +15 -4
package/dist/chunk-ED5YYFDV.js.map +0 -1
package/dist/chunk-IL5MVEN6.js.map +0 -1
package/dist/index-DaR9FCnn.d.ts +0 -109

package/README.md CHANGED Viewed

@@ -30,6 +30,7 @@
 - 🚀 **边发边收** - LLM 流式输出可直接转换为语音，显著降低首字延迟
 - 🔌 **插件化架构** - 轻松扩展支持新的语音服务提供商
 - 📦 **TypeScript 优先** - 完整的类型定义支持
+- 🌳 **Tree-Shaking 支持** - 按需加载，减少打包体积
 ### 适用场景
@@ -201,6 +202,63 @@ for await (const chunk of asr.listen(audioBuffer)) {
 ---
+## 按需加载（Tree-Shaking）
+univoice 支持 tree-shaking，你可以按需加载所需的 provider，减少打包体积。
+### 方式一：自动注册全部 Provider
+适合需要使用多个 provider 的场景：
+```typescript
+import 'univoice/tts/providers';  // 注册所有 TTS provider
+import { createTTS } from 'univoice/tts';
+const tts = createTTS({ provider: 'doubao', ... });
+```
+### 方式二：手动注册单个 Provider（推荐）
+只打包需要的 provider，最小化打包体积：
+```typescript
+import { createTTS, registerTTSProvider } from 'univoice/tts';
+import { DoubaoTTS } from 'univoice/tts/providers/doubao';
+// 只注册需要的 provider
+registerTTSProvider('doubao', DoubaoTTS);
+const tts = createTTS({ provider: 'doubao', ... });
+```
+### 方式三：直接使用 Provider 类
+最精简的方式，不使用工厂函数：
+```typescript
+import { DoubaoTTS } from 'univoice/tts/providers/doubao';
+const tts = new DoubaoTTS({
+  appId: 'your-app-id',
+  accessToken: 'your-access-token',
+  // ...
+});
+const response = await tts.synthesize({ text: '你好' });
+```
+### 可用导入路径
+| 路径 | 说明 |
+|------|------|
+| `univoice` | 主入口，导出所有 API（不自动注册 provider） |
+| `univoice/tts` | TTS 模块入口 |
+| `univoice/tts/providers` | 自动注册所有 TTS provider |
+| `univoice/asr` | ASR 模块入口 |
+| `univoice/asr/providers` | 自动注册所有 ASR provider |
+---
 ## API 文档
 ### TTS API
@@ -405,14 +463,14 @@ pnpm format
 1. 在 `src/tts/providers/` 或 `src/asr/providers/` 创建新文件
 2. 继承 `BaseTTS` 或 `BaseASR` 类
 3. 实现必要的方法
-4. 在文件末尾调用 `registerTTSProvider()` 或 `registerASRProvider()`
+4. 导出 Provider 类
 ```typescript
 // src/tts/providers/my-provider.ts
-import { BaseTTS, registerTTSProvider } from '@/tts/index';
+import { BaseTTS } from '@/tts/index';
 import type { TTSOptions, TTSRequest, TTSResponse } from '@/types/tts';
-class MyTTS extends BaseTTS {
+export class MyTTS extends BaseTTS {
   constructor(options: TTSOptions) {
     super(options);
   }
@@ -425,8 +483,15 @@ class MyTTS extends BaseTTS {
     };
   }
 }
+```
+然后在 `src/tts/providers/index.ts` 中添加自动注册：
+```typescript
+import { MyTTS } from './my-provider';
+import { registerTTSProvider } from '../index';
-registerTTSProvider('my-provider', (options) => new MyTTS(options));
+registerTTSProvider('my-provider', MyTTS);
 ```
 ### 项目结构

package/dist/base--1Nj-ls3.d.ts ADDED Viewed

@@ -0,0 +1,85 @@
+interface OpenAIChatCompletionChunk {
+    choices?: Array<{
+        delta?: {
+            content?: string | null;
+            reasoning_content?: string | null;
+        };
+    }>;
+}
+type OpenAIStream = AsyncIterable<OpenAIChatCompletionChunk>;
+interface TTSOptions {
+    provider: string;
+    apiKey?: string;
+    baseUrl?: string;
+    model?: string;
+    voice?: string;
+    speed?: number;
+    volume?: number;
+    pitch?: number;
+    format?: 'mp3' | 'wav' | 'ogg' | 'flac' | 'pcm';
+    language?: string;
+    appId?: string;
+    accessToken?: string;
+    resourceId?: string;
+    sampleRate?: number;
+    enableTimestamp?: boolean;
+}
+interface TTSRequest {
+    text: string;
+    options?: Partial<TTSOptions>;
+}
+interface TTSResponse {
+    audio: Buffer | Uint8Array;
+    format: string;
+    duration?: number;
+}
+interface SpeakInstanceOptions {
+    stream?: boolean;
+}
+interface TTSProvider {
+    name: string;
+    synthesize(request: TTSRequest): Promise<TTSResponse>;
+    speak?(input: string | TextStream, options?: SpeakInstanceOptions): AsyncIterable<TTSStreamChunk> | Promise<TTSResponse>;
+    listVoices?(): Promise<TTSVoice[]>;
+}
+interface TTSStreamChunk {
+    audioChunk: Uint8Array;
+}
+type TextStream = AsyncIterable<string> | AsyncGenerator<string> | OpenAIStream;
+interface TTSVoice {
+    id: string;
+    name: string;
+    language: string;
+    gender?: 'male' | 'female' | 'neutral';
+}
+type TTSProviderType = 'doubao' | 'minimax' | 'qwen' | 'openai' | 'gemini' | string;
+declare abstract class BaseTTS implements TTSProvider {
+    abstract name: string;
+    apiKey: string;
+    baseUrl: string;
+    model: string;
+    voice: string;
+    speed: number;
+    volume: number;
+    pitch: number;
+    format: 'mp3' | 'wav' | 'ogg' | 'flac' | 'pcm';
+    language: string;
+    constructor(options: TTSOptions);
+    abstract synthesize(request: TTSRequest): Promise<TTSResponse>;
+    speak(input: string | TextStream): Promise<TTSResponse>;
+    speak(input: string | TextStream, options: SpeakInstanceOptions & {
+        stream: true;
+    }): AsyncIterable<TTSStreamChunk>;
+    speak(input: string | TextStream, options: SpeakInstanceOptions & {
+        stream: false;
+    }): Promise<TTSResponse>;
+    private createSpeakStreamIterable;
+    private synthesizeFromInput;
+    protected speakStream(_input: string | TextStream): AsyncIterable<TTSStreamChunk>;
+    listVoices(): Promise<TTSVoice[]>;
+    buildRequestOptions(request: TTSRequest): TTSOptions;
+}
+export { BaseTTS as B, type OpenAIChatCompletionChunk as O, type SpeakInstanceOptions as S, type TTSOptions as T, type TTSProvider as a, type TTSProviderType as b, type TTSRequest as c, type TTSResponse as d, type TTSStreamChunk as e, type TTSVoice as f, type TextStream as g, type OpenAIStream as h };

package/dist/base-R8jvH4Ko.d.ts ADDED Viewed

@@ -0,0 +1,84 @@
+interface AudioFormat {
+    sampleRate?: number;
+    bits?: number;
+    channel?: number;
+}
+interface ASROptions {
+    provider: string;
+    apiKey?: string;
+    baseUrl?: string;
+    model?: string;
+    language?: string;
+    prompt?: string;
+    responseFormat?: 'json' | 'text' | 'srt' | 'vtt' | 'verbose_json';
+    appKey?: string;
+    accessKey?: string;
+    resourceId?: string;
+    mode?: 'streaming' | 'nostream' | 'async';
+    audioFormat?: AudioFormat;
+    segmentDuration?: number;
+    enableItn?: boolean;
+    enablePunc?: boolean;
+    enableDdc?: boolean;
+    showUtterances?: boolean;
+}
+interface ListenInstanceOptions {
+    stream?: boolean;
+}
+interface ASRRequest {
+    audio: Buffer | Uint8Array | string;
+    options?: Partial<ASROptions>;
+}
+interface ASRResponse {
+    text: string;
+    language?: string;
+    duration?: number;
+    segments?: ASRSegment[];
+}
+interface ASRSegment {
+    id: number;
+    start: number;
+    end: number;
+    text: string;
+    speaker?: string;
+    confidence?: number;
+}
+interface ASRStreamChunk {
+    text: string;
+    isFinal: boolean;
+    confidence?: number;
+    segment?: ASRSegment;
+}
+interface ASRProvider {
+    name: string;
+    listenStream(audio: AudioStream): AsyncIterable<ASRStreamChunk>;
+}
+type ASRProviderType = 'doubao' | 'minimax' | 'qwen' | 'openai' | 'gemini' | string;
+type AudioStream = AsyncIterable<Buffer | Uint8Array>;
+type AudioStreamInput = AudioStream | Buffer | Uint8Array | string;
+declare abstract class BaseASR {
+    abstract name: string;
+    apiKey: string;
+    baseUrl: string;
+    model: string;
+    language: string;
+    prompt: string;
+    responseFormat: 'json' | 'text' | 'srt' | 'vtt' | 'verbose_json';
+    constructor(options: ASROptions);
+    abstract listenStream(audio: AudioStream): AsyncIterable<ASRStreamChunk>;
+    private isAudioStream;
+    private isString;
+    private adaptAudioInput;
+    private fileToPcmAudioStream;
+    private createStreamIterable;
+    private collectASRResponse;
+    listen(audio: AudioStreamInput, options: ListenInstanceOptions & {
+        stream: true;
+    }): AsyncIterable<ASRStreamChunk>;
+    listen(audio: AudioStreamInput, options?: ListenInstanceOptions & {
+        stream?: false;
+    }): Promise<ASRResponse>;
+}
+export { type ASROptions as A, BaseASR as B, type ListenInstanceOptions as L, type ASRProvider as a, type ASRProviderType as b, type ASRRequest as c, type ASRResponse as d, type ASRSegment as e, type ASRStreamChunk as f, type AudioFormat as g, type AudioStream as h, type AudioStreamInput as i };

package/dist/chunk-7QVYU63E.js CHANGED Viewed

@@ -1,7 +1,6 @@
 var __defProp = Object.defineProperty;
 var __name = (target, value) => __defProp(target, "name", { value, configurable: true });
-export {
-  __name
-};
+export { __name };
+//# sourceMappingURL=chunk-7QVYU63E.js.map
 //# sourceMappingURL=chunk-7QVYU63E.js.map

package/dist/chunk-7QVYU63E.js.map CHANGED Viewed

	@@ -1 +1 @@
1	- {"version":3,"sources":[],"~~sourcesContent~~":[],"mappings":"","~~names~~":[]}
1	+ {"version":3,"sources":[],"names":[],"mappings":"","file":"chunk-7QVYU63E.js"}