npm - @aim-packages/subtitle - Versions diffs - 0.1.1 → 0.1.3 - Mend

@aim-packages/subtitle 0.1.1 → 0.1.3

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (5) hide show

package/README.md CHANGED Viewed

@@ -366,6 +366,27 @@ utils.convertTimeToAssFormat("00:00:00.999");  // "0:00:00.99"
 3. 确保时间轴的准确性和兼容性
 4. 自动处理毫秒的精度转换（3位转2位）
+##### `cleanTimeDisplay(timeString: string): string`
+清理时间显示格式，移除毫秒部分和多余的小时前缀。
+```typescript
+import { utils } from '@aim-packages/subtitle';
+utils.cleanTimeDisplay("00:01:30.500");  // "01:30"
+utils.cleanTimeDisplay("01:45:20,123");  // "01:45:20"
+utils.cleanTimeDisplay("00:00:05.00");   // "00:05"
+utils.cleanTimeDisplay("01:30:45,50");   // "01:30:45"
+```
+**参数说明：**
+- `timeString: string` - 输入的时间字符串
+**作用：**
+1. 移除时间字符串末尾的毫秒部分（支持 .xxx、,xxx 等分隔符）
+2. 移除时间字符串开头多余的 "00:" 小时前缀
+3. 保持时间格式的简洁性和可读性
+4. 自动处理不同格式的时间字符串，统一输出格式
 ### Parser 字幕格式解析器
 Parser 模块提供了多种字幕格式的解析和转换功能，支持 SRT、VTT、ASS 等常见字幕格式，以及流式解析器用于实时处理。
@@ -1162,6 +1183,185 @@ console.log(assContent);
 // 输出完整的ASS格式字幕文件，包含样式定义和字幕内容
 ```
+##### `outputTxt(params: OutputTextParams): string`
+生成TXT格式的纯文本文件，支持多种输出模式。
+**参数:**
+- `params: OutputTextParams` - 输出参数配置
+  - `useIndex?: boolean` - 是否显示索引编号
+  - `useTimestamp?: boolean` - 是否显示时间戳
+  - `useParagraph?: boolean` - 是否使用段落模式（按发言人分组或按chunkSize分组）
+**返回值:**
+- `string` - TXT格式的文本内容
+**功能特性:**
+- **段落模式**: 支持按说话人分组或按固定大小分块
+- **行模式**: 每个字幕片段单独一行
+- **多语言支持**: 自动检测中日韩语言，调整文本连接方式
+- **说话人支持**: 支持显示说话人名称和时间戳
+**示例:**
+```typescript
+import { tools } from '@aim-packages/subtitle';
+const segments1 = [
+  ["00:00:01,000", "00:00:03,000", "Hello world", "speaker1"],
+  ["00:00:03,000", "00:00:05,000", "How are you?", "speaker1"],
+  ["00:00:05,000", "00:00:07,000", "I'm fine, thank you.", "speaker2"]
+];
+const segments2 = [
+  ["00:00:01,000", "00:00:03,000", "你好世界", "speaker1"],
+  ["00:00:03,000", "00:00:05,000", "你好吗？", "speaker1"],
+  ["00:00:05,000", "00:00:07,000", "我很好，谢谢。", "speaker2"]
+];
+const speakerData = {
+  settings: {
+    speaker1: { spk: "speaker1", name: "张三", color: "#FF0000" },
+    speaker2: { spk: "speaker2", name: "李四", color: "#00FF00" }
+  },
+  speakers: { speaker1: 1, speaker2: 1 },
+  data: []
+};
+// 行模式 - 每个字幕片段单独一行
+const txtContent1 = tools.output.outputTxt({
+  segments1,
+  segments2,
+  speakerData,
+  useIndex: true,
+  useTimestamp: true,
+  useParagraph: false
+});
+console.log(txtContent1);
+// 输出:
+// 0
+// 00:00:01,000 --> 00:00:03,000
+// 张三: Hello world
+// 你好世界
+//
+// 1
+// 00:00:03,000 --> 00:00:05,000
+// 张三: How are you?
+// 你好吗？
+//
+// 2
+// 00:00:05,000 --> 00:00:07,000
+// 李四: I'm fine, thank you.
+// 我很好，谢谢。
+// 段落模式 - 按说话人分组
+const txtContent2 = tools.output.outputTxt({
+  segments1,
+  segments2,
+  speakerData,
+  useIndex: true,
+  useTimestamp: true,
+  useParagraph: true
+});
+console.log(txtContent2);
+// 输出:
+// 1
+// 张三 - 00:00:01,000 --> 00:00:05,000
+// Hello world How are you?
+// 你好世界 你好吗？
+//
+// 2
+// 李四 - 00:00:05,000 --> 00:00:07,000
+// I'm fine, thank you.
+// 我很好，谢谢。
+##### `outputMarkdown(params: OutputTextParams): string`
+生成 Markdown 格式的字幕文件，支持多种输出模式和说话人分组。
+**参数:**
+- `params: OutputTextParams` - 输出参数配置
+  - `header?: string` - 文档标题
+  - `isMd?: boolean` - 是否为 Markdown 格式（影响换行符）
+  - `chunkSize?: number` - 分块大小，默认为 10
+**返回值:**
+- `string` - Markdown 格式的字幕内容
+**功能特性:**
+- **说话人分组**: 支持按说话人分组显示内容
+- **多语言支持**: 自动检测中日韩语言，调整文本连接方式
+- **分块处理**: 支持按固定大小分块处理长文本
+- **时间显示**: 自动清理时间格式，移除毫秒和多余前缀
+- **灵活格式**: 支持 Markdown 和纯文本两种输出格式
+**示例:**
+```typescript
+import { tools } from '@aim-packages/subtitle';
+const segments1 = [
+  ["00:00:01,000", "00:00:03,000", "Hello world", "speaker1"],
+  ["00:00:03,000", "00:00:05,000", "How are you?", "speaker1"],
+  ["00:00:05,000", "00:00:07,000", "I'm fine, thank you.", "speaker2"]
+];
+const segments2 = [
+  ["00:00:01,000", "00:00:03,000", "你好世界", "speaker1"],
+  ["00:00:03,000", "00:00:05,000", "你好吗？", "speaker1"],
+  ["00:00:05,000", "00:00:07,000", "我很好，谢谢。", "speaker2"]
+];
+const speakerData = {
+  settings: {
+    speaker1: { spk: "speaker1", name: "张三", color: "#FF0000" },
+    speaker2: { spk: "speaker2", name: "李四", color: "#00FF00" }
+  },
+  speakers: { speaker1: 1, speaker2: 1 },
+  data: []
+};
+// 带说话人的 Markdown 输出
+const mdContent = tools.output.outputMarkdown({
+  segments1,
+  segments2,
+  header: "# 会议记录",
+  speakerData,
+  chunkSize: 5
+});
+console.log(mdContent);
+// 输出:
+// # 会议记录
+//
+// 张三 01:30 - 01:45
+// Hello world How are you?
+// 你好世界 你好吗？
+//
+// 李四 01:45 - 01:47
+// I'm fine, thank you.
+// 我很好，谢谢。
+// 纯文本输出（无说话人）
+const textContent = tools.output.outputMarkdown({
+  segments1,
+  segments2,
+  header: "会议记录",
+  isMd: false,
+  chunkSize: 3
+});
+console.log(textContent);
+// 输出:
+// 会议记录
+// 1. Hello world
+// 你好世界
+// 2. How are you?
+// 你好吗？
+// 3. I'm fine, thank you.
+// 我很好，谢谢。
+```
 #### 完整的字幕处理流程示例
 ```typescript