PyPI - xiaogpt - Versions diffs - 2.42__tar.gz → 2.60__tar.gz - Mend

xiaogpt 2.42tar.gz → 2.60tar.gz

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (30) hide show

{xiaogpt-2.42 → xiaogpt-2.60}/PKG-INFO RENAMED Viewed

@@ -1,6 +1,6 @@
 Metadata-Version: 2.1
 Name: xiaogpt
-Version: 2.42
+Version: 2.60
 Summary: Play ChatGPT or other LLM with xiaomi AI speaker
 Author-Email: yihong0618 <zouzou0208@gmail.com>
 License: MIT
@@ -15,7 +15,6 @@ Requires-Dist: aiohttp
 Requires-Dist: rich
 Requires-Dist: zhipuai>=2.0.1
 Requires-Dist: httpx[socks]
-Requires-Dist: edge-tts>=6.1.3
 Requires-Dist: EdgeGPT==0.1.26
 Requires-Dist: langchain>=0.0.343
 Requires-Dist: beautifulsoup4>=4.12.0
@@ -23,11 +22,11 @@ Requires-Dist: google-search-results>=2.4.2
 Requires-Dist: google-generativeai
 Requires-Dist: numexpr>=2.8.6
 Requires-Dist: dashscope>=1.10.0
-Requires-Dist: azure-cognitiveservices-speech>=1.37.0
-Requires-Dist: aiohttp==3.9.4; extra == "locked"
+Requires-Dist: tetos>=0.1.0
+Requires-Dist: aiohttp==3.9.5; extra == "locked"
 Requires-Dist: aiosignal==1.3.1; extra == "locked"
 Requires-Dist: annotated-types==0.6.0; extra == "locked"
-Requires-Dist: anyio==3.7.1; extra == "locked"
+Requires-Dist: anyio==4.3.0; extra == "locked"
 Requires-Dist: async-timeout==4.0.3; python_version < "3.11" and extra == "locked"
 Requires-Dist: attrs==23.2.0; extra == "locked"
 Requires-Dist: azure-cognitiveservices-speech==1.37.0; extra == "locked"
@@ -36,21 +35,23 @@ Requires-Dist: bingimagecreator==0.5.0; extra == "locked"
 Requires-Dist: cachetools==5.3.2; extra == "locked"
 Requires-Dist: certifi==2024.2.2; extra == "locked"
 Requires-Dist: charset-normalizer==3.3.2; extra == "locked"
+Requires-Dist: click==8.1.7; extra == "locked"
 Requires-Dist: colorama==0.4.6; platform_system == "Windows" and extra == "locked"
-Requires-Dist: dashscope==1.10.0; extra == "locked"
+Requires-Dist: dashscope==1.17.0; extra == "locked"
 Requires-Dist: dataclasses-json==0.6.3; extra == "locked"
 Requires-Dist: distro==1.9.0; extra == "locked"
 Requires-Dist: edge-tts==6.1.10; extra == "locked"
 Requires-Dist: edgegpt==0.1.26; extra == "locked"
 Requires-Dist: exceptiongroup==1.2.0; python_version < "3.11" and extra == "locked"
 Requires-Dist: frozenlist==1.4.1; extra == "locked"
-Requires-Dist: google-ai-generativelanguage==0.6.1; extra == "locked"
+Requires-Dist: google-ai-generativelanguage==0.6.2; extra == "locked"
 Requires-Dist: google-api-core==2.15.0; extra == "locked"
 Requires-Dist: google-api-core[grpc]==2.15.0; extra == "locked"
 Requires-Dist: google-api-python-client==2.125.0; extra == "locked"
 Requires-Dist: google-auth==2.26.1; extra == "locked"
 Requires-Dist: google-auth-httplib2==0.2.0; extra == "locked"
-Requires-Dist: google-generativeai==0.5.0; extra == "locked"
+Requires-Dist: google-cloud-texttospeech==2.16.3; extra == "locked"
+Requires-Dist: google-generativeai==0.5.1; extra == "locked"
 Requires-Dist: google-search-results==2.4.2; extra == "locked"
 Requires-Dist: googleapis-common-protos==1.62.0; extra == "locked"
 Requires-Dist: greenlet==3.0.3; (platform_machine == "win32" or platform_machine == "WIN32" or platform_machine == "AMD64" or platform_machine == "amd64" or platform_machine == "x86_64" or platform_machine == "ppc64le" or platform_machine == "aarch64") and extra == "locked"
@@ -73,12 +74,12 @@ Requires-Dist: markdown-it-py==3.0.0; extra == "locked"
 Requires-Dist: marshmallow==3.20.1; extra == "locked"
 Requires-Dist: mdurl==0.1.2; extra == "locked"
 Requires-Dist: miservice-fork==2.4.3; extra == "locked"
-Requires-Dist: multidict==6.0.4; extra == "locked"
+Requires-Dist: multidict==6.0.5; extra == "locked"
 Requires-Dist: mutagen==1.47.0; extra == "locked"
 Requires-Dist: mypy-extensions==1.0.0; extra == "locked"
 Requires-Dist: numexpr==2.10.0; extra == "locked"
 Requires-Dist: numpy==1.26.3; extra == "locked"
-Requires-Dist: openai==1.17.1; extra == "locked"
+Requires-Dist: openai==1.21.2; extra == "locked"
 Requires-Dist: orjson==3.10.0; extra == "locked"
 Requires-Dist: packaging==23.2; extra == "locked"
 Requires-Dist: prompt-toolkit==3.0.43; extra == "locked"
@@ -101,6 +102,7 @@ Requires-Dist: socksio==1.0.0; extra == "locked"
 Requires-Dist: soupsieve==2.5; extra == "locked"
 Requires-Dist: sqlalchemy==2.0.25; extra == "locked"
 Requires-Dist: tenacity==8.2.3; extra == "locked"
+Requires-Dist: tetos==0.1.0; extra == "locked"
 Requires-Dist: tqdm==4.66.1; extra == "locked"
 Requires-Dist: typing-extensions==4.9.0; extra == "locked"
 Requires-Dist: typing-inspect==0.9.0; extra == "locked"
@@ -134,33 +136,16 @@ Play ChatGPT and other LLM with Xiaomi AI Speaker
 - [通义千问](https://help.aliyun.com/zh/dashscope/developer-reference/api-details)
 ## 获取小米音响DID
-### Windows(使用 set 设置环境变量）
-```cmd
-pip install miservice_fork
-set MI_USER=xxxx
-set MI_PASS=xxx
-micli list 得到did
-set MI_DID=xxxx
-```
+| 系统和Shell   | Linux *sh                                      | Windows CMD用户                        | Windows PowerShell用户                         |
+| ------------- | ---------------------------------------------- | -------------------------------------- | ---------------------------------------------- |
+| 1、安装包     | `pip install miservice_fork`                   | `pip install miservice_fork`           | `pip install miservice_fork`                   |
+| 2、设置变量   | `export MI_USER=xxx` <br> `export MI_PASS=xxx` | `set MI_USER=xxx`<br>`set MI_PASS=xxx` | `$env:MI_USER="xxx"` <br> `$env:MI_PASS="xxx"` |
+| 3、取得MI_DID | `micli list`                                   | `micli list`                           | `micli list`                                   |
+| 4、设置MI_DID | `export MI_DID=xxx`                            | `set MI_DID=xxx`                       | `$env:MI_DID="xxx"`                            |
+- 注意不同shell 对环境变量的处理是不同的，尤其是powershell赋值时，可能需要双引号来包括值。
 - 如果获取did报错时，请更换一下无线网络，有很大概率解决问题。
-### Linux(使用 export 设置环境变量）
-```sh
-# 1、安装模块
-pip install miservice_fork
-# 2、设置环境用户参数
-export MI_USER=xxxx
-export MI_PASS=xxx
-# 3、使用micli list 得到did
-micli list
-# 4、根据did设置环境DID参数
-export MI_DID=xxxx
-```
 ## 一点原理
 [不用 root 使用小爱同学和 ChatGPT 交互折腾记](https://github.com/yihong0618/gitblog/issues/258)
@@ -278,38 +263,37 @@ ChatGLM [文档](http://open.bigmodel.cn/doc/api#chatglm_130b)
 ## 配置项说明
-| 参数                     | 说明                                                                                        | 默认值                                                                                                    | 可选值                                                                                                                     |
-| ------------------------ | ------------------------------------------------------------------------------------------- | --------------------------------------------------------------------------------------------------------- | -------------------------------------------------------------------------------------------------------------------------- |
-| hardware                 | 设备型号                                                                                    |                                                                                                           |                                                                                                                            |
-| account                  | 小爱账户                                                                                    |                                                                                                           |                                                                                                                            |
-| password                 | 小爱账户密码                                                                                |                                                                                                           |                                                                                                                            |
-| openai_key               | openai的apikey                                                                              |                                                                                                           |                                                                                                                            |
-| serpapi_api_key          | serpapi的key 参考 [SerpAPI](https://serpapi.com/)                                           |                                                                                                           |                                                                                                                            |
-| glm_key                  | chatglm 的 apikey                                                                           |                                                                                                           |                                                                                                                            |
-| gemini_key               | gemini 的 apikey [参考](https://makersuite.google.com/app/apikey)                           |                                                                                                           |                                                                                                                            |
-| qwen_key                 | qwen 的 apikey [参考](https://help.aliyun.com/zh/dashscope/developer-reference/api-details) |                                                                                                           |                                                                                                                            |
-| cookie                   | 小爱账户cookie （如果用上面密码登录可以不填）                                               |                                                                                                           |                                                                                                                            |
-| mi_did                   | 设备did                                                                                     |                                                                                                           |                                                                                                                            |
-| use_command              | 使用 MI command 与小爱交互                                                                  | `false`                                                                                                   |                                                                                                                            |
-| mute_xiaoai              | 快速停掉小爱自己的回答                                                                      | `true`                                                                                                    |                                                                                                                            |
-| verbose                  | 是否打印详细日志                                                                            | `false`                                                                                                   |                                                                                                                            |
-| bot                      | 使用的 bot 类型，目前支持 chatgptapi,newbing, qwen, gemini                                  | `chatgptapi`                                                                                              |                                                                                                                            |
-| tts                      | 使用的 TTS 类型                                                                             | `mi`                                                                                                      | `edge`、 `openai`、`azure`                                                                                                 |
-| tts_voice                | TTS 的嗓音                                                                                  | `zh-CN-XiaoxiaoNeural`(edge), `alloy`(openai), `zh-CN-XiaoxiaoMultilingualNeural`(azure)                  |                                                                                                                            |
-| prompt                   | 自定义prompt                                                                                | `请用100字以内回答`                                                                                       |                                                                                                                            |
-| keyword                  | 自定义请求词列表                                                                            | `["请"]`                                                                                                  |                                                                                                                            |
-| change_prompt_keyword    | 更改提示词触发列表                                                                          | `["更改提示词"]`                                                                                          |                                                                                                                            |
-| start_conversation       | 开始持续对话关键词                                                                          | `开始持续对话`                                                                                            |                                                                                                                            |
-| end_conversation         | 结束持续对话关键词                                                                          | `结束持续对话`                                                                                            |                                                                                                                            |
-| stream                   | 使用流式响应，获得更快的响应                                                                | `false`                                                                                                   |                                                                                                                            |
-| proxy                    | 支持 HTTP 代理，传入 http proxy URL                                                         | ""                                                                                                        |                                                                                                                            |
-| gpt_options              | OpenAI API 的参数字典                                                                       | `{}`                                                                                                      |                                                                                                                            |
-| bing_cookie_path         | NewBing使用的cookie路径，参考[这里]获取                                                     | 也可通过环境变量 `COOKIE_FILE` 设置                                                                       |                                                                                                                            |
-| bing_cookies             | NewBing使用的cookie字典，参考[这里]获取                                                     |                                                                                                           |                                                                                                                            |
-| deployment_id            | Azure OpenAI 服务的 deployment ID                                                           | 参考这个[如何找到deployment_id](https://github.com/yihong0618/xiaogpt/issues/347#issuecomment-1784410784) |                                                                                                                            |
-| api_base                 | 如果需要替换默认的api,或者使用Azure OpenAI 服务                                             | 例如：`https://abc-def.openai.azure.com/`                                                                 |                                                                                                                            |
-| azure_tts_speech_key     | Azure TTS key                                                                               | null                                                                                                      |                                                                                                                            |
-| azure_tts_service_region | Azure TTS 服务地区                                                                          | `eastasia`                                                                                                | [Regions - Speech service - Azure AI services](https://learn.microsoft.com/en-us/azure/ai-services/speech-service/regions) |
+| 参数                  | 说明                                                                                        | 默认值                                                                                                    | 可选值                                                |
+| --------------------- | ------------------------------------------------------------------------------------------- | --------------------------------------------------------------------------------------------------------- | ----------------------------------------------------- |
+| hardware              | 设备型号                                                                                    |                                                                                                           |                                                       |
+| account               | 小爱账户                                                                                    |                                                                                                           |                                                       |
+| password              | 小爱账户密码                                                                                |                                                                                                           |                                                       |
+| openai_key            | openai的apikey                                                                              |                                                                                                           |                                                       |
+| serpapi_api_key       | serpapi的key 参考 [SerpAPI](https://serpapi.com/)                                           |                                                                                                           |                                                       |
+| glm_key               | chatglm 的 apikey                                                                           |                                                                                                           |                                                       |
+| gemini_key            | gemini 的 apikey [参考](https://makersuite.google.com/app/apikey)                           |                                                                                                           |                                                       |
+| qwen_key              | qwen 的 apikey [参考](https://help.aliyun.com/zh/dashscope/developer-reference/api-details) |                                                                                                           |                                                       |
+| cookie                | 小爱账户cookie （如果用上面密码登录可以不填）                                               |                                                                                                           |                                                       |
+| mi_did                | 设备did                                                                                     |                                                                                                           |                                                       |
+| use_command           | 使用 MI command 与小爱交互                                                                  | `false`                                                                                                   |                                                       |
+| mute_xiaoai           | 快速停掉小爱自己的回答                                                                      | `true`                                                                                                    |                                                       |
+| verbose               | 是否打印详细日志                                                                            | `false`                                                                                                   |                                                       |
+| bot                   | 使用的 bot 类型，目前支持 chatgptapi,newbing, qwen, gemini                                  | `chatgptapi`                                                                                              |                                                       |
+| tts                   | 使用的 TTS 类型                                                                             | `mi`                                                                                                      | `edge`、 `openai`、`azure`、`volc`、`baidu`、`google` |
+| tts_options           | TTS 参数字典，参考 [tetos](https://github.com/frostming/tetos) 获取可用参数                 |                                                                                                           |                                                       |
+| prompt                | 自定义prompt                                                                                | `请用100字以内回答`                                                                                       |                                                       |
+| keyword               | 自定义请求词列表                                                                            | `["请"]`                                                                                                  |                                                       |
+| change_prompt_keyword | 更改提示词触发列表                                                                          | `["更改提示词"]`                                                                                          |                                                       |
+| start_conversation    | 开始持续对话关键词                                                                          | `开始持续对话`                                                                                            |                                                       |
+| end_conversation      | 结束持续对话关键词                                                                          | `结束持续对话`                                                                                            |                                                       |
+| stream                | 使用流式响应，获得更快的响应                                                                | `false`                                                                                                   |                                                       |
+| proxy                 | 支持 HTTP 代理，传入 http proxy URL                                                         | ""                                                                                                        |                                                       |
+| gpt_options           | OpenAI API 的参数字典                                                                       | `{}`                                                                                                      |                                                       |
+| bing_cookie_path      | NewBing使用的cookie路径，参考[这里]获取                                                     | 也可通过环境变量 `COOKIE_FILE` 设置                                                                       |                                                       |
+| bing_cookies          | NewBing使用的cookie字典，参考[这里]获取                                                     |                                                                                                           |                                                       |
+| deployment_id         | Azure OpenAI 服务的 deployment ID                                                           | 参考这个[如何找到deployment_id](https://github.com/yihong0618/xiaogpt/issues/347#issuecomment-1784410784) |                                                       |
+| api_base              | 如果需要替换默认的api,或者使用Azure OpenAI 服务                                             | 例如：`https://abc-def.openai.azure.com/`                                                                 |                                                       |
 [这里]: https://github.com/acheong08/EdgeGPT#getting-authentication-required
@@ -427,6 +411,7 @@ docker run -v <your-config-dir>:/config -p 9527:9527 -e XIAOGPT_HOSTNAME=<your i
 - [xiaomi](https://www.mi.com/)
 - [PDM](https://pdm.fming.dev/latest/)
+- [Tetos](https://github.com/frostming/tetos) TTS 云服务支持
 - @[Yonsm](https://github.com/Yonsm) 的 [MiService](https://github.com/Yonsm/MiService)
 - @[pjq](https://github.com/pjq) 给了这个项目非常多的帮助
 - @[frostming](https://github.com/frostming) 重构了一些代码，支持了`持续会话功能`

{xiaogpt-2.42 → xiaogpt-2.60}/README.md RENAMED Viewed

@@ -19,33 +19,16 @@ Play ChatGPT and other LLM with Xiaomi AI Speaker
 - [通义千问](https://help.aliyun.com/zh/dashscope/developer-reference/api-details)
 ## 获取小米音响DID
-### Windows(使用 set 设置环境变量）
-```cmd
-pip install miservice_fork
-set MI_USER=xxxx
-set MI_PASS=xxx
-micli list 得到did
-set MI_DID=xxxx
-```
+| 系统和Shell   | Linux *sh                                      | Windows CMD用户                        | Windows PowerShell用户                         |
+| ------------- | ---------------------------------------------- | -------------------------------------- | ---------------------------------------------- |
+| 1、安装包     | `pip install miservice_fork`                   | `pip install miservice_fork`           | `pip install miservice_fork`                   |
+| 2、设置变量   | `export MI_USER=xxx` <br> `export MI_PASS=xxx` | `set MI_USER=xxx`<br>`set MI_PASS=xxx` | `$env:MI_USER="xxx"` <br> `$env:MI_PASS="xxx"` |
+| 3、取得MI_DID | `micli list`                                   | `micli list`                           | `micli list`                                   |
+| 4、设置MI_DID | `export MI_DID=xxx`                            | `set MI_DID=xxx`                       | `$env:MI_DID="xxx"`                            |
+- 注意不同shell 对环境变量的处理是不同的，尤其是powershell赋值时，可能需要双引号来包括值。
 - 如果获取did报错时，请更换一下无线网络，有很大概率解决问题。
-### Linux(使用 export 设置环境变量）
-```sh
-# 1、安装模块
-pip install miservice_fork
-# 2、设置环境用户参数
-export MI_USER=xxxx
-export MI_PASS=xxx
-# 3、使用micli list 得到did
-micli list
-# 4、根据did设置环境DID参数
-export MI_DID=xxxx
-```
 ## 一点原理
 [不用 root 使用小爱同学和 ChatGPT 交互折腾记](https://github.com/yihong0618/gitblog/issues/258)
@@ -163,38 +146,37 @@ ChatGLM [文档](http://open.bigmodel.cn/doc/api#chatglm_130b)
 ## 配置项说明
-| 参数                     | 说明                                                                                        | 默认值                                                                                                    | 可选值                                                                                                                     |
-| ------------------------ | ------------------------------------------------------------------------------------------- | --------------------------------------------------------------------------------------------------------- | -------------------------------------------------------------------------------------------------------------------------- |
-| hardware                 | 设备型号                                                                                    |                                                                                                           |                                                                                                                            |
-| account                  | 小爱账户                                                                                    |                                                                                                           |                                                                                                                            |
-| password                 | 小爱账户密码                                                                                |                                                                                                           |                                                                                                                            |
-| openai_key               | openai的apikey                                                                              |                                                                                                           |                                                                                                                            |
-| serpapi_api_key          | serpapi的key 参考 [SerpAPI](https://serpapi.com/)                                           |                                                                                                           |                                                                                                                            |
-| glm_key                  | chatglm 的 apikey                                                                           |                                                                                                           |                                                                                                                            |
-| gemini_key               | gemini 的 apikey [参考](https://makersuite.google.com/app/apikey)                           |                                                                                                           |                                                                                                                            |
-| qwen_key                 | qwen 的 apikey [参考](https://help.aliyun.com/zh/dashscope/developer-reference/api-details) |                                                                                                           |                                                                                                                            |
-| cookie                   | 小爱账户cookie （如果用上面密码登录可以不填）                                               |                                                                                                           |                                                                                                                            |
-| mi_did                   | 设备did                                                                                     |                                                                                                           |                                                                                                                            |
-| use_command              | 使用 MI command 与小爱交互                                                                  | `false`                                                                                                   |                                                                                                                            |
-| mute_xiaoai              | 快速停掉小爱自己的回答                                                                      | `true`                                                                                                    |                                                                                                                            |
-| verbose                  | 是否打印详细日志                                                                            | `false`                                                                                                   |                                                                                                                            |
-| bot                      | 使用的 bot 类型，目前支持 chatgptapi,newbing, qwen, gemini                                  | `chatgptapi`                                                                                              |                                                                                                                            |
-| tts                      | 使用的 TTS 类型                                                                             | `mi`                                                                                                      | `edge`、 `openai`、`azure`                                                                                                 |
-| tts_voice                | TTS 的嗓音                                                                                  | `zh-CN-XiaoxiaoNeural`(edge), `alloy`(openai), `zh-CN-XiaoxiaoMultilingualNeural`(azure)                  |                                                                                                                            |
-| prompt                   | 自定义prompt                                                                                | `请用100字以内回答`                                                                                       |                                                                                                                            |
-| keyword                  | 自定义请求词列表                                                                            | `["请"]`                                                                                                  |                                                                                                                            |
-| change_prompt_keyword    | 更改提示词触发列表                                                                          | `["更改提示词"]`                                                                                          |                                                                                                                            |
-| start_conversation       | 开始持续对话关键词                                                                          | `开始持续对话`                                                                                            |                                                                                                                            |
-| end_conversation         | 结束持续对话关键词                                                                          | `结束持续对话`                                                                                            |                                                                                                                            |
-| stream                   | 使用流式响应，获得更快的响应                                                                | `false`                                                                                                   |                                                                                                                            |
-| proxy                    | 支持 HTTP 代理，传入 http proxy URL                                                         | ""                                                                                                        |                                                                                                                            |
-| gpt_options              | OpenAI API 的参数字典                                                                       | `{}`                                                                                                      |                                                                                                                            |
-| bing_cookie_path         | NewBing使用的cookie路径，参考[这里]获取                                                     | 也可通过环境变量 `COOKIE_FILE` 设置                                                                       |                                                                                                                            |
-| bing_cookies             | NewBing使用的cookie字典，参考[这里]获取                                                     |                                                                                                           |                                                                                                                            |
-| deployment_id            | Azure OpenAI 服务的 deployment ID                                                           | 参考这个[如何找到deployment_id](https://github.com/yihong0618/xiaogpt/issues/347#issuecomment-1784410784) |                                                                                                                            |
-| api_base                 | 如果需要替换默认的api,或者使用Azure OpenAI 服务                                             | 例如：`https://abc-def.openai.azure.com/`                                                                 |                                                                                                                            |
-| azure_tts_speech_key     | Azure TTS key                                                                               | null                                                                                                      |                                                                                                                            |
-| azure_tts_service_region | Azure TTS 服务地区                                                                          | `eastasia`                                                                                                | [Regions - Speech service - Azure AI services](https://learn.microsoft.com/en-us/azure/ai-services/speech-service/regions) |
+| 参数                  | 说明                                                                                        | 默认值                                                                                                    | 可选值                                                |
+| --------------------- | ------------------------------------------------------------------------------------------- | --------------------------------------------------------------------------------------------------------- | ----------------------------------------------------- |
+| hardware              | 设备型号                                                                                    |                                                                                                           |                                                       |
+| account               | 小爱账户                                                                                    |                                                                                                           |                                                       |
+| password              | 小爱账户密码                                                                                |                                                                                                           |                                                       |
+| openai_key            | openai的apikey                                                                              |                                                                                                           |                                                       |
+| serpapi_api_key       | serpapi的key 参考 [SerpAPI](https://serpapi.com/)                                           |                                                                                                           |                                                       |
+| glm_key               | chatglm 的 apikey                                                                           |                                                                                                           |                                                       |
+| gemini_key            | gemini 的 apikey [参考](https://makersuite.google.com/app/apikey)                           |                                                                                                           |                                                       |
+| qwen_key              | qwen 的 apikey [参考](https://help.aliyun.com/zh/dashscope/developer-reference/api-details) |                                                                                                           |                                                       |
+| cookie                | 小爱账户cookie （如果用上面密码登录可以不填）                                               |                                                                                                           |                                                       |
+| mi_did                | 设备did                                                                                     |                                                                                                           |                                                       |
+| use_command           | 使用 MI command 与小爱交互                                                                  | `false`                                                                                                   |                                                       |
+| mute_xiaoai           | 快速停掉小爱自己的回答                                                                      | `true`                                                                                                    |                                                       |
+| verbose               | 是否打印详细日志                                                                            | `false`                                                                                                   |                                                       |
+| bot                   | 使用的 bot 类型，目前支持 chatgptapi,newbing, qwen, gemini                                  | `chatgptapi`                                                                                              |                                                       |
+| tts                   | 使用的 TTS 类型                                                                             | `mi`                                                                                                      | `edge`、 `openai`、`azure`、`volc`、`baidu`、`google` |
+| tts_options           | TTS 参数字典，参考 [tetos](https://github.com/frostming/tetos) 获取可用参数                 |                                                                                                           |                                                       |
+| prompt                | 自定义prompt                                                                                | `请用100字以内回答`                                                                                       |                                                       |
+| keyword               | 自定义请求词列表                                                                            | `["请"]`                                                                                                  |                                                       |
+| change_prompt_keyword | 更改提示词触发列表                                                                          | `["更改提示词"]`                                                                                          |                                                       |
+| start_conversation    | 开始持续对话关键词                                                                          | `开始持续对话`                                                                                            |                                                       |
+| end_conversation      | 结束持续对话关键词                                                                          | `结束持续对话`                                                                                            |                                                       |
+| stream                | 使用流式响应，获得更快的响应                                                                | `false`                                                                                                   |                                                       |
+| proxy                 | 支持 HTTP 代理，传入 http proxy URL                                                         | ""                                                                                                        |                                                       |
+| gpt_options           | OpenAI API 的参数字典                                                                       | `{}`                                                                                                      |                                                       |
+| bing_cookie_path      | NewBing使用的cookie路径，参考[这里]获取                                                     | 也可通过环境变量 `COOKIE_FILE` 设置                                                                       |                                                       |
+| bing_cookies          | NewBing使用的cookie字典，参考[这里]获取                                                     |                                                                                                           |                                                       |
+| deployment_id         | Azure OpenAI 服务的 deployment ID                                                           | 参考这个[如何找到deployment_id](https://github.com/yihong0618/xiaogpt/issues/347#issuecomment-1784410784) |                                                       |
+| api_base              | 如果需要替换默认的api,或者使用Azure OpenAI 服务                                             | 例如：`https://abc-def.openai.azure.com/`                                                                 |                                                       |
 [这里]: https://github.com/acheong08/EdgeGPT#getting-authentication-required
@@ -312,6 +294,7 @@ docker run -v <your-config-dir>:/config -p 9527:9527 -e XIAOGPT_HOSTNAME=<your i
 - [xiaomi](https://www.mi.com/)
 - [PDM](https://pdm.fming.dev/latest/)
+- [Tetos](https://github.com/frostming/tetos) TTS 云服务支持
 - @[Yonsm](https://github.com/Yonsm) 的 [MiService](https://github.com/Yonsm/MiService)
 - @[pjq](https://github.com/pjq) 给了这个项目非常多的帮助
 - @[frostming](https://github.com/frostming) 重构了一些代码，支持了`持续会话功能`

{xiaogpt-2.42 → xiaogpt-2.60}/pyproject.toml RENAMED Viewed

@@ -18,7 +18,6 @@ dependencies = [
     "rich",
     "zhipuai>=2.0.1",
     "httpx[socks]",
-    "edge-tts>=6.1.3",
     "EdgeGPT==0.1.26",
     "langchain>=0.0.343",
     "beautifulsoup4>=4.12.0",
@@ -26,10 +25,10 @@ dependencies = [
     "google-generativeai",
     "numexpr>=2.8.6",
     "dashscope>=1.10.0",
-    "azure-cognitiveservices-speech>=1.37.0",
+    "tetos>=0.1.0",
 ]
 dynamic = []
-version = "2.42"
+version = "2.60"
 [project.license]
 text = "MIT"
@@ -42,10 +41,10 @@ xiaogpt = "xiaogpt.cli:main"
 [project.optional-dependencies]
 locked = [
-    "aiohttp==3.9.4",
+    "aiohttp==3.9.5",
     "aiosignal==1.3.1",
     "annotated-types==0.6.0",
-    "anyio==3.7.1",
+    "anyio==4.3.0",
     "async-timeout==4.0.3 ; python_version < \"3.11\"",
     "attrs==23.2.0",
     "azure-cognitiveservices-speech==1.37.0",
@@ -54,21 +53,23 @@ locked = [
     "cachetools==5.3.2",
     "certifi==2024.2.2",
     "charset-normalizer==3.3.2",
+    "click==8.1.7",
     "colorama==0.4.6 ; platform_system == \"Windows\"",
-    "dashscope==1.10.0",
+    "dashscope==1.17.0",
     "dataclasses-json==0.6.3",
     "distro==1.9.0",
     "edge-tts==6.1.10",
     "edgegpt==0.1.26",
     "exceptiongroup==1.2.0 ; python_version < \"3.11\"",
     "frozenlist==1.4.1",
-    "google-ai-generativelanguage==0.6.1",
+    "google-ai-generativelanguage==0.6.2",
     "google-api-core==2.15.0",
     "google-api-core[grpc]==2.15.0",
     "google-api-python-client==2.125.0",
     "google-auth==2.26.1",
     "google-auth-httplib2==0.2.0",
-    "google-generativeai==0.5.0",
+    "google-cloud-texttospeech==2.16.3",
+    "google-generativeai==0.5.1",
     "google-search-results==2.4.2",
     "googleapis-common-protos==1.62.0",
     "greenlet==3.0.3 ; platform_machine == \"win32\" or platform_machine == \"WIN32\" or platform_machine == \"AMD64\" or platform_machine == \"amd64\" or platform_machine == \"x86_64\" or platform_machine == \"ppc64le\" or platform_machine == \"aarch64\"",
@@ -91,12 +92,12 @@ locked = [
     "marshmallow==3.20.1",
     "mdurl==0.1.2",
     "miservice-fork==2.4.3",
-    "multidict==6.0.4",
+    "multidict==6.0.5",
     "mutagen==1.47.0",
     "mypy-extensions==1.0.0",
     "numexpr==2.10.0",
     "numpy==1.26.3",
-    "openai==1.17.1",
+    "openai==1.21.2",
     "orjson==3.10.0",
     "packaging==23.2",
     "prompt-toolkit==3.0.43",
@@ -119,6 +120,7 @@ locked = [
     "soupsieve==2.5",
     "sqlalchemy==2.0.25",
     "tenacity==8.2.3",
+    "tetos==0.1.0",
     "tqdm==4.66.1",
     "typing-extensions==4.9.0",
     "typing-inspect==0.9.0",

{xiaogpt-2.42 → xiaogpt-2.60}/xiaogpt/cli.py RENAMED Viewed

@@ -86,27 +86,9 @@ def main():
         help="show info",
     )
     parser.add_argument(
-        "--azure_tts_speech_key",
-        dest="azure_tts_speech_key",
-        help="if use azure tts",
-    )
-    parser.add_argument(
-        "--azure_tts_service_region",
-        dest="azure_tts_service_region",
-        help="if use azure tts",
-    )
-    tts_group = parser.add_mutually_exclusive_group()
-    tts_group.add_argument(
-        "--enable_edge_tts",
-        dest="tts",
-        action="store_const",
-        const="edge",
-        help="if use edge tts",
-    )
-    tts_group.add_argument(
         "--tts",
-        help="tts type",
-        choices=["mi", "edge", "openai", "azure"],
+        help="TTS provider",
+        choices=["mi", "edge", "openai", "azure", "google", "baidu", "volc"],
     )
     bot_group = parser.add_mutually_exclusive_group()
     bot_group.add_argument(
@@ -190,9 +172,15 @@ def main():
     options = parser.parse_args()
     config = Config.from_options(options)
-    miboy = MiGPT(config)
+    async def main(config: Config) -> None:
+        miboy = MiGPT(config)
+        try:
+            await miboy.run_forever()
+        finally:
+            await miboy.close()
     loop = asyncio.get_event_loop()
-    loop.run_until_complete(miboy.run_forever())
+    loop.run_until_complete(main(config))
 if __name__ == "__main__":

{xiaogpt-2.42 → xiaogpt-2.60}/xiaogpt/config.py RENAMED Viewed

@@ -33,15 +33,6 @@ HARDWARE_COMMAND_DICT = {
     # add more here
 }
-EDGE_TTS_DICT = {
-    "用英语": "en-US-AriaNeural",
-    "用日语": "ja-JP-NanamiNeural",
-    "用法语": "fr-BE-CharlineNeural",
-    "用韩语": "ko-KR-SunHiNeural",
-    "用德语": "de-AT-JonasNeural",
-    # add more here
-}
 DEFAULT_COMMAND = ("5-1", "5-5")
 KEY_WORD = ("帮我", "请")
@@ -80,13 +71,11 @@ class Config:
     start_conversation: str = "开始持续对话"
     end_conversation: str = "结束持续对话"
     stream: bool = False
-    tts: Literal["mi", "edge", "azure", "openai"] = "mi"
-    tts_voice: str | None = None
+    tts: Literal["mi", "edge", "azure", "openai", "baidu", "google", "volc"] = "mi"
+    tts_options: dict[str, Any] = field(default_factory=dict)
     gpt_options: dict[str, Any] = field(default_factory=dict)
     bing_cookie_path: str = ""
     bing_cookies: dict | None = None
-    azure_tts_speech_key: str | None = None
-    azure_tts_service_region: str = "eastasia"
     def __post_init__(self) -> None:
         if self.proxy:
@@ -111,8 +100,6 @@ class Config:
                 raise Exception(
                     "Using GPT api needs openai API key, please google how to"
                 )
-        if self.tts == "azure" and not self.azure_tts_speech_key:
-            raise Exception("Using Azure TTS needs azure speech key")
     @property
     def tts_command(self) -> str:

xiaogpt-2.60/xiaogpt/tts/__init__.py ADDED Viewed

@@ -0,0 +1,5 @@
+from xiaogpt.tts.base import TTS
+from xiaogpt.tts.mi import MiTTS
+from xiaogpt.tts.tetos import TetosTTS
+__all__ = ["TTS", "TetosTTS", "MiTTS"]

{xiaogpt-2.42 → xiaogpt-2.60}/xiaogpt/tts/base.py RENAMED Viewed

@@ -56,7 +56,7 @@ class TTS(abc.ABC):
         return is_playing
     @abc.abstractmethod
-    async def synthesize(self, query: str, text_stream: AsyncIterator[str]) -> None:
+    async def synthesize(self, lang: str, text_stream: AsyncIterator[str]) -> None:
         """Synthesize speech from a stream of text."""
         raise NotImplementedError
@@ -87,20 +87,20 @@ class AudioFileTTS(TTS):
         self._start_http_server()
     @abc.abstractmethod
-    async def make_audio_file(self, query: str, text: str) -> tuple[Path, float]:
+    async def make_audio_file(self, lang: str, text: str) -> tuple[Path, float]:
         """Synthesize speech from text and save it to a file.
         Return the file path and the duration of the audio in seconds.
         The file path must be relative to the self.dirname.
         """
         raise NotImplementedError
-    async def synthesize(self, query: str, text_stream: AsyncIterator[str]) -> None:
+    async def synthesize(self, lang: str, text_stream: AsyncIterator[str]) -> None:
         queue: asyncio.Queue[tuple[str, float]] = asyncio.Queue()
         finished = asyncio.Event()
         async def worker():
             async for text in text_stream:
-                path, duration = await self.make_audio_file(query, text)
+                path, duration = await self.make_audio_file(lang, text)
                 url = f"http://{self.hostname}:{self.port}/{path.name}"
                 await queue.put((url, duration))
             finished.set()

{xiaogpt-2.42 → xiaogpt-2.60}/xiaogpt/tts/mi.py RENAMED Viewed

@@ -27,7 +27,7 @@ class MiTTS(TTS):
                 f"{self.config.tts_command} {text}",
             )
-    async def synthesize(self, query: str, text_stream: AsyncIterator[str]) -> None:
+    async def synthesize(self, lang: str, text_stream: AsyncIterator[str]) -> None:
         async for text in text_stream:
             await self.say(text)
             await self.wait_for_duration(calculate_tts_elapse(text))

xiaogpt-2.60/xiaogpt/tts/tetos.py ADDED Viewed

@@ -0,0 +1,56 @@
+from __future__ import annotations
+import tempfile
+from pathlib import Path
+from miservice import MiNAService
+from tetos.base import Speaker
+from xiaogpt.config import Config
+from xiaogpt.tts.base import AudioFileTTS
+class TetosTTS(AudioFileTTS):
+    def __init__(
+        self, mina_service: MiNAService, device_id: str, config: Config
+    ) -> None:
+        super().__init__(mina_service, device_id, config)
+        self.speaker = self._get_speaker()
+    def _get_speaker(self) -> Speaker:
+        from tetos.azure import AzureSpeaker
+        from tetos.baidu import BaiduSpeaker
+        from tetos.edge import EdgeSpeaker
+        from tetos.google import GoogleSpeaker
+        from tetos.openai import OpenAISpeaker
+        from tetos.volc import VolcSpeaker
+        options = self.config.tts_options
+        allowed_speakers: list[str] = []
+        for speaker in (
+            OpenAISpeaker,
+            EdgeSpeaker,
+            AzureSpeaker,
+            VolcSpeaker,
+            GoogleSpeaker,
+            BaiduSpeaker,
+        ):
+            if (name := speaker.__name__[:-7].lower()) == self.config.tts:
+                try:
+                    return speaker(**options)
+                except TypeError as e:
+                    raise ValueError(
+                        f"{e}. Please add them via `tts_options` config"
+                    ) from e
+            else:
+                allowed_speakers.append(name)
+        raise ValueError(
+            f"Unsupported TTS: {self.config.tts}, allowed: {','.join(allowed_speakers)}"
+        )
+    async def make_audio_file(self, lang: str, text: str) -> tuple[Path, float]:
+        output_file = tempfile.NamedTemporaryFile(
+            suffix=".mp3", mode="wb", delete=False, dir=self.dirname.name
+        )
+        duration = await self.speaker.synthesize(text, output_file.name, lang=lang)
+        return Path(output_file.name), duration

{xiaogpt-2.42 → xiaogpt-2.60}/xiaogpt/xiaogpt.py RENAMED Viewed

@@ -23,8 +23,7 @@ from xiaogpt.config import (
     WAKEUP_KEYWORD,
     Config,
 )
-from xiaogpt.tts import TTS, EdgeTTS, MiTTS, AzureTTS
-from xiaogpt.tts.openai import OpenAITTS
+from xiaogpt.tts import TTS, MiTTS, TetosTTS
 from xiaogpt.utils import (
     parse_cookie_string,
 )
@@ -53,6 +52,9 @@ class MiGPT:
         self.log.debug(config)
         self.mi_session = ClientSession()
+    async def close(self):
+        await self.mi_session.close()
     async def poll_latest_ask(self):
         async with ClientSession() as session:
             session._cookie_jar = self.cookie_jar
@@ -62,7 +64,9 @@ class MiGPT:
                 )
                 new_record = await self.get_latest_ask_from_xiaoai(session)
                 start = time.perf_counter()
-                self.log.debug("Polling_event, timestamp: %s", self.last_timestamp)
+                self.log.debug(
+                    "Polling_event, timestamp: %s %s", self.last_timestamp, new_record
+                )
                 await self.polling_event.wait()
                 if (
                     self.config.mute_xiaoai
@@ -76,16 +80,16 @@ class MiGPT:
                     # if you want force mute xiaoai, comment this line below.
                     await asyncio.sleep(1 - d)
-    async def init_all_data(self, session):
-        await self.login_miboy(session)
+    async def init_all_data(self):
+        await self.login_miboy()
         await self._init_data_hardware()
         self.mi_session.cookie_jar.update_cookies(self.get_cookie())
         self.cookie_jar = self.mi_session.cookie_jar
         self.tts  # init tts
-    async def login_miboy(self, session):
+    async def login_miboy(self):
         account = MiAccount(
-            session,
+            self.mi_session,
             self.config.account,
             self.config.password,
             str(self.mi_token_home),
@@ -177,7 +181,7 @@ class MiGPT:
         return (
             self.in_conversation
             and not query.startswith(WAKEUP_KEYWORD)
-            or query.startswith(tuple(self.config.keyword))
+            or query.lower().startswith(tuple(w.lower() for w in self.config.keyword))
         )
     def need_change_prompt(self, record):
@@ -223,7 +227,7 @@ class MiGPT:
         return None
     async def _retry(self):
-        await self.init_all_data(self.mi_session)
+        await self.init_all_data()
     def _get_last_query(self, data: dict) -> dict | None:
         if d := data.get("data"):
@@ -256,14 +260,10 @@ class MiGPT:
     @functools.cached_property
     def tts(self) -> TTS:
-        if self.config.tts == "edge":
-            return EdgeTTS(self.mina_service, self.device_id, self.config)
-        elif self.config.tts == "azure":
-            return AzureTTS(self.mina_service, self.device_id, self.config)
-        elif self.config.tts == "openai":
-            return OpenAITTS(self.mina_service, self.device_id, self.config)
-        else:
+        if self.config.tts == "mi":
             return MiTTS(self.mina_service, self.device_id, self.config)
+        else:
+            return TetosTTS(self.mina_service, self.device_id, self.config)
     async def wait_for_tts_finish(self):
         while True:
@@ -343,7 +343,7 @@ class MiGPT:
         )
     async def run_forever(self):
-        await self.init_all_data(self.mi_session)
+        await self.init_all_data()
         task = asyncio.create_task(self.poll_latest_ask())
         assert task is not None  # to keep the reference to task, do not remove this
         print(
@@ -355,7 +355,6 @@ class MiGPT:
             new_record = await self.last_record.get()
             self.polling_event.clear()  # stop polling when processing the question
             query = new_record.get("query", "").strip()
             if query == self.config.start_conversation:
                 if not self.in_conversation:
                     print("开始对话")
@@ -386,6 +385,7 @@ class MiGPT:
             print("问题：" + query + "？")
             if not self.chatbot.has_history():
                 query = f"{query}，{self.config.prompt}"
+            query += "，并用本段话的language code作为开头，用|分隔，如：en-US|你好……"
             if self.config.mute_xiaoai:
                 await self.stop_if_xiaoai_is_playing()
             else:
@@ -401,7 +401,7 @@ class MiGPT:
                 print("小爱没回")
             print(f"以下是 {self.chatbot.name} 的回答: ", end="")
             try:
-                await self.tts.synthesize(query, self.ask_gpt(query))
+                await self.speak(self.ask_gpt(query))
             except Exception as e:
                 print(f"{self.chatbot.name} 回答出错 {str(e)}")
             else:
@@ -409,3 +409,18 @@ class MiGPT:
             if self.in_conversation:
                 print(f"继续对话, 或用`{self.config.end_conversation}`结束对话")
                 await self.wakeup_xiaoai()
+    async def speak(self, text_stream: AsyncIterator[str]) -> None:
+        text = await anext(text_stream)
+        # See if the first part contains language code(e.g. en-US|Hello world)
+        lang, _, first_chunk = text.rpartition("|")
+        if len(lang) > 7:
+            # It is not a legal language code, discard it
+            lang, first_chunk = "", text
+        async def gen():  # reconstruct the generator
+            yield first_chunk
+            async for text in text_stream:
+                yield text
+        await self.tts.synthesize(lang or "zh-CN", gen())

xiaogpt-2.42/xiaogpt/tts/__init__.py DELETED Viewed

@@ -1,6 +0,0 @@
-from xiaogpt.tts.base import TTS as TTS
-from xiaogpt.tts.edge import EdgeTTS as EdgeTTS
-from xiaogpt.tts.mi import MiTTS as MiTTS
-from xiaogpt.tts.azure import AzureTTS
-__all__ = ["TTS", "EdgeTTS", "MiTTS", "AzureTTS"]

xiaogpt-2.42/xiaogpt/tts/azure.py DELETED Viewed

@@ -1,98 +0,0 @@
-from __future__ import annotations
-import logging
-import tempfile
-from pathlib import Path
-from typing import Optional
-import azure.cognitiveservices.speech as speechsdk
-from xiaogpt.tts.base import AudioFileTTS
-from xiaogpt.utils import calculate_tts_elapse
-logger = logging.getLogger(__name__)
-class AzureTTS(AudioFileTTS):
-    voice_name = "zh-CN-XiaoxiaoMultilingualNeural"
-    async def make_audio_file(self, query: str, text: str) -> tuple[Path, float]:
-        output_file = tempfile.NamedTemporaryFile(
-            suffix=".mp3", mode="wb", delete=False, dir=self.dirname.name
-        )
-        speech_synthesizer = self._build_speech_synthesizer(output_file.name)
-        result: Optional[speechsdk.SpeechSynthesisResult] = (
-            speech_synthesizer.speak_text_async(text).get()
-        )
-        if result is None:
-            raise RuntimeError(
-                f"Failed to get tts from azure with voice={self.voice_name}"
-            )
-        # Check result
-        if result.reason == speechsdk.ResultReason.SynthesizingAudioCompleted:
-            logger.debug("Speech synthesized for text [{}]".format(text))
-            return Path(output_file.name), calculate_tts_elapse(text)
-        elif result.reason == speechsdk.ResultReason.Canceled:
-            cancellation_details = result.cancellation_details
-            logger.warning(f"Speech synthesis canceled: {cancellation_details.reason}")
-            if cancellation_details.reason == speechsdk.CancellationReason.Error:
-                errmsg = f"Error details: {cancellation_details.error_details}"
-                logger.error(errmsg)
-                raise RuntimeError(errmsg)
-        raise RuntimeError(f"Failed to get tts from azure with voice={self.voice_name}")
-    def _build_speech_synthesizer(self, filename: str):
-        speech_key = self.config.azure_tts_speech_key
-        service_region = self.config.azure_tts_service_region
-        if not speech_key:
-            raise Exception("Azure tts need speech key")
-        speech_config = speechsdk.SpeechConfig(
-            subscription=speech_key, region=service_region
-        )
-        speech_config.set_speech_synthesis_output_format(
-            speechsdk.SpeechSynthesisOutputFormat.Audio16Khz32KBitRateMonoMp3
-        )
-        if self.config.proxy:
-            host, port, username, password = self._parse_proxy(self.config.proxy)
-            if username and password:
-                speech_config.set_proxy(
-                    hostname=host, port=port, username=username, password=password
-                )
-            else:
-                speech_config.set_proxy(hostname=host, port=port)
-        speech_config.speech_synthesis_voice_name = (
-            self.config.tts_voice or self.voice_name
-        )
-        speech_synthesizer = speechsdk.SpeechSynthesizer(
-            speech_config=speech_config,
-            audio_config=speechsdk.audio.AudioOutputConfig(filename=filename),  # type: ignore
-        )
-        return speech_synthesizer
-    def _parse_proxy(self, proxy_str: str):
-        proxy_str = proxy_str
-        proxy_str_splited = proxy_str.split("://")
-        proxy_type = proxy_str_splited[0]
-        proxy_addr = proxy_str_splited[1]
-        if proxy_type == "http":
-            if "@" in proxy_addr:
-                proxy_addr_splited = proxy_addr.split("@")
-                proxy_auth = proxy_addr_splited[0]
-                proxy_addr_netloc = proxy_addr_splited[1]
-                proxy_auth_splited = proxy_auth.split(":")
-                username = proxy_auth_splited[0]
-                password = proxy_auth_splited[1]
-            else:
-                proxy_addr_netloc = proxy_addr
-                username, password = None, None
-            proxy_addr_netloc_splited = proxy_addr_netloc.split(":")
-            host = proxy_addr_netloc_splited[0]
-            port = int(proxy_addr_netloc_splited[1])
-            return host, port, username, password
-        raise NotImplementedError

xiaogpt-2.42/xiaogpt/tts/edge.py DELETED Viewed

@@ -1,32 +0,0 @@
-import tempfile
-from pathlib import Path
-import edge_tts
-from xiaogpt.config import EDGE_TTS_DICT
-from xiaogpt.tts.base import AudioFileTTS
-from xiaogpt.utils import find_key_by_partial_string
-class EdgeTTS(AudioFileTTS):
-    default_voice = "zh-CN-XiaoxiaoNeural"
-    async def make_audio_file(self, query: str, text: str) -> tuple[Path, float]:
-        voice = (
-            find_key_by_partial_string(EDGE_TTS_DICT, query)
-            or self.config.tts_voice
-            or self.default_voice
-        )
-        communicate = edge_tts.Communicate(text, voice, proxy=self.config.proxy)
-        duration = 0
-        with tempfile.NamedTemporaryFile(
-            suffix=".mp3", mode="wb", delete=False, dir=self.dirname.name
-        ) as f:
-            async for chunk in communicate.stream():
-                if chunk["type"] == "audio":
-                    f.write(chunk["data"])
-                elif chunk["type"] == "WordBoundary":
-                    duration = (chunk["offset"] + chunk["duration"]) / 1e7
-            if duration == 0:
-                raise RuntimeError(f"Failed to get tts from edge with voice={voice}")
-        return (Path(f.name), duration)

xiaogpt-2.42/xiaogpt/tts/openai.py DELETED Viewed

@@ -1,46 +0,0 @@
-from __future__ import annotations
-import tempfile
-from pathlib import Path
-from typing import TYPE_CHECKING
-import httpx
-from xiaogpt.tts.base import AudioFileTTS
-from xiaogpt.utils import calculate_tts_elapse
-if TYPE_CHECKING:
-    import openai
-class OpenAITTS(AudioFileTTS):
-    default_voice = "alloy"
-    async def make_audio_file(self, query: str, text: str) -> tuple[Path, float]:
-        output_file = tempfile.NamedTemporaryFile(
-            suffix=".mp3", mode="wb", delete=False, dir=self.dirname.name
-        )
-        httpx_kwargs = {}
-        if self.config.proxy:
-            httpx_kwargs["proxies"] = self.config.proxy
-        async with httpx.AsyncClient(trust_env=True, **httpx_kwargs) as sess:
-            client = self._make_openai_client(sess)
-            resp = await client.audio.speech.create(
-                model="tts-1",
-                input=text,
-                voice=self.config.tts_voice or self.default_voice,
-            )
-            resp.stream_to_file(output_file.name)
-        return Path(output_file.name), calculate_tts_elapse(text)
-    def _make_openai_client(self, sess: httpx.AsyncClient) -> openai.AsyncOpenAI:
-        import openai
-        api_base = self.config.api_base
-        if api_base and api_base.rstrip("/").endswith("openai.azure.com"):
-            raise NotImplementedError("TTS is not supported for Azure OpenAI")
-        else:
-            return openai.AsyncOpenAI(
-                api_key=self.config.openai_key, http_client=sess, base_url=api_base
-            )