npm - @lobehub/chat - Versions diffs - 1.40.0 → 1.40.2 - Mend

@lobehub/chat 1.40.0 → 1.40.2

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (110) hide show

package/CHANGELOG.md +50 -0
package/changelog/v1.json +18 -0
package/package.json +1 -1
package/src/app/(main)/chat/(workspace)/_layout/Desktop/HotKeys.tsx +7 -0
package/src/app/(main)/discover/(detail)/model/[...slugs]/features/Actions.tsx +1 -1
package/src/app/(main)/discover/(detail)/model/[...slugs]/features/Header.tsx +1 -1
package/src/app/(main)/discover/(detail)/model/[...slugs]/features/InfoSidebar/SuggestionItem.tsx +2 -2
package/src/app/(main)/discover/(detail)/model/[...slugs]/features/ProviderList/ProviderItem.tsx +1 -1
package/src/app/(main)/discover/(detail)/provider/[slug]/features/ModelList/ModelItem.tsx +3 -3
package/src/app/(main)/discover/(list)/models/features/Card.tsx +6 -2
package/src/app/(main)/settings/llm/ProviderList/Cloudflare/index.tsx +1 -5
package/src/app/(main)/settings/llm/components/ProviderModelList/ModelFetcher.tsx +2 -2
package/src/components/ModelSelect/index.tsx +7 -4
package/src/config/__tests__/app.test.ts +6 -2
package/src/config/app.ts +1 -2
package/src/config/modelProviders/ai21.ts +2 -2
package/src/config/modelProviders/ai360.ts +4 -4
package/src/config/modelProviders/anthropic.ts +8 -8
package/src/config/modelProviders/azure.ts +5 -5
package/src/config/modelProviders/baichuan.ts +6 -6
package/src/config/modelProviders/bedrock.ts +14 -14
package/src/config/modelProviders/cloudflare.ts +12 -11
package/src/config/modelProviders/deepseek.ts +1 -1
package/src/config/modelProviders/fireworksai.ts +29 -27
package/src/config/modelProviders/giteeai.ts +7 -7
package/src/config/modelProviders/github.ts +29 -28
package/src/config/modelProviders/google.ts +18 -19
package/src/config/modelProviders/groq.ts +13 -13
package/src/config/modelProviders/higress.ts +195 -194
package/src/config/modelProviders/huggingface.ts +7 -7
package/src/config/modelProviders/hunyuan.ts +25 -17
package/src/config/modelProviders/internlm.ts +6 -4
package/src/config/modelProviders/minimax.ts +5 -5
package/src/config/modelProviders/mistral.ts +14 -16
package/src/config/modelProviders/moonshot.ts +3 -3
package/src/config/modelProviders/novita.ts +15 -15
package/src/config/modelProviders/ollama.ts +46 -46
package/src/config/modelProviders/openai.ts +23 -22
package/src/config/modelProviders/openrouter.ts +20 -18
package/src/config/modelProviders/perplexity.ts +7 -7
package/src/config/modelProviders/qwen.ts +23 -25
package/src/config/modelProviders/sensenova.ts +8 -8
package/src/config/modelProviders/siliconcloud.ts +138 -92
package/src/config/modelProviders/spark.ts +6 -6
package/src/config/modelProviders/stepfun.ts +9 -9
package/src/config/modelProviders/taichu.ts +2 -3
package/src/config/modelProviders/togetherai.ts +57 -48
package/src/config/modelProviders/upstage.ts +3 -3
package/src/config/modelProviders/wenxin.ts +12 -12
package/src/config/modelProviders/xai.ts +4 -4
package/src/config/modelProviders/zeroone.ts +11 -11
package/src/config/modelProviders/zhipu.ts +17 -16
package/src/const/hotkeys.ts +1 -0
package/src/database/_deprecated/core/model.ts +1 -1
package/src/database/_deprecated/models/sessionGroup.ts +4 -1
package/src/database/client/migrations.json +2 -5
package/src/database/migrations/meta/0012_snapshot.json +176 -518
package/src/database/schemas/agent.ts +1 -1
package/src/database/schemas/message.ts +1 -0
package/src/database/schemas/session.ts +1 -0
package/src/database/server/models/topic.ts +19 -17
package/src/features/DebugUI/Content.tsx +0 -1
package/src/features/PluginStore/index.tsx +2 -2
package/src/layout/GlobalProvider/AntdV5MonkeyPatch.tsx +4 -4
package/src/libs/agent-runtime/google/index.ts +4 -3
package/src/libs/agent-runtime/higress/index.ts +1 -1
package/src/libs/agent-runtime/huggingface/index.ts +2 -4
package/src/libs/agent-runtime/minimax/index.ts +5 -10
package/src/libs/agent-runtime/mistral/index.ts +3 -6
package/src/libs/agent-runtime/moonshot/index.ts +3 -6
package/src/libs/agent-runtime/novita/__snapshots__/index.test.ts.snap +18 -18
package/src/libs/agent-runtime/novita/index.ts +1 -1
package/src/libs/agent-runtime/openai/__snapshots__/index.test.ts.snap +10 -10
package/src/libs/agent-runtime/openai/index.ts +2 -0
package/src/libs/agent-runtime/openrouter/__snapshots__/index.test.ts.snap +168 -168
package/src/libs/agent-runtime/openrouter/index.ts +1 -1
package/src/libs/agent-runtime/perplexity/index.ts +4 -4
package/src/libs/agent-runtime/sensenova/index.ts +9 -3
package/src/libs/agent-runtime/taichu/index.ts +4 -10
package/src/libs/agent-runtime/utils/streams/minimax.test.ts +5 -2
package/src/libs/agent-runtime/utils/streams/minimax.ts +4 -1
package/src/libs/agent-runtime/zhipu/index.ts +12 -13
package/src/libs/langchain/loaders/index.ts +2 -2
package/src/libs/langchain/types.ts +9 -1
package/src/locales/default/modelProvider.ts +1 -1
package/src/migrations/FromV3ToV4/fixtures/ollama-output-v4.json +1 -1
package/src/migrations/FromV6ToV7/types/v7.ts +0 -2
package/src/server/globalConfig/genServerLLMConfig.test.ts +4 -4
package/src/server/globalConfig/genServerLLMConfig.ts +29 -24
package/src/server/globalConfig/index.ts +1 -2
package/src/server/routers/edge/config/__snapshots__/index.test.ts.snap +9 -9
package/src/server/routers/lambda/_template.ts +1 -1
package/src/server/routers/lambda/knowledgeBase.ts +1 -1
package/src/server/routers/lambda/session.ts +1 -1
package/src/server/routers/lambda/sessionGroup.ts +1 -1
package/src/server/routers/lambda/thread.ts +1 -1
package/src/server/services/nextAuthUser/index.ts +1 -1
package/src/store/user/slices/modelList/__snapshots__/action.test.ts.snap +1 -1
package/src/store/user/slices/modelList/action.test.ts +4 -4
package/src/store/user/slices/modelList/reducers/customModelCard.test.ts +6 -6
package/src/store/user/slices/modelList/selectors/modelProvider.ts +3 -2
package/src/tools/dalle/Render/Item/index.tsx +1 -1
package/src/types/files/index.ts +0 -1
package/src/types/llm.ts +4 -5
package/src/utils/__snapshots__/parseModels.test.ts.snap +2 -2
package/src/utils/genUserLLMConfig.test.ts +4 -4
package/src/utils/genUserLLMConfig.ts +6 -4
package/src/utils/parseModels.test.ts +16 -16
package/src/utils/parseModels.ts +1 -1
package/src/utils/server/jwt.ts +2 -6

package/src/config/modelProviders/bedrock.ts CHANGED Viewed

@@ -27,6 +27,7 @@ const Bedrock: ModelProviderCard = {
     },
 */
     {
+      contextWindowTokens: 200_000,
       description:
         'Claude 3.5 Sonnet 提升了行业标准，性能超过竞争对手模型和 Claude 3 Opus，在广泛的评估中表现出色，同时具有我们中等层级模型的速度和成本。',
       displayName: 'Claude 3.5 Sonnet',
@@ -37,10 +38,10 @@ const Bedrock: ModelProviderCard = {
         input: 3,
         output: 15,
       },
-      tokens: 200_000,
       vision: true,
     },
     {
+      contextWindowTokens: 200_000,
       description:
         'Claude 3.5 Sonnet 提升了行业标准，性能超过竞争对手模型和 Claude 3 Opus，在广泛的评估中表现出色，同时具有我们中等层级模型的速度和成本。',
       displayName: 'Claude 3.5 Sonnet v2 (Inference profile)',
@@ -51,10 +52,10 @@ const Bedrock: ModelProviderCard = {
         input: 3,
         output: 15,
       },
-      tokens: 200_000,
       vision: true,
     },
     {
+      contextWindowTokens: 200_000,
       description:
         'Claude 3.5 Sonnet 提升了行业标准，性能超过竞争对手模型和 Claude 3 Opus，在广泛的评估中表现出色，同时具有我们中等层级模型的速度和成本。',
       displayName: 'Claude 3.5 Sonnet 0620',
@@ -65,10 +66,10 @@ const Bedrock: ModelProviderCard = {
         input: 3,
         output: 15,
       },
-      tokens: 200_000,
       vision: true,
     },
     {
+      contextWindowTokens: 200_000,
       description:
         'Claude 3 Haiku 是 Anthropic 最快、最紧凑的模型，提供近乎即时的响应速度。它可以快速回答简单的查询和请求。客户将能够构建模仿人类互动的无缝 AI 体验。Claude 3 Haiku 可以处理图像并返回文本输出，具有 200K 的上下文窗口。',
       displayName: 'Claude 3 Haiku',
@@ -79,10 +80,10 @@ const Bedrock: ModelProviderCard = {
         input: 0.25,
         output: 1.25,
       },
-      tokens: 200_000,
       vision: true,
     },
     {
+      contextWindowTokens: 200_000,
       description:
         'Anthropic 的 Claude 3 Sonnet 在智能和速度之间达到了理想的平衡——特别适合企业工作负载。它以低于竞争对手的价格提供最大的效用，并被设计成为可靠的、高耐用的主力机，适用于规模化的 AI 部署。Claude 3 Sonnet 可以处理图像并返回文本输出，具有 200K 的上下文窗口。',
       displayName: 'Claude 3 Sonnet',
@@ -93,10 +94,10 @@ const Bedrock: ModelProviderCard = {
         input: 3,
         output: 15,
       },
-      tokens: 200_000,
       vision: true,
     },
     {
+      contextWindowTokens: 200_000,
       description:
         'Claude 3 Opus 是 Anthropic 最强大的 AI 模型，具有在高度复杂任务上的最先进性能。它可以处理开放式提示和未见过的场景，具有出色的流畅性和类人的理解能力。Claude 3 Opus 展示了生成 AI 可能性的前沿。Claude 3 Opus 可以处理图像并返回文本输出，具有 200K 的上下文窗口。',
       displayName: 'Claude 3 Opus',
@@ -107,10 +108,10 @@ const Bedrock: ModelProviderCard = {
         input: 15,
         output: 75,
       },
-      tokens: 200_000,
       vision: true,
     },
     {
+      contextWindowTokens: 200_000,
       description:
         'Claude 2 的更新版，具有双倍的上下文窗口，以及在长文档和 RAG 上下文中的可靠性、幻觉率和基于证据的准确性的改进。',
       displayName: 'Claude 2.1',
@@ -119,9 +120,9 @@ const Bedrock: ModelProviderCard = {
         input: 8,
         output: 24,
       },
-      tokens: 200_000,
     },
     {
+      contextWindowTokens: 100_000,
       description:
         'Anthropic 在从复杂对话和创意内容生成到详细指令跟随的广泛任务中都表现出高度能力的模型。',
       displayName: 'Claude 2.0',
@@ -130,9 +131,9 @@ const Bedrock: ModelProviderCard = {
         input: 8,
         output: 24,
       },
-      tokens: 100_000,
     },
     {
+      contextWindowTokens: 100_000,
       description:
         '一款快速、经济且仍然非常有能力的模型，可以处理包括日常对话、文本分析、总结和文档问答在内的一系列任务。',
       displayName: 'Claude Instant',
@@ -141,9 +142,9 @@ const Bedrock: ModelProviderCard = {
         input: 0.8,
         output: 2.4,
       },
-      tokens: 100_000,
     },
     {
+      contextWindowTokens: 128_000,
       description:
         'Meta Llama 3.1 8B Instruct 的更新版，包括扩展的 128K 上下文长度、多语言性和改进的推理能力。Llama 3.1 提供的多语言大型语言模型 (LLMs) 是一组预训练的、指令调整的生成模型，包括 8B、70B 和 405B 大小 (文本输入/输出)。Llama 3.1 指令调整的文本模型 (8B、70B、405B) 专为多语言对话用例进行了优化，并在常见的行业基准测试中超过了许多可用的开源聊天模型。Llama 3.1 旨在用于多种语言的商业和研究用途。指令调整的文本模型适用于类似助手的聊天，而预训练模型可以适应各种自然语言生成任务。Llama 3.1 模型还支持利用其模型的输出来改进其他模型，包括合成数据生成和精炼。Llama 3.1 是使用优化的变压器架构的自回归语言模型。调整版本使用监督微调 (SFT) 和带有人类反馈的强化学习 (RLHF) 来符合人类对帮助性和安全性的偏好。',
       displayName: 'Llama 3.1 8B Instruct',
@@ -154,9 +155,9 @@ const Bedrock: ModelProviderCard = {
         input: 0.22,
         output: 0.22,
       },
-      tokens: 128_000,
     },
     {
+      contextWindowTokens: 128_000,
       description:
         'Meta Llama 3.1 70B Instruct 的更新版，包括扩展的 128K 上下文长度、多语言性和改进的推理能力。Llama 3.1 提供的多语言大型语言模型 (LLMs) 是一组预训练的、指令调整的生成模型，包括 8B、70B 和 405B 大小 (文本输入/输出)。Llama 3.1 指令调整的文本模型 (8B、70B、405B) 专为多语言对话用例进行了优化，并在常见的行业基准测试中超过了许多可用的开源聊天模型。Llama 3.1 旨在用于多种语言的商业和研究用途。指令调整的文本模型适用于类似助手的聊天，而预训练模型可以适应各种自然语言生成任务。Llama 3.1 模型还支持利用其模型的输出来改进其他模型，包括合成数据生成和精炼。Llama 3.1 是使用优化的变压器架构的自回归语言模型。调整版本使用监督微调 (SFT) 和带有人类反馈的强化学习 (RLHF) 来符合人类对帮助性和安全性的偏好。',
       displayName: 'Llama 3.1 70B Instruct',
@@ -167,9 +168,9 @@ const Bedrock: ModelProviderCard = {
         input: 0.99,
         output: 0.99,
       },
-      tokens: 128_000,
     },
     {
+      contextWindowTokens: 128_000,
       description:
         'Meta Llama 3.1 405B Instruct 是 Llama 3.1 Instruct 模型中最大、最强大的模型，是一款高度先进的对话推理和合成数据生成模型，也可以用作在特定领域进行专业持续预训练或微调的基础。Llama 3.1 提供的多语言大型语言模型 (LLMs) 是一组预训练的、指令调整的生成模型，包括 8B、70B 和 405B 大小 (文本输入/输出)。Llama 3.1 指令调整的文本模型 (8B、70B、405B) 专为多语言对话用例进行了优化，并在常见的行业基准测试中超过了许多可用的开源聊天模型。Llama 3.1 旨在用于多种语言的商业和研究用途。指令调整的文本模型适用于类似助手的聊天，而预训练模型可以适应各种自然语言生成任务。Llama 3.1 模型还支持利用其模型的输出来改进其他模型，包括合成数据生成和精炼。Llama 3.1 是使用优化的变压器架构的自回归语言模型。调整版本使用监督微调 (SFT) 和带有人类反馈的强化学习 (RLHF) 来符合人类对帮助性和安全性的偏好。',
       displayName: 'Llama 3.1 405B Instruct',
@@ -180,9 +181,9 @@ const Bedrock: ModelProviderCard = {
         input: 5.32,
         output: 16,
       },
-      tokens: 128_000,
     },
     {
+      contextWindowTokens: 8000,
       description:
         'Meta Llama 3 是一款面向开发者、研究人员和企业的开放大型语言模型 (LLM)，旨在帮助他们构建、实验并负责任地扩展他们的生成 AI 想法。作为全球社区创新的基础系统的一部分，它非常适合计算能力和资源有限、边缘设备和更快的训练时间。',
       displayName: 'Llama 3 8B Instruct',
@@ -191,9 +192,9 @@ const Bedrock: ModelProviderCard = {
         input: 0.3,
         output: 0.6,
       },
-      tokens: 8000,
     },
     {
+      contextWindowTokens: 8000,
       description:
         'Meta Llama 3 是一款面向开发者、研究人员和企业的开放大型语言模型 (LLM)，旨在帮助他们构建、实验并负责任地扩展他们的生成 AI 想法。作为全球社区创新的基础系统的一部分，它非常适合内容创建、对话 AI、语言理解、研发和企业应用。',
       displayName: 'Llama 3 70B Instruct',
@@ -202,7 +203,6 @@ const Bedrock: ModelProviderCard = {
         input: 2.65,
         output: 3.5,
       },
-      tokens: 8000,
     },
     /*
     // TODO: Not support for now

package/src/config/modelProviders/cloudflare.ts CHANGED Viewed

@@ -5,68 +5,69 @@ import { ModelProviderCard } from '@/types/llm';
 const Cloudflare: ModelProviderCard = {
   chatModels: [
     {
+      contextWindowTokens: 16_384,
       displayName: 'deepseek-coder-6.7b-instruct-awq',
       enabled: true,
       id: '@hf/thebloke/deepseek-coder-6.7b-instruct-awq',
-      tokens: 16_384,
     },
     {
+      contextWindowTokens: 2048,
       displayName: 'gemma-7b-it',
       enabled: true,
       id: '@hf/google/gemma-7b-it',
-      tokens: 2048,
     },
     {
+      contextWindowTokens: 4096,
       displayName: 'hermes-2-pro-mistral-7b',
       enabled: true,
       // functionCall: true,
       id: '@hf/nousresearch/hermes-2-pro-mistral-7b',
-      tokens: 4096,
     },
     {
+      contextWindowTokens: 8192,
       displayName: 'llama-3-8b-instruct-awq',
       id: '@cf/meta/llama-3-8b-instruct-awq',
-      tokens: 8192,
     },
     {
+      contextWindowTokens: 4096,
       displayName: 'mistral-7b-instruct-v0.2',
       id: '@hf/mistral/mistral-7b-instruct-v0.2',
-      tokens: 4096,
     },
     {
+      contextWindowTokens: 32_768,
       displayName: 'neural-chat-7b-v3-1-awq',
       enabled: true,
       id: '@hf/thebloke/neural-chat-7b-v3-1-awq',
-      tokens: 32_768,
     },
     {
+      contextWindowTokens: 8192,
       displayName: 'openchat-3.5-0106',
       id: '@cf/openchat/openchat-3.5-0106',
-      tokens: 8192,
     },
     {
+      contextWindowTokens: 32_768,
       displayName: 'openhermes-2.5-mistral-7b-awq',
       enabled: true,
       id: '@hf/thebloke/openhermes-2.5-mistral-7b-awq',
-      tokens: 32_768,
     },
     {
+      contextWindowTokens: 32_768,
       displayName: 'qwen1.5-14b-chat-awq',
       enabled: true,
       id: '@cf/qwen/qwen1.5-14b-chat-awq',
-      tokens: 32_768,
     },
     {
+      contextWindowTokens: 4096,
       displayName: 'starling-lm-7b-beta',
       enabled: true,
       id: '@hf/nexusflow/starling-lm-7b-beta',
-      tokens: 4096,
     },
     {
+      contextWindowTokens: 32_768,
       displayName: 'zephyr-7b-beta-awq',
       enabled: true,
       id: '@hf/thebloke/zephyr-7b-beta-awq',
-      tokens: 32_768,
     },
     {
       displayName: 'meta-llama-3-8b-instruct',

package/src/config/modelProviders/deepseek.ts CHANGED Viewed

@@ -4,6 +4,7 @@ import { ModelProviderCard } from '@/types/llm';
 const DeepSeek: ModelProviderCard = {
   chatModels: [
     {
+      contextWindowTokens: 65_536,
       description:
         '融合通用与代码能力的全新开源模型, 不仅保留了原有 Chat 模型的通用对话能力和 Coder 模型的强大代码处理能力，还更好地对齐了人类偏好。此外，DeepSeek-V2.5 在写作任务、指令跟随等多个方面也实现了大幅提升。',
       displayName: 'DeepSeek V2.5',
@@ -17,7 +18,6 @@ const DeepSeek: ModelProviderCard = {
         output: 2,
       },
       releasedAt: '2024-09-05',
-      tokens: 65_536,
     },
   ],
   checkModel: 'deepseek-chat',

package/src/config/modelProviders/fireworksai.ts CHANGED Viewed

@@ -5,208 +5,210 @@ import { ModelProviderCard } from '@/types/llm';
 const FireworksAI: ModelProviderCard = {
   chatModels: [
     {
+      contextWindowTokens: 8192,
       description:
         'Fireworks 公司最新推出的 Firefunction-v2 是一款性能卓越的函数调用模型，基于 Llama-3 开发，并通过大量优化，特别适用于函数调用、对话及指令跟随等场景。',
       displayName: 'Firefunction V2',
       enabled: true,
       functionCall: true,
       id: 'accounts/fireworks/models/firefunction-v2',
-      tokens: 8192,
     },
     {
+      contextWindowTokens: 32_768,
       description: 'Fireworks 开源函数调用模型，提供卓越的指令执行能力和开放可定制的特性。',
       displayName: 'Firefunction V1',
       functionCall: true,
       id: 'accounts/fireworks/models/firefunction-v1',
-      tokens: 32_768,
     },
     {
+      contextWindowTokens: 4096,
       description:
         'fireworks-ai/FireLLaVA-13b 是一款视觉语言模型，可以同时接收图像和文本输入，经过高质量数据训练，适合多模态任务。',
       displayName: 'FireLLaVA-13B',
       enabled: true,
       functionCall: false,
       id: 'accounts/fireworks/models/firellava-13b',
-      tokens: 4096,
       vision: true,
     },
     {
+      contextWindowTokens: 131_072,
       description:
         'Llama 3.2 1B 指令模型是Meta推出的一款轻量级多语言模型。该模型旨在提高效率，与更大型的模型相比，在延迟和成本方面提供了显著的改进。该模型的示例用例包括检索和摘要。',
       displayName: 'Llama 3.2 1B Instruct',
       enabled: true,
       id: 'accounts/fireworks/models/llama-v3p2-1b-instruct',
-      tokens: 131_072,
     },
     {
+      contextWindowTokens: 131_072,
       description:
         'Llama 3.2 3B 指令模型是Meta推出的一款轻量级多语言模型。该模型旨在提高效率，与更大型的模型相比，在延迟和成本方面提供了显著的改进。该模型的示例用例包括查询和提示重写以及写作辅助。',
       displayName: 'Llama 3.2 3B Instruct',
       enabled: true,
       id: 'accounts/fireworks/models/llama-v3p2-3b-instruct',
-      tokens: 131_072,
     },
     {
+      contextWindowTokens: 131_072,
       description:
         'Meta的11B参数指令调整图像推理模型。该模型针对视觉识别、图像推理、图像描述和回答关于图像的一般性问题进行了优化。该模型能够理解视觉数据，如图表和图形，并通过生成文本描述图像细节来弥合视觉与语言之间的差距。',
       displayName: 'Llama 3.2 11B Vision Instruct',
       enabled: true,
       id: 'accounts/fireworks/models/llama-v3p2-11b-vision-instruct',
-      tokens: 131_072,
       vision: true,
     },
     {
+      contextWindowTokens: 131_072,
       description:
         'Meta的90B参数指令调整图像推理模型。该模型针对视觉识别、图像推理、图像描述和回答关于图像的一般性问题进行了优化。该模型能够理解视觉数据，如图表和图形，并通过生成文本描述图像细节来弥合视觉与语言之间的差距。',
       displayName: 'Llama 3.2 90B Vision Instruct',
       enabled: true,
       id: 'accounts/fireworks/models/llama-v3p2-90b-vision-instruct',
-      tokens: 131_072,
       vision: true,
     },
     {
+      contextWindowTokens: 131_072,
       description:
         'Llama 3.1 8B 指令模型，专为多语言对话优化，能够在常见行业基准上超越多数开源及闭源模型。',
       displayName: 'Llama 3.1 8B Instruct',
       enabled: true,
       functionCall: false,
       id: 'accounts/fireworks/models/llama-v3p1-8b-instruct',
-      tokens: 131_072,
     },
     {
+      contextWindowTokens: 131_072,
       description:
         'Llama 3.1 70B 指令模型，提供卓越的自然语言理解和生成能力，是对话及分析任务的理想选择。',
       displayName: 'Llama 3.1 70B Instruct',
       enabled: true,
       functionCall: false,
       id: 'accounts/fireworks/models/llama-v3p1-70b-instruct',
-      tokens: 131_072,
     },
     {
+      contextWindowTokens: 131_072,
       description:
         'Llama 3.1 405B 指令模型，具备超大规模参数，适合复杂任务和高负载场景下的指令跟随。',
       displayName: 'Llama 3.1 405B Instruct',
       enabled: true,
       functionCall: false,
       id: 'accounts/fireworks/models/llama-v3p1-405b-instruct',
-      tokens: 131_072,
     },
     {
+      contextWindowTokens: 8192,
       description: 'Llama 3 8B 指令模型，优化用于对话及多语言任务，表现卓越且高效。',
       displayName: 'Llama 3 8B Instruct',
       functionCall: false,
       id: 'accounts/fireworks/models/llama-v3-8b-instruct',
-      tokens: 8192,
     },
     {
+      contextWindowTokens: 8192,
       description: 'Llama 3 70B 指令模型，专为多语言对话和自然语言理解优化，性能优于多数竞争模型。',
       displayName: 'Llama 3 70B Instruct',
       functionCall: false,
       id: 'accounts/fireworks/models/llama-v3-70b-instruct',
-      tokens: 8192,
     },
     {
+      contextWindowTokens: 8192,
       description:
         'Llama 3 8B 指令模型（HF 版本），与官方实现结果一致，具备高度一致性和跨平台兼容性。',
       displayName: 'Llama 3 8B Instruct (HF version)',
       functionCall: false,
       id: 'accounts/fireworks/models/llama-v3-8b-instruct-hf',
-      tokens: 8192,
     },
     {
+      contextWindowTokens: 8192,
       description:
         'Llama 3 70B 指令模型（HF 版本），与官方实现结果保持一致，适合高质量的指令跟随任务。',
       displayName: 'Llama 3 70B Instruct (HF version)',
       functionCall: false,
       id: 'accounts/fireworks/models/llama-v3-70b-instruct-hf',
-      tokens: 8192,
     },
     {
+      contextWindowTokens: 32_768,
       description: 'Mixtral MoE 8x7B 指令模型，多专家架构提供高效的指令跟随及执行。',
       displayName: 'Mixtral MoE 8x7B Instruct',
       enabled: true,
       functionCall: false,
       id: 'accounts/fireworks/models/mixtral-8x7b-instruct',
-      tokens: 32_768,
     },
     {
+      contextWindowTokens: 65_536,
       description:
         'Mixtral MoE 8x22B 指令模型，大规模参数和多专家架构，全方位支持复杂任务的高效处理。',
       displayName: 'Mixtral MoE 8x22B Instruct',
       enabled: true,
       functionCall: false,
       id: 'accounts/fireworks/models/mixtral-8x22b-instruct',
-      tokens: 65_536,
     },
     {
+      contextWindowTokens: 32_768,
       description:
         'Mixtral MoE 8x7B 指令模型（HF 版本），性能与官方实现一致，适合多种高效任务场景。',
       displayName: 'Mixtral MoE 8x7B Instruct (HF version)',
       functionCall: false,
       id: 'accounts/fireworks/models/mixtral-8x7b-instruct-hf',
-      tokens: 32_768,
     },
     {
+      contextWindowTokens: 32_064,
       description:
         'Phi-3-Vision-128K-Instruct 是一个轻量级的、最先进的开放多模态模型，它基于包括合成数据和经过筛选的公开网站在内的数据集构建，专注于非常高质量、推理密集型的数据，这些数据既包括文本也包括视觉。该模型属于 Phi-3 模型系列，其多模态版本支持 128K 的上下文长度（以标记为单位）。该模型经过严格的增强过程，结合了监督微调和直接偏好优化，以确保精确遵循指令和强大的安全措施。',
       displayName: 'Phi 3.5 Vision Instruct',
       enabled: true,
       functionCall: false,
       id: 'accounts/fireworks/models/phi-3-vision-128k-instruct',
-      tokens: 32_064,
       vision: true,
     },
     {
+      contextWindowTokens: 32_768,
       description: 'QwQ模型是由 Qwen 团队开发的实验性研究模型，专注于增强 AI 推理能力。',
       displayName: 'QwQ 32B Preview',
       enabled: true,
       id: 'accounts/fireworks/models/qwen-qwq-32b-preview',
-      tokens: 32_768,
     },
     {
-      description: 'Qwen2.5 是由阿里云 Qwen 团队开发的一系列仅包含解码器的语言模型。这些模型提供不同的大小，包括 0.5B、1.5B、3B、7B、14B、32B 和 72B，并且有基础版（base）和指令版（instruct）两种变体。',
+      contextWindowTokens: 32_768,
+      description:
+        'Qwen2.5 是由阿里云 Qwen 团队开发的一系列仅包含解码器的语言模型。这些模型提供不同的大小，包括 0.5B、1.5B、3B、7B、14B、32B 和 72B，并且有基础版（base）和指令版（instruct）两种变体。',
       displayName: 'Qwen2.5 72B Instruct',
       enabled: true,
       functionCall: false,
       id: 'accounts/fireworks/models/qwen2p5-72b-instruct',
-      tokens: 32_768,
     },
     {
-      description: 'Qwen2.5 Coder 32B Instruct 是阿里云发布的代码特定大语言模型系列的最新版本。该模型在 Qwen2.5 的基础上，通过 5.5 万亿个 tokens 的训练，显著提升了代码生成、推理和修复能力。它不仅增强了编码能力，还保持了数学和通用能力的优势。模型为代码智能体等实际应用提供了更全面的基础',
+      contextWindowTokens: 32_768,
+      description:
+        'Qwen2.5 Coder 32B Instruct 是阿里云发布的代码特定大语言模型系列的最新版本。该模型在 Qwen2.5 的基础上，通过 5.5 万亿个 tokens 的训练，显著提升了代码生成、推理和修复能力。它不仅增强了编码能力，还保持了数学和通用能力的优势。模型为代码智能体等实际应用提供了更全面的基础',
       displayName: 'Qwen2.5 Coder 32B Instruct',
       enabled: false,
       id: 'accounts/fireworks/models/qwen2p5-coder-32b-instruct',
-      tokens: 32_768,
     },
     {
+      contextWindowTokens: 32_768,
       description: 'Yi-Large 模型，具备卓越的多语言处理能力，可用于各类语言生成和理解任务。',
       displayName: 'Yi-Large',
       enabled: true,
       functionCall: false,
       id: 'accounts/yi-01-ai/models/yi-large',
-      tokens: 32_768,
     },
     {
+      contextWindowTokens: 8192,
       description: 'StarCoder 7B 模型，针对80多种编程语言训练，拥有出色的编程填充能力和语境理解。',
       displayName: 'StarCoder 7B',
       functionCall: false,
       id: 'accounts/fireworks/models/starcoder-7b',
-      tokens: 8192,
     },
     {
+      contextWindowTokens: 8192,
       description:
         'StarCoder 15.5B 模型，支持高级编程任务，多语言能力增强，适合复杂代码生成和理解。',
       displayName: 'StarCoder 15.5B',
       functionCall: false,
       id: 'accounts/fireworks/models/starcoder-16b',
-      tokens: 8192,
     },
     {
+      contextWindowTokens: 4096,
       description: 'MythoMax L2 13B 模型，结合新颖的合并技术，擅长叙事和角色扮演。',
       displayName: 'MythoMax L2 13b',
       functionCall: false,
       id: 'accounts/fireworks/models/mythomax-l2-13b',
-      tokens: 4096,
     },
   ],
   checkModel: 'accounts/fireworks/models/firefunction-v2',

package/src/config/modelProviders/giteeai.ts CHANGED Viewed

@@ -4,13 +4,13 @@ import { ModelProviderCard } from '@/types/llm';
 const GiteeAI: ModelProviderCard = {
   chatModels: [
     {
+      contextWindowTokens: 16_000,
       description:
         'Qwen2.5-72B-Instruct 支持 16k 上下文, 生成长文本超过 8K 。支持 function call 与外部系统无缝交互，极大提升了灵活性和扩展性。模型知识明显增加，并且大大提高了编码和数学能力, 多语言支持超过 29 种',
       displayName: 'Qwen2.5 72B Instruct',
       enabled: true,
       functionCall: true,
       id: 'Qwen2.5-72B-Instruct',
-      tokens: 16_000,
     },
     {
       description:
@@ -42,18 +42,18 @@ const GiteeAI: ModelProviderCard = {
       id: 'Qwen2.5-14B-Instruct',
     },
     {
+      contextWindowTokens: 6000,
       description:
         'Qwen2 是 Qwen 模型的最新系列，支持 128k 上下文，对比当前最优的开源模型，Qwen2-72B 在自然语言理解、知识、代码、数学及多语言等多项能力上均显著超越当前领先的模型。',
       displayName: 'Qwen2 72B Instruct',
       id: 'Qwen2-72B-Instruct',
-      tokens: 6000,
     },
     {
+      contextWindowTokens: 32_000,
       description:
         'Qwen2 是 Qwen 模型的最新系列，能够超越同等规模的最优开源模型甚至更大规模的模型，Qwen2 7B 在多个评测上取得显著的优势，尤其是代码及中文理解上。',
       displayName: 'Qwen2 7B Instruct',
       id: 'Qwen2-7B-Instruct',
-      tokens: 32_000,
     },
     {
       description:
@@ -72,28 +72,28 @@ const GiteeAI: ModelProviderCard = {
       vision: true,
     },
     {
+      contextWindowTokens: 32_000,
       description:
         'GLM-4-9B-Chat 在语义、数学、推理、代码和知识等多方面均表现出较高性能。还具备网页浏览、代码执行、自定义工具调用和长文本推理。 支持包括日语，韩语，德语在内的 26 种语言。',
       displayName: 'GLM4 9B Chat',
       enabled: true,
       id: 'glm-4-9b-chat',
-      tokens: 32_000,
     },
     {
+      contextWindowTokens: 4000,
       description:
         'Yi-1.5-34B 在保持原系列模型优秀的通用语言能力的前提下，通过增量训练 5 千亿高质量 token，大幅提高了数学逻辑、代码能力。',
       displayName: 'Yi 34B Chat',
       enabled: true,
       id: 'Yi-34B-Chat',
-      tokens: 4000,
     },
     {
+      contextWindowTokens: 8000,
       description:
         'DeepSeek Coder 33B 是一个代码语言模型， 基于 2 万亿数据训练而成，其中 87% 为代码， 13% 为中英文语言。模型引入 16K 窗口大小和填空任务，提供项目级别的代码补全和片段填充功能。',
       displayName: 'DeepSeek Coder 33B Instruct',
       enabled: true,
       id: 'deepseek-coder-33B-instruct',
-      tokens: 8000,
     },
     {
       description:
@@ -103,12 +103,12 @@ const GiteeAI: ModelProviderCard = {
       id: 'code-raccoon-v1',
     },
     {
+      contextWindowTokens: 40_000,
       description:
         'CodeGeeX4-ALL-9B 是一个多语言代码生成模型，支持包括代码补全和生成、代码解释器、网络搜索、函数调用、仓库级代码问答在内的全面功能，覆盖软件开发的各种场景。是参数少于 10B 的顶尖代码生成模型。',
       displayName: 'CodeGeeX4 All 9B',
       enabled: true,
       id: 'codegeex4-all-9b',
-      tokens: 40_000,
     },
   ],
   checkModel: 'Qwen2.5-72B-Instruct',