npm - @lobehub/chat - Versions diffs - 1.40.1 → 1.40.2 - Mend

@lobehub/chat 1.40.1 → 1.40.2

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (107) hide show

package/CHANGELOG.md +25 -0
package/changelog/v1.json +9 -0
package/package.json +1 -1
package/src/app/(main)/discover/(detail)/model/[...slugs]/features/Actions.tsx +1 -1
package/src/app/(main)/discover/(detail)/model/[...slugs]/features/Header.tsx +1 -1
package/src/app/(main)/discover/(detail)/model/[...slugs]/features/InfoSidebar/SuggestionItem.tsx +2 -2
package/src/app/(main)/discover/(detail)/model/[...slugs]/features/ProviderList/ProviderItem.tsx +1 -1
package/src/app/(main)/discover/(detail)/provider/[slug]/features/ModelList/ModelItem.tsx +3 -3
package/src/app/(main)/discover/(list)/models/features/Card.tsx +6 -2
package/src/app/(main)/settings/llm/ProviderList/Cloudflare/index.tsx +1 -5
package/src/app/(main)/settings/llm/components/ProviderModelList/ModelFetcher.tsx +2 -2
package/src/components/ModelSelect/index.tsx +7 -4
package/src/config/__tests__/app.test.ts +6 -2
package/src/config/app.ts +1 -2
package/src/config/modelProviders/ai21.ts +2 -2
package/src/config/modelProviders/ai360.ts +4 -4
package/src/config/modelProviders/anthropic.ts +8 -8
package/src/config/modelProviders/azure.ts +5 -5
package/src/config/modelProviders/baichuan.ts +6 -6
package/src/config/modelProviders/bedrock.ts +14 -14
package/src/config/modelProviders/cloudflare.ts +12 -11
package/src/config/modelProviders/deepseek.ts +1 -1
package/src/config/modelProviders/fireworksai.ts +29 -27
package/src/config/modelProviders/giteeai.ts +7 -7
package/src/config/modelProviders/github.ts +29 -28
package/src/config/modelProviders/google.ts +18 -19
package/src/config/modelProviders/groq.ts +13 -13
package/src/config/modelProviders/higress.ts +195 -194
package/src/config/modelProviders/huggingface.ts +7 -7
package/src/config/modelProviders/hunyuan.ts +25 -17
package/src/config/modelProviders/internlm.ts +6 -4
package/src/config/modelProviders/minimax.ts +5 -5
package/src/config/modelProviders/mistral.ts +14 -16
package/src/config/modelProviders/moonshot.ts +3 -3
package/src/config/modelProviders/novita.ts +15 -15
package/src/config/modelProviders/ollama.ts +46 -46
package/src/config/modelProviders/openai.ts +23 -22
package/src/config/modelProviders/openrouter.ts +20 -18
package/src/config/modelProviders/perplexity.ts +7 -7
package/src/config/modelProviders/qwen.ts +23 -25
package/src/config/modelProviders/sensenova.ts +8 -8
package/src/config/modelProviders/siliconcloud.ts +138 -92
package/src/config/modelProviders/spark.ts +6 -6
package/src/config/modelProviders/stepfun.ts +9 -9
package/src/config/modelProviders/taichu.ts +2 -3
package/src/config/modelProviders/togetherai.ts +57 -48
package/src/config/modelProviders/upstage.ts +3 -3
package/src/config/modelProviders/wenxin.ts +12 -12
package/src/config/modelProviders/xai.ts +4 -4
package/src/config/modelProviders/zeroone.ts +11 -11
package/src/config/modelProviders/zhipu.ts +17 -16
package/src/database/_deprecated/core/model.ts +1 -1
package/src/database/_deprecated/models/sessionGroup.ts +4 -1
package/src/database/client/migrations.json +2 -5
package/src/database/migrations/meta/0012_snapshot.json +176 -518
package/src/database/schemas/agent.ts +1 -1
package/src/database/schemas/message.ts +1 -0
package/src/database/schemas/session.ts +1 -0
package/src/database/server/models/topic.ts +19 -17
package/src/features/DebugUI/Content.tsx +0 -1
package/src/features/PluginStore/index.tsx +2 -2
package/src/layout/GlobalProvider/AntdV5MonkeyPatch.tsx +4 -4
package/src/libs/agent-runtime/google/index.ts +4 -3
package/src/libs/agent-runtime/higress/index.ts +1 -1
package/src/libs/agent-runtime/huggingface/index.ts +2 -4
package/src/libs/agent-runtime/minimax/index.ts +5 -10
package/src/libs/agent-runtime/mistral/index.ts +3 -6
package/src/libs/agent-runtime/moonshot/index.ts +3 -6
package/src/libs/agent-runtime/novita/__snapshots__/index.test.ts.snap +18 -18
package/src/libs/agent-runtime/novita/index.ts +1 -1
package/src/libs/agent-runtime/openai/__snapshots__/index.test.ts.snap +10 -10
package/src/libs/agent-runtime/openrouter/__snapshots__/index.test.ts.snap +168 -168
package/src/libs/agent-runtime/openrouter/index.ts +1 -1
package/src/libs/agent-runtime/perplexity/index.ts +4 -4
package/src/libs/agent-runtime/sensenova/index.ts +9 -3
package/src/libs/agent-runtime/taichu/index.ts +4 -10
package/src/libs/agent-runtime/utils/streams/minimax.test.ts +5 -2
package/src/libs/agent-runtime/utils/streams/minimax.ts +4 -1
package/src/libs/agent-runtime/zhipu/index.ts +12 -13
package/src/libs/langchain/loaders/index.ts +2 -2
package/src/libs/langchain/types.ts +9 -1
package/src/locales/default/modelProvider.ts +1 -1
package/src/migrations/FromV3ToV4/fixtures/ollama-output-v4.json +1 -1
package/src/migrations/FromV6ToV7/types/v7.ts +0 -2
package/src/server/globalConfig/genServerLLMConfig.test.ts +4 -4
package/src/server/globalConfig/genServerLLMConfig.ts +29 -24
package/src/server/globalConfig/index.ts +1 -2
package/src/server/routers/edge/config/__snapshots__/index.test.ts.snap +9 -9
package/src/server/routers/lambda/_template.ts +1 -1
package/src/server/routers/lambda/knowledgeBase.ts +1 -1
package/src/server/routers/lambda/session.ts +1 -1
package/src/server/routers/lambda/sessionGroup.ts +1 -1
package/src/server/routers/lambda/thread.ts +1 -1
package/src/server/services/nextAuthUser/index.ts +1 -1
package/src/store/user/slices/modelList/__snapshots__/action.test.ts.snap +1 -1
package/src/store/user/slices/modelList/action.test.ts +4 -4
package/src/store/user/slices/modelList/reducers/customModelCard.test.ts +6 -6
package/src/store/user/slices/modelList/selectors/modelProvider.ts +3 -2
package/src/tools/dalle/Render/Item/index.tsx +1 -1
package/src/types/files/index.ts +0 -1
package/src/types/llm.ts +4 -5
package/src/utils/__snapshots__/parseModels.test.ts.snap +2 -2
package/src/utils/genUserLLMConfig.test.ts +4 -4
package/src/utils/genUserLLMConfig.ts +6 -4
package/src/utils/parseModels.test.ts +16 -16
package/src/utils/parseModels.ts +1 -1
package/src/utils/server/jwt.ts +2 -6

package/src/config/modelProviders/ollama.ts CHANGED Viewed

@@ -3,334 +3,334 @@ import { ModelProviderCard } from '@/types/llm';
 const Ollama: ModelProviderCard = {
   chatModels: [
     {
+      contextWindowTokens: 128_000,
       description:
         'Llama 3.1 是 Meta 推出的领先模型，支持高达 405B 参数，可应用于复杂对话、多语言翻译和数据分析领域。',
       displayName: 'Llama 3.1 8B',
       enabled: true,
       functionCall: true,
       id: 'llama3.1',
-      tokens: 128_000,
     },
     {
+      contextWindowTokens: 128_000,
       description:
         'Llama 3.1 是 Meta 推出的领先模型，支持高达 405B 参数，可应用于复杂对话、多语言翻译和数据分析领域。',
       displayName: 'Llama 3.1 70B',
       id: 'llama3.1:70b',
-      tokens: 128_000,
     },
     {
+      contextWindowTokens: 128_000,
       description:
         'Llama 3.1 是 Meta 推出的领先模型，支持高达 405B 参数，可应用于复杂对话、多语言翻译和数据分析领域。',
       displayName: 'Llama 3.1 405B',
       id: 'llama3.1:405b',
-      tokens: 128_000,
     },
     {
+      contextWindowTokens: 16_384,
       description:
         'Code Llama 是一款专注于代码生成和讨论的 LLM，结合广泛的编程语言支持，适用于开发者环境。',
       displayName: 'Code Llama 7B',
       enabled: true,
       id: 'codellama',
-      tokens: 16_384,
     },
     {
+      contextWindowTokens: 16_384,
       description:
         'Code Llama 是一款专注于代码生成和讨论的 LLM，结合广泛的编程语言支持，适用于开发者环境。',
       displayName: 'Code Llama 13B',
       id: 'codellama:13b',
-      tokens: 16_384,
     },
     {
+      contextWindowTokens: 16_384,
       description:
         'Code Llama 是一款专注于代码生成和讨论的 LLM，结合广泛的编程语言支持，适用于开发者环境。',
       displayName: 'Code Llama 34B',
       id: 'codellama:34b',
-      tokens: 16_384,
     },
     {
+      contextWindowTokens: 16_384,
       description:
         'Code Llama 是一款专注于代码生成和讨论的 LLM，结合广泛的编程语言支持，适用于开发者环境。',
       displayName: 'Code Llama 70B',
       id: 'codellama:70b',
-      tokens: 16_384,
     },
     {
+      contextWindowTokens: 128_000,
       description: 'QwQ 是一个实验研究模型，专注于提高 AI 推理能力。',
       displayName: 'QwQ 32B',
       enabled: true,
       functionCall: true,
       id: 'qwq',
       releasedAt: '2024-11-28',
-      tokens: 128_000,
     },
     {
+      contextWindowTokens: 128_000,
       description: 'Qwen2.5 是阿里巴巴的新一代大规模语言模型，以优异的性能支持多元化的应用需求。',
       displayName: 'Qwen2.5 0.5B',
       id: 'qwen2.5:0.5b',
-      tokens: 128_000,
     },
     {
+      contextWindowTokens: 128_000,
       description: 'Qwen2.5 是阿里巴巴的新一代大规模语言模型，以优异的性能支持多元化的应用需求。',
       displayName: 'Qwen2.5 1.5B',
       id: 'qwen2.5:1.5b',
-      tokens: 128_000,
     },
     {
+      contextWindowTokens: 128_000,
       description: 'Qwen2.5 是阿里巴巴的新一代大规模语言模型，以优异的性能支持多元化的应用需求。',
       displayName: 'Qwen2.5 7B',
       enabled: true,
       functionCall: true,
       id: 'qwen2.5',
-      tokens: 128_000,
     },
     {
+      contextWindowTokens: 128_000,
       description: 'Qwen2.5 是阿里巴巴的新一代大规模语言模型，以优异的性能支持多元化的应用需求。',
       displayName: 'Qwen2.5 72B',
       id: 'qwen2.5:72b',
-      tokens: 128_000,
     },
     {
+      contextWindowTokens: 128_000,
       description: 'Qwen2.5 是阿里巴巴的新一代大规模语言模型，以优异的性能支持多元化的应用需求。',
       displayName: 'Qwen2.5 7B',
       enabled: true,
       functionCall: true,
       id: 'qwen2.5',
-      tokens: 128_000,
     },
     {
+      contextWindowTokens: 65_536,
       description: 'CodeQwen1.5 是基于大量代码数据训练的大型语言模型，专为解决复杂编程任务。',
       displayName: 'CodeQwen1.5 7B',
       functionCall: true,
       id: 'codeqwen',
-      tokens: 65_536,
     },
     {
+      contextWindowTokens: 128_000,
       description: 'Qwen2 是阿里巴巴的新一代大规模语言模型，以优异的性能支持多元化的应用需求。',
       displayName: 'Qwen2 0.5B',
       functionCall: true,
       id: 'qwen2:0.5b',
-      tokens: 128_000,
     },
     {
+      contextWindowTokens: 128_000,
       description: 'Qwen2 是阿里巴巴的新一代大规模语言模型，以优异的性能支持多元化的应用需求。',
       displayName: 'Qwen2 1.5B',
       functionCall: true,
       id: 'qwen2:1.5b',
-      tokens: 128_000,
     },
     {
+      contextWindowTokens: 128_000,
       description: 'Qwen2 是阿里巴巴的新一代大规模语言模型，以优异的性能支持多元化的应用需求。',
       displayName: 'Qwen2 7B',
       functionCall: true,
       id: 'qwen2',
-      tokens: 128_000,
     },
     {
+      contextWindowTokens: 128_000,
       description: 'Qwen2 是阿里巴巴的新一代大规模语言模型，以优异的性能支持多元化的应用需求。',
       displayName: 'Qwen2 72B',
       functionCall: true,
       id: 'qwen2:72b',
-      tokens: 128_000,
     },
     {
+      contextWindowTokens: 8192,
       description: 'Gemma 2 是 Google 推出的高效模型，涵盖从小型应用到复杂数据处理的多种应用场景。',
       displayName: 'Gemma 2 2B',
       id: 'gemma2:2b',
-      tokens: 8192,
     },
     {
+      contextWindowTokens: 8192,
       description: 'Gemma 2 是 Google 推出的高效模型，涵盖从小型应用到复杂数据处理的多种应用场景。',
       displayName: 'Gemma 2 9B',
       id: 'gemma2',
-      tokens: 8192,
     },
     {
+      contextWindowTokens: 8192,
       description: 'Gemma 2 是 Google 推出的高效模型，涵盖从小型应用到复杂数据处理的多种应用场景。',
       displayName: 'Gemma 2 27B',
       id: 'gemma2:27b',
-      tokens: 8192,
     },
     {
+      contextWindowTokens: 8192,
       description: 'CodeGemma 专用于不同编程任务的轻量级语言模型，支持快速迭代和集成。',
       displayName: 'CodeGemma 2B',
       id: 'codegemma:2b',
-      tokens: 8192,
     },
     {
+      contextWindowTokens: 8192,
       description: 'CodeGemma 专用于不同编程任务的轻量级语言模型，支持快速迭代和集成。',
       displayName: 'CodeGemma 7B',
       id: 'codegemma',
-      tokens: 8192,
     },
     {
+      contextWindowTokens: 128_000,
       description: 'Phi-3 是微软推出的轻量级开放模型，适用于高效集成和大规模知识推理。',
       displayName: 'Phi-3 3.8B',
       enabled: true,
       id: 'phi3',
-      tokens: 128_000,
     },
     {
+      contextWindowTokens: 128_000,
       description: 'Phi-3 是微软推出的轻量级开放模型，适用于高效集成和大规模知识推理。',
       displayName: 'Phi-3 14B',
       id: 'phi3:14b',
-      tokens: 128_000,
     },
     {
+      contextWindowTokens: 32_768,
       description:
         'WizardLM 2 是微软AI提供的语言模型，在复杂对话、多语言、推理和智能助手领域表现尤为出色。',
       displayName: 'WizardLM 2 7B',
       enabled: true,
       id: 'wizardlm2',
-      tokens: 32_768,
     },
     {
+      contextWindowTokens: 65_536,
       description:
         'WizardLM 2 是微软AI提供的语言模型，在复杂对话、多语言、推理和智能助手领域表现尤为出色。',
       displayName: 'WizardLM 2 8x22B',
       id: 'wizardlm2:8x22b',
-      tokens: 65_536,
     },
     {
+      contextWindowTokens: 32_768,
       description: 'MathΣtral 专为科学研究和数学推理设计，提供有效的计算能力和结果解释。',
       displayName: 'MathΣtral 7B',
       enabled: true,
       id: 'mathstral',
-      tokens: 32_768,
     },
     {
+      contextWindowTokens: 32_768,
       description: 'Mistral 是 Mistral AI 发布的 7B 模型，适合多变的语言处理需求。',
       displayName: 'Mistral 7B',
       enabled: true,
       functionCall: true,
       id: 'mistral',
-      tokens: 32_768,
     },
     {
+      contextWindowTokens: 32_768,
       description:
         'Mixtral 是 Mistral AI 的专家模型，具有开源权重，并在代码生成和语言理解方面提供支持。',
       displayName: 'Mixtral 8x7B',
       enabled: true,
       functionCall: true,
       id: 'mixtral',
-      tokens: 32_768,
     },
     {
+      contextWindowTokens: 65_536,
       description:
         'Mixtral 是 Mistral AI 的专家模型，具有开源权重，并在代码生成和语言理解方面提供支持。',
       displayName: 'Mixtral 8x22B',
       functionCall: true,
       id: 'mixtral:8x22b',
-      tokens: 65_536,
     },
     {
+      contextWindowTokens: 128_000,
       description:
         'Mixtral Large 是 Mistral 的旗舰模型，结合代码生成、数学和推理的能力，支持 128k 上下文窗口。',
       displayName: 'Mixtral Large 123B',
       enabled: true,
       id: 'mistral-large',
-      tokens: 128_000,
     },
     {
+      contextWindowTokens: 128_000,
       description: 'Mistral Nemo 由 Mistral AI 和 NVIDIA 合作推出，是高效性能的 12B 模型。',
       displayName: 'Mixtral Nemo 12B',
       enabled: true,
       functionCall: true,
       id: 'mistral-nemo',
-      tokens: 128_000,
     },
     {
+      contextWindowTokens: 32_768,
       description: 'Codestral 是 Mistral AI 的首款代码模型，为代码生成任务提供优异支持。',
       displayName: 'Codestral 22B',
       enabled: true,
       id: 'codestral',
-      tokens: 32_768,
     },
     {
+      contextWindowTokens: 8192,
       description: 'Aya 23 是 Cohere 推出的多语言模型，支持 23 种语言，为多元化语言应用提供便利。',
       displayName: 'Aya 23 8B',
       enabled: true,
       id: 'aya',
-      tokens: 8192,
     },
     {
+      contextWindowTokens: 8192,
       description: 'Aya 23 是 Cohere 推出的多语言模型，支持 23 种语言，为多元化语言应用提供便利。',
       displayName: 'Aya 23 35B',
       id: 'aya:35b',
-      tokens: 8192,
     },
     {
+      contextWindowTokens: 131_072,
       description: 'Command R 是优化用于对话和长上下文任务的LLM，特别适合动态交互与知识管理。',
       displayName: 'Command R 35B',
       enabled: true,
       functionCall: true,
       id: 'command-r',
-      tokens: 131_072,
     },
     {
+      contextWindowTokens: 131_072,
       description: 'Command R+ 是一款高性能的大型语言模型，专为真实企业场景和复杂应用而设计。',
       displayName: 'Command R+ 104B',
       enabled: true,
       functionCall: true,
       id: 'command-r-plus',
-      tokens: 131_072,
     },
     {
+      contextWindowTokens: 32_768,
       description: 'DeepSeek V2 是高效的 Mixture-of-Experts 语言模型，适用于经济高效的处理需求。',
       displayName: 'DeepSeek V2 16B',
       enabled: true,
       id: 'deepseek-v2',
-      tokens: 32_768,
     },
     {
+      contextWindowTokens: 128_000,
       description: 'DeepSeek V2 236B 是 DeepSeek 的设计代码模型，提供强大的代码生成能力。',
       displayName: 'DeepSeek V2 236B',
       id: 'deepseek-v2:236b',
-      tokens: 128_000,
     },
     {
+      contextWindowTokens: 128_000,
       description:
         'DeepSeek Coder V2 是开源的混合专家代码模型，在代码任务方面表现优异，与 GPT4-Turbo 相媲美。',
       displayName: 'DeepSeek Coder V2 16B',
       enabled: true,
       id: 'deepseek-coder-v2',
-      tokens: 128_000,
     },
     {
+      contextWindowTokens: 128_000,
       description:
         'DeepSeek Coder V2 是开源的混合专家代码模型，在代码任务方面表现优异，与 GPT4-Turbo 相媲美。',
       displayName: 'DeepSeek Coder V2 236B',
       id: 'deepseek-coder-v2:236b',
-      tokens: 128_000,
     },
     {
+      contextWindowTokens: 4096,
       description: 'LLaVA 是结合视觉编码器和 Vicuna 的多模态模型，用于强大的视觉和语言理解。',
       displayName: 'LLaVA 7B',
       enabled: true,
       id: 'llava',
-      tokens: 4096,
       vision: true,
     },
     {
+      contextWindowTokens: 4096,
       description: 'LLaVA 是结合视觉编码器和 Vicuna 的多模态模型，用于强大的视觉和语言理解。',
       displayName: 'LLaVA 13B',
       id: 'llava:13b',
-      tokens: 4096,
       vision: true,
     },
     {
+      contextWindowTokens: 4096,
       description: 'LLaVA 是结合视觉编码器和 Vicuna 的多模态模型，用于强大的视觉和语言理解。',
       displayName: 'LLaVA 34B',
       id: 'llava:34b',
-      tokens: 4096,
       vision: true,
     },
     {
+      contextWindowTokens: 128_000,
       description:
         'MiniCPM-V 是 OpenBMB 推出的新一代多模态大模型，具备卓越的 OCR 识别和多模态理解能力，支持广泛的应用场景。',
       displayName: 'MiniCPM-V 8B',
       enabled: true,
       id: 'minicpm-v',
-      tokens: 128_000,
       vision: true,
     },
   ],

package/src/config/modelProviders/openai.ts CHANGED Viewed

@@ -4,6 +4,7 @@ import { ModelProviderCard } from '@/types/llm';
 const OpenAI: ModelProviderCard = {
   chatModels: [
     {
+      contextWindowTokens: 128_000,
       description:
         'o1-mini是一款针对编程、数学和科学应用场景而设计的快速、经济高效的推理模型。该模型具有128K上下文和2023年10月的知识截止日期。',
       displayName: 'OpenAI o1-mini',
@@ -15,9 +16,9 @@ const OpenAI: ModelProviderCard = {
         output: 12,
       },
       releasedAt: '2024-09-12',
-      tokens: 128_000,
     },
     {
+      contextWindowTokens: 128_000,
       description:
         'o1是OpenAI新的推理模型，适用于需要广泛通用知识的复杂任务。该模型具有128K上下文和2023年10月的知识截止日期。',
       displayName: 'OpenAI o1-preview',
@@ -29,9 +30,9 @@ const OpenAI: ModelProviderCard = {
         output: 60,
       },
       releasedAt: '2024-09-12',
-      tokens: 128_000,
     },
     {
+      contextWindowTokens: 128_000,
       description:
         'GPT-4o mini是OpenAI在GPT-4 Omni之后推出的最新模型，支持图文输入并输出文本。作为他们最先进的小型模型，它比其他近期的前沿模型便宜很多，并且比GPT-3.5 Turbo便宜超过60%。它保持了最先进的智能，同时具有显著的性价比。GPT-4o mini在MMLU测试中获得了 82% 的得分，目前在聊天偏好上排名高于 GPT-4。',
       displayName: 'GPT-4o mini',
@@ -43,10 +44,10 @@ const OpenAI: ModelProviderCard = {
         input: 0.15,
         output: 0.6,
       },
-      tokens: 128_000,
       vision: true,
     },
     {
+      contextWindowTokens: 128_000,
       description:
         'ChatGPT-4o 是一款动态模型，实时更新以保持当前最新版本。它结合了强大的语言理解与生成能力，适合于大规模应用场景，包括客户服务、教育和技术支持。',
       displayName: 'GPT-4o 1120',
@@ -58,10 +59,10 @@ const OpenAI: ModelProviderCard = {
         output: 10,
       },
       releasedAt: '2024-11-20',
-      tokens: 128_000,
       vision: true,
     },
     {
+      contextWindowTokens: 128_000,
       description:
         'ChatGPT-4o 是一款动态模型，实时更新以保持当前最新版本。它结合了强大的语言理解与生成能力，适合于大规模应用场景，包括客户服务、教育和技术支持。',
       displayName: 'GPT-4o',
@@ -72,10 +73,10 @@ const OpenAI: ModelProviderCard = {
         input: 2.5,
         output: 10,
       },
-      tokens: 128_000,
       vision: true,
     },
     {
+      contextWindowTokens: 128_000,
       description:
         'ChatGPT-4o 是一款动态模型，实时更新以保持当前最新版本。它结合了强大的语言理解与生成能力，适合于大规模应用场景，包括客户服务、教育和技术支持。',
       displayName: 'GPT-4o 0806',
@@ -86,10 +87,10 @@ const OpenAI: ModelProviderCard = {
         output: 10,
       },
       releasedAt: '2024-08-06',
-      tokens: 128_000,
       vision: true,
     },
     {
+      contextWindowTokens: 128_000,
       description:
         'ChatGPT-4o 是一款动态模型，实时更新以保持当前最新版本。它结合了强大的语言理解与生成能力，适合于大规模应用场景，包括客户服务、教育和技术支持。',
       displayName: 'GPT-4o 0513',
@@ -100,10 +101,10 @@ const OpenAI: ModelProviderCard = {
         output: 15,
       },
       releasedAt: '2024-05-13',
-      tokens: 128_000,
       vision: true,
     },
     {
+      contextWindowTokens: 128_000,
       description:
         'ChatGPT-4o 是一款动态模型，实时更新以保持当前最新版本。它结合了强大的语言理解与生成能力，适合于大规模应用场景，包括客户服务、教育和技术支持。',
       displayName: 'ChatGPT-4o',
@@ -113,10 +114,10 @@ const OpenAI: ModelProviderCard = {
         input: 5,
         output: 15,
       },
-      tokens: 128_000,
       vision: true,
     },
     {
+      contextWindowTokens: 128_000,
       description:
         '最新的 GPT-4 Turbo 模型具备视觉功能。现在，视觉请求可以使用 JSON 模式和函数调用。 GPT-4 Turbo 是一个增强版本，为多模态任务提供成本效益高的支持。它在准确性和效率之间找到平衡，适合需要进行实时交互的应用程序场景。',
       displayName: 'GPT-4 Turbo',
@@ -126,10 +127,10 @@ const OpenAI: ModelProviderCard = {
         input: 10,
         output: 30,
       },
-      tokens: 128_000,
       vision: true,
     },
     {
+      contextWindowTokens: 128_000,
       description:
         '最新的 GPT-4 Turbo 模型具备视觉功能。现在，视觉请求可以使用 JSON 模式和函数调用。 GPT-4 Turbo 是一个增强版本，为多模态任务提供成本效益高的支持。它在准确性和效率之间找到平衡，适合需要进行实时交互的应用程序场景。',
       displayName: 'GPT-4 Turbo Vision 0409',
@@ -139,10 +140,10 @@ const OpenAI: ModelProviderCard = {
         input: 10,
         output: 30,
       },
-      tokens: 128_000,
       vision: true,
     },
     {
+      contextWindowTokens: 128_000,
       description:
         '最新的 GPT-4 Turbo 模型具备视觉功能。现在，视觉请求可以使用 JSON 模式和函数调用。 GPT-4 Turbo 是一个增强版本，为多模态任务提供成本效益高的支持。它在准确性和效率之间找到平衡，适合需要进行实时交互的应用程序场景。',
       displayName: 'GPT-4 Turbo Preview',
@@ -152,9 +153,9 @@ const OpenAI: ModelProviderCard = {
         input: 10,
         output: 30,
       },
-      tokens: 128_000,
     },
     {
+      contextWindowTokens: 128_000,
       description:
         '最新的 GPT-4 Turbo 模型具备视觉功能。现在，视觉请求可以使用 JSON 模式和函数调用。 GPT-4 Turbo 是一个增强版本，为多模态任务提供成本效益高的支持。它在准确性和效率之间找到平衡，适合需要进行实时交互的应用程序场景。',
       displayName: 'GPT-4 Turbo Preview 0125',
@@ -164,9 +165,9 @@ const OpenAI: ModelProviderCard = {
         input: 10,
         output: 30,
       },
-      tokens: 128_000,
     },
     {
+      contextWindowTokens: 128_000,
       description:
         '最新的 GPT-4 Turbo 模型具备视觉功能。现在，视觉请求可以使用 JSON 模式和函数调用。 GPT-4 Turbo 是一个增强版本，为多模态任务提供成本效益高的支持。它在准确性和效率之间找到平衡，适合需要进行实时交互的应用程序场景。',
       displayName: 'GPT-4 Turbo Preview 1106',
@@ -176,9 +177,9 @@ const OpenAI: ModelProviderCard = {
         input: 10,
         output: 30,
       },
-      tokens: 128_000,
     },
     {
+      contextWindowTokens: 8192,
       description:
         'GPT-4 提供了一个更大的上下文窗口，能够处理更长的文本输入，适用于需要广泛信息整合和数据分析的场景。',
       displayName: 'GPT-4',
@@ -188,9 +189,9 @@ const OpenAI: ModelProviderCard = {
         input: 30,
         output: 60,
       },
-      tokens: 8192,
     },
     {
+      contextWindowTokens: 8192,
       description:
         'GPT-4 提供了一个更大的上下文窗口，能够处理更长的文本输入，适用于需要广泛信息整合和数据分析的场景。',
       displayName: 'GPT-4 0613',
@@ -200,11 +201,12 @@ const OpenAI: ModelProviderCard = {
         input: 30,
         output: 60,
       },
-      tokens: 8192,
     },
     {
+      contextWindowTokens: 32_768,
       description:
-        'GPT-4 提供了一个更大的上下文窗口，能够处理更长的文本输入，适用于需要广泛信息整合和数据分析的场景。', // Will be discontinued on June 6, 2025
+        'GPT-4 提供了一个更大的上下文窗口，能够处理更长的文本输入，适用于需要广泛信息整合和数据分析的场景。',
+      // Will be discontinued on June 6, 2025
       displayName: 'GPT-4 32K',
       functionCall: true,
       id: 'gpt-4-32k',
@@ -212,9 +214,9 @@ const OpenAI: ModelProviderCard = {
         input: 60,
         output: 120,
       },
-      tokens: 32_768,
     },
     {
+      contextWindowTokens: 32_768,
       // Will be discontinued on June 6, 2025
       description:
         'GPT-4 提供了一个更大的上下文窗口，能够处理更长的文本输入，适用于需要广泛信息整合和数据分析的场景。',
@@ -225,9 +227,9 @@ const OpenAI: ModelProviderCard = {
         input: 60,
         output: 120,
       },
-      tokens: 32_768,
     },
     {
+      contextWindowTokens: 16_385,
       description:
         'GPT 3.5 Turbo，适用于各种文本生成和理解任务，Currently points to gpt-3.5-turbo-0125',
       displayName: 'GPT-3.5 Turbo',
@@ -237,9 +239,9 @@ const OpenAI: ModelProviderCard = {
         input: 0.5,
         output: 1.5,
       },
-      tokens: 16_385,
     },
     {
+      contextWindowTokens: 16_385,
       description:
         'GPT 3.5 Turbo，适用于各种文本生成和理解任务，Currently points to gpt-3.5-turbo-0125',
       displayName: 'GPT-3.5 Turbo 0125',
@@ -249,9 +251,9 @@ const OpenAI: ModelProviderCard = {
         input: 0.5,
         output: 1.5,
       },
-      tokens: 16_385,
     },
     {
+      contextWindowTokens: 16_385,
       description:
         'GPT 3.5 Turbo，适用于各种文本生成和理解任务，Currently points to gpt-3.5-turbo-0125',
       displayName: 'GPT-3.5 Turbo 1106',
@@ -261,9 +263,9 @@ const OpenAI: ModelProviderCard = {
         input: 1,
         output: 2,
       },
-      tokens: 16_385,
     },
     {
+      contextWindowTokens: 4096,
       description:
         'GPT 3.5 Turbo，适用于各种文本生成和理解任务，Currently points to gpt-3.5-turbo-0125',
       displayName: 'GPT-3.5 Turbo Instruct',
@@ -272,7 +274,6 @@ const OpenAI: ModelProviderCard = {
         input: 1.5,
         output: 2,
       },
-      tokens: 4096,
     },
   ],
   checkModel: 'gpt-4o-mini',