npm - @lobehub/chat - Versions diffs - 1.88.19 → 1.88.21 - Mend

@lobehub/chat 1.88.19 → 1.88.21

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (82) hide show

package/.i18nrc.js +1 -1
package/CHANGELOG.md +51 -0
package/changelog/v1.json +18 -0
package/locales/ar/chat.json +3 -0
package/locales/ar/models.json +92 -17
package/locales/ar/setting.json +0 -12
package/locales/bg-BG/chat.json +3 -0
package/locales/bg-BG/models.json +92 -17
package/locales/bg-BG/setting.json +0 -12
package/locales/de-DE/chat.json +3 -0
package/locales/de-DE/models.json +92 -17
package/locales/de-DE/setting.json +0 -12
package/locales/en-US/chat.json +3 -0
package/locales/en-US/models.json +92 -17
package/locales/en-US/setting.json +0 -12
package/locales/es-ES/chat.json +3 -0
package/locales/es-ES/models.json +92 -17
package/locales/es-ES/setting.json +0 -12
package/locales/fa-IR/chat.json +3 -0
package/locales/fa-IR/models.json +92 -17
package/locales/fa-IR/setting.json +0 -12
package/locales/fr-FR/chat.json +3 -0
package/locales/fr-FR/models.json +92 -17
package/locales/fr-FR/setting.json +0 -12
package/locales/it-IT/chat.json +3 -0
package/locales/it-IT/models.json +92 -17
package/locales/it-IT/setting.json +0 -12
package/locales/ja-JP/chat.json +3 -0
package/locales/ja-JP/models.json +92 -17
package/locales/ja-JP/setting.json +0 -12
package/locales/ko-KR/chat.json +3 -0
package/locales/ko-KR/models.json +92 -17
package/locales/ko-KR/setting.json +0 -12
package/locales/nl-NL/chat.json +3 -0
package/locales/nl-NL/models.json +92 -17
package/locales/nl-NL/setting.json +0 -12
package/locales/pl-PL/chat.json +3 -0
package/locales/pl-PL/models.json +92 -17
package/locales/pl-PL/setting.json +0 -12
package/locales/pt-BR/chat.json +3 -0
package/locales/pt-BR/models.json +92 -17
package/locales/pt-BR/setting.json +0 -12
package/locales/ru-RU/chat.json +3 -0
package/locales/ru-RU/models.json +92 -17
package/locales/ru-RU/setting.json +0 -12
package/locales/tr-TR/chat.json +3 -0
package/locales/tr-TR/models.json +92 -17
package/locales/tr-TR/setting.json +0 -12
package/locales/vi-VN/chat.json +3 -0
package/locales/vi-VN/models.json +92 -17
package/locales/vi-VN/setting.json +0 -12
package/locales/zh-CN/chat.json +3 -0
package/locales/zh-CN/models.json +89 -14
package/locales/zh-CN/setting.json +0 -12
package/locales/zh-TW/chat.json +3 -0
package/locales/zh-TW/models.json +92 -17
package/locales/zh-TW/setting.json +0 -12
package/package.json +1 -1
package/src/app/[variants]/(main)/settings/common/features/Appearance/ThemeSwatches/ThemeSwatchesNeutral.tsx +4 -2
package/src/app/[variants]/(main)/settings/common/features/Appearance/ThemeSwatches/ThemeSwatchesPrimary.tsx +4 -2
package/src/config/aiModels/deepseek.ts +5 -3
package/src/config/aiModels/groq.ts +16 -29
package/src/config/aiModels/hunyuan.ts +104 -82
package/src/config/aiModels/novita.ts +27 -121
package/src/config/aiModels/openai.ts +19 -2
package/src/config/aiModels/openrouter.ts +59 -47
package/src/config/aiModels/siliconcloud.ts +73 -39
package/src/config/aiModels/volcengine.ts +3 -3
package/src/config/aiModels/xai.ts +2 -0
package/src/features/AgentSetting/AgentMeta/index.tsx +5 -0
package/src/features/AgentSetting/AgentModal/index.tsx +1 -26
package/src/features/ChatInput/ActionBar/Model/ControlsForm.tsx +12 -0
package/src/features/ChatInput/ActionBar/Model/ReasoningEffortSlider.tsx +57 -0
package/src/features/ModelSwitchPanel/index.tsx +10 -9
package/src/features/PluginDevModal/MCPManifestForm/index.tsx +3 -1
package/src/libs/model-runtime/novita/__snapshots__/index.test.ts.snap +1 -1
package/src/locales/default/chat.ts +3 -0
package/src/locales/default/setting.ts +0 -12
package/src/services/chat.ts +5 -1
package/src/store/chat/slices/aiChat/actions/generateAIChat.ts +0 -5
package/src/types/agent/chatConfig.ts +1 -0
package/src/types/aiModel.ts +5 -1

package/locales/de-DE/models.json CHANGED Viewed

@@ -341,9 +341,6 @@
   "Qwen2.5-Coder-32B-Instruct": {
     "description": "Qwen2.5-Coder-32B-Instruct ist ein großes Sprachmodell, das speziell für die Codegenerierung, das Verständnis von Code und effiziente Entwicklungsszenarien entwickelt wurde. Es verwendet eine branchenführende Parametergröße von 32B und kann vielfältige Programmieranforderungen erfüllen."
   },
-  "SenseCat-5-1202": {
-    "description": "Basierend auf der neuesten Version V5.5, zeigt es im Vergleich zur vorherigen Version signifikante Verbesserungen in den grundlegenden Fähigkeiten in Chinesisch und Englisch, im Chat, in naturwissenschaftlichem Wissen, in geisteswissenschaftlichem Wissen, im Schreiben, in mathematischer Logik und in der Wortanzahlkontrolle."
-  },
   "SenseChat": {
     "description": "Basisversion des Modells (V4) mit 4K Kontextlänge, die über starke allgemeine Fähigkeiten verfügt."
   },
@@ -356,6 +353,9 @@
   "SenseChat-5": {
     "description": "Die neueste Modellversion (V5.5) mit 128K Kontextlänge hat signifikante Verbesserungen in den Bereichen mathematische Schlussfolgerungen, englische Konversation, Befolgen von Anweisungen und Verständnis langer Texte, vergleichbar mit GPT-4o."
   },
+  "SenseChat-5-1202": {
+    "description": "Basierend auf der neuesten Version V5.5 zeigt es im Vergleich zur Vorgängerversion deutliche Verbesserungen in den Bereichen Grundfähigkeiten in Chinesisch und Englisch, Chat, naturwissenschaftliches Wissen, geisteswissenschaftliches Wissen, Schreiben, mathematische Logik und Wortzahlkontrolle."
+  },
   "SenseChat-5-Cantonese": {
     "description": "Mit 32K Kontextlänge übertrifft es GPT-4 im Verständnis von Konversationen auf Kantonesisch und kann in mehreren Bereichen wie Wissen, Schlussfolgerungen, Mathematik und Programmierung mit GPT-4 Turbo konkurrieren."
   },
@@ -515,6 +515,12 @@
   "ai21-jamba-1.5-mini": {
     "description": "Ein mehrsprachiges Modell mit 52 Milliarden Parametern (12 Milliarden aktiv), das ein 256K langes Kontextfenster, Funktionsaufrufe, strukturierte Ausgaben und fundierte Generierung bietet."
   },
+  "ai21-labs/AI21-Jamba-1.5-Large": {
+    "description": "Ein mehrsprachiges Modell mit 398 Milliarden Parametern (davon 94 Milliarden aktiv), das ein 256K langes Kontextfenster, Funktionsaufrufe, strukturierte Ausgaben und faktengestützte Generierung bietet."
+  },
+  "ai21-labs/AI21-Jamba-1.5-Mini": {
+    "description": "Ein mehrsprachiges Modell mit 52 Milliarden Parametern (davon 12 Milliarden aktiv), das ein 256K langes Kontextfenster, Funktionsaufrufe, strukturierte Ausgaben und faktengestützte Generierung bietet."
+  },
   "anthropic.claude-3-5-sonnet-20240620-v1:0": {
     "description": "Claude 3.5 Sonnet hebt den Branchenstandard an, übertrifft die Konkurrenzmodelle und Claude 3 Opus und zeigt in umfassenden Bewertungen hervorragende Leistungen, während es die Geschwindigkeit und Kosten unserer mittleren Modelle beibehält."
   },
@@ -668,6 +674,12 @@
   "cohere-command-r-plus": {
     "description": "Command R+ ist ein hochmodernes, RAG-optimiertes Modell, das für unternehmensgerechte Arbeitslasten konzipiert ist."
   },
+  "cohere/Cohere-command-r": {
+    "description": "Command R ist ein skalierbares Generierungsmodell, das für RAG und Tool-Nutzung entwickelt wurde, um Unternehmen produktionsreife KI zu ermöglichen."
+  },
+  "cohere/Cohere-command-r-plus": {
+    "description": "Command R+ ist ein hochmodernes, für RAG optimiertes Modell, das für unternehmensweite Arbeitslasten ausgelegt ist."
+  },
   "command": {
     "description": "Ein dialogbasiertes Modell, das Anweisungen folgt und in sprachlichen Aufgaben hohe Qualität und Zuverlässigkeit bietet. Im Vergleich zu unserem grundlegenden Generierungsmodell hat es eine längere Kontextlänge."
   },
@@ -1028,6 +1040,12 @@
   "gemini-2.5-flash-preview-04-17": {
     "description": "Gemini 2.5 Flash Preview ist das kosteneffizienteste Modell von Google und bietet umfassende Funktionen."
   },
+  "gemini-2.5-flash-preview-04-17-thinking": {
+    "description": "Gemini 2.5 Flash Preview ist Googles kosteneffizientestes Modell mit umfassenden Funktionen."
+  },
+  "gemini-2.5-flash-preview-05-20": {
+    "description": "Gemini 2.5 Flash Preview ist Googles kosteneffizientestes Modell mit umfassenden Funktionen."
+  },
   "gemini-2.5-pro-exp-03-25": {
     "description": "Gemini 2.5 Pro Experimental ist Googles fortschrittlichstes Denkmodell, das in der Lage ist, komplexe Probleme in den Bereichen Code, Mathematik und STEM zu analysieren. Es kann auch lange Kontexte nutzen, um große Datensätze, Codebasen und Dokumente zu analysieren."
   },
@@ -1262,23 +1280,17 @@
   "grok-2-vision-1212": {
     "description": "Dieses Modell hat Verbesserungen in Bezug auf Genauigkeit, Befolgung von Anweisungen und Mehrsprachigkeit erfahren."
   },
-  "grok-3-beta": {
-    "description": "Flaggschiff-Modell, das sich auf Datenextraktion, Programmierung und Textzusammenfassungen für Unternehmensanwendungen spezialisiert hat und über umfassendes Wissen in den Bereichen Finanzen, Gesundheitswesen, Recht und Wissenschaft verfügt."
-  },
-  "grok-3-fast-beta": {
-    "description": "Flaggschiff-Modell, das sich auf Datenextraktion, Programmierung und Textzusammenfassungen für Unternehmensanwendungen spezialisiert hat und über umfassendes Wissen in den Bereichen Finanzen, Gesundheitswesen, Recht und Wissenschaft verfügt."
+  "grok-3": {
+    "description": "Ein Flaggschiffmodell, spezialisiert auf Datenextraktion, Programmierung und Textzusammenfassung für Unternehmensanwendungen, mit tiefgreifendem Wissen in den Bereichen Finanzen, Medizin, Recht und Wissenschaft."
   },
-  "grok-3-mini-beta": {
-    "description": "Leichtgewichtiges Modell, das vor dem Gespräch nachdenkt. Es läuft schnell und intelligent und eignet sich für logische Aufgaben, die kein tiefes Fachwissen erfordern, und kann die ursprünglichen Denkprozesse erfassen."
+  "grok-3-fast": {
+    "description": "Ein Flaggschiffmodell, spezialisiert auf Datenextraktion, Programmierung und Textzusammenfassung für Unternehmensanwendungen, mit tiefgreifendem Wissen in den Bereichen Finanzen, Medizin, Recht und Wissenschaft."
   },
-  "grok-3-mini-fast-beta": {
-    "description": "Leichtgewichtiges Modell, das vor dem Gespräch nachdenkt. Es läuft schnell und intelligent und eignet sich für logische Aufgaben, die kein tiefes Fachwissen erfordern, und kann die ursprünglichen Denkprozesse erfassen."
+  "grok-3-mini": {
+    "description": "Ein leichtgewichtiges Modell, das vor der Antwort nachdenkt. Es arbeitet schnell und intelligent, eignet sich für logische Aufgaben ohne tiefgehendes Fachwissen und ermöglicht die Nachverfolgung des ursprünglichen Denkprozesses."
   },
-  "grok-beta": {
-    "description": "Bietet eine Leistung, die mit Grok 2 vergleichbar ist, jedoch mit höherer Effizienz, Geschwindigkeit und Funktionalität."
-  },
-  "grok-vision-beta": {
-    "description": "Das neueste Modell zur Bildverständnis, das eine Vielzahl von visuellen Informationen verarbeiten kann, einschließlich Dokumenten, Diagrammen, Screenshots und Fotos."
+  "grok-3-mini-fast": {
+    "description": "Ein leichtgewichtiges Modell, das vor der Antwort nachdenkt. Es arbeitet schnell und intelligent, eignet sich für logische Aufgaben ohne tiefgehendes Fachwissen und ermöglicht die Nachverfolgung des ursprünglichen Denkprozesses."
   },
   "gryphe/mythomax-l2-13b": {
     "description": "MythoMax l2 13B ist ein Sprachmodell, das Kreativität und Intelligenz kombiniert und mehrere führende Modelle integriert."
@@ -1322,6 +1334,9 @@
   "hunyuan-t1-latest": {
     "description": "Das erste ultra-skalierbare Hybrid-Transformer-Mamba-Inferenzmodell der Branche, das die Inferenzfähigkeiten erweitert, eine extrem hohe Dekodierungsgeschwindigkeit bietet und weiter auf menschliche Präferenzen abgestimmt ist."
   },
+  "hunyuan-t1-vision": {
+    "description": "Hunyuan ist ein multimodales Verständnis- und Tiefdenkmodell, das native multimodale lange Denkprozesse unterstützt. Es ist spezialisiert auf verschiedene Bildinferenzszenarien und zeigt im Vergleich zu Schnelldenkmodellen umfassende Verbesserungen bei naturwissenschaftlichen Problemen."
+  },
   "hunyuan-translation": {
     "description": "Unterstützt die Übersetzung zwischen Chinesisch und Englisch, Japanisch, Französisch, Portugiesisch, Spanisch, Türkisch, Russisch, Arabisch, Koreanisch, Italienisch, Deutsch, Vietnamesisch, Malaiisch und Indonesisch in 15 Sprachen. Basierend auf einem automatisierten Bewertungs-Framework COMET, das auf mehrsprachigen Übersetzungsbewertungsszenarien basiert, übertrifft es insgesamt die Übersetzungsfähigkeiten anderer Modelle ähnlicher Größe auf dem Markt."
   },
@@ -1586,6 +1601,30 @@
   "meta.llama3-8b-instruct-v1:0": {
     "description": "Meta Llama 3 ist ein offenes großes Sprachmodell (LLM), das sich an Entwickler, Forscher und Unternehmen richtet und ihnen hilft, ihre Ideen für generative KI zu entwickeln, zu experimentieren und verantwortungsbewusst zu skalieren. Als Teil eines globalen Innovationssystems ist es besonders geeignet für Umgebungen mit begrenzter Rechenleistung und Ressourcen, für Edge-Geräte und schnellere Trainingszeiten."
   },
+  "meta/Llama-3.2-11B-Vision-Instruct": {
+    "description": "Exzellente Bildinferenzfähigkeiten bei hochauflösenden Bildern, ideal für Anwendungen im Bereich visuelles Verständnis."
+  },
+  "meta/Llama-3.2-90B-Vision-Instruct": {
+    "description": "Fortschrittliche Bildinferenzfähigkeiten für visuelle Verständnisagenten."
+  },
+  "meta/Llama-3.3-70B-Instruct": {
+    "description": "Llama 3.3 ist das fortschrittlichste mehrsprachige Open-Source-Großsprachmodell der Llama-Reihe, das Leistung vergleichbar mit einem 405B-Modell zu sehr niedrigen Kosten bietet. Basierend auf der Transformer-Architektur, verbessert durch überwachtes Feintuning (SFT) und verstärkendes Lernen mit menschlichem Feedback (RLHF) für Nützlichkeit und Sicherheit. Die instruktionsoptimierte Version ist für mehrsprachige Dialoge optimiert und übertrifft viele offene und geschlossene Chatmodelle in verschiedenen Branchenbenchmarks. Wissensstand: Dezember 2023."
+  },
+  "meta/Meta-Llama-3-70B-Instruct": {
+    "description": "Ein leistungsstarkes Modell mit 70 Milliarden Parametern, das hervorragende Leistungen bei Inferenz, Codierung und vielfältigen Sprachaufgaben zeigt."
+  },
+  "meta/Meta-Llama-3-8B-Instruct": {
+    "description": "Ein vielseitiges Modell mit 8 Milliarden Parametern, optimiert für Dialog- und Textgenerierungsaufgaben."
+  },
+  "meta/Meta-Llama-3.1-405B-Instruct": {
+    "description": "Llama 3.1 ist ein instruktionsoptimiertes Textmodell, das für mehrsprachige Dialoganwendungen optimiert wurde und in vielen verfügbaren offenen und geschlossenen Chatmodellen bei gängigen Branchenbenchmarks hervorragende Leistungen zeigt."
+  },
+  "meta/Meta-Llama-3.1-70B-Instruct": {
+    "description": "Llama 3.1 ist ein instruktionsoptimiertes Textmodell, das für mehrsprachige Dialoganwendungen optimiert wurde und in vielen verfügbaren offenen und geschlossenen Chatmodellen bei gängigen Branchenbenchmarks hervorragende Leistungen zeigt."
+  },
+  "meta/Meta-Llama-3.1-8B-Instruct": {
+    "description": "Llama 3.1 ist ein instruktionsoptimiertes Textmodell, das für mehrsprachige Dialoganwendungen optimiert wurde und in vielen verfügbaren offenen und geschlossenen Chatmodellen bei gängigen Branchenbenchmarks hervorragende Leistungen zeigt."
+  },
   "meta/llama-3.1-405b-instruct": {
     "description": "Fortgeschrittenes LLM, das die Generierung synthetischer Daten, Wissensverdichtung und Schlussfolgerungen unterstützt, geeignet für Chatbots, Programmierung und spezifische Aufgaben."
   },
@@ -1610,6 +1649,30 @@
   "meta/llama-3.3-70b-instruct": {
     "description": "Fortschrittliches LLM, das auf Schlussfolgern, Mathematik, Allgemeinwissen und Funktionsaufrufen spezialisiert ist."
   },
+  "microsoft/Phi-3-medium-128k-instruct": {
+    "description": "Dasselbe Phi-3-medium-Modell, jedoch mit größerem Kontextfenster, geeignet für RAG oder wenige Eingabeaufforderungen."
+  },
+  "microsoft/Phi-3-medium-4k-instruct": {
+    "description": "Ein Modell mit 14 Milliarden Parametern, das qualitativ besser als Phi-3-mini ist und sich auf hochwertige, inferenzintensive Daten konzentriert."
+  },
+  "microsoft/Phi-3-mini-128k-instruct": {
+    "description": "Dasselbe Phi-3-mini-Modell, jedoch mit größerem Kontextfenster, geeignet für RAG oder wenige Eingabeaufforderungen."
+  },
+  "microsoft/Phi-3-mini-4k-instruct": {
+    "description": "Das kleinste Mitglied der Phi-3-Familie, optimiert für Qualität und geringe Latenz."
+  },
+  "microsoft/Phi-3-small-128k-instruct": {
+    "description": "Dasselbe Phi-3-small-Modell, jedoch mit größerem Kontextfenster, geeignet für RAG oder wenige Eingabeaufforderungen."
+  },
+  "microsoft/Phi-3-small-8k-instruct": {
+    "description": "Ein Modell mit 7 Milliarden Parametern, das qualitativ besser als Phi-3-mini ist und sich auf hochwertige, inferenzintensive Daten konzentriert."
+  },
+  "microsoft/Phi-3.5-mini-instruct": {
+    "description": "Aktualisierte Version des Phi-3-mini-Modells."
+  },
+  "microsoft/Phi-3.5-vision-instruct": {
+    "description": "Aktualisierte Version des Phi-3-vision-Modells."
+  },
   "microsoft/WizardLM-2-8x22B": {
     "description": "WizardLM 2 ist ein Sprachmodell von Microsoft AI, das in komplexen Dialogen, Mehrsprachigkeit, Inferenz und intelligenten Assistenten besonders gut abschneidet."
   },
@@ -1628,6 +1691,15 @@
   "mistral": {
     "description": "Mistral ist ein 7B-Modell von Mistral AI, das sich für vielfältige Anforderungen an die Sprachverarbeitung eignet."
   },
+  "mistral-ai/Mistral-Large-2411": {
+    "description": "Das Flaggschiffmodell von Mistral, geeignet für komplexe Aufgaben mit großem Inferenzbedarf oder hoher Spezialisierung (Textgenerierung, Codegenerierung, RAG oder Agenten)."
+  },
+  "mistral-ai/Mistral-Nemo": {
+    "description": "Mistral Nemo ist ein hochmodernes Sprachmodell (LLM) mit führenden Fähigkeiten in seiner Größenklasse für Inferenz, Weltwissen und Codierung."
+  },
+  "mistral-ai/mistral-small-2503": {
+    "description": "Mistral Small eignet sich für alle sprachbasierten Aufgaben, die hohe Effizienz und geringe Latenz erfordern."
+  },
   "mistral-large": {
     "description": "Mixtral Large ist das Flaggschiff-Modell von Mistral, das die Fähigkeiten zur Codegenerierung, Mathematik und Schlussfolgerungen kombiniert und ein Kontextfenster von 128k unterstützt."
   },
@@ -1769,6 +1841,9 @@
   "openai/gpt-4o-mini": {
     "description": "GPT-4o mini ist das neueste Modell von OpenAI, das nach GPT-4 Omni veröffentlicht wurde und Text- und Bild-Eingaben unterstützt. Als ihr fortschrittlichstes kleines Modell ist es viel günstiger als andere neueste Modelle und über 60 % günstiger als GPT-3.5 Turbo. Es behält die fortschrittlichste Intelligenz bei und bietet gleichzeitig ein hervorragendes Preis-Leistungs-Verhältnis. GPT-4o mini erzielte 82 % im MMLU-Test und rangiert derzeit in den Chat-Präferenzen über GPT-4."
   },
+  "openai/o1": {
+    "description": "o1 ist OpenAIs neues Inferenzmodell, das Bild- und Texteingaben unterstützt und Text ausgibt. Es eignet sich für komplexe Aufgaben, die umfangreiches Allgemeinwissen erfordern. Das Modell verfügt über einen Kontext von 200K und einen Wissensstand bis Oktober 2023."
+  },
   "openai/o1-mini": {
     "description": "o1-mini ist ein schnelles und kosteneffizientes Inferenzmodell, das für Programmier-, Mathematik- und Wissenschaftsanwendungen entwickelt wurde. Das Modell hat einen Kontext von 128K und einen Wissensstand bis Oktober 2023."
   },

package/locales/de-DE/setting.json CHANGED Viewed

@@ -259,9 +259,6 @@
     "enableMaxTokens": {
       "title": "Maximale Token pro Antwort aktivieren"
     },
-    "enableReasoningEffort": {
-      "title": "Aktivieren Sie die Anpassung der Schlussfolgerungsintensität"
-    },
     "frequencyPenalty": {
       "desc": "Je höher der Wert, desto vielfältiger und abwechslungsreicher die Wortwahl; je niedriger der Wert, desto einfacher und schlichter die Wortwahl",
       "title": "Wortvielfalt"
@@ -281,15 +278,6 @@
       "desc": "Je höher der Wert, desto eher werden unterschiedliche Ausdrucksweisen bevorzugt, um Wiederholungen zu vermeiden; je niedriger der Wert, desto eher werden wiederholte Konzepte oder Erzählungen verwendet, was zu einer konsistenteren Ausdrucksweise führt",
       "title": "Ausdrucksvielfalt"
     },
-    "reasoningEffort": {
-      "desc": "Je höher der Wert, desto stärker die Schlussfolgerungsfähigkeit, aber dies kann die Antwortzeit und den Tokenverbrauch erhöhen.",
-      "options": {
-        "high": "Hoch",
-        "low": "Niedrig",
-        "medium": "Mittel"
-      },
-      "title": "Schlussfolgerungsintensität"
-    },
     "submit": "Modell-Einstellungen aktualisieren",
     "temperature": {
       "desc": "Je höher der Wert, desto kreativer und einfallsreicher die Antworten; je niedriger der Wert, desto strenger die Antworten",

package/locales/en-US/chat.json CHANGED Viewed

@@ -43,6 +43,9 @@
     "reasoningBudgetToken": {
       "title": "Thinking Consumption Token"
     },
+    "reasoningEffort": {
+      "title": "Reasoning Intensity"
+    },
     "title": "Model Extension Features"
   },
   "history": {

package/locales/en-US/models.json CHANGED Viewed

@@ -341,9 +341,6 @@
   "Qwen2.5-Coder-32B-Instruct": {
     "description": "Qwen2.5-Coder-32B-Instruct is a large language model specifically designed for code generation, code understanding, and efficient development scenarios, featuring an industry-leading 32 billion parameters to meet diverse programming needs."
   },
-  "SenseCat-5-1202": {
-    "description": "Based on the latest version V5.5, it shows significant improvements over the previous version in several dimensions, including basic capabilities in Chinese and English, conversation, scientific knowledge, humanities knowledge, writing, mathematical logic, and word count control."
-  },
   "SenseChat": {
     "description": "Basic version model (V4) with a context length of 4K, featuring strong general capabilities."
   },
@@ -356,6 +353,9 @@
   "SenseChat-5": {
     "description": "The latest version model (V5.5) with a context length of 128K shows significant improvements in mathematical reasoning, English conversation, instruction following, and long text comprehension, comparable to GPT-4o."
   },
+  "SenseChat-5-1202": {
+    "description": "Based on version V5.5, this latest release shows significant improvements over the previous version in foundational Chinese and English capabilities, chat, science knowledge, humanities knowledge, writing, mathematical logic, and word count control."
+  },
   "SenseChat-5-Cantonese": {
     "description": "With a context length of 32K, it surpasses GPT-4 in Cantonese conversation comprehension and is competitive with GPT-4 Turbo in knowledge, reasoning, mathematics, and code writing across multiple domains."
   },
@@ -515,6 +515,12 @@
   "ai21-jamba-1.5-mini": {
     "description": "A 52B parameter (12B active) multilingual model, offering a 256K long context window, function calling, structured output, and grounded generation."
   },
+  "ai21-labs/AI21-Jamba-1.5-Large": {
+    "description": "A 398B parameter (94B active) multilingual model providing a 256K long context window, function calling, structured output, and fact-based generation."
+  },
+  "ai21-labs/AI21-Jamba-1.5-Mini": {
+    "description": "A 52B parameter (12B active) multilingual model offering a 256K long context window, function calling, structured output, and fact-based generation."
+  },
   "anthropic.claude-3-5-sonnet-20240620-v1:0": {
     "description": "Claude 3.5 Sonnet raises the industry standard, outperforming competitor models and Claude 3 Opus, excelling in a wide range of evaluations while maintaining the speed and cost of our mid-tier models."
   },
@@ -668,6 +674,12 @@
   "cohere-command-r-plus": {
     "description": "Command R+ is a state-of-the-art RAG-optimized model designed to tackle enterprise-grade workloads."
   },
+  "cohere/Cohere-command-r": {
+    "description": "Command R is a scalable generative model designed for RAG and tool usage, enabling enterprises to achieve production-grade AI."
+  },
+  "cohere/Cohere-command-r-plus": {
+    "description": "Command R+ is a state-of-the-art RAG-optimized model designed to handle enterprise-level workloads."
+  },
   "command": {
     "description": "An instruction-following dialogue model that delivers high quality and reliability in language tasks, with a longer context length compared to our base generation models."
   },
@@ -1028,6 +1040,12 @@
   "gemini-2.5-flash-preview-04-17": {
     "description": "Gemini 2.5 Flash Preview is Google's most cost-effective model, offering a comprehensive set of features."
   },
+  "gemini-2.5-flash-preview-04-17-thinking": {
+    "description": "Gemini 2.5 Flash Preview is Google's most cost-effective model, offering comprehensive capabilities."
+  },
+  "gemini-2.5-flash-preview-05-20": {
+    "description": "Gemini 2.5 Flash Preview is Google's most cost-effective model, offering comprehensive capabilities."
+  },
   "gemini-2.5-pro-exp-03-25": {
     "description": "Gemini 2.5 Pro Experimental is Google's most advanced thinking model, capable of reasoning about complex problems in code, mathematics, and STEM fields, as well as analyzing large datasets, codebases, and documents using long context."
   },
@@ -1262,23 +1280,17 @@
   "grok-2-vision-1212": {
     "description": "This model has improved in accuracy, instruction adherence, and multilingual capabilities."
   },
-  "grok-3-beta": {
-    "description": "A flagship model, proficient in data extraction, programming, and text summarization for enterprise applications, with deep knowledge in fields such as finance, healthcare, law, and science."
-  },
-  "grok-3-fast-beta": {
-    "description": "A flagship model, proficient in data extraction, programming, and text summarization for enterprise applications, with deep knowledge in fields such as finance, healthcare, law, and science."
+  "grok-3": {
+    "description": "A flagship model skilled in data extraction, programming, and text summarization for enterprise applications, with deep knowledge in finance, healthcare, law, and science."
   },
-  "grok-3-mini-beta": {
-    "description": "A lightweight model that thinks before responding. It operates quickly and intelligently, suitable for logical tasks that do not require deep domain knowledge, while capturing the raw thought process."
+  "grok-3-fast": {
+    "description": "A flagship model skilled in data extraction, programming, and text summarization for enterprise applications, with deep knowledge in finance, healthcare, law, and science."
   },
-  "grok-3-mini-fast-beta": {
-    "description": "A lightweight model that thinks before responding. It operates quickly and intelligently, suitable for logical tasks that do not require deep domain knowledge, while capturing the raw thought process."
+  "grok-3-mini": {
+    "description": "A lightweight model that thinks before responding. It runs fast and intelligently, suitable for logical tasks that do not require deep domain knowledge, and can provide raw thought trajectories."
   },
-  "grok-beta": {
-    "description": "Offers performance comparable to Grok 2 but with higher efficiency, speed, and functionality."
-  },
-  "grok-vision-beta": {
-    "description": "The latest image understanding model that can handle a wide range of visual information, including documents, charts, screenshots, and photographs."
+  "grok-3-mini-fast": {
+    "description": "A lightweight model that thinks before responding. It runs fast and intelligently, suitable for logical tasks that do not require deep domain knowledge, and can provide raw thought trajectories."
   },
   "gryphe/mythomax-l2-13b": {
     "description": "MythoMax l2 13B is a language model that combines creativity and intelligence by merging multiple top models."
@@ -1322,6 +1334,9 @@
   "hunyuan-t1-latest": {
     "description": "The industry's first ultra-large-scale Hybrid-Transformer-Mamba inference model, enhancing reasoning capabilities with exceptional decoding speed, further aligning with human preferences."
   },
+  "hunyuan-t1-vision": {
+    "description": "Hunyuan is a multimodal deep thinking model supporting native multimodal chain-of-thought reasoning, excelling in various image reasoning scenarios and significantly outperforming fast-thinking models on science problems."
+  },
   "hunyuan-translation": {
     "description": "Supports translation between Chinese and 15 other languages including English, Japanese, French, Portuguese, Spanish, Turkish, Russian, Arabic, Korean, Italian, German, Vietnamese, Malay, and Indonesian. It is based on a multi-scenario translation evaluation set with automated COMET scoring, demonstrating overall superior translation capabilities compared to similarly scaled models in the market."
   },
@@ -1586,6 +1601,30 @@
   "meta.llama3-8b-instruct-v1:0": {
     "description": "Meta Llama 3 is an open large language model (LLM) aimed at developers, researchers, and enterprises, designed to help them build, experiment, and responsibly scale their generative AI ideas. As part of a foundational system for global community innovation, it is particularly suitable for those with limited computational power and resources, edge devices, and faster training times."
   },
+  "meta/Llama-3.2-11B-Vision-Instruct": {
+    "description": "Exhibits excellent image reasoning capabilities on high-resolution images, suitable for visual understanding applications."
+  },
+  "meta/Llama-3.2-90B-Vision-Instruct": {
+    "description": "Advanced image reasoning capabilities designed for visual understanding agent applications."
+  },
+  "meta/Llama-3.3-70B-Instruct": {
+    "description": "Llama 3.3 is the most advanced multilingual open-source large language model in the Llama series, offering performance comparable to a 405B model at a very low cost. Based on the Transformer architecture, it is enhanced through supervised fine-tuning (SFT) and reinforcement learning with human feedback (RLHF) to improve usefulness and safety. Its instruction-tuned version is optimized for multilingual dialogue and outperforms many open-source and closed chat models on multiple industry benchmarks. Knowledge cutoff date: December 2023."
+  },
+  "meta/Meta-Llama-3-70B-Instruct": {
+    "description": "A powerful 70 billion parameter model excelling in reasoning, coding, and a wide range of language applications."
+  },
+  "meta/Meta-Llama-3-8B-Instruct": {
+    "description": "A versatile 8 billion parameter model optimized for dialogue and text generation tasks."
+  },
+  "meta/Meta-Llama-3.1-405B-Instruct": {
+    "description": "Llama 3.1 instruction-tuned text model optimized for multilingual dialogue use cases, performing excellently on common industry benchmarks among many available open-source and closed chat models."
+  },
+  "meta/Meta-Llama-3.1-70B-Instruct": {
+    "description": "Llama 3.1 instruction-tuned text model optimized for multilingual dialogue use cases, performing excellently on common industry benchmarks among many available open-source and closed chat models."
+  },
+  "meta/Meta-Llama-3.1-8B-Instruct": {
+    "description": "Llama 3.1 instruction-tuned text model optimized for multilingual dialogue use cases, performing excellently on common industry benchmarks among many available open-source and closed chat models."
+  },
   "meta/llama-3.1-405b-instruct": {
     "description": "An advanced LLM supporting synthetic data generation, knowledge distillation, and reasoning, suitable for chatbots, programming, and domain-specific tasks."
   },
@@ -1610,6 +1649,30 @@
   "meta/llama-3.3-70b-instruct": {
     "description": "An advanced LLM skilled in reasoning, mathematics, common sense, and function calling."
   },
+  "microsoft/Phi-3-medium-128k-instruct": {
+    "description": "The same Phi-3-medium model but with a larger context size, suitable for RAG or few-shot prompting."
+  },
+  "microsoft/Phi-3-medium-4k-instruct": {
+    "description": "A 14 billion parameter model with higher quality than Phi-3-mini, focusing on high-quality, reasoning-intensive data."
+  },
+  "microsoft/Phi-3-mini-128k-instruct": {
+    "description": "The same Phi-3-mini model but with a larger context size, suitable for RAG or few-shot prompting."
+  },
+  "microsoft/Phi-3-mini-4k-instruct": {
+    "description": "The smallest member of the Phi-3 family, optimized for quality and low latency."
+  },
+  "microsoft/Phi-3-small-128k-instruct": {
+    "description": "The same Phi-3-small model but with a larger context size, suitable for RAG or few-shot prompting."
+  },
+  "microsoft/Phi-3-small-8k-instruct": {
+    "description": "A 7 billion parameter model with higher quality than Phi-3-mini, focusing on high-quality, reasoning-intensive data."
+  },
+  "microsoft/Phi-3.5-mini-instruct": {
+    "description": "An updated version of the Phi-3-mini model."
+  },
+  "microsoft/Phi-3.5-vision-instruct": {
+    "description": "An updated version of the Phi-3-vision model."
+  },
   "microsoft/WizardLM-2-8x22B": {
     "description": "WizardLM 2 is a language model provided by Microsoft AI, excelling in complex dialogues, multilingual capabilities, reasoning, and intelligent assistant tasks."
   },
@@ -1628,6 +1691,15 @@
   "mistral": {
     "description": "Mistral is a 7B model released by Mistral AI, suitable for diverse language processing needs."
   },
+  "mistral-ai/Mistral-Large-2411": {
+    "description": "Mistral's flagship model, ideal for large-scale reasoning or highly specialized complex tasks such as synthetic text generation, code generation, RAG, or agents."
+  },
+  "mistral-ai/Mistral-Nemo": {
+    "description": "Mistral Nemo is a cutting-edge large language model (LLM) with state-of-the-art reasoning, world knowledge, and coding capabilities in its size category."
+  },
+  "mistral-ai/mistral-small-2503": {
+    "description": "Mistral Small is suitable for any language-based task requiring high efficiency and low latency."
+  },
   "mistral-large": {
     "description": "Mixtral Large is Mistral's flagship model, combining capabilities in code generation, mathematics, and reasoning, supporting a 128k context window."
   },
@@ -1769,6 +1841,9 @@
   "openai/gpt-4o-mini": {
     "description": "GPT-4o mini is the latest model released by OpenAI following GPT-4 Omni, supporting both text and image input while outputting text. As their most advanced small model, it is significantly cheaper than other recent cutting-edge models and over 60% cheaper than GPT-3.5 Turbo. It maintains state-of-the-art intelligence while offering remarkable cost-effectiveness. GPT-4o mini scored 82% on the MMLU test and currently ranks higher than GPT-4 in chat preferences."
   },
+  "openai/o1": {
+    "description": "o1 is OpenAI's new reasoning model that supports multimodal input and outputs text, suitable for complex tasks requiring broad general knowledge. This model features a 200K context window and a knowledge cutoff date of October 2023."
+  },
   "openai/o1-mini": {
     "description": "o1-mini is a fast and cost-effective reasoning model designed for programming, mathematics, and scientific applications. This model features a 128K context and has a knowledge cutoff date of October 2023."
   },

package/locales/en-US/setting.json CHANGED Viewed

@@ -259,9 +259,6 @@
     "enableMaxTokens": {
       "title": "Enable Max Tokens Limit"
     },
-    "enableReasoningEffort": {
-      "title": "Enable Reasoning Effort Adjustment"
-    },
     "frequencyPenalty": {
       "desc": "The higher the value, the more diverse and rich the vocabulary; the lower the value, the simpler and more straightforward the language.",
       "title": "Vocabulary Richness"
@@ -281,15 +278,6 @@
       "desc": "The higher the value, the more inclined to use different expressions and avoid concept repetition; the lower the value, the more inclined to use repeated concepts or narratives, resulting in more consistent expression.",
       "title": "Expression Divergence"
     },
-    "reasoningEffort": {
-      "desc": "The higher the value, the stronger the reasoning ability, but it may increase response time and token consumption.",
-      "options": {
-        "high": "High",
-        "low": "Low",
-        "medium": "Medium"
-      },
-      "title": "Reasoning Effort"
-    },
     "submit": "Update Model Settings",
     "temperature": {
       "desc": "The higher the value, the more creative and imaginative the responses; the lower the value, the more rigorous the responses.",

package/locales/es-ES/chat.json CHANGED Viewed

@@ -43,6 +43,9 @@
     "reasoningBudgetToken": {
       "title": "Token de consumo de pensamiento"
     },
+    "reasoningEffort": {
+      "title": "Intensidad de razonamiento"
+    },
     "title": "Funcionalidad de extensión del modelo"
   },
   "history": {