@lobehub/chat 1.97.14 → 1.97.16
This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.
- package/CHANGELOG.md +50 -0
- package/changelog/v1.json +18 -0
- package/locales/ar/models.json +54 -30
- package/locales/bg-BG/models.json +54 -30
- package/locales/de-DE/models.json +54 -30
- package/locales/en-US/models.json +54 -30
- package/locales/es-ES/models.json +54 -30
- package/locales/fa-IR/models.json +54 -30
- package/locales/fr-FR/models.json +54 -30
- package/locales/it-IT/models.json +53 -29
- package/locales/ja-JP/models.json +54 -30
- package/locales/ko-KR/models.json +53 -29
- package/locales/nl-NL/models.json +53 -29
- package/locales/pl-PL/models.json +54 -30
- package/locales/pt-BR/models.json +72 -30
- package/locales/ru-RU/models.json +54 -30
- package/locales/tr-TR/models.json +54 -30
- package/locales/vi-VN/models.json +54 -30
- package/locales/zh-CN/models.json +53 -29
- package/locales/zh-TW/models.json +54 -30
- package/package.json +1 -1
- package/src/config/aiModels/xai.ts +1 -1
package/CHANGELOG.md
CHANGED
@@ -2,6 +2,56 @@
|
|
2
2
|
|
3
3
|
# Changelog
|
4
4
|
|
5
|
+
### [Version 1.97.16](https://github.com/lobehub/lobe-chat/compare/v1.97.15...v1.97.16)
|
6
|
+
|
7
|
+
<sup>Released on **2025-07-13**</sup>
|
8
|
+
|
9
|
+
#### 💄 Styles
|
10
|
+
|
11
|
+
- **misc**: Update i18n.
|
12
|
+
|
13
|
+
<br/>
|
14
|
+
|
15
|
+
<details>
|
16
|
+
<summary><kbd>Improvements and Fixes</kbd></summary>
|
17
|
+
|
18
|
+
#### Styles
|
19
|
+
|
20
|
+
- **misc**: Update i18n, closes [#8410](https://github.com/lobehub/lobe-chat/issues/8410) ([2515875](https://github.com/lobehub/lobe-chat/commit/2515875))
|
21
|
+
|
22
|
+
</details>
|
23
|
+
|
24
|
+
<div align="right">
|
25
|
+
|
26
|
+
[](#readme-top)
|
27
|
+
|
28
|
+
</div>
|
29
|
+
|
30
|
+
### [Version 1.97.15](https://github.com/lobehub/lobe-chat/compare/v1.97.14...v1.97.15)
|
31
|
+
|
32
|
+
<sup>Released on **2025-07-12**</sup>
|
33
|
+
|
34
|
+
#### 🐛 Bug Fixes
|
35
|
+
|
36
|
+
- **misc**: Add vision support to Grok 4.
|
37
|
+
|
38
|
+
<br/>
|
39
|
+
|
40
|
+
<details>
|
41
|
+
<summary><kbd>Improvements and Fixes</kbd></summary>
|
42
|
+
|
43
|
+
#### What's fixed
|
44
|
+
|
45
|
+
- **misc**: Add vision support to Grok 4, closes [#8386](https://github.com/lobehub/lobe-chat/issues/8386) ([8512f5a](https://github.com/lobehub/lobe-chat/commit/8512f5a))
|
46
|
+
|
47
|
+
</details>
|
48
|
+
|
49
|
+
<div align="right">
|
50
|
+
|
51
|
+
[](#readme-top)
|
52
|
+
|
53
|
+
</div>
|
54
|
+
|
5
55
|
### [Version 1.97.14](https://github.com/lobehub/lobe-chat/compare/v1.97.13...v1.97.14)
|
6
56
|
|
7
57
|
<sup>Released on **2025-07-12**</sup>
|
package/changelog/v1.json
CHANGED
@@ -1,4 +1,22 @@
|
|
1
1
|
[
|
2
|
+
{
|
3
|
+
"children": {
|
4
|
+
"improvements": [
|
5
|
+
"Update i18n."
|
6
|
+
]
|
7
|
+
},
|
8
|
+
"date": "2025-07-13",
|
9
|
+
"version": "1.97.16"
|
10
|
+
},
|
11
|
+
{
|
12
|
+
"children": {
|
13
|
+
"fixes": [
|
14
|
+
"Add vision support to Grok 4."
|
15
|
+
]
|
16
|
+
},
|
17
|
+
"date": "2025-07-12",
|
18
|
+
"version": "1.97.15"
|
19
|
+
},
|
2
20
|
{
|
3
21
|
"children": {
|
4
22
|
"fixes": [
|
package/locales/ar/models.json
CHANGED
@@ -71,44 +71,23 @@
|
|
71
71
|
"DeepSeek-V3": {
|
72
72
|
"description": "DeepSeek-V3 هو نموذج MoE تم تطويره ذاتيًا بواسطة شركة DeepSeek. حقق DeepSeek-V3 نتائج تقييم تفوقت على نماذج مفتوحة المصدر الأخرى مثل Qwen2.5-72B و Llama-3.1-405B، وفي الأداء ينافس النماذج المغلقة الرائدة عالميًا مثل GPT-4o و Claude-3.5-Sonnet."
|
73
73
|
},
|
74
|
-
"Doubao-1.5-thinking-pro-m": {
|
75
|
-
"description": "Doubao-1.5 هو نموذج تفكير عميق جديد (نسخة m تأتي مع قدرة استدلال عميق متعددة الوسائط أصلية)، يظهر أداءً بارزًا في مجالات الرياضيات، البرمجة، الاستدلال العلمي، والكتابة الإبداعية، حيث حقق أو اقترب من المستوى الأول في عدة معايير مرموقة مثل AIME 2024، Codeforces، وGPQA. يدعم نافذة سياق تصل إلى 128k، وإخراج يصل إلى 16k."
|
76
|
-
},
|
77
|
-
"Doubao-1.5-thinking-vision-pro": {
|
78
|
-
"description": "نموذج تفكير بصري عميق جديد، يتمتع بقدرات فهم واستدلال متعددة الوسائط أقوى، وقد حقق أداءً متميزًا في 37 من 59 معيار تقييم علني."
|
79
|
-
},
|
80
|
-
"Doubao-1.5-vision-pro": {
|
81
|
-
"description": "Doubao-1.5-vision-pro هو نموذج كبير متعدد الوسائط تم ترقيته حديثًا، يدعم التعرف على الصور بدقة غير محدودة ونسب عرض إلى ارتفاع متطرفة، ويعزز قدرات الاستدلال البصري، التعرف على الوثائق، فهم المعلومات التفصيلية، واتباع التعليمات."
|
82
|
-
},
|
83
|
-
"Doubao-1.5-vision-pro-32k": {
|
84
|
-
"description": "دو باو 1.5 فيجن برو هو نموذج كبير متعدد الوسائط تم تحديثه حديثًا، يدعم التعرف على الصور بدقة أي دقة ونسب عرض إلى ارتفاع متطرفة، مما يعزز القدرة على الاستدلال البصري، والتعرف على الوثائق، وفهم المعلومات التفصيلية، والامتثال للتعليمات."
|
85
|
-
},
|
86
74
|
"Doubao-lite-128k": {
|
87
|
-
"description": "
|
75
|
+
"description": "Doubao-lite يتميز بسرعة استجابة فائقة وقيمة أفضل مقابل المال، ويوفر خيارات أكثر مرونة للعملاء في سيناريوهات مختلفة. يدعم الاستدلال والتخصيص مع نافذة سياق 128k."
|
88
76
|
},
|
89
77
|
"Doubao-lite-32k": {
|
90
|
-
"description": "
|
78
|
+
"description": "Doubao-lite يتميز بسرعة استجابة فائقة وقيمة أفضل مقابل المال، ويوفر خيارات أكثر مرونة للعملاء في سيناريوهات مختلفة. يدعم الاستدلال والتخصيص مع نافذة سياق 32k."
|
91
79
|
},
|
92
80
|
"Doubao-lite-4k": {
|
93
|
-
"description": "
|
81
|
+
"description": "Doubao-lite يتميز بسرعة استجابة فائقة وقيمة أفضل مقابل المال، ويوفر خيارات أكثر مرونة للعملاء في سيناريوهات مختلفة. يدعم الاستدلال والتخصيص مع نافذة سياق 4k."
|
94
82
|
},
|
95
83
|
"Doubao-pro-128k": {
|
96
|
-
"description": "النموذج الرئيسي
|
97
|
-
},
|
98
|
-
"Doubao-pro-256k": {
|
99
|
-
"description": "أفضل نموذج رئيسي من حيث الأداء، مناسب لمعالجة المهام المعقدة، حيث يظهر أداءً جيدًا في سيناريوهات مثل الأسئلة والأجوبة المرجعية، والتلخيص، والإبداع، وتصنيف النصوص، وأدوار الشخصيات. يدعم استدلال نافذة السياق 256k والتعديل الدقيق."
|
84
|
+
"description": "النموذج الرئيسي الأكثر فعالية، مناسب لمعالجة المهام المعقدة، ويحقق أداءً ممتازًا في سيناريوهات مثل الأسئلة المرجعية، التلخيص، الإبداع، تصنيف النصوص، ولعب الأدوار. يدعم الاستدلال والتخصيص مع نافذة سياق 128k."
|
100
85
|
},
|
101
86
|
"Doubao-pro-32k": {
|
102
|
-
"description": "النموذج الرئيسي
|
87
|
+
"description": "النموذج الرئيسي الأكثر فعالية، مناسب لمعالجة المهام المعقدة، ويحقق أداءً ممتازًا في سيناريوهات مثل الأسئلة المرجعية، التلخيص، الإبداع، تصنيف النصوص، ولعب الأدوار. يدعم الاستدلال والتخصيص مع نافذة سياق 32k."
|
103
88
|
},
|
104
89
|
"Doubao-pro-4k": {
|
105
|
-
"description": "النموذج الرئيسي
|
106
|
-
},
|
107
|
-
"Doubao-vision-lite-32k": {
|
108
|
-
"description": "نموذج دو باو فيجن هو نموذج كبير متعدد الوسائط تم إطلاقه من قبل دو باو، يتمتع بقدرة قوية على فهم الصور والاستدلال، بالإضافة إلى القدرة الدقيقة على فهم التعليمات. أظهر النموذج أداءً قويًا في استخراج معلومات النصوص من الصور، ومهام الاستدلال المعتمدة على الصور، مما يجعله مناسبًا لمهام الأسئلة والأجوبة البصرية الأكثر تعقيدًا وعمومية."
|
109
|
-
},
|
110
|
-
"Doubao-vision-pro-32k": {
|
111
|
-
"description": "نموذج دو باو فيجن هو نموذج كبير متعدد الوسائط تم إطلاقه من قبل دو باو، يتمتع بقدرة قوية على فهم الصور والاستدلال، بالإضافة إلى القدرة الدقيقة على فهم التعليمات. أظهر النموذج أداءً قويًا في استخراج معلومات النصوص من الصور، ومهام الاستدلال المعتمدة على الصور، مما يجعله مناسبًا لمهام الأسئلة والأجوبة البصرية الأكثر تعقيدًا وعمومية."
|
90
|
+
"description": "النموذج الرئيسي الأكثر فعالية، مناسب لمعالجة المهام المعقدة، ويحقق أداءً ممتازًا في سيناريوهات مثل الأسئلة المرجعية، التلخيص، الإبداع، تصنيف النصوص، ولعب الأدوار. يدعم الاستدلال والتخصيص مع نافذة سياق 4k."
|
112
91
|
},
|
113
92
|
"ERNIE-3.5-128K": {
|
114
93
|
"description": "نموذج اللغة الكبير الرائد الذي طورته بايدو، يغطي كمية هائلة من البيانات باللغة الصينية والإنجليزية، ويتميز بقدرات عامة قوية، يمكنه تلبية معظم متطلبات الحوار، والإجابة على الأسئلة، وإنشاء المحتوى، وتطبيقات الإضافات؛ يدعم الاتصال التلقائي بإضافات بحث بايدو، مما يضمن تحديث معلومات الإجابة."
|
@@ -914,9 +893,39 @@
|
|
914
893
|
"doubao-1.5-thinking-pro": {
|
915
894
|
"description": "نموذج Doubao-1.5 الجديد للتفكير العميق، يتميز بأداء بارز في مجالات الرياضيات، البرمجة، الاستدلال العلمي، وكذلك في المهام العامة مثل الكتابة الإبداعية. حقق أو اقترب من المستوى الأول في العديد من المعايير المرموقة مثل AIME 2024 وCodeforces وGPQA. يدعم نافذة سياق بحجم 128k و16k للإخراج."
|
916
895
|
},
|
896
|
+
"doubao-1.5-thinking-pro-m": {
|
897
|
+
"description": "نموذج التفكير العميق الجديد Doubao-1.5 (الإصدار m مزود بقدرات استدلال متعددة الوسائط أصلية)، يتميز بأداء بارز في المجالات المتخصصة مثل الرياضيات، البرمجة، الاستدلال العلمي، والمهام العامة مثل الكتابة الإبداعية. وصل أو اقترب من المستوى الأول في معايير AIME 2024، Codeforces، GPQA وغيرها. يدعم نافذة سياق 128k وإخراج 16k."
|
898
|
+
},
|
899
|
+
"doubao-1.5-thinking-vision-pro": {
|
900
|
+
"description": "نموذج التفكير العميق البصري الجديد، يتمتع بقدرات فهم واستدلال متعددة الوسائط عامة أقوى، وحقق أداءً متفوقًا في 37 من أصل 59 معيار تقييم عام."
|
901
|
+
},
|
902
|
+
"doubao-1.5-ui-tars": {
|
903
|
+
"description": "Doubao-1.5-UI-TARS هو نموذج وكيل موجه أصلاً للتفاعل مع واجهات المستخدم الرسومية (GUI). يتفاعل بسلاسة مع GUI من خلال قدرات شبيهة بالبشر في الإدراك، الاستدلال، والعمل."
|
904
|
+
},
|
917
905
|
"doubao-1.5-vision-lite": {
|
918
906
|
"description": "Doubao-1.5-vision-lite هو نموذج كبير متعدد الوسائط تم ترقيته حديثًا، يدعم التعرف على الصور بدقة غير محدودة ونسب عرض إلى ارتفاع متطرفة، ويعزز قدرات الاستدلال البصري، التعرف على الوثائق، فهم المعلومات التفصيلية، واتباع التعليمات. يدعم نافذة سياق 128k، وطول الإخراج يدعم حتى 16k توكن."
|
919
907
|
},
|
908
|
+
"doubao-1.5-vision-pro": {
|
909
|
+
"description": "نموذج متعدد الوسائط مطور Doubao-1.5-vision-pro يدعم التعرف على الصور بأي دقة ونسب أبعاد متطرفة، معزّز بقدرات الاستدلال البصري، التعرف على الوثائق، فهم التفاصيل، والامتثال للتعليمات."
|
910
|
+
},
|
911
|
+
"doubao-1.5-vision-pro-32k": {
|
912
|
+
"description": "نموذج متعدد الوسائط مطور Doubao-1.5-vision-pro يدعم التعرف على الصور بأي دقة ونسب أبعاد متطرفة، معزّز بقدرات الاستدلال البصري، التعرف على الوثائق، فهم التفاصيل، والامتثال للتعليمات."
|
913
|
+
},
|
914
|
+
"doubao-lite-128k": {
|
915
|
+
"description": "يتميز بسرعة استجابة فائقة وقيمة أفضل مقابل المال، ويوفر خيارات أكثر مرونة للعملاء في سيناريوهات مختلفة. يدعم الاستدلال والتخصيص مع نافذة سياق 128k."
|
916
|
+
},
|
917
|
+
"doubao-lite-32k": {
|
918
|
+
"description": "يتميز بسرعة استجابة فائقة وقيمة أفضل مقابل المال، ويوفر خيارات أكثر مرونة للعملاء في سيناريوهات مختلفة. يدعم الاستدلال والتخصيص مع نافذة سياق 32k."
|
919
|
+
},
|
920
|
+
"doubao-lite-4k": {
|
921
|
+
"description": "يتميز بسرعة استجابة فائقة وقيمة أفضل مقابل المال، ويوفر خيارات أكثر مرونة للعملاء في سيناريوهات مختلفة. يدعم الاستدلال والتخصيص مع نافذة سياق 4k."
|
922
|
+
},
|
923
|
+
"doubao-pro-256k": {
|
924
|
+
"description": "النموذج الرئيسي الأكثر فعالية، مناسب لمعالجة المهام المعقدة، ويحقق أداءً ممتازًا في سيناريوهات مثل الأسئلة المرجعية، التلخيص، الإبداع، تصنيف النصوص، ولعب الأدوار. يدعم الاستدلال والتخصيص مع نافذة سياق 256k."
|
925
|
+
},
|
926
|
+
"doubao-pro-32k": {
|
927
|
+
"description": "النموذج الرئيسي الأكثر فعالية، مناسب لمعالجة المهام المعقدة، ويحقق أداءً ممتازًا في سيناريوهات مثل الأسئلة المرجعية، التلخيص، الإبداع، تصنيف النصوص، ولعب الأدوار. يدعم الاستدلال والتخصيص مع نافذة سياق 32k."
|
928
|
+
},
|
920
929
|
"doubao-seed-1.6": {
|
921
930
|
"description": "نموذج Doubao-Seed-1.6 متعدد الوسائط للتفكير العميق، يدعم ثلاثة أوضاع تفكير: تلقائي/تفكير/عدم تفكير. في وضع عدم التفكير، يتحسن أداء النموذج بشكل كبير مقارنة بـ Doubao-1.5-pro/250115. يدعم نافذة سياق بحجم 256k وطول إخراج يصل إلى 16k رمز."
|
922
931
|
},
|
@@ -926,6 +935,12 @@
|
|
926
935
|
"doubao-seed-1.6-thinking": {
|
927
936
|
"description": "نموذج Doubao-Seed-1.6-thinking يعزز قدرات التفكير بشكل كبير، مقارنة بـ Doubao-1.5-thinking-pro، مع تحسينات إضافية في القدرات الأساسية مثل البرمجة والرياضيات والاستدلال المنطقي، ويدعم الفهم البصري. يدعم نافذة سياق بحجم 256k وطول إخراج يصل إلى 16k رمز."
|
928
937
|
},
|
938
|
+
"doubao-vision-lite-32k": {
|
939
|
+
"description": "نموذج Doubao-vision هو نموذج متعدد الوسائط أطلقته Doubao، يتمتع بقدرات قوية في فهم الصور والاستدلال، بالإضافة إلى دقة عالية في فهم التعليمات. أظهر النموذج أداءً قويًا في استخراج المعلومات من النصوص والصور، والمهام الاستدلالية القائمة على الصور، مما يجعله مناسبًا لمهام الأسئلة البصرية المعقدة والواسعة."
|
940
|
+
},
|
941
|
+
"doubao-vision-pro-32k": {
|
942
|
+
"description": "نموذج Doubao-vision هو نموذج متعدد الوسائط أطلقته Doubao، يتمتع بقدرات قوية في فهم الصور والاستدلال، بالإضافة إلى دقة عالية في فهم التعليمات. أظهر النموذج أداءً قويًا في استخراج المعلومات من النصوص والصور، والمهام الاستدلالية القائمة على الصور، مما يجعله مناسبًا لمهام الأسئلة البصرية المعقدة والواسعة."
|
943
|
+
},
|
929
944
|
"emohaa": {
|
930
945
|
"description": "Emohaa هو نموذج نفسي، يتمتع بقدرات استشارية متخصصة، يساعد المستخدمين في فهم القضايا العاطفية."
|
931
946
|
},
|
@@ -1313,6 +1328,9 @@
|
|
1313
1328
|
"gpt-4o-mini-search-preview": {
|
1314
1329
|
"description": "نسخة معاينة بحث GPT-4o mini هي نموذج مدرب خصيصًا لفهم وتنفيذ استعلامات البحث على الويب، باستخدام واجهة برمجة تطبيقات Chat Completions. بالإضافة إلى رسوم الرموز، يتم فرض رسوم على استعلامات البحث على الويب لكل استدعاء أداة."
|
1315
1330
|
},
|
1331
|
+
"gpt-4o-mini-transcribe": {
|
1332
|
+
"description": "GPT-4o Mini Transcribe هو نموذج تحويل الصوت إلى نص يستخدم GPT-4o لتفريغ الصوت. مقارنةً بنموذج Whisper الأصلي، يحسن معدل الخطأ في الكلمات ويعزز التعرف على اللغة والدقة. استخدمه للحصول على تفريغ أكثر دقة."
|
1333
|
+
},
|
1316
1334
|
"gpt-4o-mini-tts": {
|
1317
1335
|
"description": "GPT-4o mini TTS هو نموذج تحويل النص إلى كلام، مبني على GPT-4o mini، يقدم إنتاج كلمات صوتية عالية الجودة بسعر أقل."
|
1318
1336
|
},
|
@@ -1322,12 +1340,15 @@
|
|
1322
1340
|
"gpt-4o-realtime-preview-2024-10-01": {
|
1323
1341
|
"description": "الإصدار الفوري من GPT-4o، يدعم إدخال وإخراج الصوت والنص في الوقت الحقيقي."
|
1324
1342
|
},
|
1325
|
-
"gpt-4o-realtime-preview-
|
1326
|
-
"description": "
|
1343
|
+
"gpt-4o-realtime-preview-2025-06-03": {
|
1344
|
+
"description": "نسخة GPT-4o الحية، تدعم الإدخال والإخراج الصوتي والنصي في الوقت الحقيقي."
|
1327
1345
|
},
|
1328
1346
|
"gpt-4o-search-preview": {
|
1329
1347
|
"description": "نسخة معاينة بحث GPT-4o هي نموذج مدرب خصيصًا لفهم وتنفيذ استعلامات البحث على الويب، باستخدام واجهة برمجة تطبيقات Chat Completions. بالإضافة إلى رسوم الرموز، يتم فرض رسوم على استعلامات البحث على الويب لكل استدعاء أداة."
|
1330
1348
|
},
|
1349
|
+
"gpt-4o-transcribe": {
|
1350
|
+
"description": "GPT-4o Transcribe هو نموذج تحويل الصوت إلى نص يستخدم GPT-4o لتفريغ الصوت. مقارنةً بنموذج Whisper الأصلي، يحسن معدل الخطأ في الكلمات ويعزز التعرف على اللغة والدقة. استخدمه للحصول على تفريغ أكثر دقة."
|
1351
|
+
},
|
1331
1352
|
"grok-2-1212": {
|
1332
1353
|
"description": "لقد تم تحسين هذا النموذج في الدقة، والامتثال للتعليمات، والقدرة على التعامل مع لغات متعددة."
|
1333
1354
|
},
|
@@ -1460,6 +1481,9 @@
|
|
1460
1481
|
"jina-deepsearch-v1": {
|
1461
1482
|
"description": "البحث العميق يجمع بين البحث عبر الإنترنت، والقراءة، والاستدلال، مما يتيح إجراء تحقيق شامل. يمكنك اعتباره وكيلًا يتولى مهام البحث الخاصة بك - حيث يقوم بإجراء بحث واسع النطاق ويخضع لعدة تكرارات قبل تقديم الإجابة. تتضمن هذه العملية بحثًا مستمرًا، واستدلالًا، وحل المشكلات من زوايا متعددة. وهذا يختلف اختلافًا جوهريًا عن النماذج الكبيرة القياسية التي تولد الإجابات مباشرة من البيانات المدربة مسبقًا، وكذلك عن أنظمة RAG التقليدية التي تعتمد على البحث السطحي لمرة واحدة."
|
1462
1483
|
},
|
1484
|
+
"kimi-k2-0711-preview": {
|
1485
|
+
"description": "kimi-k2 هو نموذج أساسي بمعمارية MoE يتمتع بقدرات فائقة في البرمجة والوكيل، مع إجمالي 1 تريليون معلمة و32 مليار معلمة مفعلة. في اختبارات الأداء الأساسية في مجالات المعرفة العامة، البرمجة، الرياضيات، والوكيل، يتفوق نموذج K2 على النماذج المفتوحة المصدر الرئيسية الأخرى."
|
1486
|
+
},
|
1463
1487
|
"kimi-latest": {
|
1464
1488
|
"description": "يستخدم منتج كيمي المساعد الذكي أحدث نموذج كبير من كيمي، وقد يحتوي على ميزات لم تستقر بعد. يدعم فهم الصور، وسيختار تلقائيًا نموذج 8k/32k/128k كنموذج للتسعير بناءً على طول سياق الطلب."
|
1465
1489
|
},
|
@@ -2352,7 +2376,7 @@
|
|
2352
2376
|
"description": "نموذج v0-1.5-md مناسب للمهام اليومية وتوليد واجهات المستخدم (UI)"
|
2353
2377
|
},
|
2354
2378
|
"whisper-1": {
|
2355
|
-
"description": "نموذج التعرف على الصوت العام، يدعم التعرف على الصوت
|
2379
|
+
"description": "نموذج التعرف على الصوت العام، يدعم التعرف على الصوت بعدة لغات، الترجمة الصوتية، والتعرف على اللغة."
|
2356
2380
|
},
|
2357
2381
|
"wizardlm2": {
|
2358
2382
|
"description": "WizardLM 2 هو نموذج لغوي تقدمه Microsoft AI، يتميز بأداء ممتاز في الحوار المعقد، واللغات المتعددة، والاستدلال، والمساعدين الذكيين."
|
@@ -71,44 +71,23 @@
|
|
71
71
|
"DeepSeek-V3": {
|
72
72
|
"description": "DeepSeek-V3 е MoE модел, разработен от компанията DeepSeek. DeepSeek-V3 постига резултати в множество оценки, които надминават други отворени модели като Qwen2.5-72B и Llama-3.1-405B, като по отношение на производителност е наравно с водещите затворени модели в света като GPT-4o и Claude-3.5-Sonnet."
|
73
73
|
},
|
74
|
-
"Doubao-1.5-thinking-pro-m": {
|
75
|
-
"description": "Doubao-1.5 е новият модел за дълбочинно разсъждение (версия m идва с вградена многомодална дълбочинна разсъждаваща способност), който показва отлични резултати в професионални области като математика, програмиране, научни разсъждения и в общи задачи като креативно писане, достигайки или приближавайки се до водещото ниво в индустрията в множество авторитетни бенчмаркове като AIME 2024, Codeforces, GPQA. Поддържа контекстен прозорец от 128k и изход от 16k."
|
76
|
-
},
|
77
|
-
"Doubao-1.5-thinking-vision-pro": {
|
78
|
-
"description": "Напълно нов модел за дълбочинно визуално мислене, с по-силни способности за общо мултимодално разбиране и разсъждение, постигнал SOTA представяне в 37 от 59 публични оценъчни стандарта."
|
79
|
-
},
|
80
|
-
"Doubao-1.5-vision-pro": {
|
81
|
-
"description": "Doubao-1.5-vision-pro е ново обновление на мултимодалния модел, поддържащ разпознаване на изображения с произволна резолюция и екстремни съотношения на дължина и ширина, подобряващ способностите за визуални разсъждения, разпознаване на документи, разбиране на детайлна информация и следване на инструкции."
|
82
|
-
},
|
83
|
-
"Doubao-1.5-vision-pro-32k": {
|
84
|
-
"description": "Doubao-1.5-vision-pro е ново обновен мултимодален голям модел, който поддържа разпознаване на изображения с произволна резолюция и екстремни съотношения на страните, подобрявайки способностите за визуално разсъждение, разпознаване на документи, разбиране на детайлна информация и следване на инструкции."
|
85
|
-
},
|
86
74
|
"Doubao-lite-128k": {
|
87
|
-
"description": "Doubao-lite предлага
|
75
|
+
"description": "Doubao-lite предлага изключително бърза реакция и по-добро съотношение цена-качество, осигурявайки по-гъвкави опции за различни сценарии на клиентите. Поддържа разсъждения и финна настройка с контекстен прозорец от 128k."
|
88
76
|
},
|
89
77
|
"Doubao-lite-32k": {
|
90
|
-
"description": "Doubao-lite предлага
|
78
|
+
"description": "Doubao-lite предлага изключително бърза реакция и по-добро съотношение цена-качество, осигурявайки по-гъвкави опции за различни сценарии на клиентите. Поддържа разсъждения и финна настройка с контекстен прозорец от 32k."
|
91
79
|
},
|
92
80
|
"Doubao-lite-4k": {
|
93
|
-
"description": "Doubao-lite предлага
|
81
|
+
"description": "Doubao-lite предлага изключително бърза реакция и по-добро съотношение цена-качество, осигурявайки по-гъвкави опции за различни сценарии на клиентите. Поддържа разсъждения и финна настройка с контекстен прозорец от 4k."
|
94
82
|
},
|
95
83
|
"Doubao-pro-128k": {
|
96
|
-
"description": "
|
97
|
-
},
|
98
|
-
"Doubao-pro-256k": {
|
99
|
-
"description": "Най-добрият основен модел, подходящ за обработка на сложни задачи, с отлични резултати в сценарии като отговори на въпроси, резюмиране, творчество, текстова класификация и ролеви игри. Поддържа разсъждения и фина настройка с контекстен прозорец от 256k."
|
84
|
+
"description": "Най-ефективният основен модел, подходящ за обработка на сложни задачи, с отлични резултати в справки, обобщения, творчество, текстова класификация и ролеви игри. Поддържа разсъждения и финна настройка с контекстен прозорец от 128k."
|
100
85
|
},
|
101
86
|
"Doubao-pro-32k": {
|
102
|
-
"description": "
|
87
|
+
"description": "Най-ефективният основен модел, подходящ за обработка на сложни задачи, с отлични резултати в справки, обобщения, творчество, текстова класификация и ролеви игри. Поддържа разсъждения и финна настройка с контекстен прозорец от 32k."
|
103
88
|
},
|
104
89
|
"Doubao-pro-4k": {
|
105
|
-
"description": "
|
106
|
-
},
|
107
|
-
"Doubao-vision-lite-32k": {
|
108
|
-
"description": "Doubao-vision моделът е мултимодален голям модел, представен от Doubao, който притежава мощни способности за разбиране и разсъждение на изображения, както и прецизно разбиране на инструкции. Моделът показва силни резултати в извличането на текстова информация от изображения и в задачи за разсъждение, базирани на изображения, и може да се прилага в по-сложни и по-широки визуални въпроси."
|
109
|
-
},
|
110
|
-
"Doubao-vision-pro-32k": {
|
111
|
-
"description": "Doubao-vision моделът е мултимодален голям модел, представен от Doubao, който притежава мощни способности за разбиране и разсъждение на изображения, както и прецизно разбиране на инструкции. Моделът показва силни резултати в извличането на текстова информация от изображения и в задачи за разсъждение, базирани на изображения, и може да се прилага в по-сложни и по-широки визуални въпроси."
|
90
|
+
"description": "Най-ефективният основен модел, подходящ за обработка на сложни задачи, с отлични резултати в справки, обобщения, творчество, текстова класификация и ролеви игри. Поддържа разсъждения и финна настройка с контекстен прозорец от 4k."
|
112
91
|
},
|
113
92
|
"ERNIE-3.5-128K": {
|
114
93
|
"description": "Флагманският модел на Baidu, разработен самостоятелно, е мащабен езиков модел, който обхваща огромно количество китайски и английски текстове. Той притежава мощни общи способности и може да отговори на почти всички изисквания за диалогови въпроси и отговори, генериране на съдържание и приложения с плъгини; поддържа автоматично свързване с плъгина за търсене на Baidu, осигурявайки актуалност на информацията за отговорите."
|
@@ -914,9 +893,39 @@
|
|
914
893
|
"doubao-1.5-thinking-pro": {
|
915
894
|
"description": "Doubao-1.5 е нов модел за дълбоко мислене, който се отличава в специализирани области като математика, програмиране и научно разсъждение, както и в общи задачи като креативно писане. Той достига или е близо до нивото на водещите в индустрията в множество авторитетни бенчмаркове, включително AIME 2024, Codeforces и GPQA. Поддържа контекстен прозорец от 128k и 16k изход."
|
916
895
|
},
|
896
|
+
"doubao-1.5-thinking-pro-m": {
|
897
|
+
"description": "Новият дълбок мисловен модел Doubao-1.5 (версия m с вградена мултимодална дълбока разсъдителна способност), отличаващ се в математика, програмиране, научно разсъждение и творческо писане, постигащ или приближаващ се до водещите нива в индустрията на авторитетни тестове като AIME 2024, Codeforces и GPQA. Поддържа контекстен прозорец от 128k и изход до 16k."
|
898
|
+
},
|
899
|
+
"doubao-1.5-thinking-vision-pro": {
|
900
|
+
"description": "Нов визуален дълбок мисловен модел с по-силни универсални мултимодални разбиране и разсъждения, постигнал SOTA резултати в 37 от 59 публични тестови бази."
|
901
|
+
},
|
902
|
+
"doubao-1.5-ui-tars": {
|
903
|
+
"description": "Doubao-1.5-UI-TARS е агентен модел, специално създаден за графичен потребителски интерфейс (GUI). Чрез човешки подобни способности за възприятие, разсъждение и действие, осигурява безпроблемно взаимодействие с GUI."
|
904
|
+
},
|
917
905
|
"doubao-1.5-vision-lite": {
|
918
906
|
"description": "Doubao-1.5-vision-lite е ново обновление на мултимодалния модел, поддържащ разпознаване на изображения с произволна резолюция и екстремни съотношения на дължина и ширина, подобряващ способностите за визуални разсъждения, разпознаване на документи, разбиране на детайлна информация и следване на инструкции. Поддържа контекстуален прозорец от 128k, с максимална дължина на изхода от 16k токена."
|
919
907
|
},
|
908
|
+
"doubao-1.5-vision-pro": {
|
909
|
+
"description": "Новоподобреният мултимодален голям модел Doubao-1.5-vision-pro поддържа разпознаване на изображения с всякаква резолюция и екстремни съотношения на страните, подобрявайки визуалното разсъждение, разпознаване на документи, разбиране на детайлна информация и следване на инструкции."
|
910
|
+
},
|
911
|
+
"doubao-1.5-vision-pro-32k": {
|
912
|
+
"description": "Новоподобреният мултимодален голям модел Doubao-1.5-vision-pro поддържа разпознаване на изображения с всякаква резолюция и екстремни съотношения на страните, подобрявайки визуалното разсъждение, разпознаване на документи, разбиране на детайлна информация и следване на инструкции."
|
913
|
+
},
|
914
|
+
"doubao-lite-128k": {
|
915
|
+
"description": "Предлага изключително бърза реакция и по-добро съотношение цена-качество, осигурявайки по-гъвкави опции за различни сценарии на клиентите. Поддържа разсъждения и финна настройка с контекстен прозорец от 128k."
|
916
|
+
},
|
917
|
+
"doubao-lite-32k": {
|
918
|
+
"description": "Предлага изключително бърза реакция и по-добро съотношение цена-качество, осигурявайки по-гъвкави опции за различни сценарии на клиентите. Поддържа разсъждения и финна настройка с контекстен прозорец от 32k."
|
919
|
+
},
|
920
|
+
"doubao-lite-4k": {
|
921
|
+
"description": "Предлага изключително бърза реакция и по-добро съотношение цена-качество, осигурявайки по-гъвкави опции за различни сценарии на клиентите. Поддържа разсъждения и финна настройка с контекстен прозорец от 4k."
|
922
|
+
},
|
923
|
+
"doubao-pro-256k": {
|
924
|
+
"description": "Най-ефективният основен модел, подходящ за обработка на сложни задачи, с отлични резултати в справки, обобщения, творчество, текстова класификация и ролеви игри. Поддържа разсъждения и финна настройка с контекстен прозорец от 256k."
|
925
|
+
},
|
926
|
+
"doubao-pro-32k": {
|
927
|
+
"description": "Най-ефективният основен модел, подходящ за обработка на сложни задачи, с отлични резултати в справки, обобщения, творчество, текстова класификация и ролеви игри. Поддържа разсъждения и финна настройка с контекстен прозорец от 32k."
|
928
|
+
},
|
920
929
|
"doubao-seed-1.6": {
|
921
930
|
"description": "Doubao-Seed-1.6 е нов много модален модел за дълбоко мислене, който поддържа три режима на мислене: auto, thinking и non-thinking. В non-thinking режим моделът значително превъзхожда Doubao-1.5-pro/250115. Поддържа контекстен прозорец от 256k и максимална дължина на изхода до 16k токена."
|
922
931
|
},
|
@@ -926,6 +935,12 @@
|
|
926
935
|
"doubao-seed-1.6-thinking": {
|
927
936
|
"description": "Doubao-Seed-1.6-thinking моделът значително подобрява способностите за мислене в сравнение с Doubao-1.5-thinking-pro, с допълнителни подобрения в кодиране, математика и логическо разсъждение, като поддържа и визуално разбиране. Поддържа контекстен прозорец от 256k и максимална дължина на изхода до 16k токена."
|
928
937
|
},
|
938
|
+
"doubao-vision-lite-32k": {
|
939
|
+
"description": "Моделът Doubao-vision е мултимодален голям модел, разработен от Doubao, с мощни способности за разбиране и разсъждение върху изображения, както и прецизно разбиране на инструкции. Моделът показва силна производителност при извличане на информация от изображения и текст, както и при задачи за разсъждение, базирани на изображения, подходящ за по-сложни и широки визуални въпроси."
|
940
|
+
},
|
941
|
+
"doubao-vision-pro-32k": {
|
942
|
+
"description": "Моделът Doubao-vision е мултимодален голям модел, разработен от Doubao, с мощни способности за разбиране и разсъждение върху изображения, както и прецизно разбиране на инструкции. Моделът показва силна производителност при извличане на информация от изображения и текст, както и при задачи за разсъждение, базирани на изображения, подходящ за по-сложни и широки визуални въпроси."
|
943
|
+
},
|
929
944
|
"emohaa": {
|
930
945
|
"description": "Emohaa е психологически модел с професионални консултантски способности, помагащ на потребителите да разберат емоционалните проблеми."
|
931
946
|
},
|
@@ -1313,6 +1328,9 @@
|
|
1313
1328
|
"gpt-4o-mini-search-preview": {
|
1314
1329
|
"description": "GPT-4o mini предварителна версия за търсене е модел, специално обучен за разбиране и изпълнение на заявки за уеб търсене, използващ Chat Completions API. Освен таксите за токени, заявките за уеб търсене се таксуват и на всяко извикване на инструмента."
|
1315
1330
|
},
|
1331
|
+
"gpt-4o-mini-transcribe": {
|
1332
|
+
"description": "GPT-4o Mini Transcribe е модел за преобразуване на реч в текст, използващ GPT-4o за транскрибиране на аудио. В сравнение с оригиналния модел Whisper, той намалява процента на грешки в думите и подобрява разпознаването на езика и точността. Използвайте го за по-точни транскрипции."
|
1333
|
+
},
|
1316
1334
|
"gpt-4o-mini-tts": {
|
1317
1335
|
"description": "GPT-4o mini TTS е модел за преобразуване на текст в реч, базиран на GPT-4o mini, предлагащ висококачествено генериране на реч при по-ниска цена."
|
1318
1336
|
},
|
@@ -1322,12 +1340,15 @@
|
|
1322
1340
|
"gpt-4o-realtime-preview-2024-10-01": {
|
1323
1341
|
"description": "Реален вариант на GPT-4o, поддържащ вход и изход на аудио и текст в реално време."
|
1324
1342
|
},
|
1325
|
-
"gpt-4o-realtime-preview-
|
1326
|
-
"description": "
|
1343
|
+
"gpt-4o-realtime-preview-2025-06-03": {
|
1344
|
+
"description": "Реално време версия на GPT-4o, поддържаща едновременно аудио и текстов вход и изход."
|
1327
1345
|
},
|
1328
1346
|
"gpt-4o-search-preview": {
|
1329
1347
|
"description": "GPT-4o предварителна версия за търсене е модел, специално обучен за разбиране и изпълнение на заявки за уеб търсене, използващ Chat Completions API. Освен таксите за токени, заявките за уеб търсене се таксуват и на всяко извикване на инструмента."
|
1330
1348
|
},
|
1349
|
+
"gpt-4o-transcribe": {
|
1350
|
+
"description": "GPT-4o Transcribe е модел за преобразуване на реч в текст, използващ GPT-4o за транскрибиране на аудио. В сравнение с оригиналния модел Whisper, той намалява процента на грешки в думите и подобрява разпознаването на езика и точността. Използвайте го за по-точни транскрипции."
|
1351
|
+
},
|
1331
1352
|
"grok-2-1212": {
|
1332
1353
|
"description": "Този модел е подобрен по отношение на точност, спазване на инструкции и многоезични способности."
|
1333
1354
|
},
|
@@ -1460,6 +1481,9 @@
|
|
1460
1481
|
"jina-deepsearch-v1": {
|
1461
1482
|
"description": "Дълбокото търсене комбинира интернет търсене, четене и разсъждение, за да извърши обширно разследване. Можете да го разглеждате като агент, който приема вашата изследователска задача - той ще извърши широко търсене и ще премине през множество итерации, преди да предостави отговор. Този процес включва непрекъснато изследване, разсъждение и решаване на проблеми от различни ъгли. Това е коренно различно от стандартните големи модели, които генерират отговори директно от предварително обучени данни, и от традиционните RAG системи, които разчитат на еднократни повърхностни търсения."
|
1462
1483
|
},
|
1484
|
+
"kimi-k2-0711-preview": {
|
1485
|
+
"description": "kimi-k2 е базов модел с MoE архитектура с изключителни способности за кодиране и агентски функции, с общо 1 трилион параметри и 32 милиарда активни параметри. В тестове за общо знание, програмиране, математика и агентски задачи, моделът K2 превъзхожда други водещи отворени модели."
|
1486
|
+
},
|
1463
1487
|
"kimi-latest": {
|
1464
1488
|
"description": "Kimi интелигентен асистент използва най-новия Kimi голям модел, който може да съдържа нестабилни функции. Поддържа разбиране на изображения и автоматично избира 8k/32k/128k модел за таксуване в зависимост от дължината на контекста на заявката."
|
1465
1489
|
},
|
@@ -2352,7 +2376,7 @@
|
|
2352
2376
|
"description": "Моделът v0-1.5-md е подходящ за ежедневни задачи и генериране на потребителски интерфейс (UI)"
|
2353
2377
|
},
|
2354
2378
|
"whisper-1": {
|
2355
|
-
"description": "Универсален модел за разпознаване на реч, поддържащ многоезично разпознаване на реч, превод на реч и разпознаване на
|
2379
|
+
"description": "Универсален модел за разпознаване на реч, поддържащ многоезично разпознаване на реч, превод на реч и разпознаване на език."
|
2356
2380
|
},
|
2357
2381
|
"wizardlm2": {
|
2358
2382
|
"description": "WizardLM 2 е езиков модел, предоставен от Microsoft AI, който се отличава в сложни диалози, многоезичност, разсъждение и интелигентни асистенти."
|
@@ -71,44 +71,23 @@
|
|
71
71
|
"DeepSeek-V3": {
|
72
72
|
"description": "DeepSeek-V3 ist ein von der DeepSeek Company entwickeltes MoE-Modell. Die Ergebnisse von DeepSeek-V3 übertreffen die anderer Open-Source-Modelle wie Qwen2.5-72B und Llama-3.1-405B und stehen in der Leistung auf Augenhöhe mit den weltweit führenden Closed-Source-Modellen GPT-4o und Claude-3.5-Sonnet."
|
73
73
|
},
|
74
|
-
"Doubao-1.5-thinking-pro-m": {
|
75
|
-
"description": "Doubao-1.5 ist ein neues tiefes Denkmodell (m-Version mit nativer multimodaler tiefen Denkfähigkeit), das in den Fachbereichen Mathematik, Programmierung, wissenschaftlichem Denken und kreativen Schreibaufgaben herausragende Leistungen zeigt und in mehreren renommierten Benchmarks wie AIME 2024, Codeforces und GPQA die branchenführenden Standards erreicht oder nahe kommt. Es unterstützt ein Kontextfenster von 128k und 16k Ausgaben."
|
76
|
-
},
|
77
|
-
"Doubao-1.5-thinking-vision-pro": {
|
78
|
-
"description": "Ein neuartiges visuelles Tiefen-Denkmodell mit stärkeren allgemeinen multimodalen Verständnis- und Schlussfolgerungsfähigkeiten, das in 37 von 59 öffentlichen Bewertungsbenchmarks SOTA-Leistungen erzielt."
|
79
|
-
},
|
80
|
-
"Doubao-1.5-vision-pro": {
|
81
|
-
"description": "Doubao-1.5-vision-pro ist ein neu verbessertes multimodales großes Modell, das beliebige Auflösungen und extreme Seitenverhältnisse bei der Bilderkennung unterstützt und die Fähigkeiten in visueller Schlussfolgerung, Dokumentenerkennung, Detailverständnis und Befolgung von Anweisungen verbessert."
|
82
|
-
},
|
83
|
-
"Doubao-1.5-vision-pro-32k": {
|
84
|
-
"description": "Doubao-1.5-vision-pro ist das neueste Upgrade des multimodalen Großmodells, das die Erkennung von Bildern mit beliebiger Auflösung und extremen Seitenverhältnissen unterstützt und die Fähigkeiten zur visuellen Schlussfolgerung, Dokumentenerkennung, Detailverständnis und Befehlsbefolgung verbessert."
|
85
|
-
},
|
86
74
|
"Doubao-lite-128k": {
|
87
|
-
"description": "Doubao-lite bietet
|
75
|
+
"description": "Doubao-lite bietet extrem schnelle Reaktionszeiten und ein hervorragendes Preis-Leistungs-Verhältnis, um Kunden in verschiedenen Szenarien flexiblere Optionen zu bieten. Unterstützt Inferenz und Feintuning mit einem Kontextfenster von 128k."
|
88
76
|
},
|
89
77
|
"Doubao-lite-32k": {
|
90
|
-
"description": "Doubao-lite bietet
|
78
|
+
"description": "Doubao-lite bietet extrem schnelle Reaktionszeiten und ein hervorragendes Preis-Leistungs-Verhältnis, um Kunden in verschiedenen Szenarien flexiblere Optionen zu bieten. Unterstützt Inferenz und Feintuning mit einem Kontextfenster von 32k."
|
91
79
|
},
|
92
80
|
"Doubao-lite-4k": {
|
93
|
-
"description": "Doubao-lite bietet
|
81
|
+
"description": "Doubao-lite bietet extrem schnelle Reaktionszeiten und ein hervorragendes Preis-Leistungs-Verhältnis, um Kunden in verschiedenen Szenarien flexiblere Optionen zu bieten. Unterstützt Inferenz und Feintuning mit einem Kontextfenster von 4k."
|
94
82
|
},
|
95
83
|
"Doubao-pro-128k": {
|
96
|
-
"description": "Das leistungsstärkste Hauptmodell,
|
97
|
-
},
|
98
|
-
"Doubao-pro-256k": {
|
99
|
-
"description": "Das leistungsstärkste Hauptmodell, das sich gut für komplexe Aufgaben eignet und in Szenarien wie Referenzfragen, Zusammenfassungen, kreatives Schreiben, Textklassifizierung und Rollenspiel hervorragende Ergebnisse erzielt. Es unterstützt Schlussfolgerungen und Feinabstimmungen mit einem Kontextfenster von 256k."
|
84
|
+
"description": "Das leistungsstärkste Hauptmodell, geeignet für komplexe Aufgaben. Es erzielt hervorragende Ergebnisse in Szenarien wie Referenzfragen, Zusammenfassungen, kreatives Schreiben, Textklassifikation und Rollenspielen. Unterstützt Inferenz und Feintuning mit einem Kontextfenster von 128k."
|
100
85
|
},
|
101
86
|
"Doubao-pro-32k": {
|
102
|
-
"description": "Das leistungsstärkste Hauptmodell,
|
87
|
+
"description": "Das leistungsstärkste Hauptmodell, geeignet für komplexe Aufgaben. Es erzielt hervorragende Ergebnisse in Szenarien wie Referenzfragen, Zusammenfassungen, kreatives Schreiben, Textklassifikation und Rollenspielen. Unterstützt Inferenz und Feintuning mit einem Kontextfenster von 32k."
|
103
88
|
},
|
104
89
|
"Doubao-pro-4k": {
|
105
|
-
"description": "Das leistungsstärkste Hauptmodell,
|
106
|
-
},
|
107
|
-
"Doubao-vision-lite-32k": {
|
108
|
-
"description": "Das Doubao-vision-Modell ist ein multimodales Großmodell, das von Doubao eingeführt wurde und über starke Fähigkeiten zur Bildverständnis und Schlussfolgerung sowie präzise Befehlsverständnisfähigkeiten verfügt. Das Modell zeigt starke Leistungen bei der Extraktion von Bildtextinformationen und bildbasierten Schlussfolgerungsaufgaben und kann in komplexeren und breiteren visuellen Frage-Antwort-Aufgaben eingesetzt werden."
|
109
|
-
},
|
110
|
-
"Doubao-vision-pro-32k": {
|
111
|
-
"description": "Das Doubao-vision-Modell ist ein multimodales Großmodell, das von Doubao eingeführt wurde und über starke Fähigkeiten zur Bildverständnis und Schlussfolgerung sowie präzise Befehlsverständnisfähigkeiten verfügt. Das Modell zeigt starke Leistungen bei der Extraktion von Bildtextinformationen und bildbasierten Schlussfolgerungsaufgaben und kann in komplexeren und breiteren visuellen Frage-Antwort-Aufgaben eingesetzt werden."
|
90
|
+
"description": "Das leistungsstärkste Hauptmodell, geeignet für komplexe Aufgaben. Es erzielt hervorragende Ergebnisse in Szenarien wie Referenzfragen, Zusammenfassungen, kreatives Schreiben, Textklassifikation und Rollenspielen. Unterstützt Inferenz und Feintuning mit einem Kontextfenster von 4k."
|
112
91
|
},
|
113
92
|
"ERNIE-3.5-128K": {
|
114
93
|
"description": "Das von Baidu entwickelte Flaggschiff-Modell für großangelegte Sprachverarbeitung, das eine riesige Menge an chinesischen und englischen Texten abdeckt. Es verfügt über starke allgemeine Fähigkeiten und kann die meisten Anforderungen an Dialogfragen, kreative Generierung und Anwendungsfälle von Plugins erfüllen. Es unterstützt die automatische Anbindung an das Baidu-Such-Plugin, um die Aktualität der Antwortinformationen zu gewährleisten."
|
@@ -914,9 +893,39 @@
|
|
914
893
|
"doubao-1.5-thinking-pro": {
|
915
894
|
"description": "Das Doubao-1.5 Modell für tiefes Denken ist neu und zeichnet sich in Fachbereichen wie Mathematik, Programmierung und wissenschaftlichem Denken sowie in allgemeinen Aufgaben wie kreativem Schreiben aus. Es erreicht oder nähert sich in mehreren renommierten Benchmarks wie AIME 2024, Codeforces und GPQA dem Spitzenlevel der Branche. Es unterstützt ein Kontextfenster von 128k und eine Ausgabe von 16k."
|
916
895
|
},
|
896
|
+
"doubao-1.5-thinking-pro-m": {
|
897
|
+
"description": "Doubao-1.5 ist ein neues tiefgründiges Denkmodell (m-Version mit nativer multimodaler Tiefeninferenzfähigkeit), das in Fachgebieten wie Mathematik, Programmierung, wissenschaftlichem Denken sowie bei allgemeinen Aufgaben wie kreativem Schreiben herausragende Leistungen zeigt. Erreicht oder nähert sich in renommierten Benchmarks wie AIME 2024, Codeforces und GPQA der Spitzenklasse der Branche. Unterstützt ein Kontextfenster von 128k und eine Ausgabe von 16k."
|
898
|
+
},
|
899
|
+
"doubao-1.5-thinking-vision-pro": {
|
900
|
+
"description": "Neues visuelles Tiefendenkmodell mit stärkerer allgemeiner multimodaler Verständnis- und Inferenzfähigkeit, das in 37 von 59 öffentlichen Benchmark-Tests SOTA-Leistungen erzielt."
|
901
|
+
},
|
902
|
+
"doubao-1.5-ui-tars": {
|
903
|
+
"description": "Doubao-1.5-UI-TARS ist ein nativer Agentenmodell für grafische Benutzeroberflächen (GUI). Es interagiert nahtlos mit GUIs durch menschenähnliche Fähigkeiten wie Wahrnehmung, Inferenz und Handlung."
|
904
|
+
},
|
917
905
|
"doubao-1.5-vision-lite": {
|
918
906
|
"description": "Doubao-1.5-vision-lite ist ein neu verbessertes multimodales großes Modell, das beliebige Auflösungen und extreme Seitenverhältnisse bei der Bilderkennung unterstützt und die Fähigkeiten in visueller Schlussfolgerung, Dokumentenerkennung, Detailverständnis und Befolgung von Anweisungen verbessert. Es unterstützt ein Kontextfenster von 128k und eine maximale Ausgabelänge von 16k Tokens."
|
919
907
|
},
|
908
|
+
"doubao-1.5-vision-pro": {
|
909
|
+
"description": "Doubao-1.5-vision-pro ist ein neu aufgerüstetes multimodales Großmodell, das Bilderkennung in beliebiger Auflösung und extremen Seitenverhältnissen unterstützt und die Fähigkeiten in visueller Inferenz, Dokumentenerkennung, Detailverständnis und Befolgung von Anweisungen verbessert."
|
910
|
+
},
|
911
|
+
"doubao-1.5-vision-pro-32k": {
|
912
|
+
"description": "Doubao-1.5-vision-pro ist ein neu aufgerüstetes multimodales Großmodell, das Bilderkennung in beliebiger Auflösung und extremen Seitenverhältnissen unterstützt und die Fähigkeiten in visueller Inferenz, Dokumentenerkennung, Detailverständnis und Befolgung von Anweisungen verbessert."
|
913
|
+
},
|
914
|
+
"doubao-lite-128k": {
|
915
|
+
"description": "Bietet extrem schnelle Reaktionszeiten und ein hervorragendes Preis-Leistungs-Verhältnis, um Kunden in verschiedenen Szenarien flexiblere Optionen zu bieten. Unterstützt Inferenz und Feintuning mit einem Kontextfenster von 128k."
|
916
|
+
},
|
917
|
+
"doubao-lite-32k": {
|
918
|
+
"description": "Bietet extrem schnelle Reaktionszeiten und ein hervorragendes Preis-Leistungs-Verhältnis, um Kunden in verschiedenen Szenarien flexiblere Optionen zu bieten. Unterstützt Inferenz und Feintuning mit einem Kontextfenster von 32k."
|
919
|
+
},
|
920
|
+
"doubao-lite-4k": {
|
921
|
+
"description": "Bietet extrem schnelle Reaktionszeiten und ein hervorragendes Preis-Leistungs-Verhältnis, um Kunden in verschiedenen Szenarien flexiblere Optionen zu bieten. Unterstützt Inferenz und Feintuning mit einem Kontextfenster von 4k."
|
922
|
+
},
|
923
|
+
"doubao-pro-256k": {
|
924
|
+
"description": "Das leistungsstärkste Hauptmodell, geeignet für komplexe Aufgaben. Es erzielt hervorragende Ergebnisse in Szenarien wie Referenzfragen, Zusammenfassungen, kreatives Schreiben, Textklassifikation und Rollenspielen. Unterstützt Inferenz und Feintuning mit einem Kontextfenster von 256k."
|
925
|
+
},
|
926
|
+
"doubao-pro-32k": {
|
927
|
+
"description": "Das leistungsstärkste Hauptmodell, geeignet für komplexe Aufgaben. Es erzielt hervorragende Ergebnisse in Szenarien wie Referenzfragen, Zusammenfassungen, kreatives Schreiben, Textklassifikation und Rollenspielen. Unterstützt Inferenz und Feintuning mit einem Kontextfenster von 32k."
|
928
|
+
},
|
920
929
|
"doubao-seed-1.6": {
|
921
930
|
"description": "Doubao-Seed-1.6 ist ein neues multimodales Modell für tiefgehendes Denken, das drei Denkmodi unterstützt: auto, thinking und non-thinking. Im non-thinking-Modus ist die Modellleistung im Vergleich zu Doubao-1.5-pro/250115 deutlich verbessert. Unterstützt ein Kontextfenster von 256k und eine maximale Ausgabelänge von 16k Tokens."
|
922
931
|
},
|
@@ -926,6 +935,12 @@
|
|
926
935
|
"doubao-seed-1.6-thinking": {
|
927
936
|
"description": "Das Doubao-Seed-1.6-thinking Modell verfügt über stark verbesserte Denkfähigkeiten. Im Vergleich zu Doubao-1.5-thinking-pro wurden die Grundfähigkeiten in Coding, Mathematik und logischem Denken weiter verbessert und unterstützt visuelles Verständnis. Unterstützt ein Kontextfenster von 256k und eine maximale Ausgabelänge von 16k Tokens."
|
928
937
|
},
|
938
|
+
"doubao-vision-lite-32k": {
|
939
|
+
"description": "Das Doubao-vision-Modell ist ein multimodales Großmodell von Doubao mit starker Bildverständnis- und Inferenzfähigkeit sowie präziser Befehlsinterpretation. Es zeigt starke Leistung bei der Extraktion von Bild- und Textinformationen sowie bei bildbasierten Inferenzaufgaben und eignet sich für komplexere und umfassendere visuelle Frage-Antwort-Aufgaben."
|
940
|
+
},
|
941
|
+
"doubao-vision-pro-32k": {
|
942
|
+
"description": "Das Doubao-vision-Modell ist ein multimodales Großmodell von Doubao mit starker Bildverständnis- und Inferenzfähigkeit sowie präziser Befehlsinterpretation. Es zeigt starke Leistung bei der Extraktion von Bild- und Textinformationen sowie bei bildbasierten Inferenzaufgaben und eignet sich für komplexere und umfassendere visuelle Frage-Antwort-Aufgaben."
|
943
|
+
},
|
929
944
|
"emohaa": {
|
930
945
|
"description": "Emohaa ist ein psychologisches Modell mit professionellen Beratungsfähigkeiten, das den Nutzern hilft, emotionale Probleme zu verstehen."
|
931
946
|
},
|
@@ -1313,6 +1328,9 @@
|
|
1313
1328
|
"gpt-4o-mini-search-preview": {
|
1314
1329
|
"description": "Die GPT-4o mini Suchvorschau ist ein speziell trainiertes Modell zur Interpretation und Ausführung von Websuchanfragen, das die Chat Completions API verwendet. Neben den Token-Gebühren fallen für Websuchanfragen zusätzliche Gebühren pro Tool-Aufruf an."
|
1315
1330
|
},
|
1331
|
+
"gpt-4o-mini-transcribe": {
|
1332
|
+
"description": "GPT-4o Mini Transcribe ist ein Sprach-zu-Text-Modell, das GPT-4o zur Transkription von Audio verwendet. Im Vergleich zum ursprünglichen Whisper-Modell verbessert es die Wortfehlerrate sowie die Spracherkennung und Genauigkeit. Verwenden Sie es für genauere Transkriptionen."
|
1333
|
+
},
|
1316
1334
|
"gpt-4o-mini-tts": {
|
1317
1335
|
"description": "GPT-4o mini TTS ist ein Text-to-Speech-Modell, das auf GPT-4o mini basiert und hochwertige Sprachgenerierung bei niedrigeren Kosten bietet."
|
1318
1336
|
},
|
@@ -1322,12 +1340,15 @@
|
|
1322
1340
|
"gpt-4o-realtime-preview-2024-10-01": {
|
1323
1341
|
"description": "Echtzeitversion von GPT-4o, unterstützt Audio- und Texteingabe sowie -ausgabe in Echtzeit."
|
1324
1342
|
},
|
1325
|
-
"gpt-4o-realtime-preview-
|
1326
|
-
"description": "Echtzeitversion von GPT-4o, unterstützt
|
1343
|
+
"gpt-4o-realtime-preview-2025-06-03": {
|
1344
|
+
"description": "Echtzeitversion von GPT-4o, unterstützt Echtzeit-Ein- und Ausgabe von Audio und Text."
|
1327
1345
|
},
|
1328
1346
|
"gpt-4o-search-preview": {
|
1329
1347
|
"description": "Die GPT-4o Suchvorschau ist ein speziell trainiertes Modell zur Interpretation und Ausführung von Websuchanfragen, das die Chat Completions API verwendet. Neben den Token-Gebühren fallen für Websuchanfragen zusätzliche Gebühren pro Tool-Aufruf an."
|
1330
1348
|
},
|
1349
|
+
"gpt-4o-transcribe": {
|
1350
|
+
"description": "GPT-4o Transcribe ist ein Sprach-zu-Text-Modell, das GPT-4o zur Transkription von Audio verwendet. Im Vergleich zum ursprünglichen Whisper-Modell verbessert es die Wortfehlerrate sowie die Spracherkennung und Genauigkeit. Verwenden Sie es für genauere Transkriptionen."
|
1351
|
+
},
|
1331
1352
|
"grok-2-1212": {
|
1332
1353
|
"description": "Dieses Modell hat Verbesserungen in Bezug auf Genauigkeit, Befolgung von Anweisungen und Mehrsprachigkeit erfahren."
|
1333
1354
|
},
|
@@ -1460,6 +1481,9 @@
|
|
1460
1481
|
"jina-deepsearch-v1": {
|
1461
1482
|
"description": "Die Tiefensuche kombiniert Websuche, Lesen und Schlussfolgern und ermöglicht umfassende Untersuchungen. Sie können es als einen Agenten betrachten, der Ihre Forschungsaufgaben übernimmt – er führt eine umfassende Suche durch und iteriert mehrfach, bevor er eine Antwort gibt. Dieser Prozess umfasst kontinuierliche Forschung, Schlussfolgerungen und die Lösung von Problemen aus verschiedenen Perspektiven. Dies unterscheidet sich grundlegend von den Standard-Großmodellen, die Antworten direkt aus vortrainierten Daten generieren, sowie von traditionellen RAG-Systemen, die auf einmaligen Oberflächensuchen basieren."
|
1462
1483
|
},
|
1484
|
+
"kimi-k2-0711-preview": {
|
1485
|
+
"description": "kimi-k2 ist ein MoE-Architektur-Basis-Modell mit außergewöhnlichen Fähigkeiten in Code und Agentenfunktionen, mit insgesamt 1 Billion Parametern und 32 Milliarden aktiven Parametern. In Benchmark-Tests zu allgemeinem Wissen, Programmierung, Mathematik und Agenten übertrifft das K2-Modell andere führende Open-Source-Modelle."
|
1486
|
+
},
|
1463
1487
|
"kimi-latest": {
|
1464
1488
|
"description": "Das Kimi intelligente Assistenzprodukt verwendet das neueste Kimi Großmodell, das möglicherweise noch instabile Funktionen enthält. Es unterstützt die Bildverarbeitung und wählt automatisch das Abrechnungsmodell 8k/32k/128k basierend auf der Länge des angeforderten Kontexts aus."
|
1465
1489
|
},
|
@@ -2352,7 +2376,7 @@
|
|
2352
2376
|
"description": "Das Modell v0-1.5-md ist für alltägliche Aufgaben und die Generierung von Benutzeroberflächen (UI) geeignet"
|
2353
2377
|
},
|
2354
2378
|
"whisper-1": {
|
2355
|
-
"description": "
|
2379
|
+
"description": "Universelles Spracherkennungsmodell, unterstützt mehrsprachige Spracherkennung, Sprachübersetzung und Spracherkennung."
|
2356
2380
|
},
|
2357
2381
|
"wizardlm2": {
|
2358
2382
|
"description": "WizardLM 2 ist ein Sprachmodell von Microsoft AI, das in komplexen Dialogen, mehrsprachigen Anwendungen, Schlussfolgerungen und intelligenten Assistenten besonders gut abschneidet."
|