@lobehub/chat 1.36.8 → 1.36.10
This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.
- package/CHANGELOG.md +58 -0
- package/changelog/v1.json +21 -0
- package/locales/ar/models.json +81 -3
- package/locales/ar/providers.json +3 -0
- package/locales/bg-BG/models.json +81 -3
- package/locales/bg-BG/providers.json +3 -0
- package/locales/de-DE/models.json +81 -3
- package/locales/de-DE/providers.json +3 -0
- package/locales/en-US/models.json +81 -3
- package/locales/en-US/providers.json +3 -0
- package/locales/es-ES/models.json +81 -3
- package/locales/es-ES/providers.json +3 -0
- package/locales/fa-IR/models.json +81 -3
- package/locales/fa-IR/providers.json +3 -0
- package/locales/fr-FR/models.json +81 -3
- package/locales/fr-FR/providers.json +3 -0
- package/locales/it-IT/models.json +81 -3
- package/locales/it-IT/providers.json +3 -0
- package/locales/ja-JP/models.json +81 -3
- package/locales/ja-JP/providers.json +3 -0
- package/locales/ko-KR/models.json +81 -3
- package/locales/ko-KR/providers.json +3 -0
- package/locales/nl-NL/models.json +81 -3
- package/locales/nl-NL/providers.json +3 -0
- package/locales/pl-PL/modelProvider.json +9 -9
- package/locales/pl-PL/models.json +81 -3
- package/locales/pl-PL/providers.json +3 -0
- package/locales/pt-BR/models.json +81 -3
- package/locales/pt-BR/providers.json +3 -0
- package/locales/ru-RU/models.json +81 -3
- package/locales/ru-RU/providers.json +3 -0
- package/locales/tr-TR/models.json +81 -3
- package/locales/tr-TR/providers.json +3 -0
- package/locales/vi-VN/models.json +81 -3
- package/locales/vi-VN/providers.json +3 -0
- package/locales/zh-CN/models.json +91 -13
- package/locales/zh-CN/providers.json +3 -0
- package/locales/zh-TW/models.json +81 -3
- package/locales/zh-TW/providers.json +3 -0
- package/package.json +1 -1
- package/src/app/(backend)/api/webhooks/clerk/route.ts +18 -3
- package/src/config/modelProviders/azure.ts +0 -8
- package/src/config/modelProviders/higress.ts +0 -23
- package/src/config/modelProviders/openai.ts +0 -23
- package/src/database/server/models/__tests__/nextauth.test.ts +33 -0
- package/src/libs/agent-runtime/openai/__snapshots__/index.test.ts.snap +3 -13
- package/src/libs/next-auth/adapter/index.ts +8 -2
- package/src/server/routers/edge/config/__snapshots__/index.test.ts.snap +2 -9
- package/src/server/routers/edge/config/index.test.ts +1 -1
- package/src/server/services/user/index.test.ts +200 -0
- package/src/server/services/user/index.ts +24 -32
- package/src/store/chat/slices/aiChat/actions/generateAIChat.ts +0 -10
- package/vitest.config.ts +1 -1
@@ -55,6 +55,24 @@
|
|
55
55
|
"Baichuan4-Turbo": {
|
56
56
|
"description": "Модель обладает лучшими в стране возможностями, превосходя зарубежные модели в задачах на китайском языке, таких как энциклопедические знания, длинные тексты и генерация контента. Также обладает передовыми мультимодальными возможностями и демонстрирует отличные результаты в нескольких авторитетных оценочных тестах."
|
57
57
|
},
|
58
|
+
"Doubao-lite-128k": {
|
59
|
+
"description": "Doubao-lite обеспечивает выдающуюся скорость отклика и лучшее соотношение цены и качества, предлагая клиентам больше гибкости в различных сценариях. Поддерживает вывод и настройку с 128k контекстным окном."
|
60
|
+
},
|
61
|
+
"Doubao-lite-32k": {
|
62
|
+
"description": "Doubao-lite обеспечивает выдающуюся скорость отклика и лучшее соотношение цены и качества, предлагая клиентам больше гибкости в различных сценариях. Поддерживает вывод и настройку с 32k контекстным окном."
|
63
|
+
},
|
64
|
+
"Doubao-lite-4k": {
|
65
|
+
"description": "Doubao-lite обеспечивает выдающуюся скорость отклика и лучшее соотношение цены и качества, предлагая клиентам больше гибкости в различных сценариях. Поддерживает вывод и настройку с 4k контекстным окном."
|
66
|
+
},
|
67
|
+
"Doubao-pro-128k": {
|
68
|
+
"description": "Модель основных характеристик с лучшими показателями, подходит для обработки сложных задач. Хорошо справляется с задачами референсного ответа, резюмирования, творчества, классификации текста, ролевого взаимодействия и т.д. Поддерживает вывод и настройку с 128k контекстным окном."
|
69
|
+
},
|
70
|
+
"Doubao-pro-32k": {
|
71
|
+
"description": "Модель основных характеристик с лучшими показателями, подходит для обработки сложных задач. Хорошо справляется с задачами референсного ответа, резюмирования, творчества, классификации текста, ролевого взаимодействия и т.д. Поддерживает вывод и настройку с 32k контекстным окном."
|
72
|
+
},
|
73
|
+
"Doubao-pro-4k": {
|
74
|
+
"description": "Модель основных характеристик с лучшими показателями, подходит для обработки сложных задач. Хорошо справляется с задачами референсного ответа, резюмирования, творчества, классификации текста, ролевого взаимодействия и т.д. Поддерживает вывод и настройку с 4k контекстным окном."
|
75
|
+
},
|
58
76
|
"ERNIE-3.5-128K": {
|
59
77
|
"description": "Флагманская крупномасштабная языковая модель, разработанная Baidu, охватывающая огромные объемы китайских и английских текстов, обладающая мощными универсальными возможностями, способная удовлетворить большинство требований к диалоговым ответам, генерации контента и сценариям использования плагинов; поддерживает автоматическую интеграцию с плагином поиска Baidu, обеспечивая актуальность информации в ответах."
|
60
78
|
},
|
@@ -242,6 +260,21 @@
|
|
242
260
|
"SenseChat-Turbo": {
|
243
261
|
"description": "Подходит для быстрого ответа на вопросы и сценариев тонкой настройки модели."
|
244
262
|
},
|
263
|
+
"Skylark2-lite-8k": {
|
264
|
+
"description": "Модель второго поколения Skylark (云雀), модель Skylark2-lite имеет высокую скорость отклика, подходит для сценариев с высокими требованиями к оперативности, чувствительных к стоимости и с не такими высокими требованиями к точности модели. Длина контекстного окна составляет 8k."
|
265
|
+
},
|
266
|
+
"Skylark2-pro-32k": {
|
267
|
+
"description": "Модель второго поколения Skylark (云雀), версия Skylark2-pro имеет высокую точность модели, подходит для более сложных сценариев генерации текста, таких как написание специализированной документации, создание романов, высококачественный перевод и т.д. Длина контекстного окна составляет 32k."
|
268
|
+
},
|
269
|
+
"Skylark2-pro-4k": {
|
270
|
+
"description": "Модель второго поколения Skylark (云雀), модель Skylark2-pro имеет высокую точность, подходит для более сложных сценариев генерации текста, таких как специализированная документация, создание романов, высококачественный перевод и т.д. Длина контекстного окна составляет 4k."
|
271
|
+
},
|
272
|
+
"Skylark2-pro-character-4k": {
|
273
|
+
"description": "Модель второго поколения Skylark (云雀), модель Skylark2-pro-character демонстрирует выдающиеся способности к ролевым взаимодействиям и чатам, умеет играть различные роли в зависимости от требований пользователя, что делает общение естественным и плавным. Подходит для разработки чат-ботов, виртуальных помощников и онлайн-сервисов с высокой скоростью отклика."
|
274
|
+
},
|
275
|
+
"Skylark2-pro-turbo-8k": {
|
276
|
+
"description": "Модель второго поколения Skylark (云雀), модель Skylark2-pro-turbo-8k обеспечивает более быструю обработку и сниженные затраты, длина контекстного окна составляет 8k."
|
277
|
+
},
|
245
278
|
"THUDM/chatglm3-6b": {
|
246
279
|
"description": "ChatGLM3-6B — это открытая модель из серии ChatGLM, разработанная Zhizhu AI. Эта модель сохраняет отличные характеристики предыдущих моделей, такие как плавность диалога и низкий порог развертывания, одновременно вводя новые функции. Она использует более разнообразные обучающие данные, большее количество шагов обучения и более разумную стратегию обучения, показывая отличные результаты среди предобученных моделей объемом менее 10B. ChatGLM3-6B поддерживает многократные диалоги, вызовы инструментов, выполнение кода и задачи агента в сложных сценариях. Кроме диалоговой модели, также открыты базовая модель ChatGLM-6B-Base и модель для длинных текстовых диалогов ChatGLM3-6B-32K. Эта модель полностью открыта для академических исследований и также допускает бесплатное коммерческое использование после регистрации."
|
247
280
|
},
|
@@ -476,6 +509,9 @@
|
|
476
509
|
"cohere-command-r-plus": {
|
477
510
|
"description": "Command R+ — это модель, оптимизированная для RAG, предназначенная для решения задач корпоративного уровня."
|
478
511
|
},
|
512
|
+
"command-light": {
|
513
|
+
"description": ""
|
514
|
+
},
|
479
515
|
"command-r": {
|
480
516
|
"description": "Command R — это LLM, оптимизированная для диалогов и задач с длинным контекстом, особенно подходит для динамического взаимодействия и управления знаниями."
|
481
517
|
},
|
@@ -539,6 +575,9 @@
|
|
539
575
|
"gemini-1.5-flash-8b-exp-0924": {
|
540
576
|
"description": "Gemini 1.5 Flash 8B 0924 — это последняя экспериментальная модель, которая демонстрирует значительное улучшение производительности как в текстовых, так и в мультимодальных задачах."
|
541
577
|
},
|
578
|
+
"gemini-1.5-flash-exp-0827": {
|
579
|
+
"description": "Gemini 1.5 Flash 0827 предлагает оптимизированные многомодальные возможности обработки, подходящие для различных сложных задач."
|
580
|
+
},
|
542
581
|
"gemini-1.5-flash-latest": {
|
543
582
|
"description": "Gemini 1.5 Flash — это последняя многомодальная модель ИИ от Google, обладающая высокой скоростью обработки и поддерживающая текстовые, графические и видео входы, что делает её эффективной для масштабирования различных задач."
|
544
583
|
},
|
@@ -548,6 +587,12 @@
|
|
548
587
|
"gemini-1.5-pro-002": {
|
549
588
|
"description": "Gemini 1.5 Pro 002 — это последняя модель, готовая к производству, которая обеспечивает более высокое качество вывода, особенно в математических задачах, длинных контекстах и визуальных задачах."
|
550
589
|
},
|
590
|
+
"gemini-1.5-pro-exp-0801": {
|
591
|
+
"description": "Gemini 1.5 Pro 0801 предлагает выдающиеся многомодальные возможности обработки, обеспечивая большую гибкость в разработке приложений."
|
592
|
+
},
|
593
|
+
"gemini-1.5-pro-exp-0827": {
|
594
|
+
"description": "Gemini 1.5 Pro 0827 сочетает последние технологии оптимизации, обеспечивая более эффективную обработку многомодальных данных."
|
595
|
+
},
|
551
596
|
"gemini-1.5-pro-latest": {
|
552
597
|
"description": "Gemini 1.5 Pro поддерживает до 2 миллионов токенов и является идеальным выбором для средних многомодальных моделей, обеспечивая многостороннюю поддержку для сложных задач."
|
553
598
|
},
|
@@ -557,6 +602,9 @@
|
|
557
602
|
"gemini-exp-1121": {
|
558
603
|
"description": "Gemini Exp 1121 — это последняя экспериментальная многомодальная AI модель от Google, обладающая высокой скоростью обработки, поддерживающая текстовые, графические и видеовходы, что делает её эффективной для масштабирования различных задач."
|
559
604
|
},
|
605
|
+
"gemini-exp-1206": {
|
606
|
+
"description": "Gemini Exp 1206 — это новейшая экспериментальная многомодальная AI модель от Google, которая продемонстрировала определенное улучшение качества по сравнению с предыдущими версиями."
|
607
|
+
},
|
560
608
|
"gemma-7b-it": {
|
561
609
|
"description": "Gemma 7B подходит для обработки задач среднего и малого масштаба, обеспечивая экономическую эффективность."
|
562
610
|
},
|
@@ -611,6 +659,9 @@
|
|
611
659
|
"glm-4v": {
|
612
660
|
"description": "GLM-4V предлагает мощные способности понимания и вывода изображений, поддерживает множество визуальных задач."
|
613
661
|
},
|
662
|
+
"glm-4v-flash": {
|
663
|
+
"description": "GLM-4V-Flash сосредоточен на эффективном понимании одного изображения, подходит для сценариев быстрого анализа изображений, таких как анализ изображений в реальном времени или пакетная обработка изображений."
|
664
|
+
},
|
614
665
|
"glm-4v-plus": {
|
615
666
|
"description": "GLM-4V-Plus обладает способностью понимать видео-контент и множество изображений, подходит для мультимодальных задач."
|
616
667
|
},
|
@@ -647,6 +698,12 @@
|
|
647
698
|
"gpt-3.5-turbo-instruct": {
|
648
699
|
"description": "GPT 3.5 Turbo подходит для различных задач генерации и понимания текста, в настоящее время ссылается на gpt-3.5-turbo-0125."
|
649
700
|
},
|
701
|
+
"gpt-35-turbo": {
|
702
|
+
"description": "GPT 3.5 Turbo — это эффективная модель от OpenAI, предназначенная для задач чата и генерации текста, поддерживающая параллельные вызовы функций."
|
703
|
+
},
|
704
|
+
"gpt-35-turbo-16k": {
|
705
|
+
"description": "GPT 3.5 Turbo 16k — модель для генерации текста с высокой ёмкостью, подходящая для сложных задач."
|
706
|
+
},
|
650
707
|
"gpt-4": {
|
651
708
|
"description": "GPT-4 предлагает более широкий контекстный диапазон, способный обрабатывать более длинные текстовые вводы, подходя для сценариев, требующих обширной интеграции информации и анализа данных."
|
652
709
|
},
|
@@ -659,9 +716,6 @@
|
|
659
716
|
"gpt-4-1106-preview": {
|
660
717
|
"description": "Последняя модель GPT-4 Turbo обладает визуальными функциями. Теперь визуальные запросы могут использовать JSON-формат и вызовы функций. GPT-4 Turbo — это улучшенная версия, обеспечивающая экономически эффективную поддержку для мультимодальных задач. Она находит баланс между точностью и эффективностью, подходя для приложений, требующих взаимодействия в реальном времени."
|
661
718
|
},
|
662
|
-
"gpt-4-1106-vision-preview": {
|
663
|
-
"description": "Последняя модель GPT-4 Turbo обладает визуальными функциями. Теперь визуальные запросы могут использовать JSON-формат и вызовы функций. GPT-4 Turbo — это улучшенная версия, обеспечивающая экономически эффективную поддержку для мультимодальных задач. Она находит баланс между точностью и эффективностью, подходя для приложений, требующих взаимодействия в реальном времени."
|
664
|
-
},
|
665
719
|
"gpt-4-32k": {
|
666
720
|
"description": "GPT-4 предлагает более широкий контекстный диапазон, способный обрабатывать более длинные текстовые вводы, подходя для сценариев, требующих обширной интеграции информации и анализа данных."
|
667
721
|
},
|
@@ -689,6 +743,9 @@
|
|
689
743
|
"gpt-4o-2024-08-06": {
|
690
744
|
"description": "ChatGPT-4o — это динамическая модель, которая обновляется в реальном времени, чтобы оставаться актуальной. Она сочетает в себе мощное понимание языка и генерацию, подходя для масштабных приложений, включая обслуживание клиентов, образование и техническую поддержку."
|
691
745
|
},
|
746
|
+
"gpt-4o-2024-11-20": {
|
747
|
+
"description": "ChatGPT-4o — это динамическая модель, которая обновляется в реальном времени для поддержания актуальной версии. Она сочетает в себе мощное понимание языка и генерацию текста, подходя для широкого спектра приложений, включая обслуживание клиентов, образование и техническую поддержку."
|
748
|
+
},
|
692
749
|
"gpt-4o-mini": {
|
693
750
|
"description": "GPT-4o mini — это последняя модель, выпущенная OpenAI после GPT-4 Omni, поддерживающая ввод изображений и текстов с выводом текста. Как их самый продвинутый компактный модель, она значительно дешевле других недавних передовых моделей и более чем на 60% дешевле GPT-3.5 Turbo. Она сохраняет передовой уровень интеллекта при значительном соотношении цена-качество. GPT-4o mini набрала 82% на тесте MMLU и в настоящее время занимает более высокое место в предпочтениях чата по сравнению с GPT-4."
|
694
751
|
},
|
@@ -707,6 +764,9 @@
|
|
707
764
|
"hunyuan-functioncall": {
|
708
765
|
"description": "Последняя модель Hunyuan с архитектурой MOE FunctionCall, обученная на высококачественных данных FunctionCall, с контекстным окном до 32K, занимает лидирующие позиции по множеству оценочных показателей."
|
709
766
|
},
|
767
|
+
"hunyuan-large": {
|
768
|
+
"description": ""
|
769
|
+
},
|
710
770
|
"hunyuan-lite": {
|
711
771
|
"description": "Обновленная версия с MOE-структурой, контекстное окно составляет 256k, она опережает множество открытых моделей в оценках по NLP, коду, математике и другим областям."
|
712
772
|
},
|
@@ -787,6 +847,9 @@
|
|
787
847
|
"llama-3.2-90b-vision-preview": {
|
788
848
|
"description": "Llama 3.2 предназначена для обработки задач, сочетающих визуальные и текстовые данные. Она демонстрирует отличные результаты в задачах описания изображений и визуального вопросно-ответного взаимодействия, преодолевая разрыв между генерацией языка и визуальным выводом."
|
789
849
|
},
|
850
|
+
"llama-3.3-70b-versatile": {
|
851
|
+
"description": "Многоязычная большая языковая модель Meta Llama 3.3 (LLM) — это предобученная и откорректированная модель генерации на 70B (текстовый ввод/текстовый вывод). Откорректированная на чистом тексте модель Llama 3.3 оптимизирована для многоязычных диалоговых задач и превосходит многие доступные открытые и закрытые модели чата по общим промышленным стандартам."
|
852
|
+
},
|
790
853
|
"llama3-70b-8192": {
|
791
854
|
"description": "Meta Llama 3 70B предлагает непревзойдённые возможности обработки сложности, специально разработанные для высоких требований проектов."
|
792
855
|
},
|
@@ -1094,12 +1157,21 @@
|
|
1094
1157
|
"qwen-math-turbo-latest": {
|
1095
1158
|
"description": "Математическая модель Tongyi Qwen, специально разработанная для решения математических задач."
|
1096
1159
|
},
|
1160
|
+
"qwen-max": {
|
1161
|
+
"description": "Qwen-Max — это языковая модель масштаба триллиона, поддерживающая входные данные на различных языках, включая китайский и английский. В настоящее время это API, которое стоит за продуктовой версией Qwen 2.5."
|
1162
|
+
},
|
1097
1163
|
"qwen-max-latest": {
|
1098
1164
|
"description": "Модель языка Tongyi Qwen с уровнем масштабирования в триллионы, поддерживающая ввод на различных языках, включая китайский и английский, является API моделью, лежащей в основе продукта Tongyi Qwen 2.5."
|
1099
1165
|
},
|
1166
|
+
"qwen-plus": {
|
1167
|
+
"description": "Улучшенная версия Qwen-Turbo, поддерживающая входные данные на разных языках, включая китайский и английский."
|
1168
|
+
},
|
1100
1169
|
"qwen-plus-latest": {
|
1101
1170
|
"description": "Улучшенная версия модели языка Tongyi Qwen, поддерживающая ввод на различных языках, включая китайский и английский."
|
1102
1171
|
},
|
1172
|
+
"qwen-turbo": {
|
1173
|
+
"description": "Qwen-Turbo — это крупная языковая модель, поддерживающая входные данные на разных языках, включая китайский и английский."
|
1174
|
+
},
|
1103
1175
|
"qwen-turbo-latest": {
|
1104
1176
|
"description": "Модель языка Tongyi Qwen, поддерживающая ввод на различных языках, включая китайский и английский."
|
1105
1177
|
},
|
@@ -1136,12 +1208,18 @@
|
|
1136
1208
|
"qwen2.5-7b-instruct": {
|
1137
1209
|
"description": "Модель Tongyi Qwen 2.5 с открытым исходным кодом объемом 7B."
|
1138
1210
|
},
|
1211
|
+
"qwen2.5-coder-1.5b-instruct": {
|
1212
|
+
"description": "Открытая версия модели кода Qwen."
|
1213
|
+
},
|
1139
1214
|
"qwen2.5-coder-32b-instruct": {
|
1140
1215
|
"description": "Открытая версия модели кода Tongyi Qianwen."
|
1141
1216
|
},
|
1142
1217
|
"qwen2.5-coder-7b-instruct": {
|
1143
1218
|
"description": "Открытая версия модели кода Tongyi Qwen."
|
1144
1219
|
},
|
1220
|
+
"qwen2.5-math-1.5b-instruct": {
|
1221
|
+
"description": "Модель Qwen-Math обладает выдающимися способностями к решению математических задач."
|
1222
|
+
},
|
1145
1223
|
"qwen2.5-math-72b-instruct": {
|
1146
1224
|
"description": "Модель Qwen-Math с мощными способностями решения математических задач."
|
1147
1225
|
},
|
@@ -34,6 +34,9 @@
|
|
34
34
|
"groq": {
|
35
35
|
"description": "Инженерный движок LPU от Groq показал выдающиеся результаты в последних независимых бенчмарках больших языковых моделей (LLM), переопределяя стандарты AI-решений благодаря своей удивительной скорости и эффективности. Groq представляет собой образец мгновенной скорости вывода, демонстрируя хорошие результаты в облачных развертываниях."
|
36
36
|
},
|
37
|
+
"higress": {
|
38
|
+
"description": ""
|
39
|
+
},
|
37
40
|
"huggingface": {
|
38
41
|
"description": "API для инференса HuggingFace предоставляет быстрый и бесплатный способ исследовать тысячи моделей для различных задач. Независимо от того, разрабатываете ли вы прототип для нового приложения или пробуете возможности машинного обучения, этот API обеспечивает мгновенный доступ к высокопроизводительным моделям в различных областях."
|
39
42
|
},
|
@@ -55,6 +55,24 @@
|
|
55
55
|
"Baichuan4-Turbo": {
|
56
56
|
"description": "Model yetenekleri ülke içinde birinci, bilgi ansiklopedisi, uzun metinler, yaratıcı üretim gibi Çince görevlerde uluslararası ana akım modelleri aşmaktadır. Ayrıca, sektörde lider çok modlu yeteneklere sahip olup, birçok yetkili değerlendirme ölçütünde mükemmel performans sergilemektedir."
|
57
57
|
},
|
58
|
+
"Doubao-lite-128k": {
|
59
|
+
"description": "Doubao-lite, mükemmel yanıt hızı ve daha iyi maliyet Performansı ile müşterilere farklı senaryolar için daha esnek seçenekler sunar. 128k bağlam penceresi çıkarım ve ince ayar destekler."
|
60
|
+
},
|
61
|
+
"Doubao-lite-32k": {
|
62
|
+
"description": "Doubao-lite, mükemmel yanıt hızı ve daha iyi maliyet Performansı ile müşterilere farklı senaryolar için daha esnek seçenekler sunar. 32k bağlam penceresi çıkarım ve ince ayar destekler."
|
63
|
+
},
|
64
|
+
"Doubao-lite-4k": {
|
65
|
+
"description": "Doubao-lite, mükemmel yanıt hızı ve daha iyi maliyet Performansı ile müşterilere farklı senaryolar için daha esnek seçenekler sunar. 4k bağlam penceresi çıkarım ve ince ayar destekler."
|
66
|
+
},
|
67
|
+
"Doubao-pro-128k": {
|
68
|
+
"description": "En iyi performans gösteren ana model, karmaşık görevleri işlemek için uygundur; referanslı soru-cevap, özetleme, yaratım, metin sınıflandırma, rol yapma gibi senaryolar için iyi sonuçlar verir. 128k bağlam penceresi çıkarım ve ince ayar destekler."
|
69
|
+
},
|
70
|
+
"Doubao-pro-32k": {
|
71
|
+
"description": "En iyi performans gösteren ana model, karmaşık görevleri işlemek için uygundur; referanslı soru-cevap, özetleme, yaratım, metin sınıflandırma, rol yapma gibi senaryolar için iyi sonuçlar verir. 32k bağlam penceresi çıkarım ve ince ayar destekler."
|
72
|
+
},
|
73
|
+
"Doubao-pro-4k": {
|
74
|
+
"description": "En iyi performans gösteren ana model, karmaşık görevleri işlemek için uygundur; referanslı soru-cevap, özetleme, yaratım, metin sınıflandırma, rol yapma gibi senaryolar için iyi sonuçlar verir. 4k bağlam penceresi çıkarım ve ince ayar destekler."
|
75
|
+
},
|
58
76
|
"ERNIE-3.5-128K": {
|
59
77
|
"description": "Baidu'nun kendi geliştirdiği, büyük ölçekli bir dil modeli olan ERNIE-3.5, geniş bir Çin ve İngilizce veri kümesini kapsar. Güçlü genel yeteneklere sahip olup, çoğu diyalog, soru-cevap, yaratıcı içerik üretimi ve eklenti uygulama senaryolarını karşılayabilir; ayrıca, Baidu arama eklentisi ile otomatik entegrasyonu destekleyerek, soru-cevap bilgilerinin güncelliğini sağlar."
|
60
78
|
},
|
@@ -242,6 +260,21 @@
|
|
242
260
|
"SenseChat-Turbo": {
|
243
261
|
"description": "Hızlı soru-cevap ve model ince ayar senaryoları için uygundur."
|
244
262
|
},
|
263
|
+
"Skylark2-lite-8k": {
|
264
|
+
"description": "Skylark'in (Bulut Şarkıcısı) ikinci nesil modeli, Skylark2-lite modeli yüksek yanıt hızı ile donatılmıştır; gerçek zamanlı talep gereksinimleri yüksek, maliyet duyarlı ve model hassasiyetine daha az ihtiyaç duyulan senaryolar için uygundur; bağlam pencere uzunluğu 8k'dır."
|
265
|
+
},
|
266
|
+
"Skylark2-pro-32k": {
|
267
|
+
"description": "Skylark'in (Bulut Şarkıcısı) ikinci nesil modeli, Skylark2-pro sürümüyle yüksek model hassasiyetine sahiptir; profesyonel alan metin üretimi, roman yazımı, yüksek kaliteli çeviri gibi daha karmaşık metin üretim sahneleri için uygundur ve bağlam pencere uzunluğu 32k'dır."
|
268
|
+
},
|
269
|
+
"Skylark2-pro-4k": {
|
270
|
+
"description": "Skylark'in (Bulut Şarkıcısı) ikinci nesil modeli, Skylark2-pro modeli yüksek model hassasiyetine sahiptir; profesyonel alan metin üretimi, roman yazımı, yüksek kaliteli çeviri gibi daha karmaşık metin üretim sahneleri için uygundur ve bağlam pencere uzunluğu 4k'dır."
|
271
|
+
},
|
272
|
+
"Skylark2-pro-character-4k": {
|
273
|
+
"description": "Skylark'in (Bulut Şarkıcısı) ikinci nesil modeli, Skylark2-pro-character modeli, mükemmel rol yapma ve sohbet yeteneklerine sahiptir; kullanıcıdan gelen istem taleplerine göre farklı roller üstlenme kabiliyeti ile sohbet edebilir. Rol stili belirgindir ve diyalog içeriği doğal ve akıcıdır. Chatbot, sanal asistan ve çevrimiçi müşteri hizmetleri gibi senaryolar için uygundur ve yüksek yanıt hızı vardır."
|
274
|
+
},
|
275
|
+
"Skylark2-pro-turbo-8k": {
|
276
|
+
"description": "Skylark'in (Bulut Şarkıcısı) ikinci nesil modeli, Skylark2-pro-turbo-8k ile daha hızlı çıkarım gerçekleştirir, maliyeti düşüktür ve bağlam pencere uzunluğu 8k'dır."
|
277
|
+
},
|
245
278
|
"THUDM/chatglm3-6b": {
|
246
279
|
"description": "ChatGLM3-6B, Zhipu AI tarafından geliştirilen ChatGLM serisinin açık kaynak modelidir. Bu model, önceki nesil modellerin mükemmel özelliklerini korurken, yeni özellikler de eklenmiştir. Daha çeşitli eğitim verileri, daha fazla eğitim adımı ve daha mantıklı eğitim stratejileri kullanarak, 10B altındaki önceden eğitilmiş modeller arasında mükemmel performans sergilemektedir. ChatGLM3-6B, çoklu diyalog, araç çağrısı, kod yürütme ve ajan görevleri gibi karmaşık senaryoları desteklemektedir. Diyalog modelinin yanı sıra, temel model ChatGLM-6B-Base ve uzun metin diyalog modeli ChatGLM3-6B-32K da açık kaynak olarak sunulmuştur. Bu model, akademik araştırmalara tamamen açıktır ve kayıt olduktan sonra ücretsiz ticari kullanımına da izin verilmektedir."
|
247
280
|
},
|
@@ -476,6 +509,9 @@
|
|
476
509
|
"cohere-command-r-plus": {
|
477
510
|
"description": "Command R+, kurumsal düzeyde iş yüklerini ele almak için tasarlanmış en son RAG optimize edilmiş bir modeldir."
|
478
511
|
},
|
512
|
+
"command-light": {
|
513
|
+
"description": ""
|
514
|
+
},
|
479
515
|
"command-r": {
|
480
516
|
"description": "Command R, diyalog ve uzun bağlam görevleri için optimize edilmiş bir LLM'dir, dinamik etkileşim ve bilgi yönetimi için özellikle uygundur."
|
481
517
|
},
|
@@ -539,6 +575,9 @@
|
|
539
575
|
"gemini-1.5-flash-8b-exp-0924": {
|
540
576
|
"description": "Gemini 1.5 Flash 8B 0924, metin ve çok modlu kullanım durumlarında önemli performans artışları sunan en son deneysel modeldir."
|
541
577
|
},
|
578
|
+
"gemini-1.5-flash-exp-0827": {
|
579
|
+
"description": "Gemini 1.5 Flash 0827, optimize edilmiş çok modlu işleme yetenekleri sunarak çeşitli karmaşık görev sahnelerine uygundur."
|
580
|
+
},
|
542
581
|
"gemini-1.5-flash-latest": {
|
543
582
|
"description": "Gemini 1.5 Flash, Google'ın en son çok modlu AI modelidir, hızlı işleme yeteneğine sahiptir ve metin, görüntü ve video girişi destekler, çeşitli görevlerin verimli bir şekilde genişletilmesine olanak tanır."
|
544
583
|
},
|
@@ -548,6 +587,12 @@
|
|
548
587
|
"gemini-1.5-pro-002": {
|
549
588
|
"description": "Gemini 1.5 Pro 002, daha yüksek kaliteli çıktılar sunan en son üretim hazır modeldir; özellikle matematik, uzun bağlam ve görsel görevlerde önemli iyileştirmeler sağlamaktadır."
|
550
589
|
},
|
590
|
+
"gemini-1.5-pro-exp-0801": {
|
591
|
+
"description": "Gemini 1.5 Pro 0801, olağanüstü çok modlu işleme yetenekleri sunarak uygulama geliştirmeye daha fazla esneklik getirir."
|
592
|
+
},
|
593
|
+
"gemini-1.5-pro-exp-0827": {
|
594
|
+
"description": "Gemini 1.5 Pro 0827, en son optimize edilmiş teknolojilerle birleştirilmiş daha verimli çok modlu veri işleme yeteneği sunar."
|
595
|
+
},
|
551
596
|
"gemini-1.5-pro-latest": {
|
552
597
|
"description": "Gemini 1.5 Pro, 2 milyon token'a kadar destekler, orta ölçekli çok modlu modeller için ideal bir seçimdir ve karmaşık görevler için çok yönlü destek sunar."
|
553
598
|
},
|
@@ -557,6 +602,9 @@
|
|
557
602
|
"gemini-exp-1121": {
|
558
603
|
"description": "Gemini Exp 1121, Google'un en yeni deneysel çok modlu AI modelidir. Hızlı işlem yeteneğine sahip olup, metin, görüntü ve video girişi destekler ve çeşitli görevler için verimli bir şekilde ölçeklenebilir."
|
559
604
|
},
|
605
|
+
"gemini-exp-1206": {
|
606
|
+
"description": "Gemini Exp 1206, Google'ın en son deneysel çok modlu AI modelidir ve önceki sürümlere kıyasla belirli bir kalite artırımı sağlar."
|
607
|
+
},
|
560
608
|
"gemma-7b-it": {
|
561
609
|
"description": "Gemma 7B, orta ölçekli görev işleme için uygundur ve maliyet etkinliği sunar."
|
562
610
|
},
|
@@ -611,6 +659,9 @@
|
|
611
659
|
"glm-4v": {
|
612
660
|
"description": "GLM-4V, güçlü görüntü anlama ve akıl yürütme yetenekleri sunar, çeşitli görsel görevleri destekler."
|
613
661
|
},
|
662
|
+
"glm-4v-flash": {
|
663
|
+
"description": "GLM-4V-Flash, hızlı görsel analiz veya toplu görsel işleme gibi sahnelerde, tek bir görüntü anlayışına odaklanarak etkili bir performans sunar."
|
664
|
+
},
|
614
665
|
"glm-4v-plus": {
|
615
666
|
"description": "GLM-4V-Plus, video içeriği ve çoklu görüntüleri anlama yeteneğine sahiptir, çok modlu görevler için uygundur."
|
616
667
|
},
|
@@ -647,6 +698,12 @@
|
|
647
698
|
"gpt-3.5-turbo-instruct": {
|
648
699
|
"description": "GPT 3.5 Turbo, çeşitli metin üretimi ve anlama görevleri için uygundur, şu anda gpt-3.5-turbo-0125'e işaret ediyor."
|
649
700
|
},
|
701
|
+
"gpt-35-turbo": {
|
702
|
+
"description": "GPT 3.5 Turbo, OpenAI tarafından sağlanan verimli bir modeldir ve sohbet ve metin üretim görevleri için uygundur, paralel fonksiyon çağrılarını destekler."
|
703
|
+
},
|
704
|
+
"gpt-35-turbo-16k": {
|
705
|
+
"description": "GPT 3.5 Turbo 16k, karmaşık görevler için uygun yüksek kapasiteli bir metin üretim modelidir."
|
706
|
+
},
|
650
707
|
"gpt-4": {
|
651
708
|
"description": "GPT-4, daha büyük bir bağlam penceresi sunarak daha uzun metin girişlerini işleyebilir, geniş bilgi entegrasyonu ve veri analizi gerektiren senaryolar için uygundur."
|
652
709
|
},
|
@@ -659,9 +716,6 @@
|
|
659
716
|
"gpt-4-1106-preview": {
|
660
717
|
"description": "En son GPT-4 Turbo modeli görsel işlevselliğe sahiptir. Artık görsel talepler JSON formatı ve fonksiyon çağrıları ile işlenebilir. GPT-4 Turbo, çok modlu görevler için maliyet etkin bir destek sunan geliştirilmiş bir versiyondur. Doğruluk ve verimlilik arasında bir denge sağlar, gerçek zamanlı etkileşim gerektiren uygulama senaryoları için uygundur."
|
661
718
|
},
|
662
|
-
"gpt-4-1106-vision-preview": {
|
663
|
-
"description": "En son GPT-4 Turbo modeli görsel işlevselliğe sahiptir. Artık görsel talepler JSON formatı ve fonksiyon çağrıları ile işlenebilir. GPT-4 Turbo, çok modlu görevler için maliyet etkin bir destek sunan geliştirilmiş bir versiyondur. Doğruluk ve verimlilik arasında bir denge sağlar, gerçek zamanlı etkileşim gerektiren uygulama senaryoları için uygundur."
|
664
|
-
},
|
665
719
|
"gpt-4-32k": {
|
666
720
|
"description": "GPT-4, daha büyük bir bağlam penceresi sunarak daha uzun metin girişlerini işleyebilir, geniş bilgi entegrasyonu ve veri analizi gerektiren senaryolar için uygundur."
|
667
721
|
},
|
@@ -689,6 +743,9 @@
|
|
689
743
|
"gpt-4o-2024-08-06": {
|
690
744
|
"description": "ChatGPT-4o, güncel versiyonunu korumak için gerçek zamanlı olarak güncellenen dinamik bir modeldir. Güçlü dil anlama ve üretme yeteneklerini birleştirir, müşteri hizmetleri, eğitim ve teknik destek gibi geniş ölçekli uygulama senaryoları için uygundur."
|
691
745
|
},
|
746
|
+
"gpt-4o-2024-11-20": {
|
747
|
+
"description": "ChatGPT-4o, güncel en son sürümü korumak için gerçek zamanlı olarak güncellenen dinamik bir modeldir. Müşteri hizmetleri, eğitim ve teknik destek gibi büyük ölçekli uygulama senaryoları için güçlü dil anlama ve üretme yeteneklerini bir araya getirir."
|
748
|
+
},
|
692
749
|
"gpt-4o-mini": {
|
693
750
|
"description": "GPT-4o mini, OpenAI'nin GPT-4 Omni'den sonra tanıttığı en yeni modeldir. Görsel ve metin girişi destekler ve metin çıktısı verir. En gelişmiş küçük model olarak, diğer son zamanlardaki öncü modellere göre çok daha ucuzdur ve GPT-3.5 Turbo'dan %60'tan fazla daha ucuzdur. En son teknolojiyi korurken, önemli bir maliyet etkinliği sunar. GPT-4o mini, MMLU testinde %82 puan almış olup, şu anda sohbet tercihleri açısından GPT-4'ün üzerinde yer almaktadır."
|
694
751
|
},
|
@@ -707,6 +764,9 @@
|
|
707
764
|
"hunyuan-functioncall": {
|
708
765
|
"description": "Hunyuan'ın en son MOE mimarisi FunctionCall modeli, yüksek kaliteli FunctionCall verisi ile eğitilmiş olup, bağlam penceresi 32K'ya ulaşmıştır ve birçok boyutta değerlendirme göstergelerinde lider konumdadır."
|
709
766
|
},
|
767
|
+
"hunyuan-large": {
|
768
|
+
"description": ""
|
769
|
+
},
|
710
770
|
"hunyuan-lite": {
|
711
771
|
"description": "MOE yapısına yükseltilmiş, bağlam penceresi 256k, NLP, kod, matematik, endüstri gibi birçok değerlendirme setinde birçok açık kaynak modelden önde."
|
712
772
|
},
|
@@ -787,6 +847,9 @@
|
|
787
847
|
"llama-3.2-90b-vision-preview": {
|
788
848
|
"description": "Llama 3.2, görsel ve metin verilerini birleştiren görevleri işlemek için tasarlanmıştır. Görüntü tanımlama ve görsel soru-cevap gibi görevlerde mükemmel performans sergiler, dil üretimi ile görsel akıl yürütme arasındaki uçurumu aşar."
|
789
849
|
},
|
850
|
+
"llama-3.3-70b-versatile": {
|
851
|
+
"description": "Meta Llama 3.3 çok dilli büyük dil modeli (LLM), 70B (metin girişi/metin çıkışı) içindeki önceden eğitilmiş ve talimat ayarlanmış bir üretim modelidir. Llama 3.3 talimat ayarlı saf metin modeli, çok dilli konuşma kullanım durumları için optimize edilmiştir ve yaygın endüstri kıyaslamalarında mevcut birçok açık kaynak ve kapalı sohbet modelinden daha üstündür."
|
852
|
+
},
|
790
853
|
"llama3-70b-8192": {
|
791
854
|
"description": "Meta Llama 3 70B, eşsiz karmaşıklık işleme yeteneği sunar ve yüksek talepli projeler için özel olarak tasarlanmıştır."
|
792
855
|
},
|
@@ -1094,12 +1157,21 @@
|
|
1094
1157
|
"qwen-math-turbo-latest": {
|
1095
1158
|
"description": "Tongyi Qianwen matematik modeli, matematik problemlerini çözmek için özel olarak tasarlanmış bir dil modelidir."
|
1096
1159
|
},
|
1160
|
+
"qwen-max": {
|
1161
|
+
"description": "Tongyi Qianwen, 100 milyar seviyesinde büyük ölçekli bir dil modelidir ve Çince, İngilizce gibi farklı dil girişlerini destekler; şu anda Tongyi Qianwen 2.5 ürün sürümünün arkasındaki API modelidir."
|
1162
|
+
},
|
1097
1163
|
"qwen-max-latest": {
|
1098
1164
|
"description": "Tongyi Qianwen, 100 milyar seviyesinde büyük bir dil modeli, Çince, İngilizce ve diğer dillerde girişleri destekler, şu anda Tongyi Qianwen 2.5 ürün versiyonunun arkasındaki API modelidir."
|
1099
1165
|
},
|
1166
|
+
"qwen-plus": {
|
1167
|
+
"description": "Tongyi Qianwen, Çince, İngilizce gibi farklı dil girişlerini destekleyen geliştirilmiş büyük ölçekli bir dil modelidir."
|
1168
|
+
},
|
1100
1169
|
"qwen-plus-latest": {
|
1101
1170
|
"description": "Tongyi Qianwen'in geliştirilmiş versiyonu, çok dilli girişleri destekler."
|
1102
1171
|
},
|
1172
|
+
"qwen-turbo": {
|
1173
|
+
"description": "Tongyi Qianwen, Çince, İngilizce gibi farklı dil girişlerini destekleyen büyük ölçekli bir dil modelidir."
|
1174
|
+
},
|
1103
1175
|
"qwen-turbo-latest": {
|
1104
1176
|
"description": "Tongyi Qianwen, çok dilli bir dil modeli, Çince, İngilizce ve diğer dillerde girişleri destekler."
|
1105
1177
|
},
|
@@ -1136,12 +1208,18 @@
|
|
1136
1208
|
"qwen2.5-7b-instruct": {
|
1137
1209
|
"description": "Tongyi Qianwen 2.5, halka açık 7B ölçeğinde bir modeldir."
|
1138
1210
|
},
|
1211
|
+
"qwen2.5-coder-1.5b-instruct": {
|
1212
|
+
"description": "Tongyi Qianwen kodlama modelinin açık kaynak sürümüdür."
|
1213
|
+
},
|
1139
1214
|
"qwen2.5-coder-32b-instruct": {
|
1140
1215
|
"description": "Tongyi Qianwen kod modeli açık kaynak versiyonu."
|
1141
1216
|
},
|
1142
1217
|
"qwen2.5-coder-7b-instruct": {
|
1143
1218
|
"description": "Tongyi Qianwen kodlama modelinin açık kaynak versiyonu."
|
1144
1219
|
},
|
1220
|
+
"qwen2.5-math-1.5b-instruct": {
|
1221
|
+
"description": "Qwen-Math modeli, güçlü matematiksel problem çözme yeteneklerine sahiptir."
|
1222
|
+
},
|
1145
1223
|
"qwen2.5-math-72b-instruct": {
|
1146
1224
|
"description": "Qwen-Math modeli, güçlü matematik problem çözme yeteneklerine sahiptir."
|
1147
1225
|
},
|
@@ -34,6 +34,9 @@
|
|
34
34
|
"groq": {
|
35
35
|
"description": "Groq'un LPU çıkarım motoru, en son bağımsız büyük dil modeli (LLM) benchmark testlerinde mükemmel performans sergilemekte ve olağanüstü hız ve verimliliği ile yapay zeka çözümlerinin standartlarını yeniden tanımlamaktadır. Groq, bulut tabanlı dağıtımlarda iyi bir performans sergileyen anlık çıkarım hızının temsilcisidir."
|
36
36
|
},
|
37
|
+
"higress": {
|
38
|
+
"description": ""
|
39
|
+
},
|
37
40
|
"huggingface": {
|
38
41
|
"description": "HuggingFace Inference API, binlerce modeli keşfetmenin hızlı ve ücretsiz bir yolunu sunar, çeşitli görevler için uygundur. Yeni uygulamalar için prototip oluşturuyor ya da makine öğreniminin yeteneklerini deniyorsanız, bu API size birçok alanda yüksek performanslı modellere anında erişim sağlar."
|
39
42
|
},
|
@@ -55,6 +55,24 @@
|
|
55
55
|
"Baichuan4-Turbo": {
|
56
56
|
"description": "Mô hình có khả năng hàng đầu trong nước, vượt trội hơn các mô hình chính thống nước ngoài trong các nhiệm vụ tiếng Trung như bách khoa toàn thư, văn bản dài và sáng tạo nội dung. Cũng có khả năng đa phương tiện hàng đầu trong ngành, thể hiện xuất sắc trong nhiều tiêu chuẩn đánh giá uy tín."
|
57
57
|
},
|
58
|
+
"Doubao-lite-128k": {
|
59
|
+
"description": "Doubao-lite có tốc độ phản hồi cực nhanh, giá trị tốt hơn, cung cấp sự lựa chọn linh hoạt cho khách hàng trong nhiều tình huống khác nhau. Hỗ trợ suy diễn và tinh chỉnh trong ngữ cảnh 128k."
|
60
|
+
},
|
61
|
+
"Doubao-lite-32k": {
|
62
|
+
"description": "Doubao-lite có tốc độ phản hồi cực nhanh, giá trị tốt hơn, cung cấp sự lựa chọn linh hoạt cho khách hàng trong nhiều tình huống khác nhau. Hỗ trợ suy diễn và tinh chỉnh trong ngữ cảnh 32k."
|
63
|
+
},
|
64
|
+
"Doubao-lite-4k": {
|
65
|
+
"description": "Doubao-lite có tốc độ phản hồi cực nhanh, giá trị tốt hơn, cung cấp sự lựa chọn linh hoạt cho khách hàng trong nhiều tình huống khác nhau. Hỗ trợ suy diễn và tinh chỉnh trong ngữ cảnh 4k."
|
66
|
+
},
|
67
|
+
"Doubao-pro-128k": {
|
68
|
+
"description": "Mô hình chính có hiệu quả tốt nhất, phù hợp để xử lý các nhiệm vụ phức tạp, có hiệu quả tốt trong các tình huống như hỏi đáp tham khảo, tóm tắt, sáng tác, phân loại văn bản, và nhập vai. Hỗ trợ suy diễn và tinh chỉnh trong ngữ cảnh 128k."
|
69
|
+
},
|
70
|
+
"Doubao-pro-32k": {
|
71
|
+
"description": "Mô hình chính có hiệu quả tốt nhất, phù hợp để xử lý các nhiệm vụ phức tạp, có hiệu quả tốt trong các tình huống như hỏi đáp tham khảo, tóm tắt, sáng tác, phân loại văn bản, và nhập vai. Hỗ trợ suy diễn và tinh chỉnh trong ngữ cảnh 32k."
|
72
|
+
},
|
73
|
+
"Doubao-pro-4k": {
|
74
|
+
"description": "Mô hình chính có hiệu quả tốt nhất, phù hợp để xử lý các nhiệm vụ phức tạp, có hiệu quả tốt trong các tình huống như hỏi đáp tham khảo, tóm tắt, sáng tác, phân loại văn bản, và nhập vai. Hỗ trợ suy diễn và tinh chỉnh trong ngữ cảnh 4k."
|
75
|
+
},
|
58
76
|
"ERNIE-3.5-128K": {
|
59
77
|
"description": "Mô hình ngôn ngữ quy mô lớn hàng đầu do Baidu tự phát triển, bao phủ một lượng lớn tài liệu tiếng Trung và tiếng Anh, có khả năng tổng quát mạnh mẽ, có thể đáp ứng hầu hết các yêu cầu về đối thoại, hỏi đáp, sáng tạo nội dung và các tình huống ứng dụng plugin; hỗ trợ tự động kết nối với plugin tìm kiếm của Baidu, đảm bảo thông tin hỏi đáp luôn được cập nhật kịp thời."
|
60
78
|
},
|
@@ -242,6 +260,21 @@
|
|
242
260
|
"SenseChat-Turbo": {
|
243
261
|
"description": "Phù hợp cho các tình huống hỏi đáp nhanh và tinh chỉnh mô hình."
|
244
262
|
},
|
263
|
+
"Skylark2-lite-8k": {
|
264
|
+
"description": "Mô hình thế hệ thứ hai Skylark, mô hình Skylark2-lite có tốc độ phản hồi cao, phù hợp cho các tình huống yêu cầu tính thời gian thực cao, nhạy cảm với chi phí, không yêu cầu độ chính xác mô hình cao, chiều dài cửa sổ ngữ cảnh là 8k."
|
265
|
+
},
|
266
|
+
"Skylark2-pro-32k": {
|
267
|
+
"description": "Mô hình thế hệ thứ hai Skylark, phiên bản Skylark2-pro có độ chính xác cao hơn, phù hợp cho các tình huống tạo văn bản phức tạp, như tạo nội dung chuyên ngành, sáng tác tiểu thuyết, dịch thuật chất lượng cao, chiều dài cửa sổ ngữ cảnh là 32k."
|
268
|
+
},
|
269
|
+
"Skylark2-pro-4k": {
|
270
|
+
"description": "Mô hình thế hệ thứ hai Skylark, mô hình Skylark2-pro có độ chính xác cao hơn, phù hợp cho các tình huống tạo văn bản phức tạp, như tạo nội dung chuyên ngành, sáng tác tiểu thuyết, dịch thuật chất lượng cao, chiều dài cửa sổ ngữ cảnh là 4k."
|
271
|
+
},
|
272
|
+
"Skylark2-pro-character-4k": {
|
273
|
+
"description": "Mô hình thế hệ thứ hai Skylark, mô hình Skylark2-pro-character có khả năng nhập vai và trò chuyện xuất sắc, giỏi nhập vai theo yêu cầu của người dùng, tạo ra những cuộc trò chuyện tự nhiên, phù hợp để xây dựng chatbot, trợ lý ảo và dịch vụ khách hàng trực tuyến, có tốc độ phản hồi cao."
|
274
|
+
},
|
275
|
+
"Skylark2-pro-turbo-8k": {
|
276
|
+
"description": "Mô hình thế hệ thứ hai Skylark, mô hình Skylark2-pro-turbo-8k có tốc độ suy diễn nhanh hơn, chi phí thấp hơn, chiều dài cửa sổ ngữ cảnh là 8k."
|
277
|
+
},
|
245
278
|
"THUDM/chatglm3-6b": {
|
246
279
|
"description": "ChatGLM3-6B là mô hình mã nguồn mở trong loạt ChatGLM, được phát triển bởi Zhizhu AI. Mô hình này giữ lại những đặc điểm xuất sắc của thế hệ trước, như khả năng đối thoại mượt mà và ngưỡng triển khai thấp, đồng thời giới thiệu các tính năng mới. Nó sử dụng dữ liệu đào tạo đa dạng hơn, số bước đào tạo đầy đủ hơn và chiến lược đào tạo hợp lý hơn, thể hiện xuất sắc trong các mô hình tiền huấn luyện dưới 10B. ChatGLM3-6B hỗ trợ đối thoại nhiều vòng, gọi công cụ, thực thi mã và các nhiệm vụ Agent trong các tình huống phức tạp. Ngoài mô hình đối thoại, còn có mô hình cơ bản ChatGLM-6B-Base và mô hình đối thoại văn bản dài ChatGLM3-6B-32K. Mô hình hoàn toàn mở cho nghiên cứu học thuật và cho phép sử dụng thương mại miễn phí sau khi đăng ký."
|
247
280
|
},
|
@@ -476,6 +509,9 @@
|
|
476
509
|
"cohere-command-r-plus": {
|
477
510
|
"description": "Command R+ là mô hình tối ưu hóa RAG hiện đại, được thiết kế để xử lý khối lượng công việc cấp doanh nghiệp."
|
478
511
|
},
|
512
|
+
"command-light": {
|
513
|
+
"description": ""
|
514
|
+
},
|
479
515
|
"command-r": {
|
480
516
|
"description": "Command R là LLM được tối ưu hóa cho các nhiệm vụ đối thoại và ngữ cảnh dài, đặc biệt phù hợp cho tương tác động và quản lý kiến thức."
|
481
517
|
},
|
@@ -539,6 +575,9 @@
|
|
539
575
|
"gemini-1.5-flash-8b-exp-0924": {
|
540
576
|
"description": "Gemini 1.5 Flash 8B 0924 là mô hình thử nghiệm mới nhất, có sự cải thiện đáng kể về hiệu suất trong các trường hợp sử dụng văn bản và đa phương thức."
|
541
577
|
},
|
578
|
+
"gemini-1.5-flash-exp-0827": {
|
579
|
+
"description": "Gemini 1.5 Flash 0827 cung cấp khả năng xử lý đa phương tiện tối ưu, áp dụng cho nhiều tình huống tác vụ phức tạp."
|
580
|
+
},
|
542
581
|
"gemini-1.5-flash-latest": {
|
543
582
|
"description": "Gemini 1.5 Flash là mô hình AI đa phương thức mới nhất của Google, có khả năng xử lý nhanh, hỗ trợ đầu vào văn bản, hình ảnh và video, phù hợp cho việc mở rộng hiệu quả cho nhiều nhiệm vụ."
|
544
583
|
},
|
@@ -548,6 +587,12 @@
|
|
548
587
|
"gemini-1.5-pro-002": {
|
549
588
|
"description": "Gemini 1.5 Pro 002 là mô hình sẵn sàng cho sản xuất mới nhất, cung cấp đầu ra chất lượng cao hơn, đặc biệt là trong các nhiệm vụ toán học, ngữ cảnh dài và thị giác."
|
550
589
|
},
|
590
|
+
"gemini-1.5-pro-exp-0801": {
|
591
|
+
"description": "Gemini 1.5 Pro 0801 cung cấp khả năng xử lý đa phương tiện xuất sắc, mang lại tính linh hoạt cao hơn cho việc phát triển ứng dụng."
|
592
|
+
},
|
593
|
+
"gemini-1.5-pro-exp-0827": {
|
594
|
+
"description": "Gemini 1.5 Pro 0827 kết hợp công nghệ tối ưu hóa mới nhất, mang lại khả năng xử lý dữ liệu đa phương tiện hiệu quả hơn."
|
595
|
+
},
|
551
596
|
"gemini-1.5-pro-latest": {
|
552
597
|
"description": "Gemini 1.5 Pro hỗ trợ lên đến 2 triệu tokens, là lựa chọn lý tưởng cho mô hình đa phương thức trung bình, phù hợp cho hỗ trợ đa diện cho các nhiệm vụ phức tạp."
|
553
598
|
},
|
@@ -557,6 +602,9 @@
|
|
557
602
|
"gemini-exp-1121": {
|
558
603
|
"description": "Gemini Exp 1121 là mô hình AI đa phương thức thử nghiệm mới nhất của Google, có khả năng xử lý nhanh chóng, hỗ trợ đầu vào văn bản, hình ảnh và video, phù hợp cho việc mở rộng hiệu quả cho nhiều nhiệm vụ."
|
559
604
|
},
|
605
|
+
"gemini-exp-1206": {
|
606
|
+
"description": "Gemini Exp 1206 là mô hình AI đa phương tiện thử nghiệm mới nhất của Google, có sự cải thiện về chất lượng so với các phiên bản trước."
|
607
|
+
},
|
560
608
|
"gemma-7b-it": {
|
561
609
|
"description": "Gemma 7B phù hợp cho việc xử lý các nhiệm vụ quy mô vừa và nhỏ, đồng thời mang lại hiệu quả chi phí."
|
562
610
|
},
|
@@ -611,6 +659,9 @@
|
|
611
659
|
"glm-4v": {
|
612
660
|
"description": "GLM-4V cung cấp khả năng hiểu và suy luận hình ảnh mạnh mẽ, hỗ trợ nhiều nhiệm vụ hình ảnh."
|
613
661
|
},
|
662
|
+
"glm-4v-flash": {
|
663
|
+
"description": "GLM-4V-Flash tập trung vào hiểu hình ảnh đơn lẻ một cách hiệu quả, phù hợp cho các tình huống phân tích hình ảnh nhanh chóng, chẳng hạn như phân tích hình ảnh theo thời gian thực hoặc xử lý hình ảnh hàng loạt."
|
664
|
+
},
|
614
665
|
"glm-4v-plus": {
|
615
666
|
"description": "GLM-4V-Plus có khả năng hiểu nội dung video và nhiều hình ảnh, phù hợp cho các nhiệm vụ đa phương tiện."
|
616
667
|
},
|
@@ -647,6 +698,12 @@
|
|
647
698
|
"gpt-3.5-turbo-instruct": {
|
648
699
|
"description": "GPT 3.5 Turbo, phù hợp cho nhiều nhiệm vụ sinh và hiểu văn bản, hiện tại trỏ đến gpt-3.5-turbo-0125."
|
649
700
|
},
|
701
|
+
"gpt-35-turbo": {
|
702
|
+
"description": "GPT 3.5 Turbo, mô hình hiệu quả do OpenAI cung cấp, phù hợp cho các tác vụ trò chuyện và tạo văn bản, hỗ trợ gọi hàm song song."
|
703
|
+
},
|
704
|
+
"gpt-35-turbo-16k": {
|
705
|
+
"description": "GPT 3.5 Turbo 16k, mô hình tạo văn bản dung lượng cao, phù hợp cho các nhiệm vụ phức tạp."
|
706
|
+
},
|
650
707
|
"gpt-4": {
|
651
708
|
"description": "GPT-4 cung cấp một cửa sổ ngữ cảnh lớn hơn, có khả năng xử lý các đầu vào văn bản dài hơn, phù hợp cho các tình huống cần tích hợp thông tin rộng rãi và phân tích dữ liệu."
|
652
709
|
},
|
@@ -659,9 +716,6 @@
|
|
659
716
|
"gpt-4-1106-preview": {
|
660
717
|
"description": "Mô hình GPT-4 Turbo mới nhất có chức năng hình ảnh. Hiện tại, các yêu cầu hình ảnh có thể sử dụng chế độ JSON và gọi hàm. GPT-4 Turbo là một phiên bản nâng cao, cung cấp hỗ trợ chi phí hiệu quả cho các nhiệm vụ đa phương tiện. Nó tìm thấy sự cân bằng giữa độ chính xác và hiệu quả, phù hợp cho các ứng dụng cần tương tác theo thời gian thực."
|
661
718
|
},
|
662
|
-
"gpt-4-1106-vision-preview": {
|
663
|
-
"description": "Mô hình GPT-4 Turbo mới nhất có chức năng hình ảnh. Hiện tại, các yêu cầu hình ảnh có thể sử dụng chế độ JSON và gọi hàm. GPT-4 Turbo là một phiên bản nâng cao, cung cấp hỗ trợ chi phí hiệu quả cho các nhiệm vụ đa phương tiện. Nó tìm thấy sự cân bằng giữa độ chính xác và hiệu quả, phù hợp cho các ứng dụng cần tương tác theo thời gian thực."
|
664
|
-
},
|
665
719
|
"gpt-4-32k": {
|
666
720
|
"description": "GPT-4 cung cấp một cửa sổ ngữ cảnh lớn hơn, có khả năng xử lý các đầu vào văn bản dài hơn, phù hợp cho các tình huống cần tích hợp thông tin rộng rãi và phân tích dữ liệu."
|
667
721
|
},
|
@@ -689,6 +743,9 @@
|
|
689
743
|
"gpt-4o-2024-08-06": {
|
690
744
|
"description": "ChatGPT-4o là một mô hình động, được cập nhật theo thời gian thực để giữ phiên bản mới nhất. Nó kết hợp khả năng hiểu và sinh ngôn ngữ mạnh mẽ, phù hợp cho các ứng dụng quy mô lớn, bao gồm dịch vụ khách hàng, giáo dục và hỗ trợ kỹ thuật."
|
691
745
|
},
|
746
|
+
"gpt-4o-2024-11-20": {
|
747
|
+
"description": "ChatGPT-4o là một mô hình động, được cập nhật liên tục để giữ phiên bản mới nhất. Nó kết hợp khả năng hiểu và tạo ngôn ngữ mạnh mẽ, phù hợp cho nhiều ứng dụng quy mô lớn, bao gồm dịch vụ khách hàng, giáo dục và hỗ trợ kỹ thuật."
|
748
|
+
},
|
692
749
|
"gpt-4o-mini": {
|
693
750
|
"description": "GPT-4o mini là mô hình mới nhất do OpenAI phát hành sau GPT-4 Omni, hỗ trợ đầu vào hình ảnh và đầu ra văn bản. Là mô hình nhỏ gọn tiên tiến nhất của họ, nó rẻ hơn nhiều so với các mô hình tiên tiến gần đây khác và rẻ hơn hơn 60% so với GPT-3.5 Turbo. Nó giữ lại trí thông minh tiên tiến nhất trong khi có giá trị sử dụng đáng kể. GPT-4o mini đạt 82% điểm trong bài kiểm tra MMLU và hiện đứng cao hơn GPT-4 về sở thích trò chuyện."
|
694
751
|
},
|
@@ -707,6 +764,9 @@
|
|
707
764
|
"hunyuan-functioncall": {
|
708
765
|
"description": "Mô hình FunctionCall với cấu trúc MOE mới nhất của Hunyuan, được huấn luyện trên dữ liệu FunctionCall chất lượng cao, với cửa sổ ngữ cảnh đạt 32K, dẫn đầu trong nhiều chỉ số đánh giá."
|
709
766
|
},
|
767
|
+
"hunyuan-large": {
|
768
|
+
"description": ""
|
769
|
+
},
|
710
770
|
"hunyuan-lite": {
|
711
771
|
"description": "Nâng cấp lên cấu trúc MOE, với cửa sổ ngữ cảnh 256k, dẫn đầu nhiều mô hình mã nguồn mở trong các bộ đánh giá NLP, mã, toán học, ngành nghề, v.v."
|
712
772
|
},
|
@@ -787,6 +847,9 @@
|
|
787
847
|
"llama-3.2-90b-vision-preview": {
|
788
848
|
"description": "Llama 3.2 được thiết kế để xử lý các nhiệm vụ kết hợp dữ liệu hình ảnh và văn bản. Nó thể hiện xuất sắc trong các nhiệm vụ mô tả hình ảnh và hỏi đáp hình ảnh, vượt qua rào cản giữa tạo ngôn ngữ và suy luận hình ảnh."
|
789
849
|
},
|
850
|
+
"llama-3.3-70b-versatile": {
|
851
|
+
"description": "Mô hình ngôn ngữ lớn Meta Llama 3.3 (LLM) đa ngôn ngữ là mô hình tạo ra dựa trên 70B (đầu vào/đầu ra văn bản) đã được huấn luyện và điều chỉnh theo chỉ dẫn. Mô hình thuần văn bản Llama 3.3 được tối ưu hóa cho các trường hợp hội thoại đa ngôn ngữ và vượt trội hơn nhiều mô hình trò chuyện mã nguồn mở và đóng khác trên các tiêu chuẩn ngành thông thường."
|
852
|
+
},
|
790
853
|
"llama3-70b-8192": {
|
791
854
|
"description": "Meta Llama 3 70B cung cấp khả năng xử lý phức tạp vô song, được thiết kế riêng cho các dự án yêu cầu cao."
|
792
855
|
},
|
@@ -1094,12 +1157,21 @@
|
|
1094
1157
|
"qwen-math-turbo-latest": {
|
1095
1158
|
"description": "Mô hình toán học Qwen được thiết kế đặc biệt để giải quyết các bài toán toán học."
|
1096
1159
|
},
|
1160
|
+
"qwen-max": {
|
1161
|
+
"description": "Mô hình ngôn ngữ quy mô lớn Qwen cấp tỷ, hỗ trợ đầu vào bằng tiếng Trung, tiếng Anh và nhiều ngôn ngữ khác, là mô hình API đằng sau phiên bản sản phẩm Qwen 2.5 hiện tại."
|
1162
|
+
},
|
1097
1163
|
"qwen-max-latest": {
|
1098
1164
|
"description": "Mô hình ngôn ngữ quy mô lớn Qwen với hàng trăm tỷ tham số, hỗ trợ đầu vào bằng tiếng Trung, tiếng Anh và nhiều ngôn ngữ khác, là mô hình API đứng sau phiên bản sản phẩm Qwen 2.5 hiện tại."
|
1099
1165
|
},
|
1166
|
+
"qwen-plus": {
|
1167
|
+
"description": "Mô hình ngôn ngữ quy mô lớn Qwen phiên bản nâng cao, hỗ trợ đầu vào bằng tiếng Trung, tiếng Anh và nhiều ngôn ngữ khác."
|
1168
|
+
},
|
1100
1169
|
"qwen-plus-latest": {
|
1101
1170
|
"description": "Phiên bản nâng cao của mô hình ngôn ngữ quy mô lớn Qwen, hỗ trợ đầu vào bằng tiếng Trung, tiếng Anh và nhiều ngôn ngữ khác."
|
1102
1171
|
},
|
1172
|
+
"qwen-turbo": {
|
1173
|
+
"description": "Mô hình ngôn ngữ quy mô lớn Qwen hỗ trợ đầu vào bằng tiếng Trung, tiếng Anh và nhiều ngôn ngữ khác."
|
1174
|
+
},
|
1103
1175
|
"qwen-turbo-latest": {
|
1104
1176
|
"description": "Mô hình ngôn ngữ quy mô lớn Qwen, hỗ trợ đầu vào bằng tiếng Trung, tiếng Anh và nhiều ngôn ngữ khác."
|
1105
1177
|
},
|
@@ -1136,12 +1208,18 @@
|
|
1136
1208
|
"qwen2.5-7b-instruct": {
|
1137
1209
|
"description": "Mô hình 7B quy mô mở nguồn của Qwen 2.5."
|
1138
1210
|
},
|
1211
|
+
"qwen2.5-coder-1.5b-instruct": {
|
1212
|
+
"description": "Phiên bản mã nguồn mở của mô hình mã Qwen."
|
1213
|
+
},
|
1139
1214
|
"qwen2.5-coder-32b-instruct": {
|
1140
1215
|
"description": "Phiên bản mã nguồn mở của mô hình mã Qwen."
|
1141
1216
|
},
|
1142
1217
|
"qwen2.5-coder-7b-instruct": {
|
1143
1218
|
"description": "Phiên bản mã nguồn mở của mô hình mã Qwen."
|
1144
1219
|
},
|
1220
|
+
"qwen2.5-math-1.5b-instruct": {
|
1221
|
+
"description": "Mô hình Qwen-Math có khả năng giải toán mạnh mẽ."
|
1222
|
+
},
|
1145
1223
|
"qwen2.5-math-72b-instruct": {
|
1146
1224
|
"description": "Mô hình Qwen-Math có khả năng giải quyết bài toán toán học mạnh mẽ."
|
1147
1225
|
},
|