@lobehub/chat 1.97.14 → 1.97.16

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.
@@ -71,44 +71,23 @@
71
71
  "DeepSeek-V3": {
72
72
  "description": "DeepSeek-V3 est un modèle MoE développé en interne par la société DeepSeek. Les performances de DeepSeek-V3 surpassent celles d'autres modèles open source tels que Qwen2.5-72B et Llama-3.1-405B, et se mesurent à la performance des modèles fermés de pointe au monde comme GPT-4o et Claude-3.5-Sonnet."
73
73
  },
74
- "Doubao-1.5-thinking-pro-m": {
75
- "description": "Doubao-1.5 est un nouveau modèle de pensée profonde (version m avec des capacités de raisonnement multimodal natif), qui excelle dans des domaines spécialisés tels que les mathématiques, la programmation, le raisonnement scientifique et des tâches générales comme l'écriture créative, atteignant ou se rapprochant des niveaux de pointe dans plusieurs benchmarks autorisés tels que AIME 2024, Codeforces, GPQA. Prend en charge une fenêtre de contexte de 128k et une sortie de 16k."
76
- },
77
- "Doubao-1.5-thinking-vision-pro": {
78
- "description": "Nouveau modèle de pensée visuelle profonde, doté de capacités de compréhension et de raisonnement multimodal général plus puissantes, ayant obtenu des performances SOTA dans 37 des 59 benchmarks d'évaluation publics."
79
- },
80
- "Doubao-1.5-vision-pro": {
81
- "description": "Doubao-1.5-vision-pro est un modèle multimodal de nouvelle génération, prenant en charge la reconnaissance d'images à n'importe quelle résolution et rapport d'aspect extrême, améliorant les capacités de raisonnement visuel, de reconnaissance de documents, de compréhension des informations détaillées et de respect des instructions."
82
- },
83
- "Doubao-1.5-vision-pro-32k": {
84
- "description": "Doubao-1.5-vision-pro est un modèle multimodal de grande taille récemment mis à jour, prenant en charge la reconnaissance d'images à toute résolution et avec des rapports d'aspect extrêmes, améliorant les capacités de raisonnement visuel, de reconnaissance de documents, de compréhension des informations détaillées et de suivi des instructions."
85
- },
86
74
  "Doubao-lite-128k": {
87
- "description": "Doubao-lite présente une rapidité de réponse exceptionnelle et un excellent rapport qualité-prix, offrant des choix plus flexibles pour différents scénarios clients. Prend en charge le raisonnement et le réglage fin avec une fenêtre de contexte de 128k."
75
+ "description": "Doubao-lite offre une vitesse de réponse exceptionnelle et un excellent rapport qualité-prix, offrant aux clients une flexibilité accrue pour différents scénarios. Prend en charge l'inférence et le fine-tuning avec une fenêtre contextuelle de 128k."
88
76
  },
89
77
  "Doubao-lite-32k": {
90
- "description": "Doubao-lite présente une rapidité de réponse exceptionnelle et un excellent rapport qualité-prix, offrant des choix plus flexibles pour différents scénarios clients. Prend en charge le raisonnement et le réglage fin avec une fenêtre de contexte de 32k."
78
+ "description": "Doubao-lite offre une vitesse de réponse exceptionnelle et un excellent rapport qualité-prix, offrant aux clients une flexibilité accrue pour différents scénarios. Prend en charge l'inférence et le fine-tuning avec une fenêtre contextuelle de 32k."
91
79
  },
92
80
  "Doubao-lite-4k": {
93
- "description": "Doubao-lite présente une rapidité de réponse exceptionnelle et un excellent rapport qualité-prix, offrant des choix plus flexibles pour différents scénarios clients. Prend en charge le raisonnement et le réglage fin avec une fenêtre de contexte de 4k."
81
+ "description": "Doubao-lite offre une vitesse de réponse exceptionnelle et un excellent rapport qualité-prix, offrant aux clients une flexibilité accrue pour différents scénarios. Prend en charge l'inférence et le fine-tuning avec une fenêtre contextuelle de 4k."
94
82
  },
95
83
  "Doubao-pro-128k": {
96
- "description": "Le modèle principal offrant les meilleures performances, adapté aux tâches complexes, avec de bons résultats dans des scénarios tels que le question-réponse, le résumé, la création, la classification de texte et le jeu de rôle. Prend en charge le raisonnement et le réglage fin avec une fenêtre de contexte de 128k."
97
- },
98
- "Doubao-pro-256k": {
99
- "description": "Le modèle phare avec les meilleures performances, adapté au traitement de tâches complexes, offrant de bons résultats dans des scénarios tels que les questions-réponses de référence, les résumés, la création, la classification de texte et le jeu de rôle. Prend en charge le raisonnement et le réglage fin avec une fenêtre contextuelle de 256k."
84
+ "description": "Modèle principal le plus performant, adapté aux tâches complexes, avec d'excellents résultats dans les domaines des questions-réponses, résumés, création, classification de texte, jeu de rôle, etc. Prend en charge l'inférence et le fine-tuning avec une fenêtre contextuelle de 128k."
100
85
  },
101
86
  "Doubao-pro-32k": {
102
- "description": "Le modèle principal offrant les meilleures performances, adapté aux tâches complexes, avec de bons résultats dans des scénarios tels que le question-réponse, le résumé, la création, la classification de texte et le jeu de rôle. Prend en charge le raisonnement et le réglage fin avec une fenêtre de contexte de 32k."
87
+ "description": "Modèle principal le plus performant, adapté aux tâches complexes, avec d'excellents résultats dans les domaines des questions-réponses, résumés, création, classification de texte, jeu de rôle, etc. Prend en charge l'inférence et le fine-tuning avec une fenêtre contextuelle de 32k."
103
88
  },
104
89
  "Doubao-pro-4k": {
105
- "description": "Le modèle principal offrant les meilleures performances, adapté aux tâches complexes, avec de bons résultats dans des scénarios tels que le question-réponse, le résumé, la création, la classification de texte et le jeu de rôle. Prend en charge le raisonnement et le réglage fin avec une fenêtre de contexte de 4k."
106
- },
107
- "Doubao-vision-lite-32k": {
108
- "description": "Le modèle Doubao-vision est un modèle multimodal lancé par Doubao, doté de puissantes capacités de compréhension et de raisonnement d'images, ainsi que d'une compréhension précise des instructions. Le modèle a démontré de solides performances dans l'extraction d'informations textuelles à partir d'images et dans des tâches de raisonnement basées sur des images, pouvant être appliqué à des tâches de questions-réponses visuelles plus complexes et variées."
109
- },
110
- "Doubao-vision-pro-32k": {
111
- "description": "Le modèle Doubao-vision est un modèle multimodal lancé par Doubao, doté de puissantes capacités de compréhension et de raisonnement d'images, ainsi que d'une compréhension précise des instructions. Le modèle a démontré de solides performances dans l'extraction d'informations textuelles à partir d'images et dans des tâches de raisonnement basées sur des images, pouvant être appliqué à des tâches de questions-réponses visuelles plus complexes et variées."
90
+ "description": "Modèle principal le plus performant, adapté aux tâches complexes, avec d'excellents résultats dans les domaines des questions-réponses, résumés, création, classification de texte, jeu de rôle, etc. Prend en charge l'inférence et le fine-tuning avec une fenêtre contextuelle de 4k."
112
91
  },
113
92
  "ERNIE-3.5-128K": {
114
93
  "description": "Modèle de langage à grande échelle de pointe développé par Baidu, couvrant une vaste quantité de corpus en chinois et en anglais, avec de puissantes capacités générales, capable de répondre à la plupart des exigences en matière de dialogue, de questions-réponses, de création de contenu et d'applications de plugins ; prend en charge l'intégration automatique avec le plugin de recherche Baidu, garantissant la pertinence des informations de réponse."
@@ -914,9 +893,39 @@
914
893
  "doubao-1.5-thinking-pro": {
915
894
  "description": "Le modèle de réflexion approfondie Doubao-1.5, entièrement nouveau, se distingue dans des domaines spécialisés tels que les mathématiques, la programmation, le raisonnement scientifique, ainsi que dans des tâches générales comme l'écriture créative. Il atteint ou se rapproche du niveau de premier plan de l'industrie sur plusieurs références de renom telles que AIME 2024, Codeforces, GPQA. Il prend en charge une fenêtre de contexte de 128k et une sortie de 16k."
916
895
  },
896
+ "doubao-1.5-thinking-pro-m": {
897
+ "description": "Nouveau modèle de réflexion profonde Doubao-1.5 (version m avec capacités natives d'inférence multimodale profonde), excellent dans les domaines spécialisés tels que mathématiques, programmation, raisonnement scientifique, ainsi que dans les tâches générales comme l'écriture créative. Atteint ou approche le niveau de pointe dans plusieurs benchmarks prestigieux tels que AIME 2024, Codeforces, GPQA. Prend en charge une fenêtre contextuelle de 128k et une sortie de 16k."
898
+ },
899
+ "doubao-1.5-thinking-vision-pro": {
900
+ "description": "Nouveau modèle de réflexion visuelle profonde, doté d'une compréhension et d'un raisonnement multimodaux généraux renforcés, avec des performances SOTA sur 37 des 59 benchmarks publics."
901
+ },
902
+ "doubao-1.5-ui-tars": {
903
+ "description": "Doubao-1.5-UI-TARS est un modèle Agent natif conçu pour l'interaction avec les interfaces graphiques (GUI). Il interagit de manière fluide avec les GUI grâce à des capacités humaines de perception, raisonnement et action."
904
+ },
917
905
  "doubao-1.5-vision-lite": {
918
906
  "description": "Doubao-1.5-vision-lite est un modèle multimodal de nouvelle génération, prenant en charge la reconnaissance d'images à n'importe quelle résolution et rapport d'aspect extrême, améliorant les capacités de raisonnement visuel, de reconnaissance de documents, de compréhension des informations détaillées et de respect des instructions. Il prend en charge une fenêtre de contexte de 128k, avec une longueur de sortie maximale de 16k tokens."
919
907
  },
908
+ "doubao-1.5-vision-pro": {
909
+ "description": "Doubao-1.5-vision-pro est un modèle multimodal de nouvelle génération, prenant en charge la reconnaissance d'images à résolution arbitraire et aux rapports d'aspect extrêmes, améliorant le raisonnement visuel, la reconnaissance documentaire, la compréhension des détails et le respect des instructions."
910
+ },
911
+ "doubao-1.5-vision-pro-32k": {
912
+ "description": "Doubao-1.5-vision-pro est un modèle multimodal de nouvelle génération, prenant en charge la reconnaissance d'images à résolution arbitraire et aux rapports d'aspect extrêmes, améliorant le raisonnement visuel, la reconnaissance documentaire, la compréhension des détails et le respect des instructions."
913
+ },
914
+ "doubao-lite-128k": {
915
+ "description": "Offre une vitesse de réponse exceptionnelle et un excellent rapport qualité-prix, offrant aux clients une flexibilité accrue pour différents scénarios. Prend en charge l'inférence et le fine-tuning avec une fenêtre contextuelle de 128k."
916
+ },
917
+ "doubao-lite-32k": {
918
+ "description": "Offre une vitesse de réponse exceptionnelle et un excellent rapport qualité-prix, offrant aux clients une flexibilité accrue pour différents scénarios. Prend en charge l'inférence et le fine-tuning avec une fenêtre contextuelle de 32k."
919
+ },
920
+ "doubao-lite-4k": {
921
+ "description": "Offre une vitesse de réponse exceptionnelle et un excellent rapport qualité-prix, offrant aux clients une flexibilité accrue pour différents scénarios. Prend en charge l'inférence et le fine-tuning avec une fenêtre contextuelle de 4k."
922
+ },
923
+ "doubao-pro-256k": {
924
+ "description": "Modèle principal le plus performant, adapté aux tâches complexes, avec d'excellents résultats dans les domaines des questions-réponses, résumés, création, classification de texte, jeu de rôle, etc. Prend en charge l'inférence et le fine-tuning avec une fenêtre contextuelle de 256k."
925
+ },
926
+ "doubao-pro-32k": {
927
+ "description": "Modèle principal le plus performant, adapté aux tâches complexes, avec d'excellents résultats dans les domaines des questions-réponses, résumés, création, classification de texte, jeu de rôle, etc. Prend en charge l'inférence et le fine-tuning avec une fenêtre contextuelle de 32k."
928
+ },
920
929
  "doubao-seed-1.6": {
921
930
  "description": "Doubao-Seed-1.6 est un tout nouveau modèle multimodal de réflexion profonde, supportant trois modes de pensée : auto, réflexion et non-réflexion. En mode non-réflexion, les performances du modèle sont largement améliorées par rapport à Doubao-1.5-pro/250115. Il prend en charge une fenêtre contextuelle de 256k et une longueur de sortie maximale de 16k tokens."
922
931
  },
@@ -926,6 +935,12 @@
926
935
  "doubao-seed-1.6-thinking": {
927
936
  "description": "Le modèle Doubao-Seed-1.6-thinking a une capacité de réflexion considérablement renforcée. Par rapport à Doubao-1.5-thinking-pro, il améliore davantage les compétences fondamentales telles que le codage, les mathématiques et le raisonnement logique, tout en supportant la compréhension visuelle. Il prend en charge une fenêtre contextuelle de 256k et une longueur de sortie maximale de 16k tokens."
928
937
  },
938
+ "doubao-vision-lite-32k": {
939
+ "description": "Le modèle Doubao-vision est un grand modèle multimodal développé par Doubao, doté de puissantes capacités de compréhension et de raisonnement d'images, ainsi que d'une compréhension précise des instructions. Il excelle dans l'extraction d'informations texte-image et les tâches de raisonnement basées sur l'image, pouvant être appliqué à des tâches de questions-réponses visuelles plus complexes et étendues."
940
+ },
941
+ "doubao-vision-pro-32k": {
942
+ "description": "Le modèle Doubao-vision est un grand modèle multimodal développé par Doubao, doté de puissantes capacités de compréhension et de raisonnement d'images, ainsi que d'une compréhension précise des instructions. Il excelle dans l'extraction d'informations texte-image et les tâches de raisonnement basées sur l'image, pouvant être appliqué à des tâches de questions-réponses visuelles plus complexes et étendues."
943
+ },
929
944
  "emohaa": {
930
945
  "description": "Emohaa est un modèle psychologique, doté de compétences de conseil professionnel, aidant les utilisateurs à comprendre les problèmes émotionnels."
931
946
  },
@@ -1313,6 +1328,9 @@
1313
1328
  "gpt-4o-mini-search-preview": {
1314
1329
  "description": "La version préliminaire GPT-4o mini Search est un modèle spécialement entraîné pour comprendre et exécuter des requêtes de recherche web, utilisant l’API Chat Completions. En plus des frais de jetons, les requêtes de recherche web sont facturées par appel d’outil."
1315
1330
  },
1331
+ "gpt-4o-mini-transcribe": {
1332
+ "description": "GPT-4o Mini Transcribe est un modèle de transcription audio en texte utilisant GPT-4o. Par rapport au modèle Whisper original, il améliore le taux d'erreur des mots ainsi que la reconnaissance et la précision linguistiques. Utilisez-le pour obtenir des transcriptions plus précises."
1333
+ },
1316
1334
  "gpt-4o-mini-tts": {
1317
1335
  "description": "GPT-4o mini TTS est un modèle de synthèse vocale basé sur GPT-4o mini, offrant une génération de voix de haute qualité à un coût plus faible."
1318
1336
  },
@@ -1322,12 +1340,15 @@
1322
1340
  "gpt-4o-realtime-preview-2024-10-01": {
1323
1341
  "description": "Version en temps réel de GPT-4o, prenant en charge les entrées et sorties audio et textuelles en temps réel."
1324
1342
  },
1325
- "gpt-4o-realtime-preview-2024-12-17": {
1326
- "description": "Version en temps réel de GPT-4o, prenant en charge les entrées et sorties audio et textuelles en temps réel."
1343
+ "gpt-4o-realtime-preview-2025-06-03": {
1344
+ "description": "Version en temps réel de GPT-4o, prenant en charge l'entrée et la sortie audio et texte en temps réel."
1327
1345
  },
1328
1346
  "gpt-4o-search-preview": {
1329
1347
  "description": "La version préliminaire GPT-4o Search est un modèle spécialement entraîné pour comprendre et exécuter des requêtes de recherche web, utilisant l’API Chat Completions. En plus des frais de jetons, les requêtes de recherche web sont facturées par appel d’outil."
1330
1348
  },
1349
+ "gpt-4o-transcribe": {
1350
+ "description": "GPT-4o Transcribe est un modèle de transcription audio en texte utilisant GPT-4o. Par rapport au modèle Whisper original, il améliore le taux d'erreur des mots ainsi que la reconnaissance et la précision linguistiques. Utilisez-le pour obtenir des transcriptions plus précises."
1351
+ },
1331
1352
  "grok-2-1212": {
1332
1353
  "description": "Ce modèle a été amélioré en termes de précision, de respect des instructions et de capacités multilingues."
1333
1354
  },
@@ -1460,6 +1481,9 @@
1460
1481
  "jina-deepsearch-v1": {
1461
1482
  "description": "La recherche approfondie combine la recherche sur le web, la lecture et le raisonnement pour mener des enquêtes complètes. Vous pouvez la considérer comme un agent qui prend en charge vos tâches de recherche - elle effectuera une recherche approfondie et itérative avant de fournir une réponse. Ce processus implique une recherche continue, un raisonnement et une résolution de problèmes sous différents angles. Cela diffère fondamentalement des grands modèles standard qui génèrent des réponses directement à partir de données pré-entraînées et des systèmes RAG traditionnels qui dépendent d'une recherche superficielle unique."
1462
1483
  },
1484
+ "kimi-k2-0711-preview": {
1485
+ "description": "kimi-k2 est un modèle de base à architecture MoE doté de capacités exceptionnelles en code et Agent, avec un total de 1T de paramètres et 32B de paramètres activés. Dans les tests de performance sur les principales catégories telles que le raisonnement général, la programmation, les mathématiques et les Agents, le modèle K2 surpasse les autres modèles open source majeurs."
1486
+ },
1463
1487
  "kimi-latest": {
1464
1488
  "description": "Le produit d'assistant intelligent Kimi utilise le dernier modèle Kimi, qui peut inclure des fonctionnalités encore instables. Il prend en charge la compréhension des images et choisit automatiquement le modèle de facturation 8k/32k/128k en fonction de la longueur du contexte de la demande."
1465
1489
  },
@@ -2352,7 +2376,7 @@
2352
2376
  "description": "Le modèle v0-1.5-md convient aux tâches quotidiennes et à la génération d'interfaces utilisateur (UI)"
2353
2377
  },
2354
2378
  "whisper-1": {
2355
- "description": "Modèle de reconnaissance vocale général, prenant en charge la reconnaissance vocale multilingue, la traduction vocale et la reconnaissance de langue."
2379
+ "description": "Modèle universel de reconnaissance vocale, prenant en charge la reconnaissance vocale multilingue, la traduction vocale et la reconnaissance de langue."
2356
2380
  },
2357
2381
  "wizardlm2": {
2358
2382
  "description": "WizardLM 2 est un modèle de langage proposé par Microsoft AI, particulièrement performant dans les domaines des dialogues complexes, du multilinguisme, du raisonnement et des assistants intelligents."
@@ -71,44 +71,23 @@
71
71
  "DeepSeek-V3": {
72
72
  "description": "DeepSeek-V3 è un modello MoE sviluppato internamente dalla DeepSeek Company. I risultati di DeepSeek-V3 in molte valutazioni superano quelli di altri modelli open source come Qwen2.5-72B e Llama-3.1-405B, e si confronta alla pari con i modelli closed source di punta a livello mondiale come GPT-4o e Claude-3.5-Sonnet."
73
73
  },
74
- "Doubao-1.5-thinking-pro-m": {
75
- "description": "Doubao-1.5 è un nuovo modello di pensiero profondo (versione m con capacità di ragionamento multimodale native), che si distingue in matematica, programmazione, ragionamento scientifico e compiti generali come la scrittura creativa, raggiungendo o avvicinandosi ai livelli di punta del settore in vari benchmark autorevoli come AIME 2024, Codeforces, GPQA. Supporta una finestra di contesto di 128k e un output di 16k."
76
- },
77
- "Doubao-1.5-thinking-vision-pro": {
78
- "description": "Nuovo modello di pensiero visivo profondo, con una maggiore capacità di comprensione e ragionamento multimodale generale, ottenendo prestazioni SOTA in 37 dei 59 benchmark pubblici."
79
- },
80
- "Doubao-1.5-vision-pro": {
81
- "description": "Doubao-1.5-vision-pro è un grande modello multimodale aggiornato, che supporta il riconoscimento di immagini a qualsiasi risoluzione e proporzioni estremamente lunghe, migliorando le capacità di ragionamento visivo, riconoscimento di documenti, comprensione delle informazioni dettagliate e rispetto delle istruzioni."
82
- },
83
- "Doubao-1.5-vision-pro-32k": {
84
- "description": "Doubao-1.5-vision-pro è un modello multimodale aggiornato, che supporta il riconoscimento di immagini con qualsiasi risoluzione e rapporti di aspetto estremi, migliorando le capacità di ragionamento visivo, riconoscimento di documenti, comprensione delle informazioni dettagliate e capacità di seguire istruzioni."
85
- },
86
74
  "Doubao-lite-128k": {
87
- "description": "Doubao-lite offre un'estrema velocità di risposta, un miglior rapporto qualità-prezzo e opzioni più flessibili per diversi scenari dei clienti. Supporta inferenze e fine-tuning con una finestra di contesto di 128k."
75
+ "description": "Doubao-lite offre una velocità di risposta eccezionale e un miglior rapporto qualità-prezzo, fornendo ai clienti scelte più flessibili per diversi scenari. Supporta inferenza e fine-tuning con una finestra contestuale di 128k."
88
76
  },
89
77
  "Doubao-lite-32k": {
90
- "description": "Doubao-lite offre un'estrema velocità di risposta, un miglior rapporto qualità-prezzo e opzioni più flessibili per diversi scenari dei clienti. Supporta inferenze e fine-tuning con una finestra di contesto di 32k."
78
+ "description": "Doubao-lite offre una velocità di risposta eccezionale e un miglior rapporto qualità-prezzo, fornendo ai clienti scelte più flessibili per diversi scenari. Supporta inferenza e fine-tuning con una finestra contestuale di 32k."
91
79
  },
92
80
  "Doubao-lite-4k": {
93
- "description": "Doubao-lite offre un'estrema velocità di risposta, un miglior rapporto qualità-prezzo e opzioni più flessibili per diversi scenari dei clienti. Supporta inferenze e fine-tuning con una finestra di contesto di 4k."
81
+ "description": "Doubao-lite offre una velocità di risposta eccezionale e un miglior rapporto qualità-prezzo, fornendo ai clienti scelte più flessibili per diversi scenari. Supporta inferenza e fine-tuning con una finestra contestuale di 4k."
94
82
  },
95
83
  "Doubao-pro-128k": {
96
- "description": "Il modello principale presenta le migliori prestazioni, adatto per compiti complessi, con risultati eccellenti in scenari di domanda di riferimento, sintesi, creazione, classificazione del testo, e role-playing. Supporta inferenze e fine-tuning con una finestra di contesto di 128k."
97
- },
98
- "Doubao-pro-256k": {
99
- "description": "Il modello principale con le migliori prestazioni, adatto a gestire compiti complessi, con ottimi risultati in scenari di domande e risposte, riassunti, creazione, classificazione del testo e interpretazione di ruoli. Supporta il ragionamento e il fine-tuning con una finestra di contesto di 256k."
84
+ "description": "Il modello principale con le migliori prestazioni, adatto per gestire compiti complessi, con ottimi risultati in domande di riferimento, sintesi, creazione, classificazione del testo, role-playing e altri scenari. Supporta inferenza e fine-tuning con una finestra contestuale di 128k."
100
85
  },
101
86
  "Doubao-pro-32k": {
102
- "description": "Il modello principale presenta le migliori prestazioni, adatto per compiti complessi, con risultati eccellenti in scenari di domanda di riferimento, sintesi, creazione, classificazione del testo, e role-playing. Supporta inferenze e fine-tuning con una finestra di contesto di 32k."
87
+ "description": "Il modello principale con le migliori prestazioni, adatto per gestire compiti complessi, con ottimi risultati in domande di riferimento, sintesi, creazione, classificazione del testo, role-playing e altri scenari. Supporta inferenza e fine-tuning con una finestra contestuale di 32k."
103
88
  },
104
89
  "Doubao-pro-4k": {
105
- "description": "Il modello principale presenta le migliori prestazioni, adatto per compiti complessi, con risultati eccellenti in scenari di domanda di riferimento, sintesi, creazione, classificazione del testo, e role-playing. Supporta inferenze e fine-tuning con una finestra di contesto di 4k."
106
- },
107
- "Doubao-vision-lite-32k": {
108
- "description": "Il modello Doubao-vision è un modello multimodale lanciato da Doubao, dotato di potenti capacità di comprensione e ragionamento delle immagini, nonché di una precisa comprensione delle istruzioni. Il modello ha dimostrato prestazioni eccezionali nell'estrazione di informazioni testuali da immagini e in compiti di ragionamento basati su immagini, applicabile a compiti di domanda e risposta visiva più complessi e ampi."
109
- },
110
- "Doubao-vision-pro-32k": {
111
- "description": "Il modello Doubao-vision è un modello multimodale lanciato da Doubao, dotato di potenti capacità di comprensione e ragionamento delle immagini, nonché di una precisa comprensione delle istruzioni. Il modello ha dimostrato prestazioni eccezionali nell'estrazione di informazioni testuali da immagini e in compiti di ragionamento basati su immagini, applicabile a compiti di domanda e risposta visiva più complessi e ampi."
90
+ "description": "Il modello principale con le migliori prestazioni, adatto per gestire compiti complessi, con ottimi risultati in domande di riferimento, sintesi, creazione, classificazione del testo, role-playing e altri scenari. Supporta inferenza e fine-tuning con una finestra contestuale di 4k."
112
91
  },
113
92
  "ERNIE-3.5-128K": {
114
93
  "description": "Modello di linguaggio di grande scala di punta sviluppato da Baidu, che copre un'enorme quantità di dati in cinese e inglese, con potenti capacità generali, in grado di soddisfare la maggior parte delle esigenze di domande e risposte, generazione creativa e scenari di applicazione dei plugin; supporta l'integrazione automatica con il plugin di ricerca di Baidu, garantendo l'aggiornamento delle informazioni nelle risposte."
@@ -914,9 +893,39 @@
914
893
  "doubao-1.5-thinking-pro": {
915
894
  "description": "Il modello di pensiero profondo Doubao-1.5, completamente nuovo, si distingue in ambiti professionali come matematica, programmazione e ragionamento scientifico, oltre che in compiti generali come la scrittura creativa, raggiungendo o avvicinandosi ai livelli di eccellenza del settore in numerosi benchmark autorevoli come AIME 2024, Codeforces e GPQA. Supporta una finestra di contesto di 128k e un output di 16k."
916
895
  },
896
+ "doubao-1.5-thinking-pro-m": {
897
+ "description": "Doubao-1.5 è un nuovo modello di pensiero profondo (versione m con capacità native di inferenza multimodale profonda), eccellente in matematica, programmazione, ragionamento scientifico e compiti generali come scrittura creativa. Raggiunge o si avvicina al livello top nel settore in benchmark autorevoli come AIME 2024, Codeforces, GPQA. Supporta una finestra contestuale di 128k e output di 16k."
898
+ },
899
+ "doubao-1.5-thinking-vision-pro": {
900
+ "description": "Nuovo modello di pensiero profondo visivo con capacità multimodali generali potenziate, che ha raggiunto prestazioni SOTA in 37 su 59 benchmark pubblici."
901
+ },
902
+ "doubao-1.5-ui-tars": {
903
+ "description": "Doubao-1.5-UI-TARS è un modello Agent nativo progettato per l'interazione con interfacce grafiche (GUI). Interagisce senza soluzione di continuità con la GUI attraverso capacità umanoidi di percezione, ragionamento e azione."
904
+ },
917
905
  "doubao-1.5-vision-lite": {
918
906
  "description": "Doubao-1.5-vision-lite è un grande modello multimodale aggiornato, che supporta il riconoscimento di immagini a qualsiasi risoluzione e proporzioni estremamente lunghe, migliorando le capacità di ragionamento visivo, riconoscimento di documenti, comprensione delle informazioni dettagliate e rispetto delle istruzioni. Supporta una finestra di contesto di 128k e una lunghezza di uscita massima di 16k token."
919
907
  },
908
+ "doubao-1.5-vision-pro": {
909
+ "description": "Doubao-1.5-vision-pro è un modello multimodale avanzato che supporta il riconoscimento di immagini a qualsiasi risoluzione e rapporti d'aspetto estremi, migliorando il ragionamento visivo, il riconoscimento documentale, la comprensione dei dettagli e l'aderenza alle istruzioni."
910
+ },
911
+ "doubao-1.5-vision-pro-32k": {
912
+ "description": "Doubao-1.5-vision-pro è un modello multimodale avanzato che supporta il riconoscimento di immagini a qualsiasi risoluzione e rapporti d'aspetto estremi, migliorando il ragionamento visivo, il riconoscimento documentale, la comprensione dei dettagli e l'aderenza alle istruzioni."
913
+ },
914
+ "doubao-lite-128k": {
915
+ "description": "Offre una velocità di risposta eccezionale e un miglior rapporto qualità-prezzo, fornendo ai clienti scelte più flessibili per diversi scenari. Supporta inferenza e fine-tuning con una finestra contestuale di 128k."
916
+ },
917
+ "doubao-lite-32k": {
918
+ "description": "Offre una velocità di risposta eccezionale e un miglior rapporto qualità-prezzo, fornendo ai clienti scelte più flessibili per diversi scenari. Supporta inferenza e fine-tuning con una finestra contestuale di 32k."
919
+ },
920
+ "doubao-lite-4k": {
921
+ "description": "Offre una velocità di risposta eccezionale e un miglior rapporto qualità-prezzo, fornendo ai clienti scelte più flessibili per diversi scenari. Supporta inferenza e fine-tuning con una finestra contestuale di 4k."
922
+ },
923
+ "doubao-pro-256k": {
924
+ "description": "Il modello principale con le migliori prestazioni, adatto per gestire compiti complessi, con ottimi risultati in domande di riferimento, sintesi, creazione, classificazione del testo, role-playing e altri scenari. Supporta inferenza e fine-tuning con una finestra contestuale di 256k."
925
+ },
926
+ "doubao-pro-32k": {
927
+ "description": "Il modello principale con le migliori prestazioni, adatto per gestire compiti complessi, con ottimi risultati in domande di riferimento, sintesi, creazione, classificazione del testo, role-playing e altri scenari. Supporta inferenza e fine-tuning con una finestra contestuale di 32k."
928
+ },
920
929
  "doubao-seed-1.6": {
921
930
  "description": "Doubao-Seed-1.6 è un nuovo modello multimodale di pensiero profondo che supporta tre modalità di pensiero: auto, thinking e non-thinking. In modalità non-thinking, le prestazioni del modello migliorano significativamente rispetto a Doubao-1.5-pro/250115. Supporta una finestra contestuale di 256k e una lunghezza massima di output di 16k token."
922
931
  },
@@ -926,6 +935,12 @@
926
935
  "doubao-seed-1.6-thinking": {
927
936
  "description": "Il modello Doubao-Seed-1.6-thinking ha capacità di pensiero notevolmente potenziate; rispetto a Doubao-1.5-thinking-pro, migliora ulteriormente le capacità di base come coding, matematica e ragionamento logico, supportando anche la comprensione visiva. Supporta una finestra contestuale di 256k e una lunghezza massima di output di 16k token."
928
937
  },
938
+ "doubao-vision-lite-32k": {
939
+ "description": "Il modello Doubao-vision è un modello multimodale lanciato da Doubao, con potenti capacità di comprensione e ragionamento delle immagini e una precisa comprensione delle istruzioni. Il modello mostra prestazioni eccellenti nell'estrazione di informazioni da testo e immagini e in compiti di ragionamento basati su immagini, applicabile a compiti di domande visive più complessi e ampi."
940
+ },
941
+ "doubao-vision-pro-32k": {
942
+ "description": "Il modello Doubao-vision è un modello multimodale lanciato da Doubao, con potenti capacità di comprensione e ragionamento delle immagini e una precisa comprensione delle istruzioni. Il modello mostra prestazioni eccellenti nell'estrazione di informazioni da testo e immagini e in compiti di ragionamento basati su immagini, applicabile a compiti di domande visive più complessi e ampi."
943
+ },
929
944
  "emohaa": {
930
945
  "description": "Emohaa è un modello psicologico, con capacità di consulenza professionale, aiuta gli utenti a comprendere i problemi emotivi."
931
946
  },
@@ -1313,6 +1328,9 @@
1313
1328
  "gpt-4o-mini-search-preview": {
1314
1329
  "description": "La versione preview di GPT-4o mini per la ricerca è un modello appositamente addestrato per comprendere ed eseguire query di ricerca web, utilizzando l’API Chat Completions. Oltre ai costi per token, le query di ricerca web comportano un costo per ogni chiamata allo strumento."
1315
1330
  },
1331
+ "gpt-4o-mini-transcribe": {
1332
+ "description": "GPT-4o Mini Transcribe è un modello di trascrizione vocale che utilizza GPT-4o per convertire audio in testo. Rispetto al modello Whisper originale, migliora il tasso di errore delle parole e la precisione nel riconoscimento linguistico. Usalo per ottenere trascrizioni più accurate."
1333
+ },
1316
1334
  "gpt-4o-mini-tts": {
1317
1335
  "description": "GPT-4o mini TTS è un modello di sintesi vocale basato su GPT-4o mini, che offre una generazione di voce di alta qualità a un costo più basso."
1318
1336
  },
@@ -1322,12 +1340,15 @@
1322
1340
  "gpt-4o-realtime-preview-2024-10-01": {
1323
1341
  "description": "Versione in tempo reale di GPT-4o, supporta input e output audio e testuali in tempo reale."
1324
1342
  },
1325
- "gpt-4o-realtime-preview-2024-12-17": {
1343
+ "gpt-4o-realtime-preview-2025-06-03": {
1326
1344
  "description": "Versione in tempo reale di GPT-4o, supporta input e output audio e testuali in tempo reale."
1327
1345
  },
1328
1346
  "gpt-4o-search-preview": {
1329
1347
  "description": "La versione preview di GPT-4o per la ricerca è un modello appositamente addestrato per comprendere ed eseguire query di ricerca web, utilizzando l’API Chat Completions. Oltre ai costi per token, le query di ricerca web comportano un costo per ogni chiamata allo strumento."
1330
1348
  },
1349
+ "gpt-4o-transcribe": {
1350
+ "description": "GPT-4o Transcribe è un modello di trascrizione vocale che utilizza GPT-4o per convertire audio in testo. Rispetto al modello Whisper originale, migliora il tasso di errore delle parole e la precisione nel riconoscimento linguistico. Usalo per ottenere trascrizioni più accurate."
1351
+ },
1331
1352
  "grok-2-1212": {
1332
1353
  "description": "Questo modello ha migliorato l'accuratezza, il rispetto delle istruzioni e le capacità multilingue."
1333
1354
  },
@@ -1460,6 +1481,9 @@
1460
1481
  "jina-deepsearch-v1": {
1461
1482
  "description": "La ricerca approfondita combina la ricerca online, la lettura e il ragionamento, consentendo indagini complete. Puoi considerarlo come un agente che accetta il tuo compito di ricerca - eseguirà una ricerca approfondita e iterativa prima di fornire una risposta. Questo processo implica una continua ricerca, ragionamento e risoluzione dei problemi da diverse angolazioni. Questo è fondamentalmente diverso dai modelli di grandi dimensioni standard che generano risposte direttamente dai dati pre-addestrati e dai tradizionali sistemi RAG che si basano su ricerche superficiali una tantum."
1462
1483
  },
1484
+ "kimi-k2-0711-preview": {
1485
+ "description": "kimi-k2 è un modello base con architettura MoE dotato di potenti capacità di codice e Agent, con un totale di 1T parametri e 32B parametri attivi. Nei test di benchmark per ragionamento generale, programmazione, matematica e Agent, il modello K2 supera altri modelli open source principali."
1486
+ },
1463
1487
  "kimi-latest": {
1464
1488
  "description": "Il prodotto Kimi Smart Assistant utilizza il più recente modello Kimi, che potrebbe includere funzionalità non ancora stabili. Supporta la comprensione delle immagini e selezionerà automaticamente il modello di fatturazione 8k/32k/128k in base alla lunghezza del contesto della richiesta."
1465
1489
  },
@@ -2352,7 +2376,7 @@
2352
2376
  "description": "Il modello v0-1.5-md è adatto per compiti quotidiani e generazione di interfacce utente (UI)"
2353
2377
  },
2354
2378
  "whisper-1": {
2355
- "description": "Modello di riconoscimento vocale universale, supporta il riconoscimento vocale multilingue, la traduzione vocale e il riconoscimento linguistico."
2379
+ "description": "Modello universale di riconoscimento vocale, supporta riconoscimento vocale multilingue, traduzione vocale e identificazione della lingua."
2356
2380
  },
2357
2381
  "wizardlm2": {
2358
2382
  "description": "WizardLM 2 è un modello di linguaggio fornito da Microsoft AI, particolarmente efficace in dialoghi complessi, multilingue, ragionamento e assistenti intelligenti."
@@ -71,44 +71,23 @@
71
71
  "DeepSeek-V3": {
72
72
  "description": "DeepSeek-V3は、深度求索社が独自に開発したMoEモデルです。DeepSeek-V3は、Qwen2.5-72BやLlama-3.1-405Bなどの他のオープンソースモデルを超える評価成績を収め、性能面では世界トップクラスのクローズドソースモデルであるGPT-4oやClaude-3.5-Sonnetと肩を並べています。"
73
73
  },
74
- "Doubao-1.5-thinking-pro-m": {
75
- "description": "Doubao-1.5は新しい深い思考モデルであり(mバージョンはネイティブなマルチモーダル深推論能力を備えています)、数学、プログラミング、科学推論などの専門分野や創造的な執筆などの一般的なタスクで優れたパフォーマンスを発揮し、AIME 2024、Codeforces、GPQAなどの複数の権威あるベンチマークで業界の第一梯隊レベルに達しています。128kのコンテキストウィンドウと16kの出力をサポートしています。"
76
- },
77
- "Doubao-1.5-thinking-vision-pro": {
78
- "description": "全く新しい視覚的深層思考モデルで、より強力な汎用マルチモーダル理解と推論能力を備えており、59 の公開評価基準のうち 37 の基準で SOTA パフォーマンスを達成しています。"
79
- },
80
- "Doubao-1.5-vision-pro": {
81
- "description": "Doubao-1.5-vision-proは新たにアップグレードされた多モーダル大モデルで、任意の解像度と極端なアスペクト比の画像認識をサポートし、視覚推論、文書認識、詳細情報の理解、指示の遵守能力を強化しています。"
82
- },
83
- "Doubao-1.5-vision-pro-32k": {
84
- "description": "Doubao-1.5-vision-proは全く新しいアップグレード版のマルチモーダル大モデルで、任意の解像度と極端なアスペクト比の画像認識をサポートし、視覚推論、文書認識、詳細情報の理解、指示遵守能力を強化しています。"
85
- },
86
74
  "Doubao-lite-128k": {
87
- "description": "Doubao-liteは、極めて高速な応答速度と優れたコストパフォーマンスを備え、顧客のさまざまなシーンに柔軟な選択肢を提供します。128kコンテキストウィンドウの推論と微調整をサポートしています。"
75
+ "description": "Doubao-liteは極めて高速な応答速度と優れたコストパフォーマンスを備え、さまざまなシナリオに柔軟な選択肢を提供します。128kのコンテキストウィンドウでの推論と微調整をサポートします。"
88
76
  },
89
77
  "Doubao-lite-32k": {
90
- "description": "Doubao-liteは、極めて高速な応答速度と優れたコストパフォーマンスを備え、顧客のさまざまなシーンに柔軟な選択肢を提供します。32kコンテキストウィンドウの推論と微調整をサポートしています。"
78
+ "description": "Doubao-liteは極めて高速な応答速度と優れたコストパフォーマンスを備え、さまざまなシナリオに柔軟な選択肢を提供します。32kのコンテキストウィンドウでの推論と微調整をサポートします。"
91
79
  },
92
80
  "Doubao-lite-4k": {
93
- "description": "Doubao-liteは、極めて高速な応答速度と優れたコストパフォーマンスを備え、顧客のさまざまなシーンに柔軟な選択肢を提供します。4kコンテキストウィンドウの推論と微調整をサポートしています。"
81
+ "description": "Doubao-liteは極めて高速な応答速度と優れたコストパフォーマンスを備え、さまざまなシナリオに柔軟な選択肢を提供します。4kのコンテキストウィンドウでの推論と微調整をサポートします。"
94
82
  },
95
83
  "Doubao-pro-128k": {
96
- "description": "最も効果的な主力モデルで、複雑なタスクの処理に適しており、参考質問応答、要約、創作、テキスト分類、ロールプレイングなどのシーンで素晴らしい結果を出します。128kコンテキストウィンドウの推論と微調整をサポートしています。"
97
- },
98
- "Doubao-pro-256k": {
99
- "description": "最も効果的な主力モデルで、複雑なタスクの処理に適しており、参考質問応答、要約、創作、テキスト分類、ロールプレイなどのシーンで優れた効果を発揮します。256kのコンテキストウィンドウでの推論とファインチューニングをサポートします。"
84
+ "description": "最も高性能な主力モデルで、複雑なタスクの処理に適しています。参考質問応答、要約、創作、テキスト分類、ロールプレイなどのシーンで優れた効果を発揮します。128kのコンテキストウィンドウでの推論と微調整をサポートします。"
100
85
  },
101
86
  "Doubao-pro-32k": {
102
- "description": "最も効果的な主力モデルで、複雑なタスクの処理に適しており、参考質問応答、要約、創作、テキスト分類、ロールプレイングなどのシーンで素晴らしい結果を出します。32kコンテキストウィンドウの推論と微調整をサポートしています。"
87
+ "description": "最も高性能な主力モデルで、複雑なタスクの処理に適しています。参考質問応答、要約、創作、テキスト分類、ロールプレイなどのシーンで優れた効果を発揮します。32kのコンテキストウィンドウでの推論と微調整をサポートします。"
103
88
  },
104
89
  "Doubao-pro-4k": {
105
- "description": "最も効果的な主力モデルで、複雑なタスクの処理に適しており、参考質問応答、要約、創作、テキスト分類、ロールプレイングなどのシーンで素晴らしい結果を出します。4kコンテキストウィンドウの推論と微調整をサポートしています。"
106
- },
107
- "Doubao-vision-lite-32k": {
108
- "description": "Doubao-visionモデルは豆包が提供するマルチモーダル大モデルで、強力な画像理解と推論能力、正確な指示理解能力を備えています。モデルは画像テキスト情報の抽出や画像に基づく推論タスクで強力な性能を発揮し、より複雑で広範な視覚的質問応答タスクに応用できます。"
109
- },
110
- "Doubao-vision-pro-32k": {
111
- "description": "Doubao-visionモデルは豆包が提供するマルチモーダル大モデルで、強力な画像理解と推論能力、正確な指示理解能力を備えています。モデルは画像テキスト情報の抽出や画像に基づく推論タスクで強力な性能を発揮し、より複雑で広範な視覚的質問応答タスクに応用できます。"
90
+ "description": "最も高性能な主力モデルで、複雑なタスクの処理に適しています。参考質問応答、要約、創作、テキスト分類、ロールプレイなどのシーンで優れた効果を発揮します。4kのコンテキストウィンドウでの推論と微調整をサポートします。"
112
91
  },
113
92
  "ERNIE-3.5-128K": {
114
93
  "description": "百度が独自に開発したフラッグシップの大規模言語モデルで、膨大な中英語のコーパスをカバーし、強力な汎用能力を持っています。ほとんどの対話型質問応答、創作生成、プラグインアプリケーションの要件を満たすことができます。また、百度検索プラグインとの自動接続をサポートし、質問応答情報のタイムリーさを保証します。"
@@ -914,9 +893,39 @@
914
893
  "doubao-1.5-thinking-pro": {
915
894
  "description": "Doubao-1.5の新しい深層思考モデルは、数学、プログラミング、科学的推論などの専門分野や、創造的な執筆などの一般的なタスクで優れたパフォーマンスを発揮し、AIME 2024、Codeforces、GPQAなどの複数の権威あるベンチマークで業界の最前線に達するか、またはそれに近いレベルを実現しています。128kのコンテキストウィンドウと16kの出力をサポートしています。"
916
895
  },
896
+ "doubao-1.5-thinking-pro-m": {
897
+ "description": "Doubao-1.5の新しい深層思考モデル(mバージョンはネイティブのマルチモーダル深層推論能力を備えています)は、数学、プログラミング、科学的推論などの専門分野および創造的な執筆などの一般タスクで優れたパフォーマンスを発揮し、AIME 2024、Codeforces、GPQAなどの複数の権威あるベンチマークで業界トップクラスのレベルに達しています。128kのコンテキストウィンドウと16kの出力をサポートします。"
898
+ },
899
+ "doubao-1.5-thinking-vision-pro": {
900
+ "description": "新しい視覚深層思考モデルで、より強力な汎用マルチモーダル理解と推論能力を備え、59の公開ベンチマークのうち37でSOTA(最先端)を達成しています。"
901
+ },
902
+ "doubao-1.5-ui-tars": {
903
+ "description": "Doubao-1.5-UI-TARSは、グラフィカルユーザーインターフェース(GUI)向けにネイティブ設計されたエージェントモデルです。知覚、推論、行動などの人間のような能力を通じてGUIとシームレスにインタラクションします。"
904
+ },
917
905
  "doubao-1.5-vision-lite": {
918
906
  "description": "Doubao-1.5-vision-liteは新たにアップグレードされた多モーダル大モデルで、任意の解像度と極端なアスペクト比の画像認識をサポートし、視覚推論、文書認識、詳細情報の理解、指示の遵守能力を強化しています。128kのコンテキストウィンドウをサポートし、出力長は最大16kトークンをサポートします。"
919
907
  },
908
+ "doubao-1.5-vision-pro": {
909
+ "description": "Doubao-1.5-vision-proは新たにアップグレードされたマルチモーダル大規模モデルで、任意の解像度および極端なアスペクト比の画像認識をサポートし、視覚的推論、文書認識、詳細情報の理解、指示の遵守能力を強化しています。"
910
+ },
911
+ "doubao-1.5-vision-pro-32k": {
912
+ "description": "Doubao-1.5-vision-proは新たにアップグレードされたマルチモーダル大規模モデルで、任意の解像度および極端なアスペクト比の画像認識をサポートし、視覚的推論、文書認識、詳細情報の理解、指示の遵守能力を強化しています。"
913
+ },
914
+ "doubao-lite-128k": {
915
+ "description": "極めて高速な応答速度と優れたコストパフォーマンスを備え、さまざまなシナリオに柔軟な選択肢を提供します。128kのコンテキストウィンドウでの推論と微調整をサポートします。"
916
+ },
917
+ "doubao-lite-32k": {
918
+ "description": "極めて高速な応答速度と優れたコストパフォーマンスを備え、さまざまなシナリオに柔軟な選択肢を提供します。32kのコンテキストウィンドウでの推論と微調整をサポートします。"
919
+ },
920
+ "doubao-lite-4k": {
921
+ "description": "極めて高速な応答速度と優れたコストパフォーマンスを備え、さまざまなシナリオに柔軟な選択肢を提供します。4kのコンテキストウィンドウでの推論と微調整をサポートします。"
922
+ },
923
+ "doubao-pro-256k": {
924
+ "description": "最も高性能な主力モデルで、複雑なタスクの処理に適しています。参考質問応答、要約、創作、テキスト分類、ロールプレイなどのシーンで優れた効果を発揮します。256kのコンテキストウィンドウでの推論と微調整をサポートします。"
925
+ },
926
+ "doubao-pro-32k": {
927
+ "description": "最も高性能な主力モデルで、複雑なタスクの処理に適しています。参考質問応答、要約、創作、テキスト分類、ロールプレイなどのシーンで優れた効果を発揮します。32kのコンテキストウィンドウでの推論と微調整をサポートします。"
928
+ },
920
929
  "doubao-seed-1.6": {
921
930
  "description": "Doubao-Seed-1.6 は新しいマルチモーダル深層思考モデルで、auto/thinking/non-thinking の三つの思考モードをサポートします。non-thinking モードでは、Doubao-1.5-pro/250115 と比較して大幅に性能が向上しています。256k のコンテキストウィンドウをサポートし、最大 16k トークンの出力長に対応しています。"
922
931
  },
@@ -926,6 +935,12 @@
926
935
  "doubao-seed-1.6-thinking": {
927
936
  "description": "Doubao-Seed-1.6-thinking モデルは思考能力が大幅に強化されており、Doubao-1.5-thinking-pro と比較して、コーディング、数学、論理推論などの基礎能力がさらに向上しています。視覚理解もサポートしています。256k のコンテキストウィンドウをサポートし、最大 16k トークンの出力長に対応しています。"
928
937
  },
938
+ "doubao-vision-lite-32k": {
939
+ "description": "Doubao-visionモデルは豆包が提供するマルチモーダル大規模モデルで、強力な画像理解と推論能力、正確な指示理解能力を備えています。画像テキスト情報抽出や画像に基づく推論タスクで高い性能を示し、より複雑で幅広い視覚質問応答タスクに応用可能です。"
940
+ },
941
+ "doubao-vision-pro-32k": {
942
+ "description": "Doubao-visionモデルは豆包が提供するマルチモーダル大規模モデルで、強力な画像理解と推論能力、正確な指示理解能力を備えています。画像テキスト情報抽出や画像に基づく推論タスクで高い性能を示し、より複雑で幅広い視覚質問応答タスクに応用可能です。"
943
+ },
929
944
  "emohaa": {
930
945
  "description": "Emohaaは心理モデルで、専門的な相談能力を持ち、ユーザーが感情問題を理解するのを助けます。"
931
946
  },
@@ -1313,6 +1328,9 @@
1313
1328
  "gpt-4o-mini-search-preview": {
1314
1329
  "description": "GPT-4o mini検索プレビュー版は、ウェブ検索クエリの理解と実行に特化して訓練されたモデルで、Chat Completions APIを使用しています。トークン料金に加え、ウェブ検索クエリはツール呼び出しごとに料金が発生します。"
1315
1330
  },
1331
+ "gpt-4o-mini-transcribe": {
1332
+ "description": "GPT-4o Mini TranscribeはGPT-4oを使用した音声からテキストへの転写モデルです。元のWhisperモデルと比較して単語誤り率が改善され、言語認識と精度が向上しています。より正確な転写を得るためにご利用ください。"
1333
+ },
1316
1334
  "gpt-4o-mini-tts": {
1317
1335
  "description": "GPT-4o mini TTS は、GPT-4o mini に基づくテキスト音声合成モデルで、高品質な音声生成を低コストで提供します。"
1318
1336
  },
@@ -1322,12 +1340,15 @@
1322
1340
  "gpt-4o-realtime-preview-2024-10-01": {
1323
1341
  "description": "GPT-4oリアルタイムバージョン、音声とテキストのリアルタイム入力と出力をサポート"
1324
1342
  },
1325
- "gpt-4o-realtime-preview-2024-12-17": {
1326
- "description": "GPT-4oリアルタイムバージョン、音声とテキストのリアルタイム入力と出力をサポート"
1343
+ "gpt-4o-realtime-preview-2025-06-03": {
1344
+ "description": "GPT-4oのリアルタイムバージョンで、音声とテキストのリアルタイム入出力をサポートします。"
1327
1345
  },
1328
1346
  "gpt-4o-search-preview": {
1329
1347
  "description": "GPT-4o検索プレビュー版は、ウェブ検索クエリの理解と実行に特化して訓練されたモデルで、Chat Completions APIを使用しています。トークン料金に加え、ウェブ検索クエリはツール呼び出しごとに料金が発生します。"
1330
1348
  },
1349
+ "gpt-4o-transcribe": {
1350
+ "description": "GPT-4o TranscribeはGPT-4oを使用した音声からテキストへの転写モデルです。元のWhisperモデルと比較して単語誤り率が改善され、言語認識と精度が向上しています。より正確な転写を得るためにご利用ください。"
1351
+ },
1331
1352
  "grok-2-1212": {
1332
1353
  "description": "このモデルは、精度、指示の遵守、そして多言語能力において改善されています。"
1333
1354
  },
@@ -1460,6 +1481,9 @@
1460
1481
  "jina-deepsearch-v1": {
1461
1482
  "description": "深層検索は、ウェブ検索、読解、推論を組み合わせて、包括的な調査を行います。これは、あなたの研究タスクを受け入れる代理人として考えることができ、広範な検索を行い、何度も反復してから答えを提供します。このプロセスには、継続的な研究、推論、さまざまな視点からの問題解決が含まれます。これは、事前に訓練されたデータから直接答えを生成する標準的な大規模モデルや、一度きりの表面的な検索に依存する従来のRAGシステムとは根本的に異なります。"
1462
1483
  },
1484
+ "kimi-k2-0711-preview": {
1485
+ "description": "kimi-k2は強力なコードおよびエージェント能力を備えたMoEアーキテクチャの基盤モデルで、総パラメータ数は1兆、活性化パラメータは320億です。一般知識推論、プログラミング、数学、エージェントなどの主要カテゴリのベンチマーク性能テストで、K2モデルは他の主流オープンソースモデルを上回る性能を示しています。"
1486
+ },
1463
1487
  "kimi-latest": {
1464
1488
  "description": "Kimi スマートアシスタント製品は最新の Kimi 大モデルを使用しており、まだ安定していない機能が含まれている可能性があります。画像理解をサポートし、リクエストのコンテキストの長さに応じて 8k/32k/128k モデルを請求モデルとして自動的に選択します。"
1465
1489
  },
@@ -2352,7 +2376,7 @@
2352
2376
  "description": "v0-1.5-md モデルは、日常的なタスクやユーザーインターフェース(UI)生成に適しています"
2353
2377
  },
2354
2378
  "whisper-1": {
2355
- "description": "汎用音声認識モデル、多言語音声認識、音声翻訳、言語認識をサポート"
2379
+ "description": "汎用音声認識モデルで、多言語の音声認識、音声翻訳、言語識別をサポートします。"
2356
2380
  },
2357
2381
  "wizardlm2": {
2358
2382
  "description": "WizardLM 2は、Microsoft AIが提供する言語モデルであり、複雑な対話、多言語、推論、インテリジェントアシスタントの分野で特に優れた性能を発揮します。"