@lobehub/chat 1.97.15 → 1.97.17

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.
@@ -71,44 +71,23 @@
71
71
  "DeepSeek-V3": {
72
72
  "description": "DeepSeek-V3 là một mô hình MoE do công ty DeepSeek tự phát triển. Nhiều kết quả đánh giá của DeepSeek-V3 đã vượt qua các mô hình mã nguồn mở khác như Qwen2.5-72B và Llama-3.1-405B, và về hiệu suất không thua kém các mô hình đóng nguồn hàng đầu thế giới như GPT-4o và Claude-3.5-Sonnet."
73
73
  },
74
- "Doubao-1.5-thinking-pro-m": {
75
- "description": "Doubao-1.5 là mô hình suy nghĩ sâu mới (phiên bản m đi kèm khả năng suy luận đa phương thức nguyên bản), thể hiện xuất sắc trong các lĩnh vực chuyên môn như toán học, lập trình, suy luận khoa học và các nhiệm vụ chung như viết sáng tạo, đạt hoặc gần đạt trình độ hàng đầu trong nhiều bài kiểm tra chuẩn uy tín như AIME 2024, Codeforces, GPQA. Hỗ trợ cửa sổ ngữ cảnh 128k, đầu ra 16k."
76
- },
77
- "Doubao-1.5-thinking-vision-pro": {
78
- "description": "Mô hình tư duy sâu mới với thị giác, có khả năng hiểu và suy luận đa phương thức mạnh mẽ hơn, đạt được hiệu suất SOTA trong 37 trên 59 tiêu chuẩn đánh giá công khai."
79
- },
80
- "Doubao-1.5-vision-pro": {
81
- "description": "Doubao-1.5-vision-pro là mô hình đa phương tiện lớn được nâng cấp mới, hỗ trợ nhận diện hình ảnh với bất kỳ độ phân giải nào và tỷ lệ dài rộng cực đoan, tăng cường khả năng suy luận hình ảnh, nhận diện tài liệu, hiểu thông tin chi tiết và tuân thủ hướng dẫn."
82
- },
83
- "Doubao-1.5-vision-pro-32k": {
84
- "description": "Doubao-1.5-vision-pro là mô hình lớn đa phương thức được nâng cấp hoàn toàn, hỗ trợ nhận diện hình ảnh với bất kỳ độ phân giải nào và tỷ lệ dài rộng cực đoan, tăng cường khả năng suy luận thị giác, nhận diện tài liệu, hiểu thông tin chi tiết và tuân thủ chỉ dẫn."
85
- },
86
74
  "Doubao-lite-128k": {
87
- "description": "Doubao-lite tốc độ phản hồi cực nhanh, giá trị tốt hơn, cung cấp sự lựa chọn linh hoạt cho khách hàng trong nhiều tình huống khác nhau. Hỗ trợ suy diễn và tinh chỉnh trong ngữ cảnh 128k."
75
+ "description": "Doubao-lite sở hữu tốc độ phản hồi tối ưu, hiệu quả chi phí tốt hơn, cung cấp lựa chọn linh hoạt hơn cho các kịch bản khác nhau của khách hàng. Hỗ trợ suy luận và tinh chỉnh với cửa sổ ngữ cảnh 128k."
88
76
  },
89
77
  "Doubao-lite-32k": {
90
- "description": "Doubao-lite tốc độ phản hồi cực nhanh, giá trị tốt hơn, cung cấp sự lựa chọn linh hoạt cho khách hàng trong nhiều tình huống khác nhau. Hỗ trợ suy diễn và tinh chỉnh trong ngữ cảnh 32k."
78
+ "description": "Doubao-lite sở hữu tốc độ phản hồi tối ưu, hiệu quả chi phí tốt hơn, cung cấp lựa chọn linh hoạt hơn cho các kịch bản khác nhau của khách hàng. Hỗ trợ suy luận và tinh chỉnh với cửa sổ ngữ cảnh 32k."
91
79
  },
92
80
  "Doubao-lite-4k": {
93
- "description": "Doubao-lite tốc độ phản hồi cực nhanh, giá trị tốt hơn, cung cấp sự lựa chọn linh hoạt cho khách hàng trong nhiều tình huống khác nhau. Hỗ trợ suy diễn và tinh chỉnh trong ngữ cảnh 4k."
81
+ "description": "Doubao-lite sở hữu tốc độ phản hồi tối ưu, hiệu quả chi phí tốt hơn, cung cấp lựa chọn linh hoạt hơn cho các kịch bản khác nhau của khách hàng. Hỗ trợ suy luận và tinh chỉnh với cửa sổ ngữ cảnh 4k."
94
82
  },
95
83
  "Doubao-pro-128k": {
96
- "description": "Mô hình chính hiệu quả tốt nhất, phù hợp để xử lý các nhiệm vụ phức tạp, có hiệu quả tốt trong các tình huống như hỏi đáp tham khảo, tóm tắt, sáng tác, phân loại văn bản, nhập vai. Hỗ trợ suy diễn và tinh chỉnh trong ngữ cảnh 128k."
97
- },
98
- "Doubao-pro-256k": {
99
- "description": "Mô hình chủ lực có hiệu quả tốt nhất, phù hợp để xử lý các nhiệm vụ phức tạp, có hiệu quả tốt trong các tình huống như hỏi đáp tham khảo, tóm tắt, sáng tác, phân loại văn bản, và nhập vai. Hỗ trợ suy luận và tinh chỉnh với cửa sổ ngữ cảnh 256k."
84
+ "description": "Mô hình chủ lực với hiệu quả tốt nhất, phù hợp xử lý các nhiệm vụ phức tạp, có hiệu quả xuất sắc trong các kịch bản như hỏi đáp tham khảo, tóm tắt, sáng tạo, phân loại văn bản, nhập vai. Hỗ trợ suy luận và tinh chỉnh với cửa sổ ngữ cảnh 128k."
100
85
  },
101
86
  "Doubao-pro-32k": {
102
- "description": "Mô hình chính hiệu quả tốt nhất, phù hợp để xử lý các nhiệm vụ phức tạp, có hiệu quả tốt trong các tình huống như hỏi đáp tham khảo, tóm tắt, sáng tác, phân loại văn bản, nhập vai. Hỗ trợ suy diễn và tinh chỉnh trong ngữ cảnh 32k."
87
+ "description": "Mô hình chủ lực với hiệu quả tốt nhất, phù hợp xử lý các nhiệm vụ phức tạp, có hiệu quả xuất sắc trong các kịch bản như hỏi đáp tham khảo, tóm tắt, sáng tạo, phân loại văn bản, nhập vai. Hỗ trợ suy luận và tinh chỉnh với cửa sổ ngữ cảnh 32k."
103
88
  },
104
89
  "Doubao-pro-4k": {
105
- "description": "Mô hình chính hiệu quả tốt nhất, phù hợp để xử lý các nhiệm vụ phức tạp, có hiệu quả tốt trong các tình huống như hỏi đáp tham khảo, tóm tắt, sáng tác, phân loại văn bản, nhập vai. Hỗ trợ suy diễn và tinh chỉnh trong ngữ cảnh 4k."
106
- },
107
- "Doubao-vision-lite-32k": {
108
- "description": "Mô hình Doubao-vision là mô hình lớn đa phương thức do Doubao phát triển, có khả năng hiểu và suy luận hình ảnh mạnh mẽ, cũng như khả năng hiểu chỉ dẫn chính xác. Mô hình thể hiện hiệu suất mạnh mẽ trong việc trích xuất thông tin văn bản từ hình ảnh và các nhiệm vụ suy luận dựa trên hình ảnh, có thể áp dụng cho các nhiệm vụ hỏi đáp thị giác phức tạp và đa dạng hơn."
109
- },
110
- "Doubao-vision-pro-32k": {
111
- "description": "Mô hình Doubao-vision là mô hình lớn đa phương thức do Doubao phát triển, có khả năng hiểu và suy luận hình ảnh mạnh mẽ, cũng như khả năng hiểu chỉ dẫn chính xác. Mô hình thể hiện hiệu suất mạnh mẽ trong việc trích xuất thông tin văn bản từ hình ảnh và các nhiệm vụ suy luận dựa trên hình ảnh, có thể áp dụng cho các nhiệm vụ hỏi đáp thị giác phức tạp và đa dạng hơn."
90
+ "description": "Mô hình chủ lực với hiệu quả tốt nhất, phù hợp xử lý các nhiệm vụ phức tạp, có hiệu quả xuất sắc trong các kịch bản như hỏi đáp tham khảo, tóm tắt, sáng tạo, phân loại văn bản, nhập vai. Hỗ trợ suy luận và tinh chỉnh với cửa sổ ngữ cảnh 4k."
112
91
  },
113
92
  "ERNIE-3.5-128K": {
114
93
  "description": "Mô hình ngôn ngữ quy mô lớn hàng đầu do Baidu tự phát triển, bao phủ một lượng lớn tài liệu tiếng Trung và tiếng Anh, có khả năng tổng quát mạnh mẽ, có thể đáp ứng hầu hết các yêu cầu về đối thoại, hỏi đáp, sáng tạo nội dung và các tình huống ứng dụng plugin; hỗ trợ tự động kết nối với plugin tìm kiếm của Baidu, đảm bảo thông tin hỏi đáp luôn được cập nhật kịp thời."
@@ -914,9 +893,39 @@
914
893
  "doubao-1.5-thinking-pro": {
915
894
  "description": "Mô hình tư duy sâu mới Doubao-1.5, nổi bật trong các lĩnh vực chuyên môn như toán học, lập trình, suy luận khoa học và các nhiệm vụ viết sáng tạo, đạt hoặc gần đạt trình độ hàng đầu trong ngành trên nhiều tiêu chuẩn uy tín như AIME 2024, Codeforces, GPQA. Hỗ trợ cửa sổ ngữ cảnh 128k, đầu ra 16k."
916
895
  },
896
+ "doubao-1.5-thinking-pro-m": {
897
+ "description": "Doubao-1.5 là mô hình tư duy sâu hoàn toàn mới (phiên bản m có khả năng suy luận đa phương thức sâu nguyên bản), thể hiện xuất sắc trong các lĩnh vực chuyên môn như toán học, lập trình, suy luận khoa học và các nhiệm vụ sáng tạo chung. Đạt hoặc gần đạt trình độ hàng đầu ngành trên nhiều chuẩn đánh giá uy tín như AIME 2024, Codeforces, GPQA. Hỗ trợ cửa sổ ngữ cảnh 128k, đầu ra 16k."
898
+ },
899
+ "doubao-1.5-thinking-vision-pro": {
900
+ "description": "Mô hình tư duy sâu đa phương thức hoàn toàn mới, có khả năng hiểu và suy luận đa phương thức tổng quát mạnh mẽ, đạt hiệu suất SOTA trên 37 trong số 59 chuẩn đánh giá công khai."
901
+ },
902
+ "doubao-1.5-ui-tars": {
903
+ "description": "Doubao-1.5-UI-TARS là mô hình Agent nguyên bản hướng tới tương tác giao diện đồ họa (GUI). Thông qua khả năng nhận thức, suy luận và hành động giống con người, tương tác liền mạch với GUI."
904
+ },
917
905
  "doubao-1.5-vision-lite": {
918
906
  "description": "Doubao-1.5-vision-lite là mô hình đa phương tiện lớn được nâng cấp mới, hỗ trợ nhận diện hình ảnh với bất kỳ độ phân giải nào và tỷ lệ dài rộng cực đoan, tăng cường khả năng suy luận hình ảnh, nhận diện tài liệu, hiểu thông tin chi tiết và tuân thủ hướng dẫn. Hỗ trợ cửa sổ ngữ cảnh 128k, độ dài đầu ra tối đa 16k tokens."
919
907
  },
908
+ "doubao-1.5-vision-pro": {
909
+ "description": "Doubao-1.5-vision-pro là mô hình đa phương thức lớn được nâng cấp hoàn toàn mới, hỗ trợ nhận dạng hình ảnh với độ phân giải tùy ý và tỷ lệ khung hình cực đoan, tăng cường khả năng suy luận thị giác, nhận dạng tài liệu, hiểu thông tin chi tiết và tuân thủ chỉ dẫn."
910
+ },
911
+ "doubao-1.5-vision-pro-32k": {
912
+ "description": "Doubao-1.5-vision-pro là mô hình đa phương thức lớn được nâng cấp hoàn toàn mới, hỗ trợ nhận dạng hình ảnh với độ phân giải tùy ý và tỷ lệ khung hình cực đoan, tăng cường khả năng suy luận thị giác, nhận dạng tài liệu, hiểu thông tin chi tiết và tuân thủ chỉ dẫn."
913
+ },
914
+ "doubao-lite-128k": {
915
+ "description": "Sở hữu tốc độ phản hồi tối ưu, hiệu quả chi phí tốt hơn, cung cấp lựa chọn linh hoạt hơn cho các kịch bản khác nhau của khách hàng. Hỗ trợ suy luận và tinh chỉnh với cửa sổ ngữ cảnh 128k."
916
+ },
917
+ "doubao-lite-32k": {
918
+ "description": "Sở hữu tốc độ phản hồi tối ưu, hiệu quả chi phí tốt hơn, cung cấp lựa chọn linh hoạt hơn cho các kịch bản khác nhau của khách hàng. Hỗ trợ suy luận và tinh chỉnh với cửa sổ ngữ cảnh 32k."
919
+ },
920
+ "doubao-lite-4k": {
921
+ "description": "Sở hữu tốc độ phản hồi tối ưu, hiệu quả chi phí tốt hơn, cung cấp lựa chọn linh hoạt hơn cho các kịch bản khác nhau của khách hàng. Hỗ trợ suy luận và tinh chỉnh với cửa sổ ngữ cảnh 4k."
922
+ },
923
+ "doubao-pro-256k": {
924
+ "description": "Mô hình chủ lực với hiệu quả tốt nhất, phù hợp xử lý các nhiệm vụ phức tạp, có hiệu quả xuất sắc trong các kịch bản như hỏi đáp tham khảo, tóm tắt, sáng tạo, phân loại văn bản, nhập vai. Hỗ trợ suy luận và tinh chỉnh với cửa sổ ngữ cảnh 256k."
925
+ },
926
+ "doubao-pro-32k": {
927
+ "description": "Mô hình chủ lực với hiệu quả tốt nhất, phù hợp xử lý các nhiệm vụ phức tạp, có hiệu quả xuất sắc trong các kịch bản như hỏi đáp tham khảo, tóm tắt, sáng tạo, phân loại văn bản, nhập vai. Hỗ trợ suy luận và tinh chỉnh với cửa sổ ngữ cảnh 32k."
928
+ },
920
929
  "doubao-seed-1.6": {
921
930
  "description": "Doubao-Seed-1.6 là mô hình suy nghĩ sâu đa phương thức hoàn toàn mới, hỗ trợ ba chế độ suy nghĩ auto/thinking/non-thinking. Ở chế độ non-thinking, hiệu quả mô hình cải thiện đáng kể so với Doubao-1.5-pro/250115. Hỗ trợ cửa sổ ngữ cảnh 256k, độ dài đầu ra tối đa 16k tokens."
922
931
  },
@@ -926,6 +935,12 @@
926
935
  "doubao-seed-1.6-thinking": {
927
936
  "description": "Mô hình Doubao-Seed-1.6-thinking có khả năng suy nghĩ được tăng cường đáng kể, so với Doubao-1.5-thinking-pro, nâng cao hơn nữa các năng lực cơ bản như lập trình, toán học, suy luận logic, đồng thời hỗ trợ hiểu hình ảnh. Hỗ trợ cửa sổ ngữ cảnh 256k, độ dài đầu ra tối đa 16k tokens."
928
937
  },
938
+ "doubao-vision-lite-32k": {
939
+ "description": "Mô hình Doubao-vision là mô hình đa phương thức lớn do Doubao phát triển, có khả năng hiểu và suy luận hình ảnh mạnh mẽ, cùng khả năng hiểu chỉ dẫn chính xác. Mô hình thể hiện hiệu suất vượt trội trong việc trích xuất thông tin văn bản từ hình ảnh và các nhiệm vụ suy luận dựa trên hình ảnh, có thể ứng dụng trong các nhiệm vụ hỏi đáp thị giác phức tạp và đa dạng hơn."
940
+ },
941
+ "doubao-vision-pro-32k": {
942
+ "description": "Mô hình Doubao-vision là mô hình đa phương thức lớn do Doubao phát triển, có khả năng hiểu và suy luận hình ảnh mạnh mẽ, cùng khả năng hiểu chỉ dẫn chính xác. Mô hình thể hiện hiệu suất vượt trội trong việc trích xuất thông tin văn bản từ hình ảnh và các nhiệm vụ suy luận dựa trên hình ảnh, có thể ứng dụng trong các nhiệm vụ hỏi đáp thị giác phức tạp và đa dạng hơn."
943
+ },
929
944
  "emohaa": {
930
945
  "description": "Emohaa là mô hình tâm lý, có khả năng tư vấn chuyên nghiệp, giúp người dùng hiểu các vấn đề cảm xúc."
931
946
  },
@@ -1313,6 +1328,9 @@
1313
1328
  "gpt-4o-mini-search-preview": {
1314
1329
  "description": "GPT-4o mini phiên bản xem trước tìm kiếm là mô hình được huấn luyện chuyên biệt để hiểu và thực thi các truy vấn tìm kiếm trên web, sử dụng API Chat Completions. Ngoài phí token, truy vấn tìm kiếm trên web còn tính phí theo mỗi lần gọi công cụ."
1315
1330
  },
1331
+ "gpt-4o-mini-transcribe": {
1332
+ "description": "GPT-4o Mini Transcribe là mô hình chuyển đổi giọng nói thành văn bản sử dụng GPT-4o để phiên âm âm thanh. So với mô hình Whisper gốc, nó cải thiện tỷ lệ lỗi từ và nâng cao khả năng nhận diện ngôn ngữ cũng như độ chính xác. Sử dụng nó để có bản phiên âm chính xác hơn."
1333
+ },
1316
1334
  "gpt-4o-mini-tts": {
1317
1335
  "description": "GPT-4o mini TTS là mô hình chuyển văn bản thành giọng nói dựa trên GPT-4o mini, cung cấp sinh âm thanh cao cấp với chi phí thấp hơn."
1318
1336
  },
@@ -1322,12 +1340,15 @@
1322
1340
  "gpt-4o-realtime-preview-2024-10-01": {
1323
1341
  "description": "Phiên bản thời gian thực của GPT-4o, hỗ trợ đầu vào và đầu ra âm thanh và văn bản theo thời gian thực."
1324
1342
  },
1325
- "gpt-4o-realtime-preview-2024-12-17": {
1326
- "description": "Phiên bản thời gian thực của GPT-4o, hỗ trợ đầu vào và đầu ra âm thanh và văn bản theo thời gian thực."
1343
+ "gpt-4o-realtime-preview-2025-06-03": {
1344
+ "description": "Phiên bản thời gian thực của GPT-4o, hỗ trợ nhập xuất âm thanh và văn bản theo thời gian thực."
1327
1345
  },
1328
1346
  "gpt-4o-search-preview": {
1329
1347
  "description": "GPT-4o phiên bản xem trước tìm kiếm là mô hình được huấn luyện chuyên biệt để hiểu và thực thi các truy vấn tìm kiếm trên web, sử dụng API Chat Completions. Ngoài phí token, truy vấn tìm kiếm trên web còn tính phí theo mỗi lần gọi công cụ."
1330
1348
  },
1349
+ "gpt-4o-transcribe": {
1350
+ "description": "GPT-4o Transcribe là mô hình chuyển đổi giọng nói thành văn bản sử dụng GPT-4o để phiên âm âm thanh. So với mô hình Whisper gốc, nó cải thiện tỷ lệ lỗi từ và nâng cao khả năng nhận diện ngôn ngữ cũng như độ chính xác. Sử dụng nó để có bản phiên âm chính xác hơn."
1351
+ },
1331
1352
  "grok-2-1212": {
1332
1353
  "description": "Mô hình này đã được cải thiện về độ chính xác, khả năng tuân thủ hướng dẫn và khả năng đa ngôn ngữ."
1333
1354
  },
@@ -1460,6 +1481,9 @@
1460
1481
  "jina-deepsearch-v1": {
1461
1482
  "description": "Tìm kiếm sâu kết hợp tìm kiếm trên mạng, đọc và suy luận, có thể thực hiện điều tra toàn diện. Bạn có thể coi nó như một đại lý, nhận nhiệm vụ nghiên cứu của bạn - nó sẽ thực hiện tìm kiếm rộng rãi và qua nhiều lần lặp lại trước khi đưa ra câu trả lời. Quá trình này liên quan đến nghiên cứu liên tục, suy luận và giải quyết vấn đề từ nhiều góc độ. Điều này khác biệt hoàn toàn với việc tạo ra câu trả lời trực tiếp từ dữ liệu đã được huấn luyện trước của các mô hình lớn tiêu chuẩn và các hệ thống RAG truyền thống dựa vào tìm kiếm bề mặt một lần."
1462
1483
  },
1484
+ "kimi-k2-0711-preview": {
1485
+ "description": "kimi-k2 là mô hình cơ sở kiến trúc MoE với khả năng mã hóa và Agent cực mạnh, tổng số tham số 1T, tham số kích hoạt 32B. Trong các bài kiểm tra hiệu năng chuẩn về suy luận kiến thức chung, lập trình, toán học, Agent và các lĩnh vực chính khác, mô hình K2 vượt trội hơn các mô hình mã nguồn mở phổ biến khác."
1486
+ },
1463
1487
  "kimi-latest": {
1464
1488
  "description": "Sản phẩm trợ lý thông minh Kimi sử dụng mô hình lớn Kimi mới nhất, có thể chứa các tính năng chưa ổn định. Hỗ trợ hiểu hình ảnh, đồng thời tự động chọn mô hình 8k/32k/128k làm mô hình tính phí dựa trên độ dài ngữ cảnh yêu cầu."
1465
1489
  },
@@ -2352,7 +2376,7 @@
2352
2376
  "description": "Mô hình v0-1.5-md phù hợp cho các nhiệm vụ hàng ngày và tạo giao diện người dùng (UI)"
2353
2377
  },
2354
2378
  "whisper-1": {
2355
- "description": "Mô hình nhận diện giọng nói đa năng, hỗ trợ nhận diện giọng nói đa ngôn ngữ, dịch giọng nói và nhận diện ngôn ngữ."
2379
+ "description": "Mô hình nhận dạng giọng nói đa năng, hỗ trợ nhận dạng giọng nói đa ngôn ngữ, dịch giọng nói và nhận diện ngôn ngữ."
2356
2380
  },
2357
2381
  "wizardlm2": {
2358
2382
  "description": "WizardLM 2 là mô hình ngôn ngữ do Microsoft AI cung cấp, đặc biệt xuất sắc trong các lĩnh vực đối thoại phức tạp, đa ngôn ngữ, suy luận và trợ lý thông minh."
@@ -71,44 +71,23 @@
71
71
  "DeepSeek-V3": {
72
72
  "description": "DeepSeek-V3 是一款由深度求索公司自研的MoE模型。DeepSeek-V3 多项评测成绩超越了 Qwen2.5-72B 和 Llama-3.1-405B 等其他开源模型,并在性能上和世界顶尖的闭源模型 GPT-4o 以及 Claude-3.5-Sonnet 不分伯仲。"
73
73
  },
74
- "Doubao-1.5-thinking-pro-m": {
75
- "description": "Doubao-1.5全新深度思考模型 (m 版本自带原生多模态深度推理能力),在数学、编程、科学推理等专业领域及创意写作等通用任务中表现突出,在AIME 2024、Codeforces、GPQA等多项权威基准上达到或接近业界第一梯队水平。支持128k上下文窗口,16k输出。"
76
- },
77
- "Doubao-1.5-thinking-vision-pro": {
78
- "description": "全新视觉深度思考模型,具备更强的通用多模态理解和推理能力,在 59 个公开评测基准中的 37 个上取得 SOTA 表现。"
79
- },
80
- "Doubao-1.5-vision-pro": {
81
- "description": "Doubao-1.5-vision-pro 全新升级的多模态大模型,支持任意分辨率和极端长宽比图像识别,增强视觉推理、文档识别、细节信息理解和指令遵循能力。"
82
- },
83
- "Doubao-1.5-vision-pro-32k": {
84
- "description": "Doubao-1.5-vision-pro 全新升级的多模态大模型,支持任意分辨率和极端长宽比图像识别,增强视觉推理、文档识别、细节信息理解和指令遵循能力。"
85
- },
86
74
  "Doubao-lite-128k": {
87
- "description": "拥有极致的响应速度,更好的性价比,为客户不同场景提供更灵活的选择。支持 128k 上下文窗口的推理和精调。"
75
+ "description": "Doubao-lite 拥有极致的响应速度,更好的性价比,为客户不同场景提供更灵活的选择。支持128k上下文窗口的推理和精调。"
88
76
  },
89
77
  "Doubao-lite-32k": {
90
- "description": "拥有极致的响应速度,更好的性价比,为客户不同场景提供更灵活的选择。支持 32k 上下文窗口的推理和精调。"
78
+ "description": "Doubao-lite拥有极致的响应速度,更好的性价比,为客户不同场景提供更灵活的选择。支持32k上下文窗口的推理和精调。"
91
79
  },
92
80
  "Doubao-lite-4k": {
93
- "description": "拥有极致的响应速度,更好的性价比,为客户不同场景提供更灵活的选择。支持 4k 上下文窗口的推理和精调。"
81
+ "description": "Doubao-lite拥有极致的响应速度,更好的性价比,为客户不同场景提供更灵活的选择。支持4k上下文窗口的推理和精调。"
94
82
  },
95
83
  "Doubao-pro-128k": {
96
- "description": "效果最好的主力模型,适合处理复杂任务,在参考问答、总结摘要、创作、文本分类、角色扮演等场景都有很好的效果。支持 128k 上下文窗口的推理和精调。"
97
- },
98
- "Doubao-pro-256k": {
99
- "description": "效果最好的主力模型,适合处理复杂任务,在参考问答、总结摘要、创作、文本分类、角色扮演等场景都有很好的效果。支持 256k 上下文窗口的推理和精调。"
84
+ "description": "效果最好的主力模型,适合处理复杂任务,在参考问答、总结摘要、创作、文本分类、角色扮演等场景都有很好的效果。支持128k上下文窗口的推理和精调。"
100
85
  },
101
86
  "Doubao-pro-32k": {
102
- "description": "效果最好的主力模型,适合处理复杂任务,在参考问答、总结摘要、创作、文本分类、角色扮演等场景都有很好的效果。支持 32k 上下文窗口的推理和精调。"
87
+ "description": "效果最好的主力模型,适合处理复杂任务,在参考问答、总结摘要、创作、文本分类、角色扮演等场景都有很好的效果。支持32k上下文窗口的推理和精调。"
103
88
  },
104
89
  "Doubao-pro-4k": {
105
- "description": "效果最好的主力模型,适合处理复杂任务,在参考问答、总结摘要、创作、文本分类、角色扮演等场景都有很好的效果。支持 4k 上下文窗口的推理和精调。"
106
- },
107
- "Doubao-vision-lite-32k": {
108
- "description": "Doubao-vision 模型是豆包推出的多模态大模型,具备强大的图片理解与推理能力,以及精准的指令理解能力。模型在图像文本信息抽取、基于图像的推理任务上有展现出了强大的性能,能够应用于更复杂、更广泛的视觉问答任务。"
109
- },
110
- "Doubao-vision-pro-32k": {
111
- "description": "Doubao-vision 模型是豆包推出的多模态大模型,具备强大的图片理解与推理能力,以及精准的指令理解能力。模型在图像文本信息抽取、基于图像的推理任务上有展现出了强大的性能,能够应用于更复杂、更广泛的视觉问答任务。"
90
+ "description": "效果最好的主力模型,适合处理复杂任务,在参考问答、总结摘要、创作、文本分类、角色扮演等场景都有很好的效果。支持4k上下文窗口的推理和精调。"
112
91
  },
113
92
  "ERNIE-3.5-128K": {
114
93
  "description": "百度自研的旗舰级大规模⼤语⾔模型,覆盖海量中英文语料,具有强大的通用能力,可满足绝大部分对话问答、创作生成、插件应用场景要求;支持自动对接百度搜索插件,保障问答信息时效。"
@@ -914,9 +893,39 @@
914
893
  "doubao-1.5-thinking-pro": {
915
894
  "description": "Doubao-1.5全新深度思考模型,在数学、编程、科学推理等专业领域及创意写作等通用任务中表现突出,在AIME 2024、Codeforces、GPQA等多项权威基准上达到或接近业界第一梯队水平。支持128k上下文窗口,16k输出。"
916
895
  },
896
+ "doubao-1.5-thinking-pro-m": {
897
+ "description": "Doubao-1.5全新深度思考模型 (m 版本自带原生多模态深度推理能力),在数学、编程、科学推理等专业领域及创意写作等通用任务中表现突出,在AIME 2024、Codeforces、GPQA等多项权威基准上达到或接近业界第一梯队水平。支持128k上下文窗口,16k输出。"
898
+ },
899
+ "doubao-1.5-thinking-vision-pro": {
900
+ "description": "全新视觉深度思考模型,具备更强的通用多模态理解和推理能力,在 59 个公开评测基准中的 37 个上取得 SOTA 表现。"
901
+ },
902
+ "doubao-1.5-ui-tars": {
903
+ "description": "Doubao-1.5-UI-TARS 是一款原生面向图形界面交互(GUI)的Agent模型。通过感知、推理和行动等类人的能力,与 GUI 进行无缝交互。"
904
+ },
917
905
  "doubao-1.5-vision-lite": {
918
906
  "description": "Doubao-1.5-vision-lite 全新升级的多模态大模型,支持任意分辨率和极端长宽比图像识别,增强视觉推理、文档识别、细节信息理解和指令遵循能力。支持 128k 上下文窗口,输出长度支持最大 16k tokens。"
919
907
  },
908
+ "doubao-1.5-vision-pro": {
909
+ "description": "Doubao-1.5-vision-pro 全新升级的多模态大模型,支持任意分辨率和极端长宽比图像识别,增强视觉推理、文档识别、细节信息理解和指令遵循能力。"
910
+ },
911
+ "doubao-1.5-vision-pro-32k": {
912
+ "description": "Doubao-1.5-vision-pro 全新升级的多模态大模型,支持任意分辨率和极端长宽比图像识别,增强视觉推理、文档识别、细节信息理解和指令遵循能力。"
913
+ },
914
+ "doubao-lite-128k": {
915
+ "description": "拥有极致的响应速度,更好的性价比,为客户不同场景提供更灵活的选择。支持 128k 上下文窗口的推理和精调。"
916
+ },
917
+ "doubao-lite-32k": {
918
+ "description": "拥有极致的响应速度,更好的性价比,为客户不同场景提供更灵活的选择。支持 32k 上下文窗口的推理和精调。"
919
+ },
920
+ "doubao-lite-4k": {
921
+ "description": "拥有极致的响应速度,更好的性价比,为客户不同场景提供更灵活的选择。支持 4k 上下文窗口的推理和精调。"
922
+ },
923
+ "doubao-pro-256k": {
924
+ "description": "效果最好的主力模型,适合处理复杂任务,在参考问答、总结摘要、创作、文本分类、角色扮演等场景都有很好的效果。支持 256k 上下文窗口的推理和精调。"
925
+ },
926
+ "doubao-pro-32k": {
927
+ "description": "效果最好的主力模型,适合处理复杂任务,在参考问答、总结摘要、创作、文本分类、角色扮演等场景都有很好的效果。支持 32k 上下文窗口的推理和精调。"
928
+ },
920
929
  "doubao-seed-1.6": {
921
930
  "description": "Doubao-Seed-1.6全新多模态深度思考模型,同时支持auto/thinking/non-thinking三种思考模式。 non-thinking模式下,模型效果对比Doubao-1.5-pro/250115大幅提升。支持 256k 上下文窗口,输出长度支持最大 16k tokens。"
922
931
  },
@@ -926,6 +935,12 @@
926
935
  "doubao-seed-1.6-thinking": {
927
936
  "description": "Doubao-Seed-1.6-thinking模型思考能力大幅强化, 对比Doubao-1.5-thinking-pro,在Coding、Math、 逻辑推理等基础能力上进一步提升, 支持视觉理解。 支持 256k 上下文窗口,输出长度支持最大 16k tokens。"
928
937
  },
938
+ "doubao-vision-lite-32k": {
939
+ "description": "Doubao-vision 模型是豆包推出的多模态大模型,具备强大的图片理解与推理能力,以及精准的指令理解能力。模型在图像文本信息抽取、基于图像的推理任务上有展现出了强大的性能,能够应用于更复杂、更广泛的视觉问答任务。"
940
+ },
941
+ "doubao-vision-pro-32k": {
942
+ "description": "Doubao-vision 模型是豆包推出的多模态大模型,具备强大的图片理解与推理能力,以及精准的指令理解能力。模型在图像文本信息抽取、基于图像的推理任务上有展现出了强大的性能,能够应用于更复杂、更广泛的视觉问答任务。"
943
+ },
929
944
  "emohaa": {
930
945
  "description": "Emohaa 是心理模型,具备专业咨询能力,帮助用户理解情感问题。"
931
946
  },
@@ -1313,6 +1328,9 @@
1313
1328
  "gpt-4o-mini-search-preview": {
1314
1329
  "description": "GPT-4o mini 搜索预览版是一个专门训练用于理解和执行网页搜索查询的模型,使用的是 Chat Completions API。除了令牌费用之外,网页搜索查询还会按每次工具调用收取费用。"
1315
1330
  },
1331
+ "gpt-4o-mini-transcribe": {
1332
+ "description": "GPT-4o Mini Transcribe 是一种使用 GPT-4o 转录音频的语音转文本模型。与原始 Whisper 模型相比,它提高了单词错误率,并提高了语言识别和准确性。使用它来获得更准确的转录。"
1333
+ },
1316
1334
  "gpt-4o-mini-tts": {
1317
1335
  "description": "GPT-4o mini TTS 是一个基于 GPT-4o mini 构建的文本转语音模型,这是一种快速且强大的语言模型。使用它可以将文本转换为自然听起来的语音文本。最大输入标记数为 2000。"
1318
1336
  },
@@ -1322,12 +1340,15 @@
1322
1340
  "gpt-4o-realtime-preview-2024-10-01": {
1323
1341
  "description": "GPT-4o 实时版本,支持音频和文本实时输入输出"
1324
1342
  },
1325
- "gpt-4o-realtime-preview-2024-12-17": {
1343
+ "gpt-4o-realtime-preview-2025-06-03": {
1326
1344
  "description": "GPT-4o 实时版本,支持音频和文本实时输入输出"
1327
1345
  },
1328
1346
  "gpt-4o-search-preview": {
1329
1347
  "description": "GPT-4o 搜索预览版是一个专门训练用于理解和执行网页搜索查询的模型,使用的是 Chat Completions API。除了令牌费用之外,网页搜索查询还会按每次工具调用收取费用。"
1330
1348
  },
1349
+ "gpt-4o-transcribe": {
1350
+ "description": "GPT-4o Transcribe 是一种使用 GPT-4o 转录音频的语音转文本模型。与原始 Whisper 模型相比,它提高了单词错误率,并提高了语言识别和准确性。使用它来获得更准确的转录。"
1351
+ },
1331
1352
  "grok-2-1212": {
1332
1353
  "description": "该模型在准确性、指令遵循和多语言能力方面有所改进。"
1333
1354
  },
@@ -1460,6 +1481,9 @@
1460
1481
  "jina-deepsearch-v1": {
1461
1482
  "description": "深度搜索结合了网络搜索、阅读和推理,可进行全面调查。您可以将其视为一个代理,接受您的研究任务 - 它会进行广泛搜索并经过多次迭代,然后才能给出答案。这个过程涉及持续的研究、推理和从各个角度解决问题。这与直接从预训练数据生成答案的标准大模型以及依赖一次性表面搜索的传统 RAG 系统有着根本的不同。"
1462
1483
  },
1484
+ "kimi-k2-0711-preview": {
1485
+ "description": "kimi-k2 是一款具备超强代码和 Agent 能力的 MoE 架构基础模型,总参数 1T,激活参数 32B。在通用知识推理、编程、数学、Agent 等主要类别的基准性能测试中,K2 模型的性能超过其他主流开源模型。"
1486
+ },
1463
1487
  "kimi-latest": {
1464
1488
  "description": "Kimi 智能助手产品使用最新的 Kimi 大模型,可能包含尚未稳定的特性。支持图片理解,同时会自动根据请求的上下文长度选择 8k/32k/128k 模型作为计费模型"
1465
1489
  },
@@ -2352,7 +2376,7 @@
2352
2376
  "description": "v0-1.5-md 模型适用于日常任务和用户界面(UI)生成"
2353
2377
  },
2354
2378
  "whisper-1": {
2355
- "description": "通用语音识别模型,支持多语言语音识别、语音翻译和语言识别"
2379
+ "description": "通用语音识别模型,支持多语言语音识别、语音翻译和语言识别。"
2356
2380
  },
2357
2381
  "wizardlm2": {
2358
2382
  "description": "WizardLM 2 是微软AI提供的语言模型,在复杂对话、多语言、推理和智能助手领域表现尤为出色。"
@@ -71,44 +71,23 @@
71
71
  "DeepSeek-V3": {
72
72
  "description": "DeepSeek-V3 是一款由深度求索公司自研的MoE模型。DeepSeek-V3 多項評測成績超越了 Qwen2.5-72B 和 Llama-3.1-405B 等其他開源模型,並在性能上和世界頂尖的閉源模型 GPT-4o 以及 Claude-3.5-Sonnet 不分伯仲。"
73
73
  },
74
- "Doubao-1.5-thinking-pro-m": {
75
- "description": "Doubao-1.5 全新深度思考模型 (m 版本自帶原生多模態深度推理能力),在數學、程式設計、科學推理等專業領域及創意寫作等通用任務中表現突出,在 AIME 2024、Codeforces、GPQA 等多項權威基準上達到或接近業界第一梯隊水平。支持 128k 上下文窗口,16k 輸出。"
76
- },
77
- "Doubao-1.5-thinking-vision-pro": {
78
- "description": "全新視覺深度思考模型,具備更強的通用多模態理解和推理能力,在 59 個公開評測基準中的 37 個上取得 SOTA 表現。"
79
- },
80
- "Doubao-1.5-vision-pro": {
81
- "description": "Doubao-1.5-vision-pro 全新升級的多模態大模型,支持任意解析度和極端長寬比圖像識別,增強視覺推理、文檔識別、細節信息理解和指令遵循能力。"
82
- },
83
- "Doubao-1.5-vision-pro-32k": {
84
- "description": "Doubao-1.5-vision-pro 全新升級的多模態大模型,支持任意解析度和極端長寬比圖像識別,增強視覺推理、文檔識別、細節信息理解和指令遵循能力。"
85
- },
86
74
  "Doubao-lite-128k": {
87
- "description": "Doubao-lite 擁有極致的回應速度,更好的性價比,為客戶不同場景提供更靈活的選擇。支持 128k 上下文窗口的推理和精調。"
75
+ "description": "Doubao-lite 擁有極致的響應速度,更好的性價比,為客戶不同場景提供更靈活的選擇。支持128k上下文視窗的推理和精調。"
88
76
  },
89
77
  "Doubao-lite-32k": {
90
- "description": "Doubao-lite 擁有極致的回應速度,更好的性價比,為客戶不同場景提供更靈活的選擇。支持 32k 上下文窗口的推理和精調。"
78
+ "description": "Doubao-lite擁有極致的響應速度,更好的性價比,為客戶不同場景提供更靈活的選擇。支持32k上下文視窗的推理和精調。"
91
79
  },
92
80
  "Doubao-lite-4k": {
93
- "description": "Doubao-lite 擁有極致的回應速度,更好的性價比,為客戶不同場景提供更靈活的選擇。支持 4k 上下文窗口的推理和精調。"
81
+ "description": "Doubao-lite擁有極致的響應速度,更好的性價比,為客戶不同場景提供更靈活的選擇。支持4k上下文視窗的推理和精調。"
94
82
  },
95
83
  "Doubao-pro-128k": {
96
- "description": "效果最好的主力模型,適合處理複雜任務,在參考問答、總結摘要、創作、文本分類、角色扮演等場景都有很好的效果。支持 128k 上下文窗口的推理和精調。"
97
- },
98
- "Doubao-pro-256k": {
99
- "description": "效果最好的主力模型,適合處理複雜任務,在參考問答、總結摘要、創作、文本分類、角色扮演等場景都有很好的效果。支持 256k 上下文窗口的推理和精調。"
84
+ "description": "效果最好的主力模型,適合處理複雜任務,在參考問答、總結摘要、創作、文本分類、角色扮演等場景都有很好的效果。支持128k上下文視窗的推理和精調。"
100
85
  },
101
86
  "Doubao-pro-32k": {
102
- "description": "效果最好的主力模型,適合處理複雜任務,在參考問答、總結摘要、創作、文本分類、角色扮演等場景都有很好的效果。支持 32k 上下文窗口的推理和精調。"
87
+ "description": "效果最好的主力模型,適合處理複雜任務,在參考問答、總結摘要、創作、文本分類、角色扮演等場景都有很好的效果。支持32k上下文視窗的推理和精調。"
103
88
  },
104
89
  "Doubao-pro-4k": {
105
- "description": "效果最好的主力模型,適合處理複雜任務,在參考問答、總結摘要、創作、文本分類、角色扮演等場景都有很好的效果。支持 4k 上下文窗口的推理和精調。"
106
- },
107
- "Doubao-vision-lite-32k": {
108
- "description": "Doubao-vision 模型是豆包推出的多模態大模型,具備強大的圖片理解與推理能力,以及精準的指令理解能力。模型在圖像文本信息抽取、基於圖像的推理任務上展現出強大的性能,能夠應用於更複雜、更廣泛的視覺問答任務。"
109
- },
110
- "Doubao-vision-pro-32k": {
111
- "description": "Doubao-vision 模型是豆包推出的多模態大模型,具備強大的圖片理解與推理能力,以及精準的指令理解能力。模型在圖像文本信息抽取、基於圖像的推理任務上展現出強大的性能,能夠應用於更複雜、更廣泛的視覺問答任務。"
90
+ "description": "效果最好的主力模型,適合處理複雜任務,在參考問答、總結摘要、創作、文本分類、角色扮演等場景都有很好的效果。支持4k上下文視窗的推理和精調。"
112
91
  },
113
92
  "ERNIE-3.5-128K": {
114
93
  "description": "百度自研的旗艦級大規模語言模型,覆蓋海量中英文語料,具有強大的通用能力,可滿足絕大部分對話問答、創作生成、插件應用場景要求;支持自動對接百度搜索插件,保障問答信息時效。"
@@ -914,9 +893,39 @@
914
893
  "doubao-1.5-thinking-pro": {
915
894
  "description": "Doubao-1.5全新深度思考模型,在數學、程式設計、科學推理等專業領域及創意寫作等通用任務中表現突出,在AIME 2024、Codeforces、GPQA等多項權威基準上達到或接近業界第一梯隊水平。支持128k上下文窗口,16k輸出。"
916
895
  },
896
+ "doubao-1.5-thinking-pro-m": {
897
+ "description": "Doubao-1.5全新深度思考模型(m 版本自帶原生多模態深度推理能力),在數學、程式設計、科學推理等專業領域及創意寫作等通用任務中表現突出,在AIME 2024、Codeforces、GPQA等多項權威基準上達到或接近業界第一梯隊水準。支持128k上下文視窗,16k輸出。"
898
+ },
899
+ "doubao-1.5-thinking-vision-pro": {
900
+ "description": "全新視覺深度思考模型,具備更強的通用多模態理解和推理能力,在59個公開評測基準中的37個上取得SOTA表現。"
901
+ },
902
+ "doubao-1.5-ui-tars": {
903
+ "description": "Doubao-1.5-UI-TARS 是一款原生面向圖形介面互動(GUI)的Agent模型。透過感知、推理和行動等類人能力,與 GUI 進行無縫互動。"
904
+ },
917
905
  "doubao-1.5-vision-lite": {
918
906
  "description": "Doubao-1.5-vision-lite 全新升級的多模態大模型,支持任意解析度和極端長寬比圖像識別,增強視覺推理、文檔識別、細節信息理解和指令遵循能力。支持 128k 上下文窗口,輸出長度支持最大 16k tokens。"
919
907
  },
908
+ "doubao-1.5-vision-pro": {
909
+ "description": "Doubao-1.5-vision-pro 全新升級的多模態大模型,支持任意解析度和極端長寬比影像識別,增強視覺推理、文件識別、細節資訊理解和指令遵循能力。"
910
+ },
911
+ "doubao-1.5-vision-pro-32k": {
912
+ "description": "Doubao-1.5-vision-pro 全新升級的多模態大模型,支持任意解析度和極端長寬比影像識別,增強視覺推理、文件識別、細節資訊理解和指令遵循能力。"
913
+ },
914
+ "doubao-lite-128k": {
915
+ "description": "擁有極致的響應速度,更好的性價比,為客戶不同場景提供更靈活的選擇。支持128k上下文視窗的推理和精調。"
916
+ },
917
+ "doubao-lite-32k": {
918
+ "description": "擁有極致的響應速度,更好的性價比,為客戶不同場景提供更靈活的選擇。支持32k上下文視窗的推理和精調。"
919
+ },
920
+ "doubao-lite-4k": {
921
+ "description": "擁有極致的響應速度,更好的性價比,為客戶不同場景提供更靈活的選擇。支持4k上下文視窗的推理和精調。"
922
+ },
923
+ "doubao-pro-256k": {
924
+ "description": "效果最好的主力模型,適合處理複雜任務,在參考問答、總結摘要、創作、文本分類、角色扮演等場景都有很好的效果。支持256k上下文視窗的推理和精調。"
925
+ },
926
+ "doubao-pro-32k": {
927
+ "description": "效果最好的主力模型,適合處理複雜任務,在參考問答、總結摘要、創作、文本分類、角色扮演等場景都有很好的效果。支持32k上下文視窗的推理和精調。"
928
+ },
920
929
  "doubao-seed-1.6": {
921
930
  "description": "Doubao-Seed-1.6 全新多模態深度思考模型,同時支援 auto/thinking/non-thinking 三種思考模式。non-thinking 模式下,模型效果相較 Doubao-1.5-pro/250115 大幅提升。支援 256k 上下文視窗,輸出長度支援最大 16k tokens。"
922
931
  },
@@ -926,6 +935,12 @@
926
935
  "doubao-seed-1.6-thinking": {
927
936
  "description": "Doubao-Seed-1.6-thinking 模型思考能力大幅強化,相較 Doubao-1.5-thinking-pro,在 Coding、Math、邏輯推理等基礎能力上進一步提升,支援視覺理解。支援 256k 上下文視窗,輸出長度支援最大 16k tokens。"
928
937
  },
938
+ "doubao-vision-lite-32k": {
939
+ "description": "Doubao-vision 模型是豆包推出的多模態大模型,具備強大的圖片理解與推理能力,以及精準的指令理解能力。模型在影像文本資訊擷取、基於影像的推理任務上展現出強大的性能,能夠應用於更複雜、更廣泛的視覺問答任務。"
940
+ },
941
+ "doubao-vision-pro-32k": {
942
+ "description": "Doubao-vision 模型是豆包推出的多模態大模型,具備強大的圖片理解與推理能力,以及精準的指令理解能力。模型在影像文本資訊擷取、基於影像的推理任務上展現出強大的性能,能夠應用於更複雜、更廣泛的視覺問答任務。"
943
+ },
929
944
  "emohaa": {
930
945
  "description": "Emohaa是一個心理模型,具備專業諮詢能力,幫助用戶理解情感問題。"
931
946
  },
@@ -1313,6 +1328,9 @@
1313
1328
  "gpt-4o-mini-search-preview": {
1314
1329
  "description": "GPT-4o mini 搜尋預覽版是一個專門訓練用於理解和執行網頁搜尋查詢的模型,使用的是 Chat Completions API。除了代幣費用之外,網頁搜尋查詢還會按每次工具呼叫收取費用。"
1315
1330
  },
1331
+ "gpt-4o-mini-transcribe": {
1332
+ "description": "GPT-4o Mini Transcribe 是一種使用 GPT-4o 轉錄音訊的語音轉文字模型。與原始 Whisper 模型相比,它降低了字詞錯誤率,並提升了語言識別和準確性。使用它來獲得更準確的轉錄。"
1333
+ },
1316
1334
  "gpt-4o-mini-tts": {
1317
1335
  "description": "GPT-4o mini TTS 是基於 GPT-4o mini 的文本轉語音模型,提供高品質的語音生成,同時降低成本。"
1318
1336
  },
@@ -1322,12 +1340,15 @@
1322
1340
  "gpt-4o-realtime-preview-2024-10-01": {
1323
1341
  "description": "GPT-4o 實時版本,支持音頻和文本實時輸入輸出"
1324
1342
  },
1325
- "gpt-4o-realtime-preview-2024-12-17": {
1326
- "description": "GPT-4o 實時版本,支持音頻和文本實時輸入輸出"
1343
+ "gpt-4o-realtime-preview-2025-06-03": {
1344
+ "description": "GPT-4o 即時版本,支持音訊和文字即時輸入輸出"
1327
1345
  },
1328
1346
  "gpt-4o-search-preview": {
1329
1347
  "description": "GPT-4o 搜尋預覽版是一個專門訓練用於理解和執行網頁搜尋查詢的模型,使用的是 Chat Completions API。除了代幣費用之外,網頁搜尋查詢還會按每次工具呼叫收取費用。"
1330
1348
  },
1349
+ "gpt-4o-transcribe": {
1350
+ "description": "GPT-4o Transcribe 是一種使用 GPT-4o 轉錄音訊的語音轉文字模型。與原始 Whisper 模型相比,它降低了字詞錯誤率,並提升了語言識別和準確性。使用它來獲得更準確的轉錄。"
1351
+ },
1331
1352
  "grok-2-1212": {
1332
1353
  "description": "該模型在準確性、指令遵循和多語言能力方面有所改進。"
1333
1354
  },
@@ -1460,6 +1481,9 @@
1460
1481
  "jina-deepsearch-v1": {
1461
1482
  "description": "深度搜索結合了網路搜索、閱讀和推理,可進行全面調查。您可以將其視為一個代理,接受您的研究任務 - 它會進行廣泛搜索並經過多次迭代,然後才能給出答案。這個過程涉及持續的研究、推理和從各個角度解決問題。這與直接從預訓練數據生成答案的標準大模型以及依賴一次性表面搜索的傳統 RAG 系統有著根本的不同。"
1462
1483
  },
1484
+ "kimi-k2-0711-preview": {
1485
+ "description": "kimi-k2 是一款具備超強程式碼和 Agent 能力的 MoE 架構基礎模型,總參數 1T,激活參數 32B。在通用知識推理、程式設計、數學、Agent 等主要類別的基準性能測試中,K2 模型的性能超越其他主流開源模型。"
1486
+ },
1463
1487
  "kimi-latest": {
1464
1488
  "description": "Kimi 智能助手產品使用最新的 Kimi 大模型,可能包含尚未穩定的特性。支持圖片理解,同時會自動根據請求的上下文長度選擇 8k/32k/128k 模型作為計費模型"
1465
1489
  },
@@ -2352,7 +2376,7 @@
2352
2376
  "description": "v0-1.5-md 模型適用於日常任務和使用者介面(UI)生成"
2353
2377
  },
2354
2378
  "whisper-1": {
2355
- "description": "通用語音識別模型,支持多語言語音識別、語音翻譯和語言識別"
2379
+ "description": "通用語音識別模型,支持多語言語音識別、語音翻譯和語言識別。"
2356
2380
  },
2357
2381
  "wizardlm2": {
2358
2382
  "description": "WizardLM 2 是微軟 AI 提供的語言模型,在複雜對話、多語言、推理和智能助手領域表現尤為出色。"
package/package.json CHANGED
@@ -1,6 +1,6 @@
1
1
  {
2
2
  "name": "@lobehub/chat",
3
- "version": "1.97.15",
3
+ "version": "1.97.17",
4
4
  "description": "Lobe Chat - an open-source, high-performance chatbot framework that supports speech synthesis, multimodal, and extensible Function Call plugin system. Supports one-click free deployment of your private ChatGPT/LLM web application.",
5
5
  "keywords": [
6
6
  "framework",
@@ -11,7 +11,8 @@ const googleChatModels: AIChatModelCard[] = [
11
11
  contextWindowTokens: 1_048_576 + 65_536,
12
12
  description:
13
13
  'Gemini 2.5 Pro 是 Google 最先进的思维模型,能够对代码、数学和STEM领域的复杂问题进行推理,以及使用长上下文分析大型数据集、代码库和文档。',
14
- displayName: 'Gemini 2.5 Pro (Paid)',
14
+ displayName: 'Gemini 2.5 Pro',
15
+ enabled: true,
15
16
  id: 'gemini-2.5-pro',
16
17
  maxOutput: 65_536,
17
18
  pricing: {
@@ -77,30 +78,6 @@ const googleChatModels: AIChatModelCard[] = [
77
78
  },
78
79
  type: 'chat',
79
80
  },
80
- {
81
- abilities: {
82
- functionCall: true,
83
- reasoning: true,
84
- search: true,
85
- vision: true,
86
- },
87
- contextWindowTokens: 1_048_576 + 65_536,
88
- description:
89
- 'Gemini 2.5 Pro Experimental 是 Google 最先进的思维模型,能够对代码、数学和STEM领域的复杂问题进行推理,以及使用长上下文分析大型数据集、代码库和文档。',
90
- displayName: 'Gemini 2.5 Pro Experimental 03-25',
91
- id: 'gemini-2.5-pro-exp-03-25',
92
- maxOutput: 65_536,
93
- pricing: {
94
- input: 0,
95
- output: 0,
96
- },
97
- releasedAt: '2025-03-25',
98
- settings: {
99
- searchImpl: 'params',
100
- searchProvider: 'google',
101
- },
102
- type: 'chat',
103
- },
104
81
  {
105
82
  abilities: {
106
83
  functionCall: true,
@@ -206,7 +183,7 @@ const googleChatModels: AIChatModelCard[] = [
206
183
  search: true,
207
184
  vision: true,
208
185
  },
209
- contextWindowTokens: 65_536 + 65_536,
186
+ contextWindowTokens: 1_048_576 + 65_536,
210
187
  description:
211
188
  'Gemini 2.5 Flash-Lite Preview 是 Google 最小、性价比最高的模型,专为大规模使用而设计。',
212
189
  displayName: 'Gemini 2.5 Flash-Lite Preview 06-17',
@@ -493,6 +470,18 @@ const googleChatModels: AIChatModelCard[] = [
493
470
  },
494
471
  type: 'chat',
495
472
  },
473
+ {
474
+ contextWindowTokens: 2048 + 8192,
475
+ displayName: 'Gemma 3n E2B',
476
+ id: 'gemma-3n-e2b-it',
477
+ maxOutput: 2048,
478
+ pricing: {
479
+ cachedInput: 0,
480
+ input: 0,
481
+ output: 0,
482
+ },
483
+ type: 'chat',
484
+ },
496
485
  {
497
486
  contextWindowTokens: 2048 + 8192,
498
487
  displayName: 'Gemma 3n E4B',
@@ -47,22 +47,6 @@ const groqChatModels: AIChatModelCard[] = [
47
47
  },
48
48
  type: 'chat',
49
49
  },
50
- {
51
- abilities: {
52
- functionCall: true,
53
- reasoning: true,
54
- },
55
- contextWindowTokens: 131_072,
56
- displayName: 'Qwen QwQ 32B',
57
- enabled: true,
58
- id: 'qwen-qwq-32b',
59
- maxOutput: 131_072,
60
- pricing: {
61
- input: 0.29,
62
- output: 0.39,
63
- },
64
- type: 'chat',
65
- },
66
50
  {
67
51
  abilities: {
68
52
  reasoning: true,