npm - @ailib-official/ai-protocol - Versions diffs - 0.8.4 - Mend

@ailib-official/ai-protocol 0.8.4

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (194) hide show

package/LICENSE +6 -0
package/README.md +415 -0
package/dist/index.json +8 -0
package/dist/v1/models/ai21.json +140 -0
package/dist/v1/models/baichuan.json +138 -0
package/dist/v1/models/cerebras.json +147 -0
package/dist/v1/models/claude.json +114 -0
package/dist/v1/models/cohere.json +235 -0
package/dist/v1/models/deepinfra.json +43 -0
package/dist/v1/models/deepseek-chat.json +55 -0
package/dist/v1/models/doubao.json +197 -0
package/dist/v1/models/ernie.json +223 -0
package/dist/v1/models/fireworks.json +222 -0
package/dist/v1/models/gemini.json +58 -0
package/dist/v1/models/gpt.json +166 -0
package/dist/v1/models/grok.json +138 -0
package/dist/v1/models/huggingface.json +183 -0
package/dist/v1/models/hunyuan.json +255 -0
package/dist/v1/models/jina.json +139 -0
package/dist/v1/models/lepton.json +188 -0
package/dist/v1/models/llama.json +143 -0
package/dist/v1/models/minimax.json +194 -0
package/dist/v1/models/mistral.json +177 -0
package/dist/v1/models/moonshot.json +144 -0
package/dist/v1/models/nvidia.json +212 -0
package/dist/v1/models/palmyra.json +103 -0
package/dist/v1/models/perplexity.json +143 -0
package/dist/v1/models/qwen.json +49 -0
package/dist/v1/models/replicate.json +206 -0
package/dist/v1/models/sensenova.json +144 -0
package/dist/v1/models/siliconflow.json +44 -0
package/dist/v1/models/spark.json +173 -0
package/dist/v1/models/stable-diffusion.json +161 -0
package/dist/v1/models/tiangong.json +169 -0
package/dist/v1/models/together.json +43 -0
package/dist/v1/models/yi.json +199 -0
package/dist/v1/models/zhipu.json +250 -0
package/dist/v1/providers/ai21.json +215 -0
package/dist/v1/providers/anthropic.json +253 -0
package/dist/v1/providers/anyscale.json +115 -0
package/dist/v1/providers/azure.json +188 -0
package/dist/v1/providers/baichuan.json +205 -0
package/dist/v1/providers/baidu.json +205 -0
package/dist/v1/providers/cerebras.json +216 -0
package/dist/v1/providers/cohere.json +209 -0
package/dist/v1/providers/deepinfra.json +196 -0
package/dist/v1/providers/deepseek.json +221 -0
package/dist/v1/providers/doubao.json +209 -0
package/dist/v1/providers/fireworks.json +227 -0
package/dist/v1/providers/gemini.json +279 -0
package/dist/v1/providers/groq.json +218 -0
package/dist/v1/providers/huggingface.json +181 -0
package/dist/v1/providers/hunyuan.json +198 -0
package/dist/v1/providers/jina.json +202 -0
package/dist/v1/providers/lepton.json +221 -0
package/dist/v1/providers/minimax.json +209 -0
package/dist/v1/providers/mistral.json +214 -0
package/dist/v1/providers/moonshot.json +214 -0
package/dist/v1/providers/nvidia.json +213 -0
package/dist/v1/providers/openai.json +267 -0
package/dist/v1/providers/openrouter.json +220 -0
package/dist/v1/providers/perplexity.json +172 -0
package/dist/v1/providers/qwen.json +231 -0
package/dist/v1/providers/replicate.json +192 -0
package/dist/v1/providers/sensenova.json +185 -0
package/dist/v1/providers/siliconflow.json +197 -0
package/dist/v1/providers/spark.json +204 -0
package/dist/v1/providers/stability.json +221 -0
package/dist/v1/providers/tiangong.json +207 -0
package/dist/v1/providers/together.json +196 -0
package/dist/v1/providers/writer.json +253 -0
package/dist/v1/providers/xai.json +238 -0
package/dist/v1/providers/yi.json +205 -0
package/dist/v1/providers/zhipu.json +208 -0
package/dist/v1/spec.json +783 -0
package/dist/v2/providers/anthropic.json +372 -0
package/dist/v2/providers/cohere.json +109 -0
package/dist/v2/providers/deepseek.json +272 -0
package/dist/v2/providers/doubao.json +260 -0
package/dist/v2/providers/google.json +388 -0
package/dist/v2/providers/jina.json +71 -0
package/dist/v2/providers/moonshot.json +284 -0
package/dist/v2/providers/openai.json +419 -0
package/dist/v2/providers/qwen.json +274 -0
package/dist/v2/providers/zhipu.json +257 -0
package/dist/v2-alpha/providers/anthropic.json +182 -0
package/dist/v2-alpha/providers/gemini.json +187 -0
package/dist/v2-alpha/providers/openai.json +215 -0
package/dist/v2-alpha/spec.json +644 -0
package/package.json +61 -0
package/schemas/spec.json +186 -0
package/schemas/v1.json +1116 -0
package/schemas/v2/availability.json +66 -0
package/schemas/v2/capabilities.json +182 -0
package/schemas/v2/capability-profile.json +174 -0
package/schemas/v2/computer-use.json +222 -0
package/schemas/v2/context-policy.json +148 -0
package/schemas/v2/endpoint.json +2 -0
package/schemas/v2/error-codes.yaml +225 -0
package/schemas/v2/errors.json +250 -0
package/schemas/v2/execution-metadata.json +59 -0
package/schemas/v2/mcp.json +225 -0
package/schemas/v2/message-roles.json +10 -0
package/schemas/v2/multimodal.json +297 -0
package/schemas/v2/pricing.json +14 -0
package/schemas/v2/provider-contract.json +317 -0
package/schemas/v2/provider.json +203 -0
package/schemas/v2/regions.json +14 -0
package/v1/models/ai21.yaml +97 -0
package/v1/models/baichuan.yaml +95 -0
package/v1/models/cerebras.yaml +99 -0
package/v1/models/claude.yaml +59 -0
package/v1/models/cohere.yaml +165 -0
package/v1/models/deepinfra.yaml +29 -0
package/v1/models/deepseek-chat.yaml +32 -0
package/v1/models/doubao.yaml +129 -0
package/v1/models/ernie.yaml +146 -0
package/v1/models/fireworks.yaml +145 -0
package/v1/models/gemini.yaml +32 -0
package/v1/models/gpt.yaml +90 -0
package/v1/models/grok.yaml +74 -0
package/v1/models/huggingface.yaml +110 -0
package/v1/models/hunyuan.yaml +164 -0
package/v1/models/jina.yaml +98 -0
package/v1/models/lepton.yaml +130 -0
package/v1/models/llama.yaml +91 -0
package/v1/models/minimax.yaml +132 -0
package/v1/models/mistral.yaml +100 -0
package/v1/models/moonshot.yaml +97 -0
package/v1/models/nvidia.yaml +118 -0
package/v1/models/palmyra.yaml +59 -0
package/v1/models/perplexity.yaml +97 -0
package/v1/models/qwen.yaml +27 -0
package/v1/models/replicate.yaml +136 -0
package/v1/models/sensenova.yaml +97 -0
package/v1/models/siliconflow.yaml +29 -0
package/v1/models/spark.yaml +114 -0
package/v1/models/stable-diffusion.yaml +113 -0
package/v1/models/tiangong.yaml +114 -0
package/v1/models/together.yaml +29 -0
package/v1/models/yi.yaml +132 -0
package/v1/models/zhipu.yaml +163 -0
package/v1/providers/ai21.yaml +176 -0
package/v1/providers/anthropic.yaml +209 -0
package/v1/providers/anyscale.yaml +106 -0
package/v1/providers/azure.yaml +155 -0
package/v1/providers/baichuan.yaml +168 -0
package/v1/providers/baidu.yaml +173 -0
package/v1/providers/cerebras.yaml +178 -0
package/v1/providers/cohere.yaml +175 -0
package/v1/providers/deepinfra.yaml +156 -0
package/v1/providers/deepseek.yaml +189 -0
package/v1/providers/doubao.yaml +172 -0
package/v1/providers/fireworks.yaml +187 -0
package/v1/providers/gemini.yaml +229 -0
package/v1/providers/groq.yaml +181 -0
package/v1/providers/huggingface.yaml +157 -0
package/v1/providers/hunyuan.yaml +162 -0
package/v1/providers/jina.yaml +171 -0
package/v1/providers/lepton.yaml +183 -0
package/v1/providers/minimax.yaml +172 -0
package/v1/providers/mistral.yaml +186 -0
package/v1/providers/moonshot.yaml +176 -0
package/v1/providers/nvidia.yaml +172 -0
package/v1/providers/openai.yaml +224 -0
package/v1/providers/openrouter.yaml +181 -0
package/v1/providers/perplexity.yaml +144 -0
package/v1/providers/qwen.yaml +192 -0
package/v1/providers/replicate.yaml +159 -0
package/v1/providers/sensenova.yaml +153 -0
package/v1/providers/siliconflow.yaml +156 -0
package/v1/providers/spark.yaml +167 -0
package/v1/providers/stability.yaml +185 -0
package/v1/providers/tiangong.yaml +170 -0
package/v1/providers/together.yaml +156 -0
package/v1/providers/writer.yaml +212 -0
package/v1/providers/xai.yaml +206 -0
package/v1/providers/yi.yaml +168 -0
package/v1/providers/zhipu.yaml +171 -0
package/v1/spec.yaml +637 -0
package/v2/providers/anthropic.yaml +244 -0
package/v2/providers/cohere.yaml +75 -0
package/v2/providers/deepseek.yaml +176 -0
package/v2/providers/doubao.yaml +169 -0
package/v2/providers/google.yaml +245 -0
package/v2/providers/jina.yaml +55 -0
package/v2/providers/moonshot.yaml +186 -0
package/v2/providers/openai.yaml +266 -0
package/v2/providers/qwen.yaml +174 -0
package/v2/providers/zhipu.yaml +176 -0
package/v2-alpha/providers/anthropic.yaml +134 -0
package/v2-alpha/providers/gemini.yaml +144 -0
package/v2-alpha/providers/openai.yaml +154 -0
package/v2-alpha/spec.yaml +512 -0

package/v1/models/mistral.yaml ADDED Viewed

@@ -0,0 +1,100 @@
+$schema: "https://raw.githubusercontent.com/ailib-official/ai-protocol/main/schemas/v1.json"
+protocol_version: "1.1"
+# Mistral Model Instances
+# Reference: https://docs.mistral.ai/api/
+models:
+  mistral-small-latest:
+    provider: mistral
+    model_id: "mistral-small-latest"
+    display_name: "Mistral Small"
+    verification:
+      status: verified
+      verified_at: "2026-01-28"
+      source: "list_models:/models"
+    context_window: 32000
+    capabilities: [chat, tools, streaming, parallel_tools]
+    status: active
+    tags: ["mistral", "small", "tools", "latest"]
+  mistral-medium-latest:
+    provider: mistral
+    model_id: "mistral-medium-latest"
+    display_name: "Mistral Medium"
+    verification:
+      status: verified
+      verified_at: "2026-01-28"
+      source: "list_models:/models"
+    context_window: 32000
+    capabilities: [chat, tools, streaming, parallel_tools]
+    status: active
+    tags: ["mistral", "medium", "tools", "latest"]
+  mistral-large-latest:
+    provider: mistral
+    model_id: "mistral-large-latest"
+    display_name: "Mistral Large"
+    verification:
+      status: verified
+      verified_at: "2026-01-28"
+      source: "list_models:/models"
+    context_window: 32000
+    capabilities: [chat, tools, streaming, parallel_tools, agentic]
+    status: active
+    tags: ["mistral", "large", "tools", "agentic", "latest"]
+  pixtral-12b-latest:
+    provider: mistral
+    model_id: "pixtral-12b-latest"
+    display_name: "Pixtral 12B"
+    verification:
+      status: verified
+      verified_at: "2026-01-28"
+      source: "list_models:/models"
+    context_window: 128000
+    capabilities: [chat, vision, tools, streaming, parallel_tools]
+    status: active
+    tags: ["mistral", "pixtral", "vision", "12b", "latest"]
+  pixtral-large-latest:
+    provider: mistral
+    model_id: "pixtral-large-latest"
+    display_name: "Pixtral Large"
+    verification:
+      status: verified
+      verified_at: "2026-01-28"
+      source: "list_models:/models"
+    context_window: 128000
+    capabilities: [chat, vision, tools, streaming, parallel_tools, agentic]
+    status: active
+    tags: ["mistral", "pixtral", "vision", "large", "agentic", "latest"]
+  open-mistral-7b:
+    provider: mistral
+    model_id: "open-mistral-7b"
+    display_name: "Open Mistral 7B"
+    verification:
+      status: verified
+      verified_at: "2026-01-28"
+      source: "list_models:/models"
+    context_window: 32000
+    capabilities: [chat, streaming]
+    status: active
+    tags: ["mistral", "open", "7b", "base"]
+  # NOTE: `open-mixtral-8x7b` is not present in the current /v1/models list for this provider.
+  # Keep it removed to prevent 404 model_not_found. If it returns, re-add with evidence.
+  mistral-tiny:
+    provider: mistral
+    model_id: "mistral-tiny"
+    display_name: "Mistral Tiny"
+    verification:
+      status: verified
+      verified_at: "2026-01-28"
+      source: "list_models:/models"
+    context_window: 32000
+    capabilities: [chat, streaming]
+    status: active
+    tags: ["mistral", "tiny", "cost-effective"]

package/v1/models/moonshot.yaml ADDED Viewed

@@ -0,0 +1,97 @@
+$schema: "https://raw.githubusercontent.com/ailib-official/ai-protocol/main/schemas/v1.json"
+protocol_version: "1.1"
+# 月之暗面 Kimi (Moonshot) Model Instances
+#
+# VERIFIED_AT: 2026-01-31 (based on public Moonshot documentation)
+#
+# Notes:
+# - Kimi is known for ultra-long context windows.
+# - Supports file understanding and web search.
+models:
+  # Moonshot v1 series
+  moonshot-v1-8k:
+    provider: moonshot
+    model_id: "moonshot-v1-8k"
+    display_name: "Kimi v1 8K"
+    verification:
+      status: unverified
+      verified_at: "2026-01-31"
+      source: "documentation"
+      notes: "Standard context model, cost-effective."
+    context_window: 8192
+    capabilities: [chat, tools, streaming]
+    status: active
+    tags: ["moonshot", "kimi", "cn"]
+    pricing:
+      input_per_token: 0.000012
+      output_per_token: 0.000012
+  moonshot-v1-32k:
+    provider: moonshot
+    model_id: "moonshot-v1-32k"
+    display_name: "Kimi v1 32K"
+    verification:
+      status: unverified
+      verified_at: "2026-01-31"
+      source: "documentation"
+    context_window: 32768
+    capabilities: [chat, tools, streaming]
+    status: active
+    tags: ["moonshot", "kimi", "long_context", "cn"]
+    pricing:
+      input_per_token: 0.000024
+      output_per_token: 0.000024
+  moonshot-v1-128k:
+    provider: moonshot
+    model_id: "moonshot-v1-128k"
+    display_name: "Kimi v1 128K"
+    verification:
+      status: unverified
+      verified_at: "2026-01-31"
+      source: "documentation"
+    context_window: 131072
+    capabilities: [chat, tools, streaming]
+    status: active
+    tags: ["moonshot", "kimi", "ultra_long_context", "cn"]
+    pricing:
+      input_per_token: 0.00006
+      output_per_token: 0.00006
+  # Kimi k1 series (latest with enhanced capabilities)
+  kimi-latest:
+    provider: moonshot
+    model_id: "kimi-latest"
+    display_name: "Kimi Latest"
+    verification:
+      status: unverified
+      verified_at: "2026-01-31"
+      source: "documentation"
+      notes: "Alias for the latest Kimi model."
+    context_window: 131072
+    capabilities: [chat, tools, vision, streaming]
+    status: active
+    tags: ["moonshot", "kimi", "latest", "cn"]
+    pricing:
+      input_per_token: 0.00006
+      output_per_token: 0.00006
+  # Moonshot web search model
+  moonshot-v1-auto:
+    provider: moonshot
+    model_id: "moonshot-v1-auto"
+    display_name: "Kimi v1 Auto"
+    verification:
+      status: unverified
+      verified_at: "2026-01-31"
+      source: "documentation"
+      notes: "Auto-selects context window based on input."
+    context_window: 131072
+    capabilities: [chat, tools, streaming]
+    status: active
+    tags: ["moonshot", "kimi", "auto", "cn"]
+    pricing:
+      input_per_token: 0.000024
+      output_per_token: 0.000024

package/v1/models/nvidia.yaml ADDED Viewed

@@ -0,0 +1,118 @@
+$schema: "https://raw.githubusercontent.com/ailib-official/ai-protocol/main/schemas/v1.json"
+protocol_version: "1.1"
+# NVIDIA API Catalog – top LLMs including Minimax and Kimi latest (verified via official API reference)
+# Source: https://docs.api.nvidia.com/nim/reference/llm-apis
+# Catalog: https://build.nvidia.com/explore/discover
+models:
+  nvidia-nemotron-4-340b-instruct:
+    provider: nvidia
+    model_id: "nvidia-nemotron-4-340b-instruct"
+    display_name: "Nemotron 4 340B Instruct"
+    verification:
+      status: verified
+      verified_at: "2026-02-04"
+      source: "https://docs.api.nvidia.com/nim/reference/llm-apis"
+      notes: "NVIDIA flagship 340B chat model; OpenAI-compatible chat completions."
+    context_window: 128000
+    capabilities: [chat, vision, tools, streaming, agentic, parallel_tools, reasoning]
+    status: active
+    tags: ["nvidia", "nemotron", "flagship", "reasoning", "tools"]
+  "nvidia/llama3-chatqa-1.5-70b":
+    provider: nvidia
+    model_id: "nvidia/llama3-chatqa-1.5-70b"
+    display_name: "Llama 3 ChatQA 1.5 70B"
+    verification:
+      status: verified
+      verified_at: "2026-02-04"
+      source: "https://docs.api.nvidia.com/nim/reference/llm-apis"
+      notes: "70B chat QA model on NVIDIA API Catalog."
+    context_window: 32768
+    capabilities: [chat, tools, streaming, agentic]
+    status: active
+    tags: ["nvidia", "llama", "chatqa", "70b"]
+  "deepseek-ai/deepseek-r1":
+    provider: nvidia
+    model_id: "deepseek-ai/deepseek-r1"
+    display_name: "DeepSeek R1 (via NVIDIA)"
+    verification:
+      status: verified
+      verified_at: "2026-02-04"
+      source: "https://docs.api.nvidia.com/nim/reference/llm-apis"
+      notes: "Reasoning model available on NVIDIA API Catalog."
+    context_window: 64000
+    capabilities: [chat, tools, streaming, reasoning]
+    status: active
+    tags: ["deepseek", "reasoning", "nvidia-catalog"]
+  "mistralai/mistral-large-2-instruct":
+    provider: nvidia
+    model_id: "mistralai/mistral-large-2-instruct"
+    display_name: "Mistral Large 2 Instruct (via NVIDIA)"
+    verification:
+      status: verified
+      verified_at: "2026-02-04"
+      source: "https://docs.api.nvidia.com/nim/reference/llm-apis"
+      notes: "Mistral flagship instruct model on NVIDIA API Catalog."
+    context_window: 128000
+    capabilities: [chat, vision, tools, streaming, agentic]
+    status: active
+    tags: ["mistral", "instruct", "nvidia-catalog"]
+  "mistralai/mixtral-8x22b-instruct":
+    provider: nvidia
+    model_id: "mistralai/mixtral-8x22b-instruct"
+    display_name: "Mixtral 8x22B Instruct (via NVIDIA)"
+    verification:
+      status: verified
+      verified_at: "2026-02-04"
+      source: "https://docs.api.nvidia.com/nim/reference/llm-apis"
+      notes: "MoE 8x22B instruct model on NVIDIA API Catalog."
+    context_window: 65536
+    capabilities: [chat, tools, streaming, agentic]
+    status: active
+    tags: ["mistral", "mixtral", "moe", "nvidia-catalog"]
+  "meta/llama3-70b":
+    provider: nvidia
+    model_id: "meta/llama3-70b"
+    display_name: "Llama 3 70B (via NVIDIA)"
+    verification:
+      status: verified
+      verified_at: "2026-02-04"
+      source: "https://docs.api.nvidia.com/nim/reference/llm-apis"
+      notes: "Meta Llama 3 70B on NVIDIA API Catalog."
+    context_window: 8192
+    capabilities: [chat, tools, streaming]
+    status: active
+    tags: ["meta", "llama", "70b", "nvidia-catalog"]
+  "moonshotai/kimi-k2-instruct":
+    provider: nvidia
+    model_id: "moonshotai/kimi-k2-instruct"
+    display_name: "Kimi K2 Instruct (via NVIDIA)"
+    verification:
+      status: verified
+      verified_at: "2026-02-04"
+      source: "https://docs.api.nvidia.com/nim/reference/moonshotai-kimi-k2-instruct"
+      notes: "Moonshot Kimi K2 MoE 1T/32B; agentic, tools, 128K context on NVIDIA API Catalog."
+    context_window: 128000
+    capabilities: [chat, tools, streaming, agentic, reasoning]
+    status: active
+    tags: ["moonshot", "kimi", "moe", "nvidia-catalog", "agentic"]
+  "minimaxai/minimax-m2":
+    provider: nvidia
+    model_id: "minimaxai/minimax-m2"
+    display_name: "MiniMax M2 (via NVIDIA)"
+    verification:
+      status: verified
+      verified_at: "2026-02-04"
+      source: "https://docs.api.nvidia.com/nim/reference/minimaxai-minimax-m2"
+      notes: "MiniMax M2 MoE 230B/10B; coding, reasoning, tool-use, 128K context on NVIDIA API Catalog."
+    context_window: 128000
+    capabilities: [chat, tools, streaming, agentic, reasoning]
+    status: active
+    tags: ["minimax", "moe", "nvidia-catalog", "coding", "agentic"]

package/v1/models/palmyra.yaml ADDED Viewed

@@ -0,0 +1,59 @@
+$schema: "https://raw.githubusercontent.com/ailib-official/ai-protocol/main/schemas/v1.json"
+protocol_version: "1.5"
+# Writer Model Instances (Palmyra Series)
+# Notes: Writer provides enterprise-focused AI writing and content generation
+models:
+  palmyra-x-004:
+    provider: writer
+    model_id: "palmyra-x-004"
+    display_name: "Palmyra X 004"
+    verification:
+      status: unverified
+      source: "manual"
+      notes: "Flagship model for enterprise writing"
+    context_window: 128000
+    capabilities: [chat, tools, streaming, agentic, reasoning]
+    pricing:
+      input_per_token: null
+      output_per_token: null
+    status: active
+    tags: ["palmyra", "writer", "enterprise", "writing", "reasoning"]
+    agentic_capabilities:
+      reasoning_effort: "medium"
+      thinking_blocks: false
+      parallel_tools: false
+      builtin_tools: ["web_search", "fact_check", "compliance"]
+  palmyra-med:
+    provider: writer
+    model_id: "palmyra-med"
+    display_name: "Palmyra Med"
+    verification:
+      status: unverified
+      source: "manual"
+      notes: "Specialized for medical and healthcare content"
+    context_window: 64000
+    capabilities: [chat, tools, streaming, agentic]
+    pricing:
+      input_per_token: null
+      output_per_token: null
+    status: active
+    tags: ["palmyra", "writer", "medical", "healthcare", "enterprise"]
+  palmyra-fin:
+    provider: writer
+    model_id: "palmyra-fin"
+    display_name: "Palmyra Fin"
+    verification:
+      status: unverified
+      source: "manual"
+      notes: "Specialized for financial content"
+    context_window: 64000
+    capabilities: [chat, tools, streaming, agentic]
+    pricing:
+      input_per_token: null
+      output_per_token: null
+    status: active
+    tags: ["palmyra", "writer", "finance", "enterprise"]

package/v1/models/perplexity.yaml ADDED Viewed

@@ -0,0 +1,97 @@
+$schema: "https://raw.githubusercontent.com/ailib-official/ai-protocol/main/schemas/v1.json"
+protocol_version: "1.1"
+# Perplexity Model Instances
+#
+# VERIFIED_AT: 2026-01-31 (based on public Perplexity documentation)
+#
+# Notes:
+# - Perplexity is known for search-augmented AI.
+# - "Online" models include real-time web search.
+# - "Chat" models are standard conversational models.
+models:
+  # Sonar Online models (with web search)
+  llama-3.1-sonar-small-128k-online:
+    provider: perplexity
+    model_id: "llama-3.1-sonar-small-128k-online"
+    display_name: "Sonar Small Online (8B)"
+    verification:
+      status: unverified
+      verified_at: "2026-01-31"
+      source: "documentation"
+      notes: "Llama 3.1 8B with real-time web search."
+    context_window: 127072
+    capabilities: [chat, streaming, online_search]
+    status: active
+    tags: ["perplexity", "sonar", "online", "search"]
+    pricing:
+      input_per_token: 0.0000002
+      output_per_token: 0.0000002
+  llama-3.1-sonar-large-128k-online:
+    provider: perplexity
+    model_id: "llama-3.1-sonar-large-128k-online"
+    display_name: "Sonar Large Online (70B)"
+    verification:
+      status: unverified
+      verified_at: "2026-01-31"
+      source: "documentation"
+      notes: "Llama 3.1 70B with real-time web search."
+    context_window: 127072
+    capabilities: [chat, streaming, online_search]
+    status: active
+    tags: ["perplexity", "sonar", "online", "search", "large"]
+    pricing:
+      input_per_token: 0.000001
+      output_per_token: 0.000001
+  llama-3.1-sonar-huge-128k-online:
+    provider: perplexity
+    model_id: "llama-3.1-sonar-huge-128k-online"
+    display_name: "Sonar Huge Online (405B)"
+    verification:
+      status: unverified
+      verified_at: "2026-01-31"
+      source: "documentation"
+      notes: "Llama 3.1 405B with real-time web search."
+    context_window: 127072
+    capabilities: [chat, streaming, online_search]
+    status: active
+    tags: ["perplexity", "sonar", "online", "search", "flagship"]
+    pricing:
+      input_per_token: 0.000005
+      output_per_token: 0.000005
+  # Sonar Chat models (without web search)
+  llama-3.1-sonar-small-128k-chat:
+    provider: perplexity
+    model_id: "llama-3.1-sonar-small-128k-chat"
+    display_name: "Sonar Small Chat (8B)"
+    verification:
+      status: unverified
+      verified_at: "2026-01-31"
+      source: "documentation"
+    context_window: 131072
+    capabilities: [chat, streaming]
+    status: active
+    tags: ["perplexity", "sonar", "chat"]
+    pricing:
+      input_per_token: 0.0000002
+      output_per_token: 0.0000002
+  llama-3.1-sonar-large-128k-chat:
+    provider: perplexity
+    model_id: "llama-3.1-sonar-large-128k-chat"
+    display_name: "Sonar Large Chat (70B)"
+    verification:
+      status: unverified
+      verified_at: "2026-01-31"
+      source: "documentation"
+    context_window: 131072
+    capabilities: [chat, streaming]
+    status: active
+    tags: ["perplexity", "sonar", "chat", "large"]
+    pricing:
+      input_per_token: 0.000001
+      output_per_token: 0.000001

package/v1/models/qwen.yaml ADDED Viewed

@@ -0,0 +1,27 @@
+$schema: "https://raw.githubusercontent.com/ailib-official/ai-protocol/main/schemas/v1.json"
+protocol_version: "1.1"
+# Qwen Model Instances
+models:
+  qwen-max:
+    provider: qwen
+    model_id: "qwen-max"
+    display_name: "Qwen Max"
+    verification:
+      status: unverified
+      source: "manual"
+    context_window: 262144
+    capabilities: [chat, tools, streaming]
+    status: active
+    tags: ["alibaba", "qwen", "strong"]
+  qwen-turbo:
+    provider: qwen
+    model_id: "qwen-turbo"
+    display_name: "Qwen Turbo"
+    verification:
+      status: unverified
+      source: "manual"
+    capabilities: [chat, vision, tools, streaming, agentic]
+    status: active
+    tags: ["alibaba", "qwen", "fast"]

package/v1/models/replicate.yaml ADDED Viewed

@@ -0,0 +1,136 @@
+$schema: "https://raw.githubusercontent.com/ailib-official/ai-protocol/main/schemas/v1.json"
+protocol_version: "1.1"
+# Replicate Model Instances
+#
+# VERIFIED_AT: 2026-01-29 (based on public Replicate documentation)
+#
+# Notes:
+# - Replicate is a model hosting platform with async prediction API.
+# - Model IDs follow the pattern: {owner}/{model_name}
+# - Supports both native Replicate API and OpenAI-compatible endpoints for some models.
+models:
+  # Meta Llama models
+  "meta/llama-2-70b-chat":
+    provider: replicate
+    model_id: "meta/llama-2-70b-chat"
+    display_name: "Llama 2 70B Chat"
+    verification:
+      status: unverified
+      verified_at: "2026-01-29"
+      source: "documentation"
+      notes: "Based on public documentation. Runtime verification recommended."
+    context_window: 4096
+    capabilities: [chat, streaming]
+    status: active
+    tags: ["meta", "llama", "replicate", "chat"]
+  "meta/meta-llama-3-70b-instruct":
+    provider: replicate
+    model_id: "meta/meta-llama-3-70b-instruct"
+    display_name: "Llama 3 70B Instruct"
+    verification:
+      status: unverified
+      verified_at: "2026-01-29"
+      source: "documentation"
+    context_window: 8192
+    capabilities: [chat, streaming]
+    status: active
+    tags: ["meta", "llama", "replicate", "instruct"]
+  "meta/meta-llama-3.1-405b-instruct":
+    provider: replicate
+    model_id: "meta/meta-llama-3.1-405b-instruct"
+    display_name: "Llama 3.1 405B Instruct"
+    verification:
+      status: unverified
+      verified_at: "2026-01-29"
+      source: "documentation"
+    context_window: 131072
+    capabilities: [chat, streaming]
+    status: active
+    tags: ["meta", "llama", "replicate", "instruct", "flagship"]
+  # Mistral models
+  "mistralai/mistral-7b-instruct-v0.2":
+    provider: replicate
+    model_id: "mistralai/mistral-7b-instruct-v0.2"
+    display_name: "Mistral 7B Instruct v0.2"
+    verification:
+      status: unverified
+      verified_at: "2026-01-29"
+      source: "documentation"
+    context_window: 8192
+    capabilities: [chat, streaming]
+    status: active
+    tags: ["mistral", "replicate", "instruct"]
+  "mistralai/mixtral-8x7b-instruct-v0.1":
+    provider: replicate
+    model_id: "mistralai/mixtral-8x7b-instruct-v0.1"
+    display_name: "Mixtral 8x7B Instruct"
+    verification:
+      status: unverified
+      verified_at: "2026-01-29"
+      source: "documentation"
+    context_window: 32768
+    capabilities: [chat, streaming]
+    status: active
+    tags: ["mistral", "mixtral", "moe", "replicate"]
+  # Stability AI models (text)
+  "stability-ai/stablelm-tuned-alpha-7b":
+    provider: replicate
+    model_id: "stability-ai/stablelm-tuned-alpha-7b"
+    display_name: "StableLM Tuned Alpha 7B"
+    verification:
+      status: unverified
+      verified_at: "2026-01-29"
+      source: "documentation"
+    context_window: 4096
+    capabilities: [chat, streaming]
+    status: deprecated
+    tags: ["stability", "stablelm", "replicate"]
+  # Snowflake models
+  "snowflake/snowflake-arctic-instruct":
+    provider: replicate
+    model_id: "snowflake/snowflake-arctic-instruct"
+    display_name: "Snowflake Arctic Instruct"
+    verification:
+      status: unverified
+      verified_at: "2026-01-29"
+      source: "documentation"
+    context_window: 4096
+    capabilities: [chat, streaming]
+    status: active
+    tags: ["snowflake", "arctic", "replicate", "enterprise"]
+  # Vision-language models
+  "yorickvp/llava-13b":
+    provider: replicate
+    model_id: "yorickvp/llava-13b"
+    display_name: "LLaVA 13B"
+    verification:
+      status: unverified
+      verified_at: "2026-01-29"
+      source: "documentation"
+    context_window: 2048
+    capabilities: [chat, vision, streaming]
+    status: active
+    tags: ["llava", "vision", "multimodal", "replicate"]
+  # Code models
+  "meta/codellama-70b-instruct":
+    provider: replicate
+    model_id: "meta/codellama-70b-instruct"
+    display_name: "Code Llama 70B Instruct"
+    verification:
+      status: unverified
+      verified_at: "2026-01-29"
+      source: "documentation"
+    context_window: 16384
+    capabilities: [chat, code, streaming]
+    status: active
+    tags: ["meta", "codellama", "code", "replicate"]