Appearance
模型列表
可用模型以控制台和 /v1/models 返回为准。不同账号的开通范围可能不同。需要判断模型是否支持图片输入、图片生成或视频生成时,使用 /v1/model-catalog。
模型广场与开通范围
控制台的“模型广场”用于给当前租户开通模型。模型开通是租户级别的,同一租户下的用户和 API Key 共享这份开通范围。
最终能被某个 API Key 看到并调用的模型,是以下条件的交集:
- 平台当前启用且可路由的模型。
- 当前租户已经在模型广场开通的模型。
- 当前 API Key 允许调用的模型范围。
- 平台模型策略没有隐藏或禁用的模型。
如果控制台在线体验或 /v1/models 没有返回模型,请先到模型广场开通模型;如果模型已经开通但仍不可见,请检查 API Key 是否设置了模型限制。
查询模型
bash
curl https://llm.xiaoyue9527.xyz/v1/models \
-H 'Authorization: Bearer sk-gtw-REPLACE_ME'返回示例:
json
{
"object": "list",
"data": [
{
"id": "gpt-5.4",
"object": "model",
"owned_by": "OpenAI"
}
]
}查询单个模型
bash
curl https://llm.xiaoyue9527.xyz/v1/models/gpt-5.4 \
-H 'Authorization: Bearer sk-gtw-REPLACE_ME'返回示例:
json
{
"id": "gpt-5.4",
"object": "model",
"created": 1778238628,
"owned_by": "OpenAI"
}查询模型能力
bash
curl https://llm.xiaoyue9527.xyz/v1/model-catalog \
-H 'Authorization: Bearer sk-gtw-REPLACE_ME'返回示例:
json
{
"object": "list",
"data": [
{
"model_id": "gpt-4o",
"display_name": "GPT-4o",
"group": "OpenAI",
"modalities": {
"input": ["text", "image"],
"output": ["text"]
},
"tasks": ["t2t", "i2t"],
"features": ["streaming", "tool_calling", "vision"],
"badges": ["文本/对话模型", "工具调用", "视觉理解", "多模态"]
}
]
}常见 tasks 含义:
| task | 含义 |
|---|---|
t2t | 文本对话 |
i2t | 图片理解 |
t2i | 文生图 |
i2i | 图生图 |
t2v | 文生视频 |
i2v | 图生视频 |
rerank | 文档重排序 |
常用模型
以下为常见模型 ID 示例,实际可用范围以账号开通为准。
| 模型 ID | 说明 |
|---|---|
gpt-5.4 | 通用文本与代码 |
qwen3.6-plus | 通用文本 |
qwen3.5-plus | 通用文本 |
qwen3-rerank | 文本重排序,通过 /v1/rerank 调用 |
qwen3-vl-rerank | 多模态重排序,通过 /v1/rerank 调用 |
deepseek-v4-pro | DeepSeek V4 Pro,高质量文本、代码和推理场景 |
deepseek-v4-flash | DeepSeek V4 Flash,低延迟文本和在线交互场景 |
opus-4-7 | Claude Opus 兼容别名,适合 Cursor 等 OpenAI-compatible 客户端 |
模型 ID 大小写敏感。请求时请使用 /v1/models 返回的完整 ID。
可见模型与开通范围
/v1/models 返回的是当前 API Key 可调用、可展示的模型列表。不同账号、不同 API Key 的开通范围可能不同,因此不要把文档中的示例模型写死为唯一来源。
/v1/model-catalog 返回模型能力信息,适合在客户端展示模型分组、模态、任务类型、上下文长度和能力标签。实际发起调用前,仍建议以 /v1/models 的返回结果作为最终可用列表。
模型广场用于发现和开通模型;/v1/models 用于客户端运行时判断当前 Key 实际可调用的模型。生产代码应以后者为准。