Appearance
Rerank API
接口:
text
POST /v1/rerankRerank 是文档重排序接口,不属于 OpenAI Chat Completions 或 Responses SDK。请使用 HTTP 客户端调用。
模型
| 模型 | 输入 | 输出 | 说明 |
|---|---|---|---|
qwen3-rerank | text | ranking | 文本重排序 |
qwen3-vl-rerank | text, image | ranking | 多模态重排序,支持图片 URL/Base64 |
请求字段
| 字段 | 类型 | 必填 | 说明 |
|---|---|---|---|
model | string | 是 | qwen3-rerank 或 qwen3-vl-rerank |
query | string | 是 | 查询文本 |
documents | array | 是 | 候选文档数组 |
top_n | number | 否 | 返回前 N 个结果 |
return_documents | boolean | 否 | 是否在结果里返回原文档 |
instruct | string | 否 | 排序指令,文本 rerank 常用 |
documents 格式
文本 rerank 支持字符串数组:
json
[
"合同到期前 30 天未通知则自动续签一年。",
"付款方式为每月 10 日前转账。"
]多模态 rerank 支持对象:
json
[
{"text": "绿色植物照片"},
{"image_url": "https://example.com/plant.jpg"},
{"image_url": "data:image/jpeg;base64,..."}
]响应字段
| 字段 | 说明 |
|---|---|
object | rerank |
model | 使用的模型 |
results[].index | 原始 documents 下标 |
results[].relevance_score | 相关性分数,越高越相关 |
results[].document | 当 return_documents=true 时返回 |
usage.prompt_tokens | 输入 token |
usage.total_tokens | 总 token |
边界
| 边界 | 说明 |
|---|---|
| 流式 | 不支持 SSE,始终非流式返回 |
| OpenAI SDK | 不使用 Chat/Responses SDK |
| 视频 | 当前公开接口不支持视频 document |
| 文件上传 | 当前不支持文件 ID 或 /v1/files |
| 图片 | qwen3-vl-rerank 支持图片 URL 和 Base64 data URL |
| 模型能力 | Rerank 模型不应作为 chat/responses 模型使用 |
文本示例
bash
curl https://llm.lytokens.com/v1/rerank \
-H 'Content-Type: application/json' \
-H 'Authorization: Bearer sk-gtw-REPLACE_ME' \
--data-raw '{
"model": "qwen3-rerank",
"query": "什么是文本排序模型",
"documents": [
"文本排序模型广泛用于搜索引擎和推荐系统中,它们根据文本相关性对候选文本进行排序",
"量子计算是计算科学的一个前沿领域",
"预训练语言模型的发展给文本排序模型带来了新的进展"
],
"top_n": 2,
"return_documents": true
}'多模态示例
bash
curl https://llm.lytokens.com/v1/rerank \
-H 'Content-Type: application/json' \
-H 'Authorization: Bearer sk-gtw-REPLACE_ME' \
--data-raw '{
"model": "qwen3-vl-rerank",
"query": "什么是文本排序模型",
"documents": [
{
"text": "文本排序模型广泛用于搜索引擎和推荐系统中,它们根据文本相关性对候选文本进行排序"
},
{
"image_url": "https://img.alicdn.com/imgextra/i3/O1CN01rdstgY1uiZWt8gqSL_!!6000000006071-0-tps-1970-356.jpg"
}
],
"top_n": 2,
"return_documents": true
}'Python requests
python
import requests
resp = requests.post(
"https://llm.lytokens.com/v1/rerank",
headers={"Authorization": "Bearer sk-gtw-REPLACE_ME"},
json={
"model": "qwen3-rerank",
"query": "什么是自动续签风险?",
"documents": [
"合同到期前 30 天未通知则自动续签一年。",
"付款方式为每月 10 日前转账。"
],
"top_n": 2,
"return_documents": True,
},
)
print(resp.json())