Skip to content

Responses API

接口:

text
POST /v1/responses

SDK:

python
client.responses.create(...)

请求字段

字段类型必填说明
modelstring使用 /v1/models 返回的模型 ID
inputstring/array字符串或 OpenAI message 数组
instructionsstring系统指令
max_output_tokensnumber最大输出 token 数
temperaturenumber采样温度
top_pnumber核采样参数
streambooleantrue 时返回 Responses SSE
toolsarray支持 function tools
tool_choicestring/object支持 autononerequired 和指定函数
metadataobject请求元数据

响应字段

非流式返回 Responses 风格对象:

字段说明
idresponse ID
objectresponse
statuscompletedcancelled
model响应模型
output输出数组
output_textSDK 侧可聚合文本
usagetoken 用量

流式返回 Responses SSE。常见事件:

事件说明
response.created请求已创建,包含 response.id
response.output_text.delta文本增量
response.completed正常完成
response.cancelled请求被取消

取消请求

接口:

text
POST /v1/responses/{response_id}/cancel

SDK:

python
client.responses.cancel("resp_xxx")

HTTP:

bash
curl -X POST https://llm.lytokens.com/v1/responses/resp_xxx/cancel \
  -H 'Authorization: Bearer sk-gtw-REPLACE_ME'

边界

边界说明
previous_response_id暂不支持
background mode暂不支持
文件输入暂不支持
内置工具暂不支持
取消范围取消当前进程内仍活跃的流式 Responses 请求
断流缓存GET /v1/responses/{request_id} 只在服务端存在缓存时可用

示例

bash
curl -N https://llm.lytokens.com/v1/responses \
  -H 'Content-Type: application/json' \
  -H 'Authorization: Bearer sk-gtw-REPLACE_ME' \
  --data-raw '{
    "model": "qwen3.6-plus",
    "input": "解释什么是 RESTful API",
    "max_output_tokens": 2048,
    "stream": true
  }'

OpenAI-compatible API documentation.