汇云_api_技术文档
首页控制台定价日志下载关于
首页控制台定价日志下载关于
  1. Responses格式
  • 模型接口
    • 列出模型
      • 原生OpenAI格式
      • 原生Gemini格式
    • 聊天(Chat)
      • OpenAI
        • ChatCompletions格式
          • 基础文本对话
          • 流式响应
          • 图片理解
          • 函数调用
          • Logprobs 请求
          • 内容补全接口
          • 联网搜索
          • PDF文件分析
          • Codex
          • response_format
          • N测试
          • gpt-4-all(分析图片)
          • xAI联网搜索
          • 令牌用量查询(Token Usage)
        • Responses格式
          • 基础文本响应
            POST
          • 图像分析响应
            POST
          • 网络搜索工具
            POST
          • 文件搜索工具
            POST
          • Computer use
            POST
          • 流式响应
            POST
          • deep-research / 深度研究
            POST
          • 函数调用
            POST
          • 推理能力
            POST
          • 推理总结
            POST
      • Anthropic Claude
        • 原生Claude格式(推荐)
          • 文本生成
          • 图片理解
          • 文本生成 / 强制返回思考
          • 函数调用
          • 多轮函数调用
          • Web search / 联网搜索
        • OpenAI兼容格式
          • 文本生成
          • 图片理解
          • 文本生成 / 强制返回思考
          • 函数调用
          • 多轮函数调用
          • Web search / 联网搜索
      • Google Gemini
        • 原生Gemini格式
          • Gemini文本聊天
          • Gemini媒体识别
        • OpenAI兼容格式
          • 文本生成
          • 文本生成 / 强制返回思考
          • 文本生成 / 自定义思考预算
          • 图片理解
          • 函数调用
          • 全能多模态版本
          • 联网搜索
          • 文本转语音 / TTS
          • 音频理解
          • 视频理解
    • Midjourney
      • 1.文生图(Imagine)接口
      • 2.按钮点击(Action)接口
      • 3.图片融合(Blend)接口
      • 4.窗口执行(Modal)接口
      • 5.图生文(Describe)接口
      • 6.缩短提示词(Shorten)接口
      • 7.换脸(FaceSwap)接口
      • 8.上传(upload)接口
      • 9.查询接口
      • 10.批量查询接口
      • 11.获取种子(Seed)接口
      • 13.编辑图片(Edit)接口
      • 14.生成视频(Video)接口
      • 文生图 / OpenAI兼容接口
    • 图像(Images)
      • OpenAI格式
        • 图片生成 / gpt-image-1.5
        • 图片生成 / dall-e-3
        • 图片编辑 / edits接口
        • 图片编辑 / 网页版
        • 图片变体生成
        • gpt-4-all(生成图片)
        • xAI
      • Google Gemini
        • OpenAI聊天格式
          • 图片生成(Nano-banana2)
          • 图片生成(Nano-banana2-4K)
          • 图片生成 / Imagen 4
          • 图片编辑(Nano-banana)
          • 图片生成
          • 图片编辑
        • Gemini原生格式
          • 图像生成
      • 豆包(Doubao)
        • 文生图(纯文本输入单图输出)
        • 图文生图(单图输入单图输出)
        • 多图融合(多图输入单图输出)
        • 组图输出(多图输出)
      • 阿里通义千问
        • 文生图-Z-Image
        • 文生图
        • 文生图V2版
        • 文生图V1
        • 图像生成与编辑2.6
        • 通用图像编辑2.5
      • xAI / OpenAI兼容接口
      • flux / OpenAI兼容接口
      • flux-kontext-pro / OpenAI兼容接口
      • stable-diffusion / OpenAI兼容接口
      • ideogram / OpenAI兼容接口
      • recraftv3 / OpenAI兼容接口
      • flux携带参考图 / OpenAI兼容接口
    • 视频(Videos)
      • Sora-2
        • Sora-2(创建视频)
        • Sora-2(创建视频-带 Character)
        • Sora-2(编辑视频remix)
        • Sora2官方接口(Chat格式)
        • 查询视频1(异步任务)
        • 查询视频2(异步任务)
        • 获取视频内容
      • 豆包(Doubao)
        • 豆包-文生视频
        • 查询视频
      • 即梦(Jimeng)
        • 即梦AI-文生视频S2.0Pro
        • 查询视频
      • 可灵AI(Kling)
        • 可灵AI-文生视频
        • 可灵AI-文生视频kling-video-o1
        • 可灵AI-带参考视频kling-video-o1
        • 可灵AI-图生视频
        • 查询视频
      • 阿里通义千问
        • 通义万相2.6(创建视频)
        • 通义万相2.5(创建视频)
        • 查询视频(异步任务)
      • Veo 3
        • Veo 3
        • Veo 3(官方格式)
        • 查询视频
        • 查询视频(官方格式)
      • Vidu
        • Vidu-文生视频
        • 查询视频
      • OpenAI兼容接口
        • veo3
        • luma
        • runway
        • 智谱清言GLM
        • 可灵
    • 音频(Audio)
      • 原生OpenAI格式
        • 文本转语音 / TTS
        • 语音转文本 / whisper-1
        • 语音转文本 / gpt-4o-transcribe
        • 音频翻译
        • Audio接口 / 输出
        • Audio接口 / 输入
        • MiniMax语音合成TTS
        • 豆包语音2.0
      • 原生Gemini格式
    • 音乐(Music)
      • Suno
        • 生成歌曲
        • 生成歌词
        • 上传音乐
        • 歌曲拼接
        • 单个查询任务
        • 批量查询任务
      • Udio
        • Udio(Chat格式)
    • 嵌入(Embeddings)
      • 创建文本嵌入(OpenAI)
      • 批量创建嵌入(OpenAI)
      • 创建文本嵌入(Gemini)
    • 重排序 (Rerank)
      • Jina AI 重排序格式
      • Cohere 重排序格式
      • Xinference 重排序格式
    • 审查(Moderations)
      • 创建内容审核
    • GPTs 相关
      • GPTs对话
      • 搜索相关 GPTs
      • 查询 GPTs 详情
      • 批量查询 GPTs 详情
  1. Responses格式

图像分析响应

POST
/responses

请求参数

Header 参数

Body 参数application/json

示例
{
  "model": "gpt-4.1",
  "input": [
    {
      "role": "user",
      "content": [
        {
          "type": "input_text",
          "text": "描述这张图片中的内容"
        },
        {
          "type": "input_image",
          "image_url": "https://upload.wikimedia.org/wikipedia/commons/thumb/d/dd/Gfp-wisconsin-madison-the-nature-boardwalk.jpg/2560px-Gfp-wisconsin-madison-the-nature-boardwalk.jpg"
        }
      ]
    }
  ]
}

请求示例代码

Shell
JavaScript
Java
Swift
Go
PHP
Python
HTTP
C
C#
Objective-C
Ruby
OCaml
Dart
R
请求示例请求示例
Shell
JavaScript
Java
Swift
curl --location --request POST '/responses' \
--header 'Accept: application/json' \
--header 'Authorization: Bearer {{YOUR_API_KEY}}' \
--header 'Content-Type: application/json' \
--data-raw '{
  "model": "gpt-4.1",
  "input": [
    {
      "role": "user",
      "content": [
        {
          "type": "input_text",
          "text": "描述这张图片中的内容"
        },
        {
          "type": "input_image",
          "image_url": "https://upload.wikimedia.org/wikipedia/commons/thumb/d/dd/Gfp-wisconsin-madison-the-nature-boardwalk.jpg/2560px-Gfp-wisconsin-madison-the-nature-boardwalk.jpg"
        }
      ]
    }
  ]
}'

返回响应

🟢200成功
application/json
Body

示例
{
  "id": "resp_09a458ef7d14ad250068eedea510fc819380f2badab6d5b9fa",
  "object": "response",
  "created_at": 1760485029,
  "status": "completed",
  "background": false,
  "content_filters": null,
  "error": null,
  "incomplete_details": null,
  "instructions": null,
  "max_output_tokens": null,
  "max_tool_calls": null,
  "model": "gpt-4.1-data",
  "output": [
    {
      "id": "msg_09a458ef7d14ad250068eedea778f88193aa13888456165136",
      "type": "message",
      "status": "completed",
      "content": [
        {
          "type": "output_text",
          "annotations": [],
          "logprobs": [],
          "text": "这张图片展示了一片广阔的草原景色。画面中央有一条木质栈道,笔直地延伸向远方,仿佛引领人走入大自然的怀抱。栈道两侧是茂密、绿色的高草,背景中有一些低矮的灌木和树丛。天空非常辽阔,蔚蓝中夹杂着几朵白色云彩,阳光明媚,让整个画面显得清新、明亮,有一种宁静和开放的感觉。"
        }
      ],
      "role": "assistant"
    }
  ],
  "parallel_tool_calls": true,
  "previous_response_id": null,
  "prompt_cache_key": null,
  "reasoning": {
    "effort": null,
    "summary": null
  },
  "safety_identifier": null,
  "service_tier": "default",
  "store": true,
  "temperature": 1,
  "text": {
    "format": {
      "type": "text"
    },
    "verbosity": "medium"
  },
  "tool_choice": "auto",
  "tools": [],
  "top_logprobs": 0,
  "top_p": 1,
  "truncation": "disabled",
  "usage": {
    "input_tokens": 1118,
    "input_tokens_details": {
      "cached_tokens": 0
    },
    "output_tokens": 128,
    "output_tokens_details": {
      "reasoning_tokens": 0
    },
    "total_tokens": 1246
  },
  "user": null,
  "metadata": {}
}
修改于 2026-02-08 11:51:31
上一页
基础文本响应
下一页
网络搜索工具
Built with