gpt-4o-mini vision gpt 图片识别时， openai 接口不允许多轮会话，大家遇到过吗？

比如我要识别一个图片，我的消息体大概是这样：
{
  "model": "gpt-4o-mini",
  "messages": [
{
   "role": "user",
   "content": [
      {
      "type": "text",
      "text": "What’s in this image?"
      },
      {
      "type": "image_url",
      "image_url": {
         "url": f"data:image/jpeg;base64,{base64_image}"
      }
      }
   ]
}

但是如果我获取请求结果后，发现不合适，我想要带着这次的请求结果重新提问，按照非 vision 的方式是，插入一个 assistant 角色的内容，但是 vision 是不支持的，请问大家遇到过吗？ openai 好像接口不允许这么做。

zhhmax

先识别一次图，然后将得到的结果复制过去，形成一条 role=assistant 的 message ，请求结果如下：
https://i.imgur.com/Ivg0UPw.png
先识别一次图，然后将得到的结果复制过去，形成一条 role=assistant 的 message ，后面再跟一条 role=user 的 message ，请求结果如下：
https://i.imgur.com/djyWjKW.png
先识别一次图，然后将得到的结果复制过去，形成一条 role=assistant 的 message ，后面再跟一条 role=user 的 message ，message 强调重新识别，请求结果如下：
https://i.imgur.com/dUFJYhX.png
这三个截图，不知道你说的是哪种情况。

vacuitym

没有吧，我刚试了我的正常

yinmin

image url 改变 base64

gpt-4o-mini vision gpt 图片识别时， openai 接口 不允许多轮会话，大家遇到过吗？

gpt-4o-mini vision gpt 图片识别时， openai 接口不允许多轮会话，大家遇到过吗？