比如我要识别一个图片,我的消息体大概是这样:
{
  "model": "gpt-4o-mini",
  "messages": [
    {
      "role": "user",
      "content": [
        {
          "type": "text",
          "text": "What’s in this image?"
        },
        {
          "type": "image_url",
          "image_url": {
            "url": f"data:image/jpeg;base64,{base64_image}"
          }
        }
      ]
    }
   
    但是如果我获取请求结果后,发现不合适,我想要带着这次的请求结果重新提问,按照非 vision 的方式是,插入一个 assistant 角色的内容,但是 vision 是不支持的,请问大家遇到过吗? openai 好像接口不允许这么做。
举报· 77 次点击
登录 注册 站外分享
3 条回复  
zhhmax 小成 2024-8-26 00:20:13
先识别一次图,然后将得到的结果复制过去,形成一条 role=assistant 的 message ,请求结果如下:
https://i.imgur.com/Ivg0UPw.png
先识别一次图,然后将得到的结果复制过去,形成一条 role=assistant 的 message ,后面再跟一条 role=user 的 message ,请求结果如下:
https://i.imgur.com/djyWjKW.png
先识别一次图,然后将得到的结果复制过去,形成一条 role=assistant 的 message ,后面再跟一条 role=user 的 message ,message 强调重新识别,请求结果如下:
https://i.imgur.com/dUFJYhX.png
这三个截图,不知道你说的是哪种情况。
vacuitym 小成 2024-8-26 09:21:57
没有吧,我刚试了我的正常
yinmin 小成 2024-8-26 09:42:18
image url 改变 base64
返回顶部