benchmark 里面, reflection 70b 各个方面的能力都比 Claude 3.5 Sonnet,        Claude 3 Opus ,        GPT-4o        Gemini 1.5 Pro ,        Llama 3.1 405B 要强。
我用了下感觉这个模型好像没有这么牛啊。不知道是不是使用姿势不对。
比如我发 helo, 它会长篇大论的解释“helo"是一个西班牙语打招呼的词,看起来很学术的样子。
但是最后一句居然带着提示词。这开发者不知道是怎么搞的把提示词放在回答里了。

相关链接:
https://huggingface.co/spaces/featherless-ai/try-this-model
https://reflection70b.com
举报· 67 次点击
登录 注册 站外分享
6 条回复  
tool2dx 初学 2024-9-7 15:15:23
这种在 AI 里叫过拟合,光跑分强没用啊,还是要实战强才行。
Chihiro316 小成 2024-9-7 15:24:50
大预言模型。。。可以预言我能活多久么[doge]
line 小成 2024-9-7 15:44:32
把 cot 硬微调到 模型里
jlak 小成 2024-9-7 16:37:52
跑分考题就那些,全喂给 AI 再训练出不得满分💯
Sting1226 小成 2024-9-7 17:27:27
能语言我什么时候财务自由?
PositionZero 小成 2024-9-7 18:52:16
随便让它解释个名词,它一边回复一边道歉:

```
... Actually, that's not entirely accurate. A shadowban doesn't make content completely invisible, but rather reduces its visibility significantly.

... I made a mistake here. While this is true for some platforms, it's not unifersal. The effects of a shadowban can vary between platforms, and I shouldn't generalize.
```
返回顶部