飞社-令人惊奇的创意工作者社区-问与答如何评价 OpenAI 的 o3?

vfx666 · 2024-12-21 12:03:30

@trungdieu031 到时候都是机器人上班，共产主义时代真的要来了吗🤓

haiku · 2024-12-21 12:04:04

@trungdieu031 看看 Google 和 Claude 会不会跟进，推理成本太高了，英伟达芯片看起来又供不应求了

youthfire · 2024-12-21 12:11:17

o1 和 claude3.5 sonnet 1022 伯仲间，价格却直接翻了 10 倍，关键还特别慢，这 o3 价格还不上天了。Openai 现在 ppt 能力在不断上升，成品看起来不是那么尽如人意。几家里面，它家是最喜欢动态调整算力的，产品总是比发行时拉垮很多，有机会用上第一批成品的都会有这个感觉。开满算力的 gpt4 并不比现在的 4o 差多少。所以 o3 理论上会很强，实际推出后应用不看好。

Sharuru · 2024-12-21 12:12:43

每次都是发新模型，然后老模型就变笨。

trungdieu031 · 2024-12-21 12:12:47

@haiku 从报告上看，目前推理成本太高确实是最大的问题。但我对推理成本的下降持乐观态度。至少在 2030 年之前，gpu 的推理成本是稳步下降的，我直观体验上至少比摩尔定律描述的下降速度要快。给个不精确数字的话，我感觉每年推理成本至少比前年下降 1/4 ~

idblife · 2024-12-21 12:22:37

还没人能用上呢，如何评价？你是骗回复的吧

trungdieu031 · 2024-12-21 12:22:55

@youthfire o1 整体上还是要强于 claude3.5 的。目前 llm 领域的顶级三家 OpenAI , Google, Anthropic 的模型，OpenAI 整体推理能力最强，幻觉最少，Anthropic 的对齐最好，最有人格化特征，在情感哲学方面体验最好，编程方面因为 finetune 过，也是在目前可用的最强梯队，Google 新出的 gemini2.0 版本多模态能力最强，应该对档的 O 和 A 家下一代基础大模型。 o1 代表了 RL + LLM 新范式。在能用基础模型解决的问题上没有显著的优势。只有长链的推理能力才能体验优点 ~

Donaldo · 2024-12-21 13:41:46

@vfx666 #10 步子迈的太快的话，会有很长的阵痛期。。

openmynet · 2024-12-21 14:52:21

o1 到 o3,性能是线性增长，成本却是指数增长。

mumbler · 2024-12-21 14:55:46

如果是真的，贵不是问题，就怕跟 sora 一样根本达不到宣传效果，卖期货，拖一年拿出来发现低于市场上其他产品

浏览过的版块