设为首页
收藏本站
开启辅助访问
全部
问与答
创意
技术
酷工作
生活
交易
资源
节点
飞墙
Follow
明白贴
影视
报酬
登录
注册
飞社-令人惊奇的创意工作者社区-
›
首页
›
问与答
›
如何评价 OpenAI 的 o3?
FSHEX=FIND+SHARE+EXPRESS
飞社-令人惊奇的创意工作者社区- 是一个关于发现分享表达的地方
现在登录
没有账号?
立即注册
推荐主题
›
车子年检制真是折腾人, 10 年车正壮龄,却
›
年底三大件,年会、年货、年终奖,你有几样
›
求蓝牙耳机的正确使用方式
›
上班五年发现自己啥也没学会
›
半边脸宕机之我的面瘫经历
今日热议主题
出 Apple Watch S6 44mm 蓝色铝合金版
有哪位 excel 大神知道,如何在 excel 中对
移动网络 CPE 防火墙问题
GitLab60 天后会将位于中国大陆、香港和澳
ios 提醒事项如何实现每月指定日期提醒?
45 收个网易云年卡,,
遭遇过两次健身房跑路事件想到:大部分健身
windows 下用户权限管理
国产鼠标蜻蜓 R1 SE+到手,分享下
请教智能家居大佬,米家蓝牙网关,什么方案
如何评价 OpenAI 的 o3?
kdbtg91
·
6 小时前
· 2061 次点击
看测评,推理能力有很大进步,自适应思考模式还行,但是推理成本确实有点太高了。如果有申请到安全测试的欢迎说一下使用感受。
举报
·
2061 次点击
登录
注册
站外分享
微信扫一扫
QQ分享
微博分享
豆瓣分享
复制链接
显示全部
|
最早评论
19 条回复
20#
mumbler
小成
2 小时前
如果是真的,贵不是问题,就怕跟 sora 一样根本达不到宣传效果,卖期货,拖一年拿出来发现低于市场上其他产品
19#
openmynet
小成
2 小时前
o1 到 o3,性能是线性增长,成本却是指数增长。
18#
Donaldo
小成
3 小时前
@vfx666 #10 步子迈的太快的话,会有很长的阵痛期。。
17#
trungdieu031
初学
4 小时前
@youthfire o1 整体上还是要强于 claude3.5 的。 目前 llm 领域的顶级三家 OpenAI , Google, Anthropic 的模型,OpenAI 整体推理能力最强,幻觉最少,Anthropic 的对齐最好,最有人格化特征,在情感哲学方面体验最好,编程方面因为 finetune 过,也是在目前可用的最强梯队,Google 新出的 gemini2.0 版本多模态能力最强,应该对档的 O 和 A 家下一代基础大模型。 o1 代表了 RL + LLM 新范式。在能用基础模型解决的问题上没有显著的优势。只有长链的推理能力才能体验优点 ~
16#
idblife
小成
4 小时前
还没人能用上呢,如何评价? 你是骗回复的吧
15#
trungdieu031
初学
4 小时前
@haiku 从报告上看,目前推理成本太高确实是最大的问题。 但我对推理成本的下降持乐观态度。至少在 2030 年之前,gpu 的推理成本是稳步下降的,我直观体验上至少比摩尔定律描述的下降速度要快。 给个不精确数字的话,我感觉每年推理成本至少比前年下降 1/4 ~
14#
Sharuru
小成
4 小时前
每次都是发新模型,然后老模型就变笨。
13#
youthfire
小成
4 小时前
o1 和 claude3.5 sonnet 1022 伯仲间,价格却直接翻了 10 倍,关键还特别慢,这 o3 价格还不上天了。Openai 现在 ppt 能力在不断上升,成品看起来不是那么尽如人意。几家里面,它家是最喜欢动态调整算力的,产品总是比发行时拉垮很多,有机会用上第一批成品的都会有这个感觉。开满算力的 gpt4 并不比现在的 4o 差多少。所以 o3 理论上会很强,实际推出后应用不看好。
12#
haiku
小成
4 小时前
@trungdieu031 看看 Google 和 Claude 会不会跟进,推理成本太高了,英伟达芯片看起来又供不应求了
下一页 »
1
2
/ 2 页
下一页
返回顶部