以下是最近一则新闻的引用

近期,中国人工智能领域再次迎来新的焦点——DeepSeek ,一家源自杭州幻方量化公司的创业新星。这家公司在资本市场和媒体中迅速崭露头角,引发了广泛关注。 DeepSeek 凭借其最新发布的 DeepSeek-V3 模型,确实在一些关键领域取得了亮眼成绩。据官方数据显示,该模型在数学基准测试 math500 和 aime2024 中,超越了包括 llama3.1-405b 、claude-3.5-sonnet 以及备受瞩目的 gpt-4o 等国外主流大模型。在代码能力的 codeforces 基准测试中,DeepSeek-V3 同样表现不俗,分数高出国外主流模型约 30 分。这些成绩无疑为 DeepSeek 在国内乃至全球人工智能领域树立了新的标杆。

举报· 5623 次点击
登录 注册 站外分享
53 条回复  
duanxianze 小成 昨天 10:19
并没有弯道超车吧?人家只是做了优化,证明了不需要那么多卡一样可以训练 AI
rick13 初学 昨天 10:17
@Livid 这个好像说明不了啥,其他模型也会这样,语料问题
yn1024 初学 昨天 10:15
@fanxasy #16 哈哈哈,也就是在 v 站大家懂技术才能这么客观,要是把这个图发到抖音视频号上,你猜评论区会怎么样 https://i.imgur.com/Iy0taMy.png
RandyLuo 小成 昨天 10:10
@xing7673 是的,开源模型到目前这个能力,很难再苛求什么(即使自己部署不了,也有茫茫多 AI 云厂商可以卷模型推理成本)。
xz410236056 小成 昨天 10:09
用了几天了,感觉效果不错,缺点就是上下文太短,以及长上下文的时候容易弱智和反应慢
xing7673 小成 昨天 10:07
@gpt5 客观看待,claude 自家也用 opus-3.5 蒸馏自家的 sonnet ,我觉得问题不大,怎么省成本怎么来。deepseek 快+api 便宜就足够实用了。
hahajing2019 小成 昨天 10:05
弯道禁止车, 弯道超车容易翻车
shibo501c 初学 昨天 10:03
@Livid deepseek f 是这个答案,v3 好像在切换中,最近应该大部分都切换完了
LevineChen 小成 昨天 10:03
@Livid #3 之前 gemini 还说自己是文心一言
返回顶部