DeepSeek 发布了推理模型 R1-Lite-Preview

zhmouV2 · 2024-11-21 17:08:40 · 725 次点击

看 V2 好像没人提 发一下这个新闻 https://api-docs.deepseek.com/zh-cn/news/news1120

使用: https://chat.deepseek.com/

省流:

  • 类似 o1-mini 的模型,能输出思考过程并反复推理,官方给出的 benchmark 在部分领域打败了 o1-preview
  • 目前每天可用 50 次 据称未来会完整开源基座模型 R1
  • 实际体验目前不支持上传文件解析,感觉下来确实是聪明了一些 不过 token 消耗也很恐怖:比较一下 1.11 和 1.8 数字大小那个思维过程就要写篇小作文。个人认为完整模型如果开源的话,确实会成为 LLM 的搅局者,想起来上半年李彦宏说开源模型会越来越落后有点贻笑大方了。
举报· 725 次点击
登录 注册 站外分享
6 条回复  
cat9life 小成 2024-11-21 17:48:40
看起来很有意思,支持 api 了吗
zhmouV2 楼主 初学 2024-11-21 17:49:46
@cat9life #1 目前还不支持
cookii 小成 2024-11-21 17:50:47
支持 deepseek ,国产里面算好用的
PositionZero 小成 2024-11-21 19:03:50
过度思考太严重了,问了一道数学题思考五分钟,花了 15000 tokens ,同样问题 gpt-4o 不思考也能做对。不过确实很厉害,不知道 kimi 的 k0-math 什么水平
A1st0n 初学 2024-11-22 09:23:55
感觉 deepseek 在代码问答还不是如 ChatGPT 免费版
linglingfa 小成 2024-11-22 12:39:02
国内的诸多模型我也都一直在尝试和测试。 应该来说,Deepseek 算是代码能力相对比较优秀的一款国产 大模型。 不方便注册 openai 或者 claude 的朋友,也可以考虑让 deepseek 来帮你。 当然,缺点也有,就是 deepseek 出代码的速度相对较慢。 有时候写的代码行数(字数) 一多的话,就看着 deepseek 一个字母一个字母的给你输出,那种感觉真酸爽。特别是当你习惯了 ChatGPT 和 claude 的代码输出之后。
返回顶部