最近在论坛里看到有人提到硅基流动 (SiliconFlow) 这个平台,说是现在支持 DeepSeek 的 V3 和 R1 模型了。

出于好奇,我也去简单看了看。

初步印象:速度还可以,模型更新挺快,但平台本身有待进一步了解

模型更新速度: DeepSeek V3 和 R1 出来也有一两周了,硅基流动就跟上了,这点反应速度确实挺快的。

速度表现: 有人测速 V3 模型能跑到 10-15 token/s ,这个速度看起来还不错。我自己也简单试了下,速度确实还可以。 但实际体验是否稳定,尤其是在高峰期怎么样,还需要进一步观察,毕竟刚上线第一天。

注册方面: 注册倒是挺方便,手机号就行,国内外号码都支持。不用实名这点,对于只想体验国内模型的用户来说,算是个优点。

有兴趣的朋友,可以去他们平台看看: https://cloud.siliconflow.cn/i/ND6afVZP


有新闻说 2 月份硅基流动和华为云搞了个合作,说是基于华为云昇腾云服务搞 DeepSeek 推理。

新闻写得是“昇腾云服务”,不知道是不是用的昇腾芯片?还是说用的是别家的芯片提供的服务?感觉现在很多家都喜欢提昇腾,实际效果嘛... 有了解的可以说说。


关于实名和手机号:注意个人信息

国内模型不用实名,这个是优点。

但如果要用国外模型像 LLaMA ,还是要实名。

但是实名只提供给中国大陆用户,基本上外籍与港澳台人士就无缘了。


定价,这里我手动对比一下 Openrouter 上面的价格:

结论:硅基流动接近 Deepseek 官方定价和 DeepInfra 平台的定价,可以说是第一梯队。

硅基流动平台上 DeepSeek 模型的定价

DeepSeek V3: ¥2 / 百万 Tokens

DeepSeek R1: ¥16 / 百万 Tokens

OpenRouter 上的 DeepSeek V3

DeepInfra: Input $0.49 + Output $0.89

Nebius: Input $0.5 + Output $1.5

NovitaAI: Input $0.89 + Output $0.89

Fireworks: Input $0.9 + Output $0.9

Together: Input $1.25 + Output $1.25

DeepSeek (fp8): Input $0.14 + Output $0.28

OpenRouter 上的 DeepSeek R1

Nebius: Input $0.8 + Output $2.4

NovitaAI: Input $4 + Output $4

Featherless: Input $6.5 + Output $8

Avian.io: Input $6.9 + Output $7

Together: Input $7 + Output $7

Fireworks: Input $8 + Output $8

DeepInfra: Input $0.75 + Output $2.4

DeepSeek (fp8): Input $0.55 + Output $2.19

Kluster: Input $2 + Output $2

举报· 528 次点击
登录 注册 站外分享
4 条回复  
auniel 楼主 初学 2025-2-2 01:26:58
DeepSeek R1 API 获取和使用指南 https://mp.weixin.qq.com/s/u_ODtvzhvIKPz2kKUSeLTg
auniel 楼主 初学 2025-2-2 01:49:29
R1 多轮对话似乎反应极其慢。 yan5xu on X: "用硅基流动 DeepSeek-R1 的朋友注意啦!多轮对话时记得把 <think> 标签里的思维链去掉,不然会污染上下文。deepseek 官方 API 是把思维链放在 reasoning_content 字段的,但硅基流动是用 <think> 标签包起来直接返回,所以要手动处理下。 https://x.com/yan5xu/status/1885626451124424886
cbingb666 初学 2025-2-2 11:00:17
@auniel 难怪我觉得问着问着开始人格分裂
auniel 楼主 初学 2025-2-2 13:27:24
是啊,也就是说,在多轮对话的时候,把思维链的那种也当作背景信息/聊天记录了。 期待它们能够早点修复这个 bug 。 也有可能是他们之前没有大规模部署过这种显性的推理型模型,其他的推理模型可能会把思维链隐藏起来,或者说有更加明显的格式标记。。
返回顶部