设为首页
收藏本站
开启辅助访问
全部
问与答
创意
技术
酷工作
生活
交易
节点
飞墙
Follow
明白贴
工算小助手
登录
注册
飞社-令人惊奇的创意工作者社区-
›
首页
›
程序员
›
自己部署 GLM4.7 或者 MiniMax2.1,能接入 Claude code ...
FSHEX=FIND+SHARE+EXPRESS
飞社-令人惊奇的创意工作者社区- 是一个关于发现分享表达的地方
现在登录
没有账号?
立即注册
推荐主题
›
AI 都那么强了,传统的学校教育价值是不是
›
同事刮刮乐中了 100 万
›
同事用了 cc 直接一把梭,现在让我改 bug,
›
分享一下我的飞牛 NAS 网络方案,我认为比
›
小米要用 Flutter 来重写系统 App 了
今日热议主题
Github Copilot Pro 订阅是不是高级请求额
飞行模式下无法开启手机热点?
同事刮刮乐中了 100 万
有没有做过创作相关的大佬,分享下经验?
火绒可以通过 NAS 的 SMB 共享 扫描飞牛 NA
aeroshell_audio 一个 STT 音频网关:弱网
i18n 如何处理最快速, 最更新, 以及最自动?
大厂云服务器折扣,欢迎f友询价:阿里腾讯
近期换安卓直板手机有什么推荐的型号么?
AI 未来会不会颠覆校外培训,尤其是小初高
显示全部
|
最新评论
37 条回复
·
3984 次点击
31#
redbeanzzZ
小成
2026-1-20 19:51:10
github 上 claude code router 试下呢?还有 zcf
32#
Rrrrrr
初学
2026-1-20 20:02:38
2 楼正解
33#
deeplee
初学
2026-1-20 22:33:16
我们公司是内网自己部署的 glm4.7 ,配合 claude code + superpowers ,简单的项目效果还可以
34#
yycyanyicheng
初学
2026-1-20 23:14:30
code plan 9.9 5 小时 40 条 prompt. 手上有 cursor + claude sonnet 4.5 + codex 整体玩下来感觉还可以,就是做一些指令的时候没有那么好,同样的谷歌插件代码,miniax2.1 搞了几次搞不定,其实换了 codex 它也是有错误。 目前还没有强烈感觉到它很差劲的地方。平替是可以的
35#
bwnjnOEI
初学
2026-1-20 23:28:17
好几个开源 llm 网关,统一所有接口而且可以遥测和统计 token ,另外多卡用 vllm 或 sglang 部署都有很好的并发优化。必须先部署上之后效果需要不断优化,就对着这俩文档研究参数和基本原理就行
36#
bwnjnOEI
初学
2026-1-20 23:33:30
@bwnjnOEI 但是我不建议使用 claude code router ,至少公司使用这个不可行,推荐 Bifrost go 写的比 litellm python 的快
37#
bwnjnOEI
初学
2026-1-20 23:56:32
@bwnjnOEI 难点就是瞬时 token 数量会不会爆显存,如果观测一段时间爆了要么加算计要么上手段比如 fp8 (前提调点精度能不能接受
38#
starlion
小成
2026-1-21 00:35:39
可以啊,自己搞个大模型网关,通过这个网关来调用网关后面的大模型能力,就像 nginx 差不多
1
2
3
4
/ 4 页
返回顶部