设为首页
收藏本站
开启辅助访问
全部
问与答
创意
技术
酷工作
生活
交易
节点
飞墙
Follow
明白贴
工算小助手
登录
注册
飞社-令人惊奇的创意工作者社区-
›
首页
›
程序员
›
自己部署 GLM4.7 或者 MiniMax2.1,能接入 Claude code ...
FSHEX=FIND+SHARE+EXPRESS
飞社-令人惊奇的创意工作者社区- 是一个关于发现分享表达的地方
现在登录
没有账号?
立即注册
推荐主题
›
同事刮刮乐中了 100 万
›
请教各位什么是技术管理?忙一年发现没干技
›
2026 年了,为什么我依然认为 Rust 是过度
›
结束北漂后在郑州从事二道贩子的年终总结 -
›
小米要用 Flutter 来重写系统 App 了
今日热议主题
CAE 软件研发 2027 届实习生招聘(C++/QT
大家现在输入提示词,还是“手打”么?
做了个小玩意
antigravity 又挂了吗,还是账号问题
一个月开发并上架: mytess(teslamate 原
Apple Creator Studio 订阅的坑
[分享] 推荐一个整合了 Claude 3.5 和 GPT-
Mac VSCode 的引号输入 bug
GLM-OCR 发布
错过
显示全部
|
最新评论
37 条回复
·
3995 次点击
31#
redbeanzzZ
小成
2026-1-20 19:51:10
github 上 claude code router 试下呢?还有 zcf
32#
Rrrrrr
初学
2026-1-20 20:02:38
2 楼正解
33#
deeplee
初学
2026-1-20 22:33:16
我们公司是内网自己部署的 glm4.7 ,配合 claude code + superpowers ,简单的项目效果还可以
34#
yycyanyicheng
初学
2026-1-20 23:14:30
code plan 9.9 5 小时 40 条 prompt. 手上有 cursor + claude sonnet 4.5 + codex 整体玩下来感觉还可以,就是做一些指令的时候没有那么好,同样的谷歌插件代码,miniax2.1 搞了几次搞不定,其实换了 codex 它也是有错误。 目前还没有强烈感觉到它很差劲的地方。平替是可以的
35#
bwnjnOEI
初学
2026-1-20 23:28:17
好几个开源 llm 网关,统一所有接口而且可以遥测和统计 token ,另外多卡用 vllm 或 sglang 部署都有很好的并发优化。必须先部署上之后效果需要不断优化,就对着这俩文档研究参数和基本原理就行
36#
bwnjnOEI
初学
2026-1-20 23:33:30
@bwnjnOEI 但是我不建议使用 claude code router ,至少公司使用这个不可行,推荐 Bifrost go 写的比 litellm python 的快
37#
bwnjnOEI
初学
2026-1-20 23:56:32
@bwnjnOEI 难点就是瞬时 token 数量会不会爆显存,如果观测一段时间爆了要么加算计要么上手段比如 fp8 (前提调点精度能不能接受
38#
starlion
小成
2026-1-21 00:35:39
可以啊,自己搞个大模型网关,通过这个网关来调用网关后面的大模型能力,就像 nginx 差不多
1
2
3
4
/ 4 页
返回顶部