如何避免露出 prompt 给用户

ohazyi · 2025-3-4 20:12:52 · 530 次点击

尤其是用 deepseek 的思考过程的时候。由于可能在输入中注入了一些用户画像/行为的数据,但又不想让用户看到思考过程中的 prompt (比如行为习惯/抓到的私密信息等),怎样才能利用这些信息的同时不展示给用户呢?

举报· 530 次点击
登录 注册 站外分享
4 条回复  
foolishcrab 小成 2025-3-4 20:17:57
system 里定义好允许回答的问题, 关键词过滤一下用户输入, 用次一级 turbo flash 模型判断一下用户输入是否有恶意
so1n 小成 2025-3-4 20:18:42
做输出检查,或者做多 agent ,核心的 agent 后置,就看不到 prompt 了
ohazyi 楼主 小成 2025-3-4 20:25:09
@foolishcrab 不懂就问,一级 turbo flash 模型是什么?
foolishcrab 小成 2025-3-4 20:46:55
@ohazyi 次一级啊,就又便宜又快的模型
返回顶部