设为首页
收藏本站
开启辅助访问
全部
问与答
创意
技术
酷工作
生活
交易
资源
节点
飞墙
Follow
明白贴
影视
报酬
登录
注册
飞社-令人惊奇的创意工作者社区-
›
首页
›
问与答
›
LLMs 文本标签(分类)任务怎么做比较好? ...
FSHEX=FIND+SHARE+EXPRESS
飞社-令人惊奇的创意工作者社区- 是一个关于发现分享表达的地方
现在登录
没有账号?
立即注册
推荐主题
›
为国买房者,应该得到感激
›
有人做到一边得到上级认可(努力、上进),
›
女朋友说以后怀孕了 要去 15w 一个月的月子
›
从面别人,到找不到工作,年底了没脸回家了
›
被裁了,但开心不起来
今日热议主题
Python 3.13 部分前端新功能与木兰对照
macOS 大家现在用啥浏览器呢?
请教一个车辆全损赔付问题
[免费无水印] 告别只能使用 ios 制作备忘录
分享一个目前发现低价且支持高并发的 ChatG
IINA 使用问题请教
请教关于一号多拨后的下载/上传速度异常
支持 webdav 的网盘才是好网盘
请问 Github Copilot 的 web search 需要怎
[实习] [Tesla] [上海]信息娱乐系统前端软
LLMs 文本标签(分类)任务怎么做比较好?
CNYoki
·
前天 18:58
· 620 次点击
现在大概有三组共 100 多个标签,用来对多段文本进行分类,是应该设置三个 prompt 分三次进行生成,还是用一个长 prompt ?
另外现在通用型 LLMs 好像对标签工作都不太完美,经常出现标出其他不在字典的标签,或是标签过多之后分类效果不佳。
有没有朋友在做相关工作有经验的,可以分享下方法嘛
举报
·
620 次点击
登录
注册
站外分享
微信扫一扫
QQ分享
微博分享
豆瓣分享
复制链接
显示全部
|
最新评论
5 条回复
沙发
mumbler
小成
前天 19:03
标签分类是大模型的老本行,你只要把标签整理好,让它在标签库里选择,正确率比人高 模型用 gemini-exp-1206 ,目前最强大的模型,200 万 token 上下文,一次完成不会有问题
板凳
june4
小成
前天 19:43
让模型随便自由标,比如标出 1000 个不在字典的标签,然后你把这些多出来的标签设置一个映射到你的 100 个标签,这个映射是一次性的,可以手工完成或 ai 也行。
地板
CNYoki
楼主
小成
前天 20:01
@mumbler #1 我现在用的是 Qwen2.5 110B ,文本太多用商用收费模型成本太高了。现在 Prompt 用列表给出了所有标签,但发现效果不是太好(比如说不在给定字典里的标签)。您说的标签整理好,是有什么格式会好一些?
5#
CNYoki
楼主
小成
前天 20:02
@june4 #2 最开始也是用的这个方法,但是现在数据量太大了(上百万段文本),发现不在标签字典的结果就太多了 https://i.imgur.com/2ZZSapE.png
6#
mumbler
小成
前天 20:42
@CNYoki #3 格式当然 json 最好,模型用 gemini-exp-1206 ,完全免费的,200 万上下文,比 gpt4o 还强,所有数据一次处理,用什么 qwen 啊
返回顶部