|
|
|
你这个量(约每天一篇)根本就不是爬虫
说到底这个每天一篇是筛选后的结果?如果目标很明确不需要人工筛选,那写个小脚本自动访问就可以了,类似自动签到的脚本;但如果目标不明确,要在一堆海量文章选 30 篇,这个才需要爬虫,但这个筛选过程就异常的难了,自动化的话需要可能上百个条件做判断,还是说筛选过程就交给 AI ?人工筛选?
第二步将 30 篇归纳概括为最终一篇文章,这个用 api 倒不是难事,如果想本地实现,那花费就不是“小白”承担得起的
个人建议先确定这 30 篇怎么来,容易获取可以 gpt 帮忙写个小脚本,需要海量后筛的就付费请人吧 |
|