15 条回复  ·  1683 次点击
TonyG 小成 4 天前
全自动方案一般效果都不行,vibe coding 16:9 的 html ,引入各种 chart, tailwind css, fontawsome, npm 引入 cheerio ,pptxgenjs ,puppeteer 生成 html 生成截图、生成 ppt 页面的 node 命令,html 用提示词微调不足,图片用各种大模型免费生图形成插入图、背景图,结合 qwen image edit 微调图片内容。然后你就可以得到很漂亮的 ppt 了。
yayoec 初学 4 天前
banana-slides 有导出可编辑的功能,虽然做不到完美,但是确实能用
youyouzi 初学 4 天前
有个技术问题咨询一下各位大佬: gemini 生成的是图片,他如何做到可以把图片转为 ppt 以后,下载以后可以编辑呢?纯图片》可编辑 ;这个过程是提示词让 gemini 做了什么吗?
hackpro 小成 4 天前
蹲一个 NotebookLM 转可编辑 ppt 方案
syferie 初学 3 天前
我前段时间设计了一个方案,先利用 NanoBananaPro 来生成 PPT 图片,效果与 banana-slides 类似。 之后实现可编辑,核心思路是利用了 Gemini 的视觉思维能力去识别图片中的文字位置和内容样式,从而生成遮罩。 然后利用纯色填充+渐变填充来实现移除文字。 移除之后将上面识别到的文字与样式放置到对应位置,组装为一个完整 PPT ,从而达到可编辑文字的 PPT 效果。 https://github.com/MoonWeSif/NextCreator
syferie 初学 3 天前
@youyouzi 可以参考我这里的开源思路,核心利用了 Gemini 的视觉思维能力去识别图片中的文字位置和内容样式,生成遮罩。 然后利用纯色填充+渐变填充来实现移除文字。 移除之后将上面识别到的文字与样式放置到对应位置,组装为一个完整 PPT ,从而达到可编辑文字的 PPT 效果。 核心还是考虑到作为一个桌面端应用,尽量轻量化,原先是 OCR+Inpaint 的思路,但是依赖外部需要部署的服务,过于繁琐了,现在的话下载即用。
12
返回顶部