返回博客

视觉分发Skill | 图文PPT视频复用

人工智能7564
视觉分发Skill | 图文PPT视频复用

title: " 视觉分发Skill | 图文PPT视频复用" category: 人工智能 tags:


这一篇看后半段:视觉和分发。

很多好文章发不出去,不是因为内容差,而是卡在这些地方:

text
没有封面
没有配图
不能转 PPT
不能拆成小红书
不能转播客
不能剪短视频

内容在不同平台的消费方式不同。公众号需要标题和封面,小红书需要竖版卡片,知识分享需要 PPT,视频平台需要切片,课程资料需要播客、思维导图和测验。

这一篇重点拆五个 Skill:

Skill负责环节
guizang-ppt-skill把文章、报告、产品分析转成 HTML 演示稿
guizang-social-card-skill把长文转成小红书图文和公众号封面对
awesome-gpt-image-2提供 GPT-Image2 风格库、提示词模板和案例参考
anything-to-notebooklm把网页、公众号、YouTube、PDF 等资料转成播客、PPT、思维导图、测验
Youtube-clipper-skill把 YouTube 长视频切成语义片段,生成双语字幕和短视频素材

1. guizang-ppt-skill:把文章变成可演示的 HTML Deck

项目地址:op7418/guizang-ppt-skill

截至 2026-06-17,GitHub API 查询约 17.7k star。项目说明是面向 Claude Code、Codex 等 Agent 环境的网页 PPT Skill,用于生成单文件 HTML 横向翻页 PPT、PPT 配图和多平台封面。

它的核心特点:

能力说明
单文件 HTML不需要构建和服务器,浏览器可直接打开
两套视觉系统电子杂志风和瑞士国际主义风格
多种布局Style A 有 10 种布局,Style B 有 22 种锁定版式
可选配图可结合 GPT-Image 2.0 或 GPT-M 2.0 生成照片、信息图、流程图、UI 情景图
低性能静态模式可关闭 WebGL/canvas 动画,方便低性能设备演示
社交封面可生成公众号 21:9 头图、1:1 分享卡、小红书封面、视频缩略图等

1.1 适合什么内容

内容推荐用法
长文章抽 6-10 页核心观点做演讲
产品分析用瑞士风突出结构、数据、对比
技术分享用流程图、系统关系图和关键代码截图
年度复盘用大数字、时间线和对比页
公开课用电子杂志风增强叙事

不太适合:

不适合原因
大量表格培训课件HTML deck 视觉好,但信息密度不一定适合培训
多人协作 PPTX它输出的是静态 HTML,不是传统 PPTX
临时口头汇报制作视觉稿的时间可能超过收益

1.2 实用指令

markdown
帮我基于这篇文章生成一份 8 页左右的瑞士风 HTML PPT。

要求:
1. 第 1 页是问题和结论。
2. 第 2-3 页讲背景和痛点。
3. 第 4-6 页讲方案、流程和对比。
4. 第 7 页讲成本和风险。
5. 第 8 页总结和行动建议。
6. 需要 3 张配图,比例跟模板槽位匹配。
7. 不要把正文整段塞进页面。

这条指令的重点是“先给页面节奏”。如果只说“把文章做成 PPT”,模型容易把长文压缩成密密麻麻的页面。

1.3 结合 4SAPI 的成本策略

PPT 生成通常会用到三类模型:

环节推荐模型策略
提炼文章大纲中等模型
设计页面结构强一些的代码/视觉模型
生图多模态或图片模型
HTML 修改和校验代码模型

可以先不用生图,生成纯 HTML 结构预览;确认节奏后,再用图片模型补关键视觉。这样比一上来生成十几张图便宜很多。

2. guizang-social-card-skill:把长文拆成可发的小红书和封面对

项目地址:op7418/guizang-social-card-skill

截至 2026-06-17,GitHub API 查询约 3.6k star。项目定位是从文章、文案、截图、产品笔记、字幕或照片生成小红书/Rednote 图文组图,以及公众号 21:9 + 1:1 封面对。

它的核心参数很实用:

能力说明
3 个画板尺寸小红书 1080x1440、公众号 2100x900、公众号 1080x1080
28 个版式骨架Editorial 16 个,Swiss 12 个
10 套主题预设Editorial 6 套,Swiss 4 套锚点色
单文件 HTML + Playwrightnode render.mjs 可渲染 PNG
内容适配长文章、产品测评、教程拆页、数据回顾、旅行攻略、截图说明

2.1 一篇文章怎么拆成 5 张图

可以按这个结构:

页码内容
1封面:一句明确结论
2痛点:读者为什么需要看
3方法:3-5 个关键步骤
4对比:错误做法 vs 正确做法
5总结:保存理由和行动建议

示例指令:

markdown
帮我把这篇文章做成一套小红书 3:4 图文,5 张。

要求:
1. 风格用瑞士风,信息清楚,不要花哨。
2. 第 1 张是强结论封面。
3. 第 2 张讲痛点。
4. 第 3-4 张讲方法和对比。
5. 第 5 张给总结和收藏理由。
6. 输出单文件 HTML,并用 Playwright 渲染 PNG。
7. 图片中文字必须适合手机阅读,不能堆长段落。

小红书卡片不是把文章分段复制进去,而是重新排版信息。每页最好只有一个任务。

2.2 公众号封面对怎么做

公众号常见需求是同一篇文章需要两张图:

尺寸用途
21:9公众号头图
1:1分享卡和次级入口

指令可以这样写:

markdown
请基于这篇文章生成公众号封面对:

1. 21:9 头图一张。
2. 1:1 分享卡一张。
3. 两张图使用同一视觉系统。
4. 标题控制在 16 字以内。
5. 不放正文段落,只放关键词和视觉符号。
6. 输出 PNG,同时保留 HTML 源文件。

封面不要试图解释整篇文章。它只负责让读者知道“这篇解决什么问题”。

3. awesome-gpt-image-2:把生图从玄学变成模板

项目地址:freestylefly/awesome-gpt-image-2

截至 2026-06-17,GitHub API 查询约 7.6k star。项目描述是 Prompt as Code,GPT-Image2 工业级提示词引擎与模板库,包含 500 级别案例、20+ 套工业级模板,并提炼出 Agent Skill。

它最值得学的不是“某张图好看”,而是 Prompt-as-Code 的思路。

普通生图提示词常常是这样:

text
帮我生成一张科技感封面,蓝色,高级,有未来感。

这个提示词太虚。稳定的提示词应该拆成结构:

text
目标平台:
画面主体:
构图方式:
镜头语言:
材质和光线:
文字区域:
色彩约束:
禁止元素:
输出比例:

awesome-gpt-image-2 的价值就是把大量案例整理成可复用的结构。

3.1 适合什么图

图类型用法
文章封面根据主题生成主视觉
产品图电商、SaaS、硬件、工具展示
信息图流程、框架、数据关系
UI 场景图展示应用使用场景
海报活动、课程、报告、发布会
摄影风人物、空间、产品氛围

如果你要给博客配图,不要每次重新发明提示词。先从案例库里找接近的视觉方向,再改主体、平台和比例。

3.2 文章配图的实用模板

markdown
请基于以下文章主题生成配图提示词。

文章主题:
AI 内容创作 Skill 工作流,从调研到图文分发。

平台:
公众号头图,21:9。

画面目标:
表现“内容产线”而不是单个聊天机器人。

构图:
横向流程图视觉,左侧是资料、笔记、视频,中央是模型和 Skill,右侧是文章、PPT、小红书卡片、短视频。

风格:
清晰、现代、轻技术感,适合中文技术博客。

文字区域:
上方留出标题空间,不生成具体中文标题。

禁止:
不要出现真实品牌 logo,不要出现乱码文字,不要使用过暗背景。

这样生成出来的图更容易放进公众号或 PPT。

3.3 生图成本怎么控

生图最容易浪费钱。建议三步走:

text
先用文本模型确定构图
  -> 生成 2-3 个低成本方向
  -> 选定方向后再出高质量终稿

不要一上来让模型“随便出 10 张高级感封面”。你会得到一堆看起来都能用、但都不准确的图。

4. anything-to-notebooklm:一份资料拆成多种内容形态

项目地址:joeseesun/qiaomu-anything-to-notebooklm

截至 2026-06-17,GitHub API 查询约 5.2k star。项目定位是多源内容处理器,支持微信公众号、网页、YouTube、PDF、Markdown、搜索查询等输入,上传到 NotebookLM 后生成播客、PPT、思维导图、Quiz 等。

它解决的是内容复用问题。

一篇深度文章写完以后,其实还能拆成:

输出用途
播客通勤收听、私域分发
PPT团队分享、直播课
思维导图社群资料、课程附件
Quiz学习测验、训练营作业
摘要朋友圈、知识星球、邮件

4.1 适合处理哪些输入

README 里列出的输入源很多,包括公众号文章、公开网页、YouTube 视频、播客、PDF、Office 文档、音频、Markdown、压缩包、纯文本和搜索关键词。

在实际内容团队里,最常见的是:

输入输出
公众号文章播客、PPT、思维导图
YouTube 视频摘要、播客、课程笔记
PDF 报告PPT、测验、研究摘要
Markdown 长文多平台分发素材
访谈录音文章大纲、金句、短视频脚本

4.2 合规边界

这个项目的 README 提到多源抓取和一些网页处理能力。写入团队规范时,建议明确边界:

markdown
只处理以下内容:
- 自己创作的文章、音频和视频。
- 已获得授权的资料。
- 公开且允许合理引用的网页。
- 团队内部文档。

不处理:
- 未授权付费内容。
- 绕过访问限制获得的资料。
- 受版权保护且不允许二次分发的视频、音频和文档。
- 含个人隐私的数据。

内容复用不等于内容搬运。尤其是播客、课程和付费资料,版权边界要提前说清楚。

4.3 和 4SAPI 的关系

anything-to-notebooklm 更像内容中转和形态转换工具。4SAPI 可以承担其中的模型调用入口:

任务模型策略
长文摘要低成本模型分段
课程大纲中等模型
PPT 结构强模型
Quiz 生成低成本模型加人工抽查
事实复核强模型加来源

最稳的做法是先把原始资料转成 Markdown,再生成不同形态。Markdown 是内容复用的中间层。

5. Youtube-clipper-skill:长视频变短视频素材

项目地址:op7418/Youtube-clipper-skill

截至 2026-06-17,GitHub API 查询约 2.0k star。项目说明是 Claude Code 的 AI 智能视频剪辑工具,可以下载视频、生成语义章节、剪辑片段、翻译双语字幕并烧录字幕到视频。

它的流程:

text
环境检测
  -> 下载视频和字幕
  -> AI 分析字幕生成语义章节
  -> 用户选择要剪辑的章节
  -> FFmpeg 剪辑视频
  -> 翻译字幕
  -> 烧录字幕
  -> 输出短视频文件

依赖包括 yt-dlp、FFmpeg 和 Python 包。字幕烧录需要 FFmpeg 支持 libass。

5.1 适合哪些视频

视频类型用法
技术访谈切出观点片段
长课程按知识点切章节
产品发布会切功能亮点
播客视频切金句和争议点
讲座切概念解释和案例

不适合:

不适合原因
未授权影视内容版权风险高
强娱乐剪辑语义分章不一定等于爆点节奏
无字幕且音质差转写质量会影响后续剪辑
需要复杂后期包装它偏自动切片,不是完整剪辑软件

5.2 实用指令

markdown
请剪辑这个 YouTube 视频:
https://youtube.com/watch?v=VIDEO_ID

要求:
1. 先生成 2-5 分钟的语义章节。
2. 标出每个章节的核心观点和适合发布的平台。
3. 让我选择要剪的章节。
4. 生成中英双语字幕。
5. 输出原始片段、字幕文件和烧录字幕版本。
6. 不要处理未授权的素材。

这里同样要让人参与选择。AI 能帮你找章节,但“哪个片段适合发”需要结合账号定位和版权边界。

6. 一篇文章如何变成 5 种内容

假设你已经写完一篇 6000 字文章:《中文内容创作 10 个 Skill 选型指南》。

可以这样分发:

text
原文 Markdown
  -> guizang-social-card-skill:小红书 5 张图文
  -> guizang-social-card-skill:公众号封面对
  -> guizang-ppt-skill:8 页分享 PPT
  -> anything-to-notebooklm:播客、思维导图、Quiz
  -> awesome-gpt-image-2:统一视觉风格和配图提示词

如果还有视频直播或分享录屏:

text
直播录屏 / YouTube 链接
  -> Youtube-clipper-skill:语义章节
  -> 人工选择 3 段高光
  -> 生成双语字幕短视频
  -> 配合小红书卡片和公众号原文引流

内容复用的关键不是“发得越多越好”,而是每个平台都要重新适配阅读方式。

平台内容形态注意点
公众号长文 + 封面逻辑完整,标题克制
小红书3:4 图文每页一个信息点,少文字
PPT6-10 页演示讲述节奏,别堆正文
视频号/短视频30 秒到 3 分钟片段开头 3 秒讲清价值
社群摘要 + 思维导图方便保存和讨论
课程PPT + Quiz方便学习和复习

7. 建议的素材目录

如果你要长期做内容复用,建议每篇文章建一个目录:

text
content-assets/
  2026-06-17-skill-workflow/
    source.md
    sources.md
    images/
      prompts.md
      raw/
      final/
    social-card/
      index.html
      output/
    deck/
      index.html
      assets/
    notebooklm/
      mindmap.md
      quiz.md
      podcast-outline.md
    video/
      chapters.md
      clips/
    publish/
      wechat.md
      xiaohongshu.md
      newsletter.md

这样做的好处:

  1. 每个平台的素材不会混在一起。
  2. 可以保留提示词和源文件,方便下次改。
  3. 出现版权或事实争议时,能追溯素材来源。

8. 自动化边界

视觉和分发环节最容易让人误以为“可以全自动发全平台”。不建议这么做。

建议写清楚四个边界:

边界说明
人工审图生图可能出现文字错误、错手、错 logo、风格不一致
人工审字幕自动字幕会误识别专有名词和数字
人工审版权视频、图片、文章都要确认授权
人工审平台不同平台对标题、封面、导流和敏感词要求不同

4SAPI 可以统一模型调用和日志,帮你控制成本和追踪输出,但不能替你判断某张图、某段视频、某个标题是否适合发布。

9. 最小可落地流程

如果你今天就想用起来,可以先做这个版本:

text
第 1 步:写一篇 Markdown 原文
第 2 步:用 awesome-gpt-image-2 找视觉方向
第 3 步:用 guizang-social-card-skill 做公众号封面对和小红书 5 图
第 4 步:用 guizang-ppt-skill 做 8 页分享 deck
第 5 步:用 anything-to-notebooklm 生成思维导图和 Quiz
第 6 步:如果有视频,再用 Youtube-clipper-skill 切 2-3 段
第 7 步:人工复核后发布

模型路由可以这样设置:

步骤模型
提炼长文核心观点中等文本模型
设计卡片文案中文写作模型
生成 HTML/CSS代码模型
生图图片模型
校验和修改代码模型 + 人工视觉检查
字幕翻译低成本或中等模型

这样一条流程跑下来,成本可控,产物也比较完整。

10. 总结

这五个视觉分发 Skill 的分工很清楚:

text
awesome-gpt-image-2 负责视觉方向和提示词结构
guizang-social-card-skill 负责小红书图文和公众号封面对
guizang-ppt-skill 负责 HTML 演示稿
anything-to-notebooklm 负责资料复用和学习形态
Youtube-clipper-skill 负责长视频切片和字幕

如果前一篇解决的是“写得出来”,这一篇解决的是“发得出去”。

对独立创作者和小团队来说,最重要的不是一次性装满工具箱,而是先跑通一条稳定链路:一篇高质量原文,拆成 2-3 个平台真正需要的形态,再用数据复盘下一篇怎么改。

4SAPI 这类大模型API中转站可以放在这条链路中间,统一模型、额度和日志。工具越多,越需要一个统一入口;产物越多,越需要清楚的人工复核边界。

标签:大模型API中转站GPT-Image小红书视频剪辑NotebookLM

推荐阅读

探索更多前沿洞察与行业干货。