视觉分发Skill | 图文PPT视频复用

title: " 视觉分发Skill | 图文PPT视频复用" category: 人工智能 tags:

大模型API中转站
GPT-Image
PPT
小红书
NotebookLM
视频剪辑
4SAPI description: "拆解 guizang-ppt-skill、guizang-social-card-skill、awesome-gpt-image-2、anything-to-notebooklm 和 Youtube-clipper-skill，搭一条从文章到配图、PPT、图文卡片、播客和短视频的内容复用流程。"

这一篇看后半段：视觉和分发。

很多好文章发不出去，不是因为内容差，而是卡在这些地方：

text

没有封面
没有配图
不能转 PPT
不能拆成小红书
不能转播客
不能剪短视频

内容在不同平台的消费方式不同。公众号需要标题和封面，小红书需要竖版卡片，知识分享需要 PPT，视频平台需要切片，课程资料需要播客、思维导图和测验。

这一篇重点拆五个 Skill：

Skill	负责环节
guizang-ppt-skill	把文章、报告、产品分析转成 HTML 演示稿
guizang-social-card-skill	把长文转成小红书图文和公众号封面对
awesome-gpt-image-2	提供 GPT-Image2 风格库、提示词模板和案例参考
anything-to-notebooklm	把网页、公众号、YouTube、PDF 等资料转成播客、PPT、思维导图、测验
Youtube-clipper-skill	把 YouTube 长视频切成语义片段，生成双语字幕和短视频素材

1. guizang-ppt-skill：把文章变成可演示的 HTML Deck

项目地址：op7418/guizang-ppt-skill

截至 2026-06-17，GitHub API 查询约 17.7k star。项目说明是面向 Claude Code、Codex 等 Agent 环境的网页 PPT Skill，用于生成单文件 HTML 横向翻页 PPT、PPT 配图和多平台封面。

它的核心特点：

能力	说明
单文件 HTML	不需要构建和服务器，浏览器可直接打开
两套视觉系统	电子杂志风和瑞士国际主义风格
多种布局	Style A 有 10 种布局，Style B 有 22 种锁定版式
可选配图	可结合 GPT-Image 2.0 或 GPT-M 2.0 生成照片、信息图、流程图、UI 情景图
低性能静态模式	可关闭 WebGL/canvas 动画，方便低性能设备演示
社交封面	可生成公众号 21:9 头图、1:1 分享卡、小红书封面、视频缩略图等

1.1 适合什么内容

内容	推荐用法
长文章	抽 6-10 页核心观点做演讲
产品分析	用瑞士风突出结构、数据、对比
技术分享	用流程图、系统关系图和关键代码截图
年度复盘	用大数字、时间线和对比页
公开课	用电子杂志风增强叙事

不太适合：

不适合	原因
大量表格培训课件	HTML deck 视觉好，但信息密度不一定适合培训
多人协作 PPTX	它输出的是静态 HTML，不是传统 PPTX
临时口头汇报	制作视觉稿的时间可能超过收益

1.2 实用指令

markdown

帮我基于这篇文章生成一份 8 页左右的瑞士风 HTML PPT。

要求：
1. 第 1 页是问题和结论。
2. 第 2-3 页讲背景和痛点。
3. 第 4-6 页讲方案、流程和对比。
4. 第 7 页讲成本和风险。
5. 第 8 页总结和行动建议。
6. 需要 3 张配图，比例跟模板槽位匹配。
7. 不要把正文整段塞进页面。

这条指令的重点是“先给页面节奏”。如果只说“把文章做成 PPT”，模型容易把长文压缩成密密麻麻的页面。

1.3 结合 4SAPI 的成本策略

PPT 生成通常会用到三类模型：

环节	推荐模型策略
提炼文章大纲	中等模型
设计页面结构	强一些的代码/视觉模型
生图	多模态或图片模型
HTML 修改和校验	代码模型

可以先不用生图，生成纯 HTML 结构预览；确认节奏后，再用图片模型补关键视觉。这样比一上来生成十几张图便宜很多。

2. guizang-social-card-skill：把长文拆成可发的小红书和封面对

项目地址：op7418/guizang-social-card-skill

截至 2026-06-17，GitHub API 查询约 3.6k star。项目定位是从文章、文案、截图、产品笔记、字幕或照片生成小红书/Rednote 图文组图，以及公众号 21:9 + 1:1 封面对。

它的核心参数很实用：

能力	说明
3 个画板尺寸	小红书 1080x1440、公众号 2100x900、公众号 1080x1080
28 个版式骨架	Editorial 16 个，Swiss 12 个
10 套主题预设	Editorial 6 套，Swiss 4 套锚点色
单文件 HTML + Playwright	`node render.mjs` 可渲染 PNG
内容适配	长文章、产品测评、教程拆页、数据回顾、旅行攻略、截图说明

2.1 一篇文章怎么拆成 5 张图

可以按这个结构：

页码	内容
1	封面：一句明确结论
2	痛点：读者为什么需要看
3	方法：3-5 个关键步骤
4	对比：错误做法 vs 正确做法
5	总结：保存理由和行动建议

示例指令：

markdown

帮我把这篇文章做成一套小红书 3:4 图文，5 张。

要求：
1. 风格用瑞士风，信息清楚，不要花哨。
2. 第 1 张是强结论封面。
3. 第 2 张讲痛点。
4. 第 3-4 张讲方法和对比。
5. 第 5 张给总结和收藏理由。
6. 输出单文件 HTML，并用 Playwright 渲染 PNG。
7. 图片中文字必须适合手机阅读，不能堆长段落。

小红书卡片不是把文章分段复制进去，而是重新排版信息。每页最好只有一个任务。

2.2 公众号封面对怎么做

公众号常见需求是同一篇文章需要两张图：

尺寸	用途
21:9	公众号头图
1:1	分享卡和次级入口

指令可以这样写：

markdown

请基于这篇文章生成公众号封面对：

1. 21:9 头图一张。
2. 1:1 分享卡一张。
3. 两张图使用同一视觉系统。
4. 标题控制在 16 字以内。
5. 不放正文段落，只放关键词和视觉符号。
6. 输出 PNG，同时保留 HTML 源文件。

封面不要试图解释整篇文章。它只负责让读者知道“这篇解决什么问题”。

3. awesome-gpt-image-2：把生图从玄学变成模板

项目地址：freestylefly/awesome-gpt-image-2

截至 2026-06-17，GitHub API 查询约 7.6k star。项目描述是 Prompt as Code，GPT-Image2 工业级提示词引擎与模板库，包含 500 级别案例、20+ 套工业级模板，并提炼出 Agent Skill。

它最值得学的不是“某张图好看”，而是 Prompt-as-Code 的思路。

普通生图提示词常常是这样：

text

帮我生成一张科技感封面，蓝色，高级，有未来感。

这个提示词太虚。稳定的提示词应该拆成结构：

text

目标平台：
画面主体：
构图方式：
镜头语言：
材质和光线：
文字区域：
色彩约束：
禁止元素：
输出比例：

awesome-gpt-image-2 的价值就是把大量案例整理成可复用的结构。

3.1 适合什么图

图类型	用法
文章封面	根据主题生成主视觉
产品图	电商、SaaS、硬件、工具展示
信息图	流程、框架、数据关系
UI 场景图	展示应用使用场景
海报	活动、课程、报告、发布会
摄影风	人物、空间、产品氛围

如果你要给博客配图，不要每次重新发明提示词。先从案例库里找接近的视觉方向，再改主体、平台和比例。

3.2 文章配图的实用模板

markdown

请基于以下文章主题生成配图提示词。

文章主题：
AI 内容创作 Skill 工作流，从调研到图文分发。

平台：
公众号头图，21:9。

画面目标：
表现“内容产线”而不是单个聊天机器人。

构图：
横向流程图视觉，左侧是资料、笔记、视频，中央是模型和 Skill，右侧是文章、PPT、小红书卡片、短视频。

风格：
清晰、现代、轻技术感，适合中文技术博客。

文字区域：
上方留出标题空间，不生成具体中文标题。

禁止：
不要出现真实品牌 logo，不要出现乱码文字，不要使用过暗背景。

这样生成出来的图更容易放进公众号或 PPT。

3.3 生图成本怎么控

生图最容易浪费钱。建议三步走：

text

先用文本模型确定构图
  -> 生成 2-3 个低成本方向
  -> 选定方向后再出高质量终稿

不要一上来让模型“随便出 10 张高级感封面”。你会得到一堆看起来都能用、但都不准确的图。

4. anything-to-notebooklm：一份资料拆成多种内容形态

项目地址：joeseesun/qiaomu-anything-to-notebooklm

截至 2026-06-17，GitHub API 查询约 5.2k star。项目定位是多源内容处理器，支持微信公众号、网页、YouTube、PDF、Markdown、搜索查询等输入，上传到 NotebookLM 后生成播客、PPT、思维导图、Quiz 等。

它解决的是内容复用问题。

一篇深度文章写完以后，其实还能拆成：

输出	用途
播客	通勤收听、私域分发
PPT	团队分享、直播课
思维导图	社群资料、课程附件
Quiz	学习测验、训练营作业
摘要	朋友圈、知识星球、邮件

4.1 适合处理哪些输入

README 里列出的输入源很多，包括公众号文章、公开网页、YouTube 视频、播客、PDF、Office 文档、音频、Markdown、压缩包、纯文本和搜索关键词。

在实际内容团队里，最常见的是：

输入	输出
公众号文章	播客、PPT、思维导图
YouTube 视频	摘要、播客、课程笔记
PDF 报告	PPT、测验、研究摘要
Markdown 长文	多平台分发素材
访谈录音	文章大纲、金句、短视频脚本

4.2 合规边界

这个项目的 README 提到多源抓取和一些网页处理能力。写入团队规范时，建议明确边界：

markdown

只处理以下内容：
- 自己创作的文章、音频和视频。
- 已获得授权的资料。
- 公开且允许合理引用的网页。
- 团队内部文档。

不处理：
- 未授权付费内容。
- 绕过访问限制获得的资料。
- 受版权保护且不允许二次分发的视频、音频和文档。
- 含个人隐私的数据。

内容复用不等于内容搬运。尤其是播客、课程和付费资料，版权边界要提前说清楚。

4.3 和 4SAPI 的关系

anything-to-notebooklm 更像内容中转和形态转换工具。4SAPI 可以承担其中的模型调用入口：

任务	模型策略
长文摘要	低成本模型分段
课程大纲	中等模型
PPT 结构	强模型
Quiz 生成	低成本模型加人工抽查
事实复核	强模型加来源

最稳的做法是先把原始资料转成 Markdown，再生成不同形态。Markdown 是内容复用的中间层。

5. Youtube-clipper-skill：长视频变短视频素材

项目地址：op7418/Youtube-clipper-skill

截至 2026-06-17，GitHub API 查询约 2.0k star。项目说明是 Claude Code 的 AI 智能视频剪辑工具，可以下载视频、生成语义章节、剪辑片段、翻译双语字幕并烧录字幕到视频。

它的流程：

text

环境检测
  -> 下载视频和字幕
  -> AI 分析字幕生成语义章节
  -> 用户选择要剪辑的章节
  -> FFmpeg 剪辑视频
  -> 翻译字幕
  -> 烧录字幕
  -> 输出短视频文件

依赖包括 yt-dlp、FFmpeg 和 Python 包。字幕烧录需要 FFmpeg 支持 libass。

5.1 适合哪些视频

视频类型	用法
技术访谈	切出观点片段
长课程	按知识点切章节
产品发布会	切功能亮点
播客视频	切金句和争议点
讲座	切概念解释和案例

不适合：

不适合	原因
未授权影视内容	版权风险高
强娱乐剪辑	语义分章不一定等于爆点节奏
无字幕且音质差	转写质量会影响后续剪辑
需要复杂后期包装	它偏自动切片，不是完整剪辑软件

5.2 实用指令

markdown

请剪辑这个 YouTube 视频：
https://youtube.com/watch?v=VIDEO_ID

要求：
1. 先生成 2-5 分钟的语义章节。
2. 标出每个章节的核心观点和适合发布的平台。
3. 让我选择要剪的章节。
4. 生成中英双语字幕。
5. 输出原始片段、字幕文件和烧录字幕版本。
6. 不要处理未授权的素材。

这里同样要让人参与选择。AI 能帮你找章节，但“哪个片段适合发”需要结合账号定位和版权边界。

6. 一篇文章如何变成 5 种内容

假设你已经写完一篇 6000 字文章：《中文内容创作 10 个 Skill 选型指南》。

可以这样分发：

text

原文 Markdown
  -> guizang-social-card-skill：小红书 5 张图文
  -> guizang-social-card-skill：公众号封面对
  -> guizang-ppt-skill：8 页分享 PPT
  -> anything-to-notebooklm：播客、思维导图、Quiz
  -> awesome-gpt-image-2：统一视觉风格和配图提示词

如果还有视频直播或分享录屏：

text

直播录屏 / YouTube 链接
  -> Youtube-clipper-skill：语义章节
  -> 人工选择 3 段高光
  -> 生成双语字幕短视频
  -> 配合小红书卡片和公众号原文引流

内容复用的关键不是“发得越多越好”，而是每个平台都要重新适配阅读方式。

平台	内容形态	注意点
公众号	长文 + 封面	逻辑完整，标题克制
小红书	3:4 图文	每页一个信息点，少文字
PPT	6-10 页演示	讲述节奏，别堆正文
视频号/短视频	30 秒到 3 分钟片段	开头 3 秒讲清价值
社群	摘要 + 思维导图	方便保存和讨论
课程	PPT + Quiz	方便学习和复习

7. 建议的素材目录

如果你要长期做内容复用，建议每篇文章建一个目录：

text

content-assets/
  2026-06-17-skill-workflow/
    source.md
    sources.md
    images/
      prompts.md
      raw/
      final/
    social-card/
      index.html
      output/
    deck/
      index.html
      assets/
    notebooklm/
      mindmap.md
      quiz.md
      podcast-outline.md
    video/
      chapters.md
      clips/
    publish/
      wechat.md
      xiaohongshu.md
      newsletter.md

这样做的好处：

每个平台的素材不会混在一起。
可以保留提示词和源文件，方便下次改。
出现版权或事实争议时，能追溯素材来源。

8. 自动化边界

视觉和分发环节最容易让人误以为“可以全自动发全平台”。不建议这么做。

建议写清楚四个边界：

边界	说明
人工审图	生图可能出现文字错误、错手、错 logo、风格不一致
人工审字幕	自动字幕会误识别专有名词和数字
人工审版权	视频、图片、文章都要确认授权
人工审平台	不同平台对标题、封面、导流和敏感词要求不同

4SAPI 可以统一模型调用和日志，帮你控制成本和追踪输出，但不能替你判断某张图、某段视频、某个标题是否适合发布。

9. 最小可落地流程

如果你今天就想用起来，可以先做这个版本：

text

第 1 步：写一篇 Markdown 原文
第 2 步：用 awesome-gpt-image-2 找视觉方向
第 3 步：用 guizang-social-card-skill 做公众号封面对和小红书 5 图
第 4 步：用 guizang-ppt-skill 做 8 页分享 deck
第 5 步：用 anything-to-notebooklm 生成思维导图和 Quiz
第 6 步：如果有视频，再用 Youtube-clipper-skill 切 2-3 段
第 7 步：人工复核后发布

模型路由可以这样设置：

步骤	模型
提炼长文核心观点	中等文本模型
设计卡片文案	中文写作模型
生成 HTML/CSS	代码模型
生图	图片模型
校验和修改	代码模型 + 人工视觉检查
字幕翻译	低成本或中等模型

这样一条流程跑下来，成本可控，产物也比较完整。

10. 总结

这五个视觉分发 Skill 的分工很清楚：

text

awesome-gpt-image-2 负责视觉方向和提示词结构
guizang-social-card-skill 负责小红书图文和公众号封面对
guizang-ppt-skill 负责 HTML 演示稿
anything-to-notebooklm 负责资料复用和学习形态
Youtube-clipper-skill 负责长视频切片和字幕

如果前一篇解决的是“写得出来”，这一篇解决的是“发得出去”。

对独立创作者和小团队来说，最重要的不是一次性装满工具箱，而是先跑通一条稳定链路：一篇高质量原文，拆成 2-3 个平台真正需要的形态，再用数据复盘下一篇怎么改。

4SAPI 这类大模型API中转站可以放在这条链路中间，统一模型、额度和日志。工具越多，越需要一个统一入口；产物越多，越需要清楚的人工复核边界。

视觉分发Skill | 图文PPT视频复用

1. guizang-ppt-skill：把文章变成可演示的 HTML Deck

1.1 适合什么内容

1.2 实用指令

1.3 结合 4SAPI 的成本策略

2. guizang-social-card-skill：把长文拆成可发的小红书和封面对

2.1 一篇文章怎么拆成 5 张图

2.2 公众号封面对怎么做

3. awesome-gpt-image-2：把生图从玄学变成模板

3.1 适合什么图

3.2 文章配图的实用模板

3.3 生图成本怎么控

4. anything-to-notebooklm：一份资料拆成多种内容形态

4.1 适合处理哪些输入

4.2 合规边界

4.3 和 4SAPI 的关系

5. Youtube-clipper-skill：长视频变短视频素材

5.1 适合哪些视频

5.2 实用指令

6. 一篇文章如何变成 5 种内容

7. 建议的素材目录

8. 自动化边界

9. 最小可落地流程

10. 总结

推荐阅读

响应缓存、Prompt Cache 与 KV Cache 有什么区别

提示词迁移时如何建立基线并逐项删减

Codex Review Gate 的启用、关闭与循环边界

生图提示词约束冲突的 A/B 验证方法