title: " 视觉分发Skill | 图文PPT视频复用" category: 人工智能 tags:
- 大模型API中转站
- GPT-Image
- PPT
- 小红书
- NotebookLM
- 视频剪辑
- 4SAPI description: "拆解 guizang-ppt-skill、guizang-social-card-skill、awesome-gpt-image-2、anything-to-notebooklm 和 Youtube-clipper-skill,搭一条从文章到配图、PPT、图文卡片、播客和短视频的内容复用流程。"
这一篇看后半段:视觉和分发。
很多好文章发不出去,不是因为内容差,而是卡在这些地方:
内容在不同平台的消费方式不同。公众号需要标题和封面,小红书需要竖版卡片,知识分享需要 PPT,视频平台需要切片,课程资料需要播客、思维导图和测验。
这一篇重点拆五个 Skill:
| Skill | 负责环节 |
|---|---|
| guizang-ppt-skill | 把文章、报告、产品分析转成 HTML 演示稿 |
| guizang-social-card-skill | 把长文转成小红书图文和公众号封面对 |
| awesome-gpt-image-2 | 提供 GPT-Image2 风格库、提示词模板和案例参考 |
| anything-to-notebooklm | 把网页、公众号、YouTube、PDF 等资料转成播客、PPT、思维导图、测验 |
| Youtube-clipper-skill | 把 YouTube 长视频切成语义片段,生成双语字幕和短视频素材 |
1. guizang-ppt-skill:把文章变成可演示的 HTML Deck
截至 2026-06-17,GitHub API 查询约 17.7k star。项目说明是面向 Claude Code、Codex 等 Agent 环境的网页 PPT Skill,用于生成单文件 HTML 横向翻页 PPT、PPT 配图和多平台封面。
它的核心特点:
| 能力 | 说明 |
|---|---|
| 单文件 HTML | 不需要构建和服务器,浏览器可直接打开 |
| 两套视觉系统 | 电子杂志风和瑞士国际主义风格 |
| 多种布局 | Style A 有 10 种布局,Style B 有 22 种锁定版式 |
| 可选配图 | 可结合 GPT-Image 2.0 或 GPT-M 2.0 生成照片、信息图、流程图、UI 情景图 |
| 低性能静态模式 | 可关闭 WebGL/canvas 动画,方便低性能设备演示 |
| 社交封面 | 可生成公众号 21:9 头图、1:1 分享卡、小红书封面、视频缩略图等 |
1.1 适合什么内容
| 内容 | 推荐用法 |
|---|---|
| 长文章 | 抽 6-10 页核心观点做演讲 |
| 产品分析 | 用瑞士风突出结构、数据、对比 |
| 技术分享 | 用流程图、系统关系图和关键代码截图 |
| 年度复盘 | 用大数字、时间线和对比页 |
| 公开课 | 用电子杂志风增强叙事 |
不太适合:
| 不适合 | 原因 |
|---|---|
| 大量表格培训课件 | HTML deck 视觉好,但信息密度不一定适合培训 |
| 多人协作 PPTX | 它输出的是静态 HTML,不是传统 PPTX |
| 临时口头汇报 | 制作视觉稿的时间可能超过收益 |
1.2 实用指令
这条指令的重点是“先给页面节奏”。如果只说“把文章做成 PPT”,模型容易把长文压缩成密密麻麻的页面。
1.3 结合 4SAPI 的成本策略
PPT 生成通常会用到三类模型:
| 环节 | 推荐模型策略 |
|---|---|
| 提炼文章大纲 | 中等模型 |
| 设计页面结构 | 强一些的代码/视觉模型 |
| 生图 | 多模态或图片模型 |
| HTML 修改和校验 | 代码模型 |
可以先不用生图,生成纯 HTML 结构预览;确认节奏后,再用图片模型补关键视觉。这样比一上来生成十几张图便宜很多。
2. guizang-social-card-skill:把长文拆成可发的小红书和封面对
项目地址:op7418/guizang-social-card-skill
截至 2026-06-17,GitHub API 查询约 3.6k star。项目定位是从文章、文案、截图、产品笔记、字幕或照片生成小红书/Rednote 图文组图,以及公众号 21:9 + 1:1 封面对。
它的核心参数很实用:
| 能力 | 说明 |
|---|---|
| 3 个画板尺寸 | 小红书 1080x1440、公众号 2100x900、公众号 1080x1080 |
| 28 个版式骨架 | Editorial 16 个,Swiss 12 个 |
| 10 套主题预设 | Editorial 6 套,Swiss 4 套锚点色 |
| 单文件 HTML + Playwright | node render.mjs 可渲染 PNG |
| 内容适配 | 长文章、产品测评、教程拆页、数据回顾、旅行攻略、截图说明 |
2.1 一篇文章怎么拆成 5 张图
可以按这个结构:
| 页码 | 内容 |
|---|---|
| 1 | 封面:一句明确结论 |
| 2 | 痛点:读者为什么需要看 |
| 3 | 方法:3-5 个关键步骤 |
| 4 | 对比:错误做法 vs 正确做法 |
| 5 | 总结:保存理由和行动建议 |
示例指令:
小红书卡片不是把文章分段复制进去,而是重新排版信息。每页最好只有一个任务。
2.2 公众号封面对怎么做
公众号常见需求是同一篇文章需要两张图:
| 尺寸 | 用途 |
|---|---|
| 21:9 | 公众号头图 |
| 1:1 | 分享卡和次级入口 |
指令可以这样写:
封面不要试图解释整篇文章。它只负责让读者知道“这篇解决什么问题”。
3. awesome-gpt-image-2:把生图从玄学变成模板
项目地址:freestylefly/awesome-gpt-image-2
截至 2026-06-17,GitHub API 查询约 7.6k star。项目描述是 Prompt as Code,GPT-Image2 工业级提示词引擎与模板库,包含 500 级别案例、20+ 套工业级模板,并提炼出 Agent Skill。
它最值得学的不是“某张图好看”,而是 Prompt-as-Code 的思路。
普通生图提示词常常是这样:
这个提示词太虚。稳定的提示词应该拆成结构:
awesome-gpt-image-2 的价值就是把大量案例整理成可复用的结构。
3.1 适合什么图
| 图类型 | 用法 |
|---|---|
| 文章封面 | 根据主题生成主视觉 |
| 产品图 | 电商、SaaS、硬件、工具展示 |
| 信息图 | 流程、框架、数据关系 |
| UI 场景图 | 展示应用使用场景 |
| 海报 | 活动、课程、报告、发布会 |
| 摄影风 | 人物、空间、产品氛围 |
如果你要给博客配图,不要每次重新发明提示词。先从案例库里找接近的视觉方向,再改主体、平台和比例。
3.2 文章配图的实用模板
这样生成出来的图更容易放进公众号或 PPT。
3.3 生图成本怎么控
生图最容易浪费钱。建议三步走:
不要一上来让模型“随便出 10 张高级感封面”。你会得到一堆看起来都能用、但都不准确的图。
4. anything-to-notebooklm:一份资料拆成多种内容形态
项目地址:joeseesun/qiaomu-anything-to-notebooklm
截至 2026-06-17,GitHub API 查询约 5.2k star。项目定位是多源内容处理器,支持微信公众号、网页、YouTube、PDF、Markdown、搜索查询等输入,上传到 NotebookLM 后生成播客、PPT、思维导图、Quiz 等。
它解决的是内容复用问题。
一篇深度文章写完以后,其实还能拆成:
| 输出 | 用途 |
|---|---|
| 播客 | 通勤收听、私域分发 |
| PPT | 团队分享、直播课 |
| 思维导图 | 社群资料、课程附件 |
| Quiz | 学习测验、训练营作业 |
| 摘要 | 朋友圈、知识星球、邮件 |
4.1 适合处理哪些输入
README 里列出的输入源很多,包括公众号文章、公开网页、YouTube 视频、播客、PDF、Office 文档、音频、Markdown、压缩包、纯文本和搜索关键词。
在实际内容团队里,最常见的是:
| 输入 | 输出 |
|---|---|
| 公众号文章 | 播客、PPT、思维导图 |
| YouTube 视频 | 摘要、播客、课程笔记 |
| PDF 报告 | PPT、测验、研究摘要 |
| Markdown 长文 | 多平台分发素材 |
| 访谈录音 | 文章大纲、金句、短视频脚本 |
4.2 合规边界
这个项目的 README 提到多源抓取和一些网页处理能力。写入团队规范时,建议明确边界:
内容复用不等于内容搬运。尤其是播客、课程和付费资料,版权边界要提前说清楚。
4.3 和 4SAPI 的关系
anything-to-notebooklm 更像内容中转和形态转换工具。4SAPI 可以承担其中的模型调用入口:
| 任务 | 模型策略 |
|---|---|
| 长文摘要 | 低成本模型分段 |
| 课程大纲 | 中等模型 |
| PPT 结构 | 强模型 |
| Quiz 生成 | 低成本模型加人工抽查 |
| 事实复核 | 强模型加来源 |
最稳的做法是先把原始资料转成 Markdown,再生成不同形态。Markdown 是内容复用的中间层。
5. Youtube-clipper-skill:长视频变短视频素材
项目地址:op7418/Youtube-clipper-skill
截至 2026-06-17,GitHub API 查询约 2.0k star。项目说明是 Claude Code 的 AI 智能视频剪辑工具,可以下载视频、生成语义章节、剪辑片段、翻译双语字幕并烧录字幕到视频。
它的流程:
依赖包括 yt-dlp、FFmpeg 和 Python 包。字幕烧录需要 FFmpeg 支持 libass。
5.1 适合哪些视频
| 视频类型 | 用法 |
|---|---|
| 技术访谈 | 切出观点片段 |
| 长课程 | 按知识点切章节 |
| 产品发布会 | 切功能亮点 |
| 播客视频 | 切金句和争议点 |
| 讲座 | 切概念解释和案例 |
不适合:
| 不适合 | 原因 |
|---|---|
| 未授权影视内容 | 版权风险高 |
| 强娱乐剪辑 | 语义分章不一定等于爆点节奏 |
| 无字幕且音质差 | 转写质量会影响后续剪辑 |
| 需要复杂后期包装 | 它偏自动切片,不是完整剪辑软件 |
5.2 实用指令
这里同样要让人参与选择。AI 能帮你找章节,但“哪个片段适合发”需要结合账号定位和版权边界。
6. 一篇文章如何变成 5 种内容
假设你已经写完一篇 6000 字文章:《中文内容创作 10 个 Skill 选型指南》。
可以这样分发:
如果还有视频直播或分享录屏:
内容复用的关键不是“发得越多越好”,而是每个平台都要重新适配阅读方式。
| 平台 | 内容形态 | 注意点 |
|---|---|---|
| 公众号 | 长文 + 封面 | 逻辑完整,标题克制 |
| 小红书 | 3:4 图文 | 每页一个信息点,少文字 |
| PPT | 6-10 页演示 | 讲述节奏,别堆正文 |
| 视频号/短视频 | 30 秒到 3 分钟片段 | 开头 3 秒讲清价值 |
| 社群 | 摘要 + 思维导图 | 方便保存和讨论 |
| 课程 | PPT + Quiz | 方便学习和复习 |
7. 建议的素材目录
如果你要长期做内容复用,建议每篇文章建一个目录:
这样做的好处:
- 每个平台的素材不会混在一起。
- 可以保留提示词和源文件,方便下次改。
- 出现版权或事实争议时,能追溯素材来源。
8. 自动化边界
视觉和分发环节最容易让人误以为“可以全自动发全平台”。不建议这么做。
建议写清楚四个边界:
| 边界 | 说明 |
|---|---|
| 人工审图 | 生图可能出现文字错误、错手、错 logo、风格不一致 |
| 人工审字幕 | 自动字幕会误识别专有名词和数字 |
| 人工审版权 | 视频、图片、文章都要确认授权 |
| 人工审平台 | 不同平台对标题、封面、导流和敏感词要求不同 |
4SAPI 可以统一模型调用和日志,帮你控制成本和追踪输出,但不能替你判断某张图、某段视频、某个标题是否适合发布。
9. 最小可落地流程
如果你今天就想用起来,可以先做这个版本:
模型路由可以这样设置:
| 步骤 | 模型 |
|---|---|
| 提炼长文核心观点 | 中等文本模型 |
| 设计卡片文案 | 中文写作模型 |
| 生成 HTML/CSS | 代码模型 |
| 生图 | 图片模型 |
| 校验和修改 | 代码模型 + 人工视觉检查 |
| 字幕翻译 | 低成本或中等模型 |
这样一条流程跑下来,成本可控,产物也比较完整。
10. 总结
这五个视觉分发 Skill 的分工很清楚:
如果前一篇解决的是“写得出来”,这一篇解决的是“发得出去”。
对独立创作者和小团队来说,最重要的不是一次性装满工具箱,而是先跑通一条稳定链路:一篇高质量原文,拆成 2-3 个平台真正需要的形态,再用数据复盘下一篇怎么改。
4SAPI 这类大模型API中转站可以放在这条链路中间,统一模型、额度和日志。工具越多,越需要一个统一入口;产物越多,越需要清楚的人工复核边界。




