Video Storyboard Generator
通过头脑风暴与用户共同确定视频需求,基于用户画像提供个性化建议,生成结构化的视频分镜脚本。
快速导航
📋 新手推荐: 查看
references/quick-reference.md获取一页纸速查表
工作流程
技术参考
核心原则
段落是主题驱动的,不是标准化的:分镜的段落结构完全取决于视频主题和内容需求。
需求需要共同探索:用户可能对视频的具体表现形式不够清晰,需要通过头脑风暴一起确定。
用户画像驱动个性化:系统会记忆用户的偏好,在后续交互中提供更贴合用户喜好的建议。
镜头时长规则:默认单个镜头时长不得超过15秒(可自定义)。
内容安全规范:所有分镜内容必须符合安全标准,不包含暴力、血腥或不适描述。详见 references/content-safety.md。
工作流程
阶段0:用户画像加载(可选)
在开始任何交互前,检查用户画像文件是否存在:
- Windows:
C:\Users\[用户名]\.video-storyboard\user-profile.md - macOS/Linux:
~/.video-storyboard/user-profile.md - 统一表示:
<用户主目录>/.video-storyboard/user-profile.md
如果画像文件存在: 读取用户画像后,必须询问用户:
"检测到您之前的使用偏好记录。是否使用之前的偏好设置?"
- 是:应用用户画像中的偏好设置作为推荐
- 否:忽略画像记录,使用默认设置
如果画像文件不存在: 使用默认设置,并在本次交互结束后询问是否保存偏好。
详见 references/user-profile.md。
阶段1:视频类型识别与头脑风暴
识别视频类型
根据用户描述识别视频类型,详见 references/video-types.md。
头脑风暴 - 需求澄清
根据视频类型进行针对性的头脑风暴,详见 references/questions-by-type.md。
所有视频类型都需要确认: 5. 镜头时长限制 - 单个镜头最长时长(根据视频总时长自动推荐)
- 短视频(≤60秒):建议单镜头≤12秒,按镜头数量规划
- 30秒视频 → 建议3-5个镜头
- 45秒视频 → 建议4-6个镜头
- 60秒视频 → 建议5-8个镜头
- 开场镜头建议3-5秒,核心镜头8-12秒
- 标准视频(>60秒):默认15秒上限,可自定义
- 15秒以下:保持紧凑节奏
- 15-20秒:适合需要更多信息密度的场景
- 20秒以上:仅在特殊叙事需求时使用
-
分镜版式 - 需要极简版(仅内容描述)还是专业版(详细运镜指导)?
- 极简版:仅列出每个分镜的画面内容和旁白
- 专业版:包含运镜、布局、视觉元素、过渡等详细信息
-
音效/BGM - 需要音效和BGM建议吗?
- 音效:环境音、转场音效、强调音效
- BGM:背景音乐类型和节奏
-
旁白/台词呈现方式 - 如何展示旁白和角色台词?
- 仅旁白:只有解说旁白
- 仅台词:只有角色对话
- 旁白+台词:两者都有,确保内容一致
- 合并展示:旁白和台词合并为单一文本块
- 重要:每个镜头必须有对应的旁白/台词,放在该镜头后面。如果某个镜头没有,标注"无"
-
OpenCode提示词 - 需要生成可在OpenCode中使用的执行提示词吗?(仅专业版)
- 是:生成可直接复制到OpenCode的技术实现提示词
- 否:跳过,仅输出分镜文档
-
Seedance 2.0 提示词 - 需要生成可用于Seedance 2.0 AI视频生成工具的提示词吗?
- 是:为每个镜头生成符合Seedance 2.0格式的提示词,包含:
- [主体描述]:角色/物体外观详细描述
- [场景与氛围]:环境、光线、色调、风格
- [动作与情节]:按时间顺序描述动作流程
- [台词与旁白]:精确写出台词/旁白内容、语气、语速
- [镜头语言]:镜头运动和剪辑方式
- [音画同步/音频]:音效、BGM、同步要求
- [其他控制]:时长、分辨率、质量要求
- 否:跳过Seedance提示词生成
详见
docs/Seedance2.0提示词模板.md - 是:为每个镜头生成符合Seedance 2.0格式的提示词,包含:
故事类、剧情类、电影类视频额外确认: 11. 角色设定 - 主要角色有哪些? - 角色数量和定位 - 角色外貌特征 - 角色性格特点 - 是否需要角色提示词(用于AI生成角色形象)
- 角色提示词比例 - AI生图比例(默认9:16)
- 9:16(纵向,适合短视频)
- 16:9(横向,适合长视频)
- 1:1(方形)
- 21:9(电影宽屏)
- 自定义比例
详见 references/character-prompts.md。
- 场景设定 - 主要场景有哪些?
- 室内/室外
- 时间(白天/黑夜/傍晚)
- 氛围/情绪
视觉风格选择
根据视频类型和用户画像推荐风格,详见 references/visual-styles.md。优先推荐用户画像中记录的偏好风格。
阶段2:段落结构设计
根据视频类型和头脑风暴结果,设计段落结构。详见 references/story-patterns.md。
设计原则:
- 段落数量根据时长和内容复杂度决定(通常3-10个段落)
- 每个段落服务于一个清晰的叙事目标
- 段落间有逻辑递进关系
阶段3:镜头拆分(时长规则)
核心规则:单个镜头时长不得超过用户设定的上限(默认15秒)
超过上限的镜头必须拆分为多个子镜头,确保视觉节奏紧凑、镜头间有明确的运镜变化。
拆分策略详见 references/shot-duration.md。
阶段4:逻辑检查与流畅度评估
在生成分镜脚本前,必须进行系统性检查,确保分镜内容逻辑合理、流畅连贯。
4.1 分镜内部逻辑检查(每个分镜必须通过)
| 检查项 | 检查内容 | 通过标准 |
|---|---|---|
| 内容完整性 | 画面描述是否完整 | 包含主体、动作、环境三要素 |
| 时长合理性 | 是否遵守15秒规则 | 不超过用户设定的时长上限 |
| 动作可行性 | 描述的动作能否在时长内完成 | 动作复杂度与时长匹配 |
| 视觉可执行性 | 效果是否可实际制作 | 技术可实现,无不可能描述 |
| 内容安全性 | 是否符合安全规范 | 无暴力血腥,详见content-safety.md |
检查失败示例与修正:
❌ 问题分镜:"主角在3秒内完成从城市一端跑到另一端"
✓ 修正:拆分为3个镜头,每个展示不同阶段的奔跑
❌ 问题分镜:"特写镜头同时展示全景和微观细节"
✓ 修正:拆分为全景镜头 + 特写镜头
❌ 问题分镜:镜头A"人物躺下休息" → 镜头B"双手无力地下垂"
✓ 修正:躺卧姿势下手应描述为"双手自然放置在身侧"
❌ 问题分镜:镜头A"手拿咖啡杯" → 镜头B"双手插兜走开"
✓ 修正:增加过渡"放下咖啡杯"或保持道具连贯
4.2 分镜间逻辑检查(段落层面)
叙事连贯性检查:
- 相邻分镜视觉过渡是否自然?
- 场景切换是否有明确动机?
- 时间线是否清晰(过去→现在→未来)?
空间与物理逻辑检查:
- 机位移动是否符合空间关系?
- 角色位置变化是否合理?
- 视角切换是否符合180度规则?
- 相邻镜头中,角色姿势/动作是否符合物理规律?
- 现实题材:严格检查(例:躺着的人手应描述为"自然放置在身侧"而非"下垂")
- 科幻/奇幻/超能力题材:宽松检查,仅确保设定内一致
- 道具和环境状态是否连续?
- 例:上一镜头拿杯子,下一镜头杯子应仍在手中或已放下
情绪连贯性检查:
- 情绪曲线是否平滑递进?
- 高潮点位置是否合理?
- 结尾情绪是否收束得当?
信息递进检查:
- 信息呈现是否由浅入深?
- 关键信息是否得到强调?
- 有无信息重复或遗漏?
4.3 流畅度评估(技术层面)
节奏检查清单:
- 开场3秒内是否有吸引力?
- 相邻镜头时长变化是否有节奏感?
- 是否存在连续3个以上同类型运镜?
- 高潮段落节奏是否加快?
视觉多样性检查:
- 景别是否有变化(远/全/中/近/特)?
- 构图是否多样(对称/黄金分割/框架式等)?
- 色彩过渡是否自然?
- 光影变化是否符合时间逻辑?
音画同步检查:
- 音效是否与动作精确对齐?
- BGM情绪是否与画面匹配?
- 旁白节奏是否与镜头切换协调?
4.4 检查流程
第一步:分镜自查(AI自我检查) 逐条检查每个分镜的5项内部逻辑,标记问题分镜。
第二步:段落审查(整体连贯性) 按段落检查分镜间逻辑,确保叙事、空间、情绪、信息四维度连贯。
第三步:流畅度评分 为整个分镜脚本打分(1-10分),低于7分需优化。
第四步:问题汇总与修正
问题汇总格式:
- 段落X,镜头Y:问题描述
- 建议修正:具体修改方案
- 优先级:高/中/低
第五步:迭代优化 修改问题分镜后,重新执行检查流程,直到全部通过。
阶段5:生成分镜脚本
基于确定的段落结构和镜头拆分结果,生成完整的分镜脚本。
确定输出版式
根据用户选择,生成分镜脚本:
极简版输出:
- 每个镜头仅包含画面内容描述和时间
- 旁白内容(或台词内容)
- 简洁易读,快速规划
- 镜头内容使用text代码块格式,方便复制
专业版输出:
- 详细的运镜描述
- 画面布局规范
- 视觉元素说明
- 过渡效果
- 时间区间
- 旁白内容(或台词内容)
- 镜头内容使用text代码块格式,方便复制
总体规格
- 视频标题和版本信息
- 总时长(秒数 + 帧数)
- 背景风格描述
- 视觉风格定义
- 旁白风格说明
- 主角/吉祥物设定
角色提示词生成(故事/剧情/电影类)
如果视频类型是剧情类、故事类、电影类,为每个主要角色生成AI绘画提示词:
内容安全要求:
- 角色提示词中禁止包含暴力、血腥、恐怖或令人不适的描述
- 禁止使用描述临时状态的词语(如"微笑""哭泣""愤怒""奔跑"等)
- 使用描述性外貌特征替代状态词(如"嘴角自然弧度"替代"微笑")
- 如需表现动作,使用姿势描述(如"单脚离地,身体前倾"替代"奔跑")
- 涉及冲突或紧张场景时,使用抽象视觉元素替代直接描述(详见
references/content-safety.md)
角色提示词包含:
- 主体描述(外貌、衣着、年龄、性别)
- 面部特征(轮廓、五官形状,避免状态词如"微笑""严肃")
- 风格描述(艺术风格、渲染风格、光线)
- 数量和权重标签
- 比例参数(默认9:16,可自定义)
- 修饰符标签
- 示例:
主角1: 年轻女性,短发,白色衬衫,面部轮廓清晰,电影风格,电影光效,8k,高质量 --ar 9:16 主角2: 中年男性,西装,面部线条分明,写实风格,电影光效,4k,细节丰富 --ar 9:16
重要:角色提示词中禁止使用描述临时状态的词语(如"微笑""惊讶""奔跑"),应使用描述外貌特征和姿势的词语。
场景提示词生成(专业版自动生成)
专业版分镜脚本生成时,为每个场景生成场景提示词:
场景提示词包含:
- 环境类型(室内办公空间、室外城市街道等)
- 时间设定(清晨、深夜、傍晚等)
- 光线氛围(自然光、人工光、戏剧性光线)
- 色调风格(暖色调、冷色调、高对比度)
- 关键元素(3-5个核心视觉元素)
格式示例:
场景1-深夜办公室: 室内办公空间,深夜,电脑屏幕冷光+窗外城市灯光,冷蓝色调,办公桌、多显示器、咖啡杯、散落的文件、落地窗外城市夜景
详见 references/scene-prompts.md。
道具提示词生成(专业版自动生成)
专业版分镜脚本生成时,为重要道具生成道具提示词(精简原则:只抓取重要道具):
道具分类判断:
- 核心道具(推动剧情、多次出现、有特写)→ 必须生成
- 互动道具(角色使用、参与动作)→ 建议生成
- 氛围道具(增强场景感)→ 视情况
- 背景道具(纯装饰)→ 不生成
道具提示词包含:
- 外观描述(形状、颜色、尺寸)
- 材质质感(金属、木材、塑料、玻璃)
- 状态特征(全新、日常使用、陈旧、破损)
- 场景关联(所属场景、出现分镜)
格式示例:
道具-咖啡杯: 白色陶瓷马克杯,表面有轻微咖啡渍痕迹,把手一侧有细微裂纹,放置在办公桌右侧,场景1专用
详见 references/prop-prompts.md。
分镜角色提示词生成(专业版自动生成)
专业版分镜脚本生成时,为每个有角色出场的分镜生成分镜角色提示词:
与基础角色提示词的区别:
- 基础角色提示词:定义角色的固定特征(外貌、默认服饰、风格)
- 分镜角色提示词:描述角色在该分镜的具体状态(表情、姿势、服饰调整)
分镜角色提示词包含:
- 外观状态(精神饱满、疲惫、紧张、放松)
- 服饰变化(卷袖子、解领带、换装)
- 表情神态(眉头紧锁、嘴角上扬、眼神专注)
- 动作姿势(坐姿、站姿、行走、手部动作)
- 场景定位(所属场景、空间位置)
格式示例:
林晓明-分镜1: 疲惫状态,眼圈微暗,白衬衫袖口卷起,领带松散,眉头微皱盯着屏幕,坐姿前倾,办公桌前,场景1
精简原则:
- 只描述该分镜中可见的变化
- 状态相同时可标注"同上分镜"
- 避免重复基础角色提示词的固定特征
详见 references/character-prompts.md 中的"分镜角色提示词"部分。
如果用户需要音效/BGM建议,为每个镜头或段落提供:
音效:
- 环境音(雨声、风声、城市噪音等)
- 转场音效( swoosh、glitch、fade等)
- 强调音效(点击、弹跳、whoosh等)
BGM:
- 音乐类型(电子、古典、流行、氛围等)
- 节奏和情绪(紧张、轻松、激昂、温馨)
- 音量建议(铺垫、高潮、结尾)
详见 references/audio-bgm.md。
分镜段落
每个段落包含:
- 段落目标 - 该段落要传达什么信息
- 时间区间 - 开始和结束时间(秒)
- 镜头序列 - 段落内的多个镜头(每个不超过用户设定的上限)
- 每个镜头包含:运镜、布局、视觉、过渡、音效/BGM、旁白/台词
- 旁白和台词必须放在每个镜头后面,方便对应查看
- 音效/BGM(如启用)- 配套音效和BGM建议
极简版镜头内容(必须使用text代码块格式):
画面描述:简洁说明镜头要展示什么
时间:镜头时长
旁白/台词:对应该镜头的解说词或角色台词(如果没有则标注"无")
专业版镜头内容(必须使用text代码块格式):
运镜描述:速度、方向、缓动函数
画面布局:电影级构图方式(三分法/黄金分割/对称/框架式)、景别(远景/全景/中景/近景/特写)、视觉重心位置
视觉元素:具体元素描述
过渡方式:镜头间过渡效果
时间:镜头时长
音效(如启用):具体音效类型
BGM(如启用):音乐类型和音量
旁白/台词:对应该镜头的解说词或角色台词(如果没有则标注"无")
旁白和台词一致性:
- 如果分镜中包含角色台词和旁白,确保两者内容一致,避免冲突
- 旁白用于解说和引导,台词用于角色对话,两者应相辅相成
- 在文本中明确标注旁白和台词的来源
- 每个镜头必须有对应的旁白/台词,如果没有则标注"无"
- 旁白/台词必须放在镜头的text代码中
OpenCode 执行提示词(可选)
如果用户选择生成,创建可在 OpenCode 中直接使用的提示词,用于执行视频制作(仅专业版生成)。
Seedance 2.0 提示词(可选)
如果用户选择生成Seedance 2.0提示词,为每个镜头生成符合AI视频生成格式的提示词:
提示词结构(每镜头一个,必须使用text代码块格式):
[主体描述]:详细描述主要角色/物体外观、服装、年龄、体型、表情等。
[场景与氛围]:描述环境、光线、天气、色调、整体风格(电影级、写实、赛博朋克等)。
[动作与情节]:按时间顺序描述该镜头的完整动作流程,在需要说话的时刻标注"(角色说:XXX)"或"(旁白响起)"。动作要具体、可视化。
[台词与旁白]:精确写出该镜头的台词/旁白文字内容、说话角色、语气、语速、情感。
[镜头语言]:明确镜头运动和剪辑方式(从低机位缓慢推近、360度环绕拍摄、快速切镜、长镜头跟随等)。
[音画同步/音频]:描述音效、BGM、以及台词/旁白与画面的同步要求(台词在角色张嘴时精确对齐唇动、旁白在镜头推近时渐强等)。
[其他控制]:时长(建议15秒以内)、分辨率(1080p或更高)、质量要求(高度逼真,细节丰富,无畸变)。
注意事项:
- 每个镜头生成独立的Seedance提示词
- 提示词要包含该镜头的完整信息,能独立生成视频片段
- 确保相邻镜头的提示词在内容和时间上连贯
- 参考
docs/Seedance2.0提示词模板.md中的示例格式
阶段6:文件保存
在生成分镜文档前,确认文件保存位置。
默认位置: 用户当前项目的 /docs 文件夹
阶段7:更新用户画像
分镜生成完成后,更新用户画像文件。记录本次交互中用户的选择偏好,详见 references/user-profile.md。
运镜类型参考
文档层级说明
我们提供两个层级的运镜参考文档,根据您的需求选择:
| 文档 | 级别 | 适用场景 | 内容特点 |
|---|---|---|---|
camera-movements.md | 基础 | 快速查阅、入门学习 | 6种核心运镜,简洁易懂 |
cinematic-camera-movements.md | 专业 | 电影级制作、深度需求 | 20+种运镜,含复杂组合、情绪对照 |
基础运镜速查
常用运镜类型,详见 references/camera-movements.md:
- 推近 (Dolly In) - 强调主体,适合开场和重点
- 拉远 (Dolly Out) - 展示全景,适合过渡和总结
- 环绕 (Orbiting) - 360度展示,适合3D结构
- 跟拍 (Tracking) - 跟随运动,适合流程展示
- 摇移 (Pan) - 水平移动,适合宽画面展示
- 特写 (Close-up) - 强调细节,适合数据展示
电影级别运镜(推荐用于专业制作)
专业电影运镜技术,详见 references/cinematic-camera-movements.md:
基础运镜扩展:
- 缓推/急推/变焦推 - 不同速度的推镜效果
- 揭示拉镜 - 从特写拉出展现全貌
- 甩镜 - 快速摇镜转场
- 斯坦尼康运镜 - 稳定流畅的运动感
- 手持运镜 - 真实感和紧张感
复杂运镜组合:
- 推+摇组合 - 推近同时转向
- 拉+升组合 - 后拉同时上升
- 环绕+升降组合 - 螺旋上升/下降
- 眩晕变焦 - 推轨同时变焦拉
- 长镜头 - 单一镜头持续叙事
运镜情绪对照:
- 缓推 = 沉思、紧张
- 急推 = 震惊、冲击
- 环绕 = 强调、360度展示
- 上升 = 超脱、渺小
- 手持 = 真实、紧张
画面布局参考
📐 专业构图布局技术详见
references/cinematic-layouts.md
电影级别构图与布局技术:
构图法则:
- 三分法 - 3×3网格,元素放在交叉点
- 黄金分割 - 1:1.618比例,更自然和谐
- 对称构图 - 平衡、庄重、仪式感
- 框架式构图 - 画中画效果
景别系统:
- 远景 (ELS) - 环境>人物,开场establishing
- 全景 (LS) - 人物全身,展示造型
- 中景 (MS) - 膝盖以上,对话场景
- 近景 (MCU) - 胸部以上,情绪交流
- 特写 (CU) - 肩部以上,强调细节
- 大特写 (ECU) - 极细节,强烈冲击
布局方案:
- 视觉重心布局 - 根据重要性分配空间
- 引导线布局 - 利用线条引导视线
- 层次布局 - 前景、中景、背景构建3D感
- 动态平衡布局 - 不对称元素达到平衡
参考资产
🚀 快速入门
推荐新手先查阅:
references/quick-reference.md- 一页纸速查表,涵盖所有常用参数和规则
模板与配置
assets/storyboard-template.md- 分镜模板文件(含变量说明和头脑风暴清单)config/user-profile-template.md- 用户画像模板
核心参考文档
references/video-types.md- 7类视频类型对照表references/questions-by-type.md- 按视频类型的提问清单references/visual-styles.md- 视觉风格参考references/shot-duration.md- 镜头时长和拆分规则references/story-patterns.md- 12种叙事模式references/output-templates.md- 输出格式模板(含极简版和专业版)references/content-safety.md- 内容安全规范(暴力血腥替换方案)
运镜与布局参考
references/camera-movements.md- 基础运镜类型参考references/cinematic-camera-movements.md- 电影级别运镜参考(含复杂运镜组合)references/cinematic-layouts.md- 电影级别画面布局参考(含构图法则、景别系统)
角色与音频
资产提示词(专业版自动生成)
references/scene-prompts.md- 场景提示词生成指南references/prop-prompts.md- 道具提示词生成指南references/character-prompts.md- 角色提示词生成指南(含分镜角色提示词)
用户系统
references/user-profile.md- 用户画像机制
外部提示词模板
docs/Seedance2.0提示词模板.md- Seedance 2.0 AI视频生成工具提示词模板
最佳实践
头脑风暴阶段
- 提供选择而非开放式问题
- 根据主题特点给出建议
- 优先推荐用户画像中记录的偏好
段落设计阶段
- 开场前3秒必须抓住注意力
- 每个段落时长控制在8-30秒
- 保持段落间的视觉和叙事连贯性
镜头拆分阶段
- 严格遵守用户设定的时长上限
- 拆分后相邻镜头要有运镜变化
- 避免连续相同类型的运镜
画面顺序设计
- 开场段落(2-3个镜头):快速切入 → 主体展示 → 细节特写
- 核心段落(2-4个镜头):环绕展示 → 跟随流程 → 特写强调
- 结尾段落(2个镜头):汇聚元素 → 拉远全景
- 单个镜头时长:3-15秒(不得超过用户设定的上限)
脚本生成阶段
- 运镜描述要具体(速度、方向、缓动函数)
- 画面布局使用电影级别构图(详见
references/cinematic-layouts.md)- 优先使用三分法、黄金分割等经典构图
- 景别选择符合叙事需要(远/全/中/近/特/大特写)
- 运用视觉重心、引导线、层次布局增强画面质感
- 运镜方式参考电影级别运镜(详见
references/cinematic-camera-movements.md)- 根据情绪选择合适的运镜类型(缓推=沉思,急推=冲击)
- 使用复杂运镜组合增加视觉冲击力(推+摇、拉+升等)
- 避免连续使用相同运镜,保持视觉多样性
- 旁白与视觉同步
- 如有台词,确保旁白和台词内容一致
- 在输出中明确标注旁白和台词的来源
- 每个镜头必须包含对应的旁白/台词,放在该镜头的最后
- 如果某个镜头没有旁白/台词,标注"无"
- 每个镜头的旁白/台词应该与该镜头的画面内容对应
- 每个镜头内容必须使用text代码块格式,方便用户复制到其他应用
- 技术提示词包含所有视觉规范
- 内容安全检查:确保没有暴力、血腥或不适描述,使用抽象化表达和视觉隐喻替代
输出格式
生成的分镜脚本包含:
- 结构化的分镜文档 (.md) - 便于人类阅读和参考
- 每个镜头内容必须使用text代码块格式(包括极简版和专业版)
- text格式示例:```画面描述...时间...旁白...```
- 方便用户直接复制镜头内容到其他应用
- 旁白和台词明确标注,确保一致性
- 每个镜头后面紧跟该镜头的旁白/台词,方便对应
- OpenCode 执行提示词(可选) - 可直接用于执行视频制作
- 保存位置确认 - 确保文档妥善保存
详见 references/output-templates.md。