3D 词云可视化生成器
将大模型对话历史(或任何文本数据)自动转换为炫酷的 3D 地球词云可视化效果。
触发条件
当用户需要以下操作时使用此 Skill:
- 将对话历史可视化
- 生成 3D 词云
- 分析文本关键词分布
- 创建交互式数据可视化
- 导出 3D 词云为图片
功能特性
核心能力
-
多格式支持
- JSON - 自动深度提取对话内容(递归解析 content/message/text/question/answer 字段)
- Markdown - 直接读取全文
- TXT - 直接读取全文
- UTF-8-sig 编码 - 避免中文乱码
-
自动化数据处理
- 读取文件 → UTF-8 解码
- 格式解析 → JSON 自动递归提取
- 中文分词 → 使用专业分词库(segmentit)
- 去停用词 → 过滤 "的、了、是、吗" 等无意义词
- 词频统计 → 自动计算权重
- 排序筛选 → 取 TOP30 高频词
- 生成词云 → 自动渲染到地球
-
3D 地球词云
- Three.js 渲染引擎
- 真实的 3D 地球模型
- 词云作为纹理映射到地球表面
- 随机配色(15 种预设颜色)
- 星空背景(5000 颗星)
- 光照效果(环境光 + 方向光)
-
交互功能
- 鼠标拖拽旋转地球
- 滚轮缩放视角
- 右键平移视角
- 自动旋转展示
- 阻尼效果(更丝滑)
- 范围限制(1.2 - 5.0 距离)
-
纯前端运行
- 无需服务器
- 无需后端处理
- 数据不上传云端
- 完全本地处理
使用指南
基本用法
-
准备数据文件
- 使用
conversation-exporterSkill 导出对话历史 - 或准备任何 JSON/MD/TXT 文件
- 使用
-
生成可视化
- 在对话中告诉 AI:"生成 3D 词云"
- AI 会自动:
- 创建 HTML 文件
- 包含完整的 3D 渲染代码
- 支持文件上传功能
- 自动解析和生成词云
-
查看效果
- 在浏览器中打开生成的 HTML 文件
- 上传你的数据文件
- 等待自动解析和生成
- 观察 3D 词云地球
高级选项
- 自定义配色方案 - 修改颜色数组
- 调整词云数量 - 修改 TOP30 为其他数值
- 修改地球大小 - 调整 SphereGeometry 参数
- 调整旋转速度 - 修改 autoRotateSpeed 值
- 自定义停用词 - 修改 stopWords Set
数据结构
JSON 格式要求
支持任意嵌套结构,自动提取以下字段:
contenttextmessagequestionanswer
示例:
{
"conversation_history": {
"timeline": [
{
"date": "2026-03-25",
"type": "skill_installation",
"action": "安装 Skills",
"details": {
"content": "成功安装了 5 个 Skills"
}
}
]
}
}
关键词统计
- 词频决定文字大小(count * 2.5 像素)
- 自动排序并取 TOP30
- 过滤停用词
- 最小词频限制为 1
配置选项
文件编码
- 所有文件:UTF-8-sig(带 BOM)
- 目的:避免中文乱码
性能优化
- 纹理分辨率:2048x1024(高清)
- 地球细分:64x64
- 星空粒子:5000 个
- 帧率优化:requestAnimationFrame
停用词列表
const stopWords = new Set([
'的', '了', '是', '我', '你', '在', '有', '和', '就', '都',
'吗', '吧', '呢', '啊', '哦', '嗯', '这个', '那个', '可以',
'然后', '但是', '因为', '所以', '如果', '需要', '谢谢'
]);
文件输出
生成的文件
3d_word_cloud_visualizer.html- 完整的可视化工具- 包含所有必要的 HTML/CSS/JS 代码
- 支持文件上传功能
- 自动解析和生成词云
- 可在浏览器中直接运行
可选导出
- 支持导出当前词云为 PNG 图片(通过浏览器截图)
- 支持导出词云数据为 JSON 格式
技术实现
依赖库
-
Three.js (v0.160.0)
-
OrbitControls
-
segmentit (v2.0.3)
无外部依赖
- ✅ 不需要后端服务器
- ✅ 不需要 API Key
- ✅ 不需要数据库
- ✅ 所有代码包含在单个 HTML 文件中
注意事项
-
文件大小
- 建议单个文件不超过 10MB
- 大文件可能导致浏览器卡顿
-
关键词数量
- 默认 TOP30,可根据需要调整
- 过多关键词会影响性能
-
浏览器兼容性
- 推荐使用 Chrome、Firefox、Edge 现代浏览器
- 需要支持 WebGL
- IE 11 不支持
-
网络连接
- 首次打开需要下载 CDN 资源
- 后续运行可在离线模式(需缓存)
错误处理
常见问题
-
文件解析失败
- 检查文件格式是否正确
- 确保 JSON 语法无错误
- 尝试使用其他格式(MD/TXT)
-
词云生成失败
- 检查文件是否包含有效文本
- 确认 segmentit 库加载成功
- 查看浏览器控制台错误信息
-
3D 渲染失败
- 检查浏览器是否支持 WebGL
- 确认 CDN 资源加载成功
- 尝试使用不同浏览器
安全特性
- ✅ 本地处理,数据不上传云端
- ✅ 无外部 API 调用
- ✅ 无数据持久化
- ✅ 完全由用户控制数据
更新日志
- v1.0 (2026-03-25)
- 初始版本
- 支持 JSON/MD/TXT 三种格式
- 自动中文分词和词频统计
- 3D 地球词云可视化
- 鼠标交互功能
- 星空背景效果
示例工作流
完整流程
-
导出对话历史
- 使用
conversation-exporterSkill - 选择导出格式(推荐 JSON)
- 保存到本地
- 使用
-
生成可视化
- 在对话中:"生成 3D 词云"
- AI 创建
3d_word_cloud_visualizer.html
-
查看词云
- 浏览器打开 HTML 文件
- 上传导出的对话历史文件
- 等待自动解析和生成
-
交互探索
- 拖拽旋转地球
- 滚轮缩放视角
- 观察关键词分布
- 截图保存效果
技术亮点
纯前端实现
- 无需后端服务器
- 完全本地处理
- 数据安全可控
自动化程度高
- 用户只需上传文件
- 自动解析、统计、生成
- 零配置、零操作
视觉效果好
- 3D 地球模型
- 词云纹理映射
- 星空背景
- 流畅动画
交互体验佳
- 鼠标拖拽旋转
- 滚轮缩放
- 自动旋转展示
- 阻尼效果
适用场景
- 对话历史可视化
- 文本关键词分析
- 数据展示演示
- 教育培训演示
- 数据新闻制作
- 交互式报告
最佳实践
-
准备数据
- 确保文件格式正确
- 检查编码为 UTF-8
- 文件大小适中
-
生成词云
- 使用现代浏览器
- 首次打开需要网络(加载 CDN)
- 耐心等待解析完成
-
探索分析
- 尝试不同角度观察
- 注意高频关键词
- 对比不同时期数据
-
保存成果
- 使用截图工具保存图片
- 记录分析结论
- 分享可视化结果