质量审核 - Quality Review
触发命令: /review
触发关键词: 审校、校对、检查、审核、版本评估、A/B测试、版本对比
简介
质量审核技能套件,整合了文本审校和版本评估两大功能。文本审校提供全面的语法、逻辑、合规检查;版本评估支持多版本对比分析和A/B测试决策支持。
功能一: Review Text
Review Text - 文本审校
简介
对文本进行全面审校,包括语法、拼写、标点、逻辑、清晰度等方面,并提供改进建议。审校完成后会在输出末尾添加AI免责声明。生成建议后自动调用humanize_text去除AI痕迹。
使用场景
-
对初稿进行最终审校
-
发现并修正文本错误
-
提升文本质量
-
确保内容的准确性和专业性
-
发布前的最终检查
输入参数
必需参数
- source_text (string): 需要审校的原文
可选参数
review_aspects (string[]): 审校重点(可多选)
-
grammar
-
语法检查
-
spelling
-
拼写检查
-
punctuation
-
标点符号检查
-
logic
-
逻辑检查
-
clarity
-
表达清晰度检查
-
consistency
-
一致性检查
-
factual_accuracy
-
事实准确性检查
-
compliance
-
合规性检查(检查敏感词、违规内容)
-
默认值:全部检查
target_audience (string): 目标受众
-
general
-
普通大众
-
professional
-
专业人士
-
academic
-
学术界
-
youth
-
年轻群体
-
business
-
商务人士
-
默认值:general
tone_requirement (string): 语气要求
-
formal
-
正式
-
semi-formal
-
半正式
-
casual
-
非正式
-
默认值:semi-formal
return_format (string): 返回格式
-
summary_only
-
仅返回摘要和修订建议
-
detailed
-
返回详细分析和修订建议
-
with_marked_text
-
返回标注原文和修订版本
-
默认值:detailed
highlight_changes (boolean): 是否高亮显示修改
-
true
-
用特殊符号标注修改内容
-
false
-
不高亮
-
默认值:true
输出
审校结果,包括问题分析、修订建议、修订版本,以及AI免责声明"以上内容为AI大模型审校优化,在使用前需再人工审核"。修订建议会自动调用humanize_text去除AI痕迹。
处理规则
审校维度
- 语法检查(grammar)
-
主谓一致性检查
-
时态一致性检查
-
语序合理性检查
-
语法结构完整性检查
- 拼写检查(spelling)
-
错别字检查
-
同音字误用检查
-
易混字检查
-
专业术语拼写检查
- 标点符号检查(punctuation)
-
标点符号使用规范检查
-
中英文标点混用检查
-
标点符号位置检查
-
标点符号完整性检查
- 逻辑检查(logic)
-
论证逻辑检查
-
因果关系检查
-
前后一致性检查
-
推理合理性检查
- 表达清晰度检查(clarity)
-
歧义表达检查
-
冗余表达检查
-
信息过载检查
-
表达准确性检查
- 一致性检查(consistency)
-
术语一致性检查
-
人称一致性检查
-
时态一致性检查
-
格式一致性检查
- 事实准确性检查(factual_accuracy)
-
数据准确性检查
-
日期时间检查
-
专有名词检查
-
引用准确性检查
- 合规性检查(compliance)
-
敏感词检查
-
违规内容检查
-
版权内容检查
-
虚假信息检查
问题等级分类
- 严重问题(Critical)
-
严重影响理解的错误
-
明显的事实错误
-
严重的合规问题
-
必须修改
- 重要问题(Important)
-
影响阅读流畅度的错误
-
不够准确的表达
-
不够一致的术语
-
建议修改
- 一般问题(Minor)
-
细小的表达瑕疵
-
优化空间的表达
-
不够完美的措辞
-
可选修改
审校流程
- 初步扫描
-
快速扫描文本,识别明显问题
-
统计问题数量和类型分布
-
确定审校重点
- 深度分析
-
逐段深入分析
-
发现潜在问题
-
记录问题位置和类型
- 问题归类
-
将问题按严重程度归类
-
标注问题位置
-
提供问题描述
- 修订建议
-
为每个问题提供修订方案
-
说明修订理由
-
给出修改建议
- 整体评估
-
评估文本整体质量
-
给出改进方向
-
提供总结建议
修订建议格式
摘要格式(summary_only)
【审校摘要】 原文质量评分:X/10 发现问题总数:X个(严重:X个,重要:X个,一般:X个)
【主要问题】
- XXX问题
- XXX问题
- XXX问题
【修订建议】 (概括性建议)
【修订版本】 (整体修订后的文本)
详细格式(detailed)
【审校摘要】 原文质量评分:X/10 发现问题总数:X个(严重:X个,重要:X个,一般:X个)
【详细问题分析】
-
[严重] 语法错误 位置:第X行第X字 问题:XXX 建议:XXX 修订:XXX
-
[重要] 表达不够清晰 位置:第X行第X字 问题:XXX 建议:XXX 修订:XXX
...
【修订版本】 (整体修订后的文本,用特殊符号标注修改)
【改进方向】 (进一步优化的建议)
标注格式(with_marked_text)
【审校摘要】 ...
【标注原文】 (用[[删除内容]]表示删除,用【新增内容】表示新增)
【修订版本】 (清晰的修订后文本)
【问题清单】
- XXX问题 → 已修正
- XXX问题 → 已修正 ...
高亮显示规则
删除内容
-
使用[[内容]] 标注要删除的内容
-
例如:这个[[非常]]好的产品
新增内容
-
使用【内容】 标注要新增的内容
-
例如:这个产品【质量】很好
修改内容
-
使用[[原内容]]→【新内容】 标注修改
-
例如:[[非常]]→【特别】好的产品
快速模式
当用户输入包含完整的source_text时,直接使用默认参数(全部检查,普通大众受众,半正式语气,详细格式,高亮显示)执行。
交互问题模板(仅在用户未提供必要参数时显示)
我将为您审校这段文本,请确认以下要求:
-
审校重点(可多选,可选): [1] 语法检查 [2] 拼写检查 [3] 标点符号检查 [4] 逻辑检查 [5] 表达清晰度检查 [6] 一致性检查 [7] 事实准确性检查 [8] 合规性检查(敏感词、违规内容)
-
目标受众(可选): [1] 普通大众 [2] 专业人士 [3] 学术界 [4] 年轻群体 [5] 商务人士
-
语气要求(可选): [1] 正式 [2] 半正式(推荐) [3] 非正式
-
返回格式(可选): [1] 仅返回摘要和修订建议 [2] 返回详细分析和修订建议(推荐) [3] 返回标注原文和修订版本
-
是否高亮显示修改(可选): [1] 高亮显示修改内容(推荐) [2] 不高亮
您可以:
- 一次性回复所有选择(如:1,2,3,4,5,6,7,8,1,2,2,1)
- 回复部分参数,我再确认是否需要补充
- 回复"审校"或"好的",使用推荐设置执行(推荐:全部检查,普通大众受众,半正式语气,详细格式,高亮显示)
- 如果你有其他想法,可在回复的时候一并描述告知
请回复:
示例
示例1:综合审校
输入:
source_text: "这个产品有很多好的功能,能够帮助用户提高工作的效率。但是有时候它会有些问题,需要进一步改进。我们相信,通过不断的努力,这个产品会越来越好。" review_aspects: ["grammar", "spelling", "clarity", "consistency"] return_format: "detailed"
输出:
【审校摘要】 原文质量评分:7/10 发现问题总数:3个(严重:0个,重要:2个,一般:1个)
【详细问题分析】
-
[重要] 表达不够简洁 位置:第1句 问题:"有很多好的功能"表达略显啰嗦 建议:改为"功能丰富"或"功能多样" 修订:这个产品功能丰富,能够帮助用户提高工作效率。
-
[重要] 表达不够明确 位置:第2句 问题:"有时候它会有些问题"表述模糊,未说明具体问题 建议:明确指出具体问题类型 修订:但在特定情况下可能出现兼容性问题,需要进一步改进。
-
[一般] 逻辑可优化 位置:第3句 问题:"通过不断的努力"稍显空泛 建议:可以更具体地说明努力方向 修订:我们相信,通过持续优化和用户反馈,这个产品会越来越好。
【修订版本】 这个产品功能丰富,能够帮助用户提高工作效率。但在特定情况下可能出现兼容性问题,需要进一步改进。我们相信,通过持续优化和用户反馈,这个产品会越来越好。
【改进方向】
- 可以进一步丰富内容,加入具体案例
- 可以增加数据支撑,提升说服力
- 可以优化段落结构,使内容更清晰
以上内容为AI大模型审校优化,在使用前需再人工审核
示例2:合规性检查
输入:
source_text: "这个投资产品绝对没有任何风险,保证100%的收益,没有任何损失。" review_aspects: ["compliance", "factual_accuracy"] return_format: "summary_only"
输出:
【审校摘要】 原文质量评分:3/10 发现问题总数:3个(严重:3个,重要:0个,一般:0个)
【主要问题】
- [严重] 合规问题:使用"绝对没有任何风险"等绝对化表述,违反金融广告规范
- [严重] 合规问题:使用"保证100%的收益"等承诺性表述,违反金融广告规范
- [严重] 事实问题:没有任何投资产品能够保证100%的收益和零风险
【修订建议】 强烈建议修改所有绝对化表述和承诺性表述,改为更加客观、谨慎的表达方式。金融产品宣传应遵循"风险提示"原则,充分揭示风险。
【修订版本】 这个投资产品具有一定的收益潜力,但也存在相应的投资风险。投资前请仔细阅读产品说明书,充分了解产品特点和风险等级,根据自身风险承受能力进行投资。
以上内容为AI大模型审校优化,在使用前需再人工审核
示例3:详细格式+高亮显示
输入:
source_text: "我们做了一个研究,想看看这个方法到底好不好用。结果显示,这个方法比其他方法都好。" review_aspects: ["grammar", "clarity", "tone_requirement"] tone_requirement: "formal" return_format: "detailed" highlight_changes: true
输出:
【审校摘要】 原文质量评分:6/10 发现问题总数:3个(严重:0个,重要:3个,一般:0个)
【详细问题分析】
-
[重要] 表达不够正式 位置:第1句 问题:"做了一个研究"、"想看看"、"到底好不好用"表达过于口语化 建议:使用更正式的学术用语 修订:【本研究旨在】评估【该方法的】有效性
-
[重要] 表达不够准确 位置:第2句 问题:"比其他方法都好"表述过于绝对 建议:使用更准确的表达 修订:研究结果表明,该方法【在多个指标上】优于【现有】其他方法
-
[重要] 结构需要优化 位置:整体 问题:两句话衔接不够紧密 建议:增加连接词,使逻辑更清晰 修订:【本研究旨在评估该方法的】有效性。研究结果表明,该方法在多个指标上优于现有其他方法。
【修订版本】 【本研究旨在评估该方法的】有效性。研究结果表明,该方法在多个指标上优于现有其他方法。
【改进方向】
- 可以进一步增加研究背景和意义
- 可以提供具体的数据和指标
- 可以增加对结果的详细讨论
以上内容为AI大模型审校优化,在使用前需再人工审核
注意事项
-
审校会自动在输出末尾添加AI免责声明:"以上内容为AI大模型审校优化,在使用前需再人工审核"
-
审校修订建议会自动调用humanize_text,无需手动再去AI味
-
合规性检查会参考config/compliance_rules.json和config/risk_keywords.json中的规则
-
对于事实准确性检查,如果无法确认,会标注"需人工核实"
-
高亮显示模式有助于用户快速定位修改内容
-
审校建议仅供参考,用户应根据实际情况决定是否采纳
参数调整提示
在生成内容后,如果对当前结果不满意,可以尝试调整以下参数:
💡 参数调整选项:
-
审校重点: grammar 语法检查 | spelling 拼写检查 | punctuation 标点符号检查 | logic 逻辑检查 | clarity 表达清晰度检查 | consistency 一致性检查 | factual_accuracy 事实准确性检查 | compliance 合规性检查(敏感词、违规内容)
-
目标受众: general 普通大众 | professional 专业人士 | academic 学术界 | youth 年轻群体 | business 商务人士
-
语气要求: formal 正式 | semi-formal 半正式 | casual 非正式
-
返回格式: summary_only 仅返回摘要和修订建议 | detailed 返回详细分析和修订建议 | with_marked_text 返回标注原文和修订版本
-
是否高亮显示修改: true 高亮显示修改内容 | false 不高亮
使用方式: 直接回复如 "重点检查逻辑和清晰度" 或 "返回详细分析"
与其他技能的关联
-
humanize_text: 修订建议生成完成后自动调用此技能去除AI痕迹
-
polish_text: 如果目标是提升表达质量而非发现错误,应使用polish_text
-
check_style_consistency: 如果需要深度检查风格一致性,应使用此技能
-
rewrite_content: 如果需要对已有文本进行改写,可配合使用
配置文件引用
-
intent_keywords: ["审校", "校对", "检查", "审核", "修正", "纠错"]
-
compliance_rules: 在config/compliance_rules.json中定义合规检查规则
-
risk_keywords: 在config/risk_keywords.json中定义敏感词和风险词库
功能二: Evaluate Versions
Evaluate Versions - 版本评估
简介
对同一内容的多个版本进行对比评估,分析各版本的优缺点,提供版本选择建议和优化方向。适用于A/B测试、版本对比、决策支持等场景。
使用场景
-
A/B测试结果分析
-
多版本文案对比评估
-
不同方案的选择决策
-
内容优化方向指导
-
版本迭代效果评估
输入参数
必需参数
-
versions (array): 版本列表
-
每个版本包含:version_name(版本名称)、content(内容)、version_info(版本信息,可选)
-
支持2-5个版本
-
示例: [ {"version_name": "版本A", "content": "内容A", "version_info": "简洁版"}, {"version_name": "版本B", "content": "内容B", "version_info": "详细版"} ]
可选参数
evaluation_criteria (string[]): 评估标准(可多选)
-
clarity
-
清晰度
-
engagement
-
吸引力
-
persuasion
-
说服力
-
professionalism
-
专业性
-
creativity
-
创意性
-
readability
-
可读性
-
emotional_impact
-
情感影响力
-
target_audience_fit
-
目标受众契合度
-
默认值:全部评估
target_audience (string): 目标受众
-
general
-
普通大众
-
professional
-
专业人士
-
youth
-
年轻群体
-
business
-
商务人士
-
academic
-
学术界
-
自定义描述
-
默认值:general
use_case (string): 使用场景
-
marketing
-
营销推广
-
information
-
信息传达
-
education
-
教育培训
-
entertainment
-
娱乐
-
brand_building
-
品牌建设
-
custom
-
自定义
-
默认值:根据内容自动判断
evaluation_method (string): 评估方法
-
comparative
-
对比评估
-
scoring
-
评分评估
-
both
-
对比+评分(推荐)
-
默认值:both
provide_optimization_suggestions (boolean): 是否提供优化建议
-
true
-
提供各版本的优化建议(推荐)
-
false
-
不提供
-
默认值:true
输出
版本评估报告,包括各版本的详细分析、对比评估、评分排名、选择建议、优化方向等。
处理规则
评估标准详解
- 清晰度(clarity)
评估要点:
-
信息表达是否清晰明确
-
逻辑是否顺畅
-
是否有歧义表达
-
信息密度是否合理
评分标准(0-10分):
-
9-10分:表达非常清晰,无歧义
-
7-8分:表达较清晰,偶有小瑕疵
-
5-6分:表达基本清晰,有一些不够明确之处
-
0-4分:表达不够清晰,存在较多歧义
- 吸引力(engagement)
评估要点:
-
开头是否抓人眼球
-
内容是否有吸引力
-
节奏是否紧凑
-
是否让人愿意继续阅读
评分标准(0-10分):
-
9-10分:非常吸引人,引人入胜
-
7-8分:比较吸引人,有亮点
-
5-6分:有一定吸引力,但不够突出
-
0-4分:吸引力不足,难以引起兴趣
- 说服力(persuasion)
评估要点:
-
论据是否充分
-
逻辑是否严密
-
是否能有效影响读者
-
是否有行动号召力
评分标准(0-10分):
-
9-10分:说服力很强,逻辑严密
-
7-8分:说服力较强,有说服力
-
5-6分:有一定说服力,但不够充分
-
0-4分:说服力不足,难以影响读者
- 专业性(professionalism)
评估要点:
-
词汇使用是否专业
-
表达是否规范
-
是否有语法错误
-
格式是否规范
评分标准(0-10分):
-
9-10分:非常专业,规范严谨
-
7-8分:较专业,有小瑕疵
-
5-6分:基本专业,有一些不规范之处
-
0-4分:专业性不足,存在较多问题
- 创意性(creativity)
评估要点:
-
表达是否有新意
-
是否有独特角度
-
是否有创意元素
-
是否令人印象深刻
评分标准(0-10分):
-
9-10分:非常有创意,独具匠心
-
7-8分:较有创意,有亮点
-
5-6分:有一定创意,但不够突出
-
0-4分:创意不足,较为平淡
- 可读性(readability)
评估要点:
-
句子长度是否适中
-
段落结构是否合理
-
用词是否易懂
-
阅读体验是否流畅
评分标准(0-10分):
-
9-10分:可读性非常好,阅读体验流畅
-
7-8分:可读性较好,有少量小问题
-
5-6分:可读性一般,有一些不够流畅之处
-
0-4分:可读性较差,阅读体验不佳
- 情感影响力(emotional_impact)
评估要点:
-
是否能引发情感共鸣
-
情感表达是否到位
-
是否有感染力
-
是否能留下深刻印象
评分标准(0-10分):
-
9-10分:情感影响力很强,深刻共鸣
-
7-8分:情感影响力较强,有共鸣
-
5-6分:有一定情感影响,但不够深刻
-
0-4分:情感影响力不足,难以引起共鸣
- 目标受众契合度(target_audience_fit)
评估要点:
-
语言风格是否符合受众习惯
-
内容是否满足受众需求
-
是否贴近受众兴趣点
-
是否能引发受众互动
评分标准(0-10分):
-
9-10分:高度契合目标受众
-
7-8分:较契合目标受众
-
5-6分:基本契合,有改进空间
-
0-4分:不够契合目标受众
评估流程
- 版本分析
-
分析每个版本的内容特征
-
识别每个版本的优缺点
-
提取各版本的关键信息
- 维度评分
-
根据选定的evaluation_criteria,对每个版本进行评分
-
每个维度0-10分,1分一档
-
计算每个版本的平均总分
- 对比分析
-
对比不同版本在各维度上的表现
-
识别各版本的强项和弱项
-
分析版本之间的差异
- 综合评估
-
综合考虑各维度表现
-
结合target_audience和use_case
-
给出版本选择建议
- 优化建议
-
为每个版本提供优化建议
-
指出可以改进的方向
-
提供具体的修改建议
版本排名方法
综合评分排名
-
计算每个版本的平均总分
-
按照总分从高到低排名
-
考虑各维度的权重(根据use_case调整)
场景适配排名
-
根据use_case,调整各维度权重
-
计算加权总分
-
按照加权总分排名
例如:
-
营销推广场景:engagement、persuasion权重更高
-
信息传达场景:clarity、readability权重更高
-
品牌建设场景:professionalism、target_audience_fit权重更高
评估报告结构
- 概述
-
版本数量
-
评估标准
-
目标受众
-
使用场景
- 各版本详细分析
版本A分析
-
版本信息
-
各维度评分
-
优缺点分析
-
优化建议
版本B分析
- ...
- 对比分析
-
各版本评分对比表
-
各维度表现对比
-
版本差异分析
- 版本排名
-
综合评分排名
-
场景适配排名
-
推荐版本
- 选择建议
-
根据不同需求的版本选择建议
-
各版本的最佳适用场景
-
组合优化建议
快速模式
当用户输入包含完整的versions时,直接使用默认参数(全部评估标准,普通大众受众,根据内容自动判断场景,对比+评分评估,提供优化建议)执行。
交互问题模板(仅在用户未提供必要参数时显示)
我将为您评估这些版本,请确认以下要求:
-
版本列表(必选): 请提供需要评估的版本(2-5个) 格式示例: 版本A:(内容) 版本B:(内容)
-
评估标准(可多选,可选): [1] 清晰度 [2] 吸引力 [3] 说服力 [4] 专业性 [5] 创意性 [6] 可读性 [7] 情感影响力 [8] 目标受众契合度
-
目标受众(可选): [1] 普通大众 [2] 专业人士 [3] 年轻群体 [4] 商务人士 [5] 学术界 [6] 自定义(请描述)
-
使用场景(可选): [1] 营销推广 [2] 信息传达 [3] 教育培训 [4] 娱乐 [5] 品牌建设 [6] 自定义
-
评估方法(可选): [1] 对比评估 [2] 评分评估 [3] 对比+评分(推荐)
-
是否提供优化建议(可选): [1] 提供各版本的优化建议(推荐) [2] 不提供
您可以:
- 一次性回复所有信息
- 回复部分参数,我再确认是否需要补充
- 回复"评估"或"好的",使用推荐设置执行(推荐:全部评估标准,普通大众受众,根据内容自动判断场景,对比+评分,提供优化建议)
- 如果你有其他想法,可在回复的时候一并描述告知
请回复:
示例
示例1:两个版本对比评估
输入:
versions: [ {"version_name": "版本A", "content": "我们的产品功能强大,操作简单,界面友好。欢迎体验!"}, {"version_name": "版本B", "content": "这款产品超好用,功能超强,上手超简单,界面超好看!赶紧来试试!"} ] evaluation_criteria: ["clarity", "engagement", "persuasion", "readability"] evaluation_method: "both"
输出:
【版本评估报告】
概述:
- 版本数量:2个
- 评估标准:清晰度、吸引力、说服力、可读性
- 目标受众:普通大众
- 使用场景:营销推广
各版本详细分析:
【版本A】 内容:"我们的产品功能强大,操作简单,界面友好。欢迎体验!"
各维度评分:
- 清晰度:9/10 - 表达非常清晰,无歧义
- 吸引力:6/10 - 表达较为平淡,缺乏吸引力
- 说服力:7/10 - 有说服力,但不够强烈
- 可读性:10/10 - 可读性非常好
总分:8/10
优点:
- 表达清晰简洁
- 语言规范专业
- 可读性强
缺点:
- 吸引力不足,较平淡
- 说服力不够强
优化建议:
- 增强吸引力:可以使用更生动的表达,如"功能超强"、"超好用"
- 增强说服力:可以加入具体数据或案例,如"已有10万用户选择"
【版本B】 内容:"这款产品超好用,功能超强,上手超简单,界面超好看!赶紧来试试!"
各维度评分:
- 清晰度:8/10 - 表达较清晰,但"超"字重复使用略显冗余
- 吸引力:9/10 - 非常吸引人,活泼生动
- 说服力:8/10 - 说服力较强,有号召力
- 可读性:7/10 - 可读性较好,但"超"字重复略显啰嗦
总分:8/10
优点:
- 非常吸引人,活泼生动
- 有强烈的行动号召力
- 符合年轻受众喜好
缺点:
- "超"字重复使用略显冗余
- 专业性略低
优化建议:
- 减少"超"字的使用,避免重复
- 可以适当提升专业性,如将"超好用"改为"非常好用"
对比分析:
| 维度 | 版本A | 版本B | 胜出 |
|---|---|---|---|
| 清晰度 | 9/10 | 8/10 | 版本A |
| 吸引力 | 6/10 | 9/10 | 版本B |
| 说服力 | 7/10 | 8/10 | 版本B |
| 可读性 | 10/10 | 7/10 | 版本A |
综合对比:
- 版本A在清晰度和可读性上更优
- 版本B在吸引力和说服力上更优
- 两个版本各有优势,适合不同场景
版本排名:
-
综合评分排名: 第1名:版本A(8/10)和版本B(8/10)并列
-
场景适配排名(营销推广场景,吸引力和说服力权重更高): 第1名:版本B 第2名:版本A
选择建议:
-
如果目标是提升品牌形象和专业性: 推荐:版本A 理由:版本A更专业、更规范,适合品牌建设
-
如果目标是提升转化率和用户点击: 推荐:版本B 理由:版本B更具吸引力,有更强的行动号召力
-
如果目标受众是年轻群体: 推荐:版本B 理由:版本B的语言风格更符合年轻受众喜好
-
如果目标受众是商务人士: 推荐:版本A 理由:版本A更专业、更正式
组合优化建议:
可以考虑结合两个版本的优点,创建一个优化版本:
优化版本: "这款产品功能强大,非常好用,操作简单,界面友好。已有10万用户选择,赶紧来体验!"
优化要点:
- 保留版本B的吸引力:"这款"、"非常好用"、"赶紧来体验!"
- 保留版本A的专业性:"功能强大"、"操作简单"、"界面友好"
- 增加说服力:"已有10万用户选择"
示例2:多版本评估(营销推广场景)
输入:
versions: [ {"version_name": "版本A", "content": "产品限时特惠,原价299元,现在只需99元!", "version_info": "直接折扣型"}, {"version_name": "版本B", "content": "价值299元的产品,今天99元带回家!仅限今日!", "version_info": "限时强调型"}, {"version_name": "版本C", "content": "99元即可拥有价值299元的产品,还赠送VIP会员!", "version_info": "赠送优惠型"} ] evaluation_criteria: ["clarity", "engagement", "persuasion"] target_audience: "general" use_case: "marketing" evaluation_method: "both" provide_optimization_suggestions: true
输出:
【版本评估报告】
概述:
- 版本数量:3个
- 评估标准:清晰度、吸引力、说服力
- 目标受众:普通大众
- 使用场景:营销推广
各版本详细分析:
【版本A:直接折扣型】 内容:"产品限时特惠,原价299元,现在只需99元!"
各维度评分:
- 清晰度:10/10 - 非常清晰,价格信息一目了然
- 吸引力:7/10 - 有吸引力,但略显平淡
- 说服力:8/10 - 说服力较强,价格对比明显
总分:8.3/10
优点:
- 价格信息非常清晰
- 直接展示优惠力度
- 简洁明了
缺点:
- 吸引力不够强,缺乏情感冲击
- 缺少紧迫感
优化建议:
- 增强吸引力:可以加入情感元素,如"超值"、"必抢"
- 增强紧迫感:可以强调限时,如"今日特惠"、"仅限今日"
【版本B:限时强调型】 内容:"价值299元的产品,今天99元带回家!仅限今日!"
各维度评分:
- 清晰度:9/10 - 清晰明了,信息完整
- 吸引力:9/10 - 非常吸引人,情感冲击强
- 说服力:9/10 - 说服力很强,有紧迫感
总分:9/10
优点:
- 非常吸引人,情感冲击强
- 紧迫感强,激发购买冲动
- 表达生动,"带回家"很接地气
缺点:
- 基本无明显缺点
优化建议:
- 已经很优秀,可以保持
【版本C:赠送优惠型】 内容:"99元即可拥有价值299元的产品,还赠送VIP会员!"
各维度评分:
- 清晰度:8/10 - 较清晰,但信息稍多
- 吸引力:8/10 - 较有吸引力,有赠送亮点
- 说服力:9/10 - 说服力很强,赠送更有吸引力
总分:8.3/10
优点:
- 赠送增加了吸引力
- 性价比感知强
- 说服力强
缺点:
- 信息稍多,清晰度略逊于版本A和B
- 缺少紧迫感
优化建议:
- 增强紧迫感:可以加上"今日特惠"、"限时"等
- 提升清晰度:可以简化表达,如"99元=价值299元产品+VIP会员"
对比分析:
| 维度 | 版本A | 版本B | 版本C | 胜出 |
|---|---|---|---|---|
| 清晰度 | 10/10 | 9/10 | 8/10 | 版本A |
| 吸引力 | 7/10 | 9/10 | 8/10 | 版本B |
| 说服力 | 8/10 | 9/10 | 9/10 | 版本B&C |
综合对比:
- 版本A在清晰度上最优
- 版本B在吸引力和说服力上最优
- 版本C在说服力上表现优秀,赠送是亮点
版本排名:
-
综合评分排名: 第1名:版本B(9/10) 第2名:版本A和版本C(8.3/10)并列
-
场景适配排名(营销推广场景,吸引力和说服力权重更高): 第1名:版本B 第2名:版本C 第3名:版本A
选择建议:
-
如果目标是快速转化,强调紧迫感: 推荐:版本B 理由:版本B紧迫感最强,吸引力最大,最容易激发购买冲动
-
如果目标是传递超值感,强调性价比: 推荐:版本C 理由:版本C通过赠送,增强了超值感,性价比感知更强
-
如果目标是清晰传达信息,避免信息过载: 推荐:版本A 理由:版本A最清晰简洁,信息最容易理解
组合优化建议:
可以考虑结合版本B的紧迫感和版本C的赠送,创建一个终极版本:
终极优化版本: "价值299元的产品,今天99元带回家!还赠送VIP会员!仅限今日!"
优化要点:
- 保留版本B的紧迫感和生动表达:"今天"、"带回家"、"仅限今日!"
- 保留版本C的赠送亮点:"还赠送VIP会员!"
- 价格对比清晰:价值299元 vs 99元
示例3:评分评估(不提供优化建议)
输入:
versions: [ {"version_name": "版本A", "content": "人工智能技术正在改变我们的生活。"}, {"version_name": "版本B", "content": "AI技术正以前所未有的速度改变着我们的生活。"}, {"version_name": "版本C", "content": "人工智能技术的发展正在深刻影响着我们生活的方方面面。"} ] evaluation_criteria: ["clarity", "professionalism", "readability"] evaluation_method: "scoring" provide_optimization_suggestions: false
输出:
【版本评估报告】
概述:
- 版本数量:3个
- 评估标准:清晰度、专业性、可读性
- 目标受众:普通大众
- 使用场景:信息传达
各版本详细分析:
【版本A】 内容:"人工智能技术正在改变我们的生活。"
各维度评分:
- 清晰度:10/10 - 表达非常清晰,无歧义
- 专业性:8/10 - 使用规范术语,专业度较高
- 可读性:10/10 - 句子简洁,可读性非常好
总分:9.3/10
优点:
- 表达简洁清晰
- 术语使用规范
- 易于理解
缺点:
- 表达较为平淡,缺乏深度
【版本B】 内容:"AI技术正以前所未有的速度改变着我们的生活。"
各维度评分:
- 清晰度:8/10 - 表达较清晰,但"前所未有的速度"略显夸张
- 专业性:7/10 - "AI"是缩写,不如"人工智能"规范
- 可读性:9/10 - 句子略长,但可读性较好
总分:8/10
优点:
- 表达较为生动
- 有一定的感染力
缺点:
- 使用缩写"AI",不够规范
- "前所未有的速度"略显夸张
【版本C】 内容:"人工智能技术的发展正在深刻影响着我们生活的方方面面。"
各维度评分:
- 清晰度:7/10 - 表达略显冗长,"方方面面"稍显模糊
- 专业性:9/10 - 使用规范术语,表达专业
- 可读性:7/10 - 句子较长,可读性一般
总分:7.7/10
优点:
- 表达专业规范
- "深刻影响"有深度
缺点:
- 句子过长
- "方方面面"略显模糊,影响清晰度
版本排名:
综合评分排名: 第1名:版本A(9.3/10) 第2名:版本B(8/10) 第3名:版本C(7.7/10)
选择建议:
-
如果目标是简洁清晰地传达信息: 推荐:版本A 理由:版本A最简洁清晰,最易于理解
-
如果目标是表达生动,有感染力: 推荐:版本B 理由:版本B表达较为生动,有一定的感染力
-
如果目标是专业表达,有深度: 推荐:版本C 理由:版本C表达最为专业,有深度
-
综合推荐: 版本A的综合表现最优,最推荐使用
注意事项
-
评估是基于AI分析,仅供参考,最终决策应由人工判断
-
不同场景下,各评估标准的权重应有所调整
-
目标受众和使用场景对评估结果有重要影响,请准确填写
-
优化建议是基于当前版本提出的,仅供参考
-
评估结果可能与实际A/B测试结果存在差异,建议结合实际数据综合判断
参数调整提示
在生成内容后,如果对当前结果不满意,可以尝试调整以下参数:
💡 参数调整选项:
-
评估标准: clarity 清晰度 | engagement 吸引力 | persuasion 说服力 | professionalism 专业性 | creativity 创意性 | readability 可读性 | emotional_impact 情感影响力 | target_audience_fit 目标受众契合度
-
目标受众: general 普通大众 | professional 专业人士 | youth 年轻群体 | business 商务人士 | academic 学术界
-
使用场景: marketing 营销推广 | information 信息传达 | education 教育培训 | entertainment 娱乐 | brand_building 品牌建设
-
评估方法: comparative 对比评估 | scoring 评分评估 | both 对比+评分
-
是否提供优化建议: true 提供优化建议 | false 不提供
使用方式: 直接回复如 "重点评估吸引力和说服力" 或 "改为营销推广场景"
与其他技能的关联
-
review_text: 如果需要对单个版本进行全面审校,应使用此技能
-
rewrite_content: 如果需要对版本进行改写,可配合使用
-
check_style_consistency: 如果需要检查多个版本的风格一致性,应使用此技能
-
content_imitation: 如果需要让版本A模仿版本B的风格,可使用此技能
配置文件引用
-
intent_keywords: ["版本评估", "版本对比", "A/B测试", "版本选择", "多版本评估"]
-
evaluation_criteria_weights: 在config/evaluation_weights.json中定义不同场景下各评估标准的权重