背景
在线私教产品,希望通过AI能力,提供更具个性化和拟人化的反馈和鼓励,帮助用户和产品建立起情感上的联结,进而提高用户运动频次。
主要的场景是
在运动课中,基于产品的运动识别和问题纠错能力,对用户进行反馈
在运动完成后,通过个性化的角色对用户进行整体的反馈
在内容上的应用流程
先用人工,输出N份预期的内容
-
让GPT基于输入的内容和输出的内容,输出相应的提示词模板
你是一个提示词的优化专家。
目标:帮我分析一个内容的对应的提示词。
输出规范:请根据下文中###中的格式,输出对应的提示词。
1. 角色/技能/个性(清晰简洁描述准确目标是做什么)
2. 任务目标
3. 具体的上下文,关键词,负面词
4. 输入的示例
5. 输出的示例
需要分析的内容: 针对提示词和输入内容进行基于少量数据的粗调,形成一轮GPT提示词
结合大批量的数据输入,生成大量的输出结果。基于部分的异常场景下,不合预期的内容,进行分类,并生成对应的二轮GPT提示词(注意,和一轮进行区分),然后进行相应的调整和处理
注意点:
-
提示词的输入量增大会带来输出内容的随机性增大,或出现内容空洞,相关内容较少
应对:
尝试不同维度类型的提示输入
把相应的需求进行轮次的拆分,比如把用户语言的理解和分类;针对不同类型的反馈,拆分成单独的GPT,然后加入对应的细化的要求
-
特殊场景的覆盖
有些时候,一些场景没有覆盖会带来一些非常严重的问题
<aside>
🗣 最近参加一个产品分享会,听到一个做GPT+心理的产品,因为没有增加自杀可能的预警,导致吃上了官司。</aside>
基于大量测试数据的导入,先通过人工筛选问题类型,然后通过GPT对大量输出内容进行评估,是否存在负向导向等问题,再进行相应的解决。
基于对于业务的理解,有些特殊情况,其实可以有所预期。
这里还有个同类的问题,虽然不大,但也很容易踩坑。基于GPT的内容,测试其实很难实现特殊情况的覆盖,导致一些问题会很容易到线上。
输入提示词要用英文,字数限制不要用字数
进一步,GPT在功能和推荐上的应用(设想中)
1. 输入:利用GPT对于用户场景和需求的理解能力,输出已定义的维度和分值。
2. 匹配:对于我们的内容和功能,形成相应的标签,描述,结合GPT加工后的输入,进行针对性的功能和内容推荐。
3. 调整:不太确定,是否必要
在输出的维度上,让GPT重新根据用户的原始信息和我们输出的内容,进行一轮校验
1)是在匹配性上,是否和输入的内容足够相关
可以以一个分值的形式进行呈现,筛选过低的情况
2)是在发散性上,是否存在GPT自身臆造的无关内容
这个需要用是否来判断,是否有无关内容出现
3)是合规性上,是否可能存在一些不符合法律法规或文化价值观上,或一些风险性的内容。如今天听到的用GPT做心理,竟然没做最基础的自杀风险评估,甚至引导向自杀方向上。
这块有两条路径,一种是制定大的原则,然后进行延伸;
另一种是,不断增加各种情况的检测,并增加相应提示词进行排除