95%的准确率,使用大白AI打造企业级的知识库问答系统
大白AI最近上线了企业级的知识库问答系统,下面为大家浅析大白AI知识库系统的使用方法、运行原理、调优方向。
一、使用方法
目前大白AI的知识库问答系统只支持电脑桌面版,使用大白AI的桌面客户端或直接访问大白AI官网
Step1、在顶部菜单找到AI训练
Step2、点击【一分钟搭建您的专属AI】,进入机器人管理界面
Step3、创建机器人
Step4、添加知识库
Step5、添加知识库数据集
数据集支持两种导入模式:手动输入和文档导入
文档导入模式支持txt、doc、docx、pdf、md文件格式。注意:图片格式的pdf系统并不能识别。
导入数据后,系统会自动训练文档。
稍等几分钟后,系统训练完成
Step6、机器人关联知识库
回到机器人管理界面,在机器人上面点击设置
在基本配置一项中,选择刚才新增的知识库
搜索配置建议设置为:
(1)相似度:0.4
(2)单次搜索数量:4
Step7、点击机器人界面的【开始对话】按钮,进入对话聊天框
Step8、实验一下对话,结果非常准确。
提问:
这篇文档/知识库,主要讲的什么
回答:
根据提供的背景知识,这篇文档或知识库主要讲述了领导者如何提高执行力和团队协作能力的方法和技巧。它涵盖了多个章节,包括榜样的作用、沟通的重要性、组建有执行力的团队、做好团队中间的协调者、简化工作流程、科学的程序、激励员工以及时间管理等方面的内容。通过这些章节,读者可以学习到如何成为一个有效的领导者,提高团队的执行力和工作效率。
这篇文档的标题为《中层领导的105个执行细节》,大白AI总结的非常到位。
换个问题:
如何组建一支有执行力的团队
回答:
根据提供的背景知识,我可以给出一些建议来组建一支有执行力的团队:
1. 招聘合适的人才:在招聘过程中,要注重寻找具备执行力的候选人。这些候选人应该展现出积极主动、责任心强、善于解决问题和适应变化的能力。
2. 设定明确的目标和期望:团队成员需要清楚地了解他们的工作目标和预期结果。明确的目标可以激发执行力,使团队成员更加专注和努力地工作。
3. 建立有效的沟通渠道:良好的沟通是团队执行力的关键因素之一。建立开放、透明和及时的沟通渠道,鼓励团队成员分享想法、反馈问题和寻求支持。
4. 提供必要的培训和资源:为团队成员提供必要的培训和资源,以提升他们的技能和知识水平。这将增强他们的自信心和执行力,并帮助他们更好地完成任务。
5. 建立团队合作和信任:团队成员之间的合作和信任是高效执行的基础。通过促进团队合作、建立互相支持的氛围和鼓励团队成员分享经验和知识,可以增强团队的执行力。
6. 设定明确的责任和权力边界:每个团队成员都应该清楚自己的责任范围和决策权限。明确的责任和权力边界可以减少混乱和冲突,提高团队执行力。
7. 激励和奖励执行力:通过激励和奖励机制,如表扬、晋升和奖金,来认可和鼓励团队成员的执行力和优秀表现。这将激发他们的积极性和动力,进一步提高团队的执行力。
总之,组建一支有执行力的团队需要综合考虑人员选择、目标设定、沟通、培训、合作、责任和激励等方面的因素。以上建议可以帮助您打造一个高效、协作和具备执行力的团队。
语料库的内容是这样的
依然完美表现。
二、运行原理
大白AI处理知识库总共有以下几个流程
1、文档切割。目前大白AI切割长度为500tokens。
2、对切割的数据集做向量化并存储到向量数据库
3、用户提问,对用户问题做向量化
4、到知识库通过向量检索结果,取分值最高的n个结果组合(n为机器人设置项中单次搜索数量参数)
5、将返回的数据集与用户的提示词(prompt),一同提交给AI
6、返回AI的回答。
三、调优方向
我们对用户的咨询习惯做如下分类:
1、文档总结
2、细节咨询
下面分别讲解各分类的优化方向
1、文档总结
根据上述运行原理我们可知,如想得到最准确的文档总结,最好的方式是把整个文档丢给AI。而提示词:“告诉我这篇文档说了什么”或者“总结这篇文档”,向量化之后,再从数据库检索,匹配的内容相似度一定非常低,从而导致如果设置较高的相似度参数,则得到的结果条数会比较少。因此,对于文档总结类的需求,我们应降低机器人的搜索参数中的相似度参数值,经过我们的测试,这里比较合适的参数值建议为0.4。同理,如果设置的单次搜索数量参数过少,则影响丢给AI参考的内容长度,导致总结的内容不全面。但也不能过多,过多则可能超过AI入参的token最大长度,导致内容被截断。经过我们的测试,4条结果为比较合理的数值。
扩展:
优化算法:
可在对文档做向量化存储时,对每段内容做ai总结。当识别到用户的总结文档需求时,可将各段内容的总结全部取出,一起发给AI做最终总结。如此,可得到最完整的总结结果。
2、细节咨询
在上述的测试问题中,我们可以看到,大白AI可以较为完整的回答文档中出现的问题。但对于细节把控,可能会存在自由发挥的情况(不属于文档的内容)。
优化方向:
(1)限定AI的回答从文档库获取,限制AI自由发挥
(2)使用QA格式的训练语料。
由于篇幅关系,对于大白AI知识库的解析先到这里。我建了一个交流群,大家可以私信我进群参与讨论。赠送独家资料包。