需求挖掘第一步:如何做高质量的需求调研-尚媛媛
第一个主题,问卷调研的使用场景。
例如很多问题是不能通过问卷调研提供的,必须得找用户进行深度沟通,才能够获得,所以这是第一步
第二个问题,要区分问卷法和标准量表的实验场景,例如满意度,的题目,前面已经总结了非常标准的量表,可以直接拿来用。
第三个如何收集行为信息态度的信息,意见类的信息。
第四个如何来判断,我的信息是否有效还是随便乱填的,这是有方法的。
第五个,收集起来的数据如何去分析
个人思考:
提纲部分非常清晰,逻辑清楚,全面覆盖整问卷调研的全部
第一部分什么样的研究问题需要问卷调研呢?
问题分为两类,一类是为什么的问题?一类是什么的问题?
为什么的问题适合于用问卷调研做,这是属于量化的,它主要是研究相关因素,和研究影响因素的,比如说用户会有哪些类型?为什么会有这几类,又比如说,胖子是如何形成的,是有哪几种因素所造成的这是为什么的问题,而是什么的问题呢?
而是什么的问题不适合用部队调研,而是适用于深度访谈深度沟通,例如健身对你来说意味着什么?你是如何使用健身软件?这些事属于是什么的问题。还有就是焦点小组,深度访谈是一对一交,焦点小组访谈是一对多。
个人思考:
学习工具第一步不要了解这个工具的使用场景以及局限性,不能因为一个好用的工具而什么问题都用这个工具。
问卷的优势和弊端:
优势是标准化,操作方便,调查面广,分析,结果可量化,成本低,而且速度快
问卷发放的弊端,手机端上的题目非常有限(一般手机端上的题目控制是十五到以内),调查的很广却不深,同时,调查质量不一致。很多问题没办法深入。虽然我们可以把链接发给更多人,可是无法深入获取信息,第三个质量无法,把控用户他放弃你也没办法,第四,要求被调查者的文化水平,如果我们的,用户是货车司机以小学水平为主,那么有些问卷理解起来就会比较吃力。
第三部分,问卷的使用场景。
问卷是由一系列的问题构成,可以用收集态度方面的信息,行为性的信息,事实性的信息。我们的问卷是为目标服务的,而不是先投放出去,回头再看看先得出什么结论,否则这就是一场失败调查,
1、态度方面,比如说,调查,对活动的满意度,对社区的运营内容的偏好,视觉觉得好看与否。
2、行为信息方面,在做需求挖掘的时候。需要了解清楚,用户在家庭使用的时候的行为习惯,包括,如果用户没有相关信息,遇到这样的痛点,通过什么样的行为方式去解决,包括产品的时候?用自己的产品之后。
3、意见类的信息,主要是产品功能的意见反馈,例如吃饭咯,就餐的意见,智能硬件,售后的意见反馈等
第二部分,区分问卷法和标准量表产品。
1.两者的区别,编写是否有足够的发挥空间,
问卷的时候,它只是一堆问题的集合;但是量表,一个是非常困难的,一般需要几年时间,需要许许多多的数据工作,还有信度和效度的问题,需要,长期的检验,得到行业专家的认可,才可以正式使用。量表示非常养个
2.问题的题型和答案的类型上是有区别的,
量表的选项是代表对问题的程度,例如这是一个量表的问题,首先,题目会说一个陈述句,比如,我是一个非常漂亮的人,这个时候,用户来选择认同的程度,多大程度认同这句话,一代表非常不同意,二代表不同意,三,代表不确定,四,代表,同意代表,非常同意。
问卷的题目,是一个问题答案,比如说,大学可以做一个问卷调查,你认为学校,开设公开课的目的是什么?答案各种各样的目的,选择,比如a,公开课,b提高知识面,c,增加学分,公开课,客观,d,其他
3.三。回收的数据类型不一样,
从分析的角度来看,通过量表收集的数据,可以认为是等比数据,123456789,可以进行加减乘除运算,问卷调查的数据,称之为类比数据。问卷调查只能同进出某一个问题出现的频率,出现的这个比例,而数据却能够通过加减乘除的计算,得出平均分,例如,多少人认为自己的漂亮,他推算出一个平均分。
4.四,数据分析方式不一样
个人思考:
原来只知道问卷调研,不知道还有量表这个东西的存在。结合上次蓝山老师讲的聪明人如何更好的学习,有一个观点是学习的原点,量表就是问卷调研里面的学习原点。站在巨人的肩膀上更快的的学习
第二部分,量表的使用技巧
一、评分量表在用户体验中的应用
基本上产品使用场景:量表在用户体验当中的应用分为几个模块:
第一,我们会让客户在产品易用性上机测试,
第二,在文案的易懂性,进行测试,
第三,第三,对某些使用方法的知晓程度上,
第四,第四,娱乐游戏,
第五,对视觉吸引力,
第六,对产品的整体满意度进行测试。
第一张Likert量表,第二个语义差异量表,这是两个经典的评分量表,
李科特量表:
首先是阐述一个观点,例如产品的界面,美观,然后让用户,选择他的同意程度,从非常不同意到非常同意,然后选择其中的一个分数。
在阐述,一个观点的时候,注意遣词造句。不能使用一些误解的词汇和牵动用户的词汇。例如问:产品界面美观就好了,而不能写产品界面非常美观,这就会容易造成误解。
语义差异量表
他是表达了一个问题,选择这个问题的时候,再看一看,答案,两个极端给出了一对反义词,然后在中间,选择一个你认同的程度,比如你认为这个设计师如何,最差的话是业余。最好的话是专业,会让你从两者之间,选择一个区分,大家可以看到,这边对它的题目,回答,注意事项进行了阐述,在磊哥特量表的注意事项是,
接下来讲几种使用场景的应用量表。这主要是从“用户体验度量”的书籍
用的比较多的是,sumi软件可用性测试和sus软件可用性问卷,还有是任务问卷评估,这里的问卷评估问卷,有针对难易程度,也有针对用户,操作这个任务的时候的脑力负荷,也有难度期望的评估,第三块,是网站感知评估问卷,相当于网站可用性测试问卷,还有就是nps净推荐值测试。顺便给大家介绍一下,tam技术接受模型。是什么样的因素会影响用户,是否愿意接受?会使用,这项技术或者这款产品,如果大家需要做这方面的研究,可以用这方面的模型
个人思考:
将常见的问题场景进行分类,不同的分类其实已经有了很多非常有效的量表,在进行问卷调研的时候,应该对问卷调研的进行分类,找到合适的量表,如果实在找不到,才要进行自行设计。
大家在问卷设计的时候要提前看一看,有哪些量表可以用,如果实在找不到,需要自己设计,需要注意事项:
第一,一个问题需要进行多维度的拆解细分,不然很容易提出一个很宽泛的概念,用户不能准确地评估自己的态度给出分数,比如询问用户对界面设计的满意度的评分?这个对于用户来说,是很难的,因为包含的内容太多,色彩,图标颜色,行间距,排版等等等等,如果你问用户如此宽泛的问题,用户很难给出。
第二,等级的书数量,要为奇数,1到5分,1到7分,因为基数必然有一个中间项,因为会设为不确定,这样会缓解用户的一种压力,因为,当用户实在无法判断,就可以选择中间项
第三。建议大家用七点量表,虽然,12345比较顺手,但是研究结果证明,七点量表,精确度会更高,并非标标点数越高越好,因为越高,用户无法准确判断自己的态度,
第四,七点量表表以下,就不要在用户选择的圆圈圈上,附上等级数字,只需要给两个极端,非常不满意,非常满意,中间有五个点,就好了,就不需要标分数,标注分数后。当用到九点,十点,让标标分数后,就必须得标分数,这样可以节省,用户的,选择时间。
个人思考:
问卷调研是一个科学性和心理学想结合的学问,一个小小的细节,可能可以让同样的人对同样的答案得出完全不同的结果。例如选项数字要奇数,原来觉得这仅仅是对称,现在才知道中间项可以给被调研者选择的缓解。另外什么时候要表明数字,什么时候不需要表明数字,这里面也有非常大的讲究。
第三部分,收集数据的方式及优缺点
第一,用户只需要进行口头回答
一般有研究员代为填写,第一种,进行街头来访,第二种,电话访问
由研究员口述,用户回答,这个时候对研究员进行系统培训,每个人对问题的口述表达方式不一样,就会造成很大的误差,这种方式对用户来说非常方便,对研究员,需要提升。这种情况非常适合,理解力比较低的人,文化水平比较低的人来做。这种方式对于研究员,确实比较痛苦,因为在手工录入问卷,其实是非常繁琐的过程,
其次担心用户,先给我们低分,因为在面对面的沟通,他需要口头报出分数,可能会不太好意思,查过就不知道比较准确的分数
最后是这个方法对调查员的口头沟通表达能力要求非常高。
第二,第二种用户用纸和笔自己填写,分成两类,一种用户当面填写,第二种,通过邮寄,把问卷邮寄给用户。当面填写比较多。好处就在于,用户只需要看指导语就好了,这个时候可以减少,调用者给用户带来的误差现场的话我们可以对用户的意见,同时可以观察,用户当时使用产品的情况,或者生活的环境,辅助问卷进行现场分析,那么缺点是,纸质问卷的排版比较麻烦,问卷需要手工录入。
第三,在线自己填写,这是覆盖范围最广,可以大量,填写,因为没有纸质需要打印,所以比较环保,现在很多平台,在线制作,很方便,缺陷是,要求用户一定要求在网络的情况下,完成的,包括问卷星的平台,在使用之后,会让用户进行抽奖,这样会让我对用户进行投诉,把抽象当作我们公司给他们的,问下问卷填写福利。如果在线填写,用户中途放弃,我们是没有办法控制,而现场的话呢,我们可以通过鼓励给礼品,让大家填完。
第三部分介绍一下,行为类,态度类,意见类信息收集。
1、行为类问题,问人们的特征,做过的事情,在他们身上再发生过的事情,这些,可以用来旁观者,和身边的朋友证实
2、态度问题,为用户的心理状态和态度,这些事没有办法被证实,仅存于用户个人心中,而态度问题,不同的问法,产生不同的答案,一旦问题问得不好,很可能问卷作废
3、第三,意见问题,意见和态度,并没有非常差的,因为发现,有时候态度和意见其实是一样的。如何区别,问卷中,意见类是用一个问题来问的,而态度,需要一组,或者是一系列问题,来组成一个态度问题,而且态度,需要把这些组合在一起进行分析,态度类的问题,适合量表来进行调研。
第一,行为类信息的问题和答案设计
用户行为分析,是产品设计最关心的,包括对用户使用产品的,所有的数据,下载量,使用频率,访问量,都会通过第三方平台,或者后台埋点进行统计。这个问题的收集统计,主要用来发现用户使用产品的规律。可是很多时候,数据是无法通过后台埋点来获取的,例如,用户在使用竞品的时候的行为习惯,当产品仅仅为概念的时候,是否解决了用户身上是否发生了痛点,例如后台数据,用户只能提供几点几分进行了操作,还没有办法告诉你用户为什么中断而离开,以上这些,需要通过问卷的收集。
首先应该有大的调研目标,因为调研目标比较大,一般对目标进行拆分,通过哪些信息能够间接达到调研目的,例如行为类的调研目的进行拆分?一般会考虑,用户的属性,用户的使用情况,使用场景,使用动机是什么?会通过这些问题的采访完成。最喜欢那个标的收集工作。这些问题进行参与后,可以拆分成个个信息点,例如用户属性,包括姓名,联系,职业,教育程度,然后在设计问题的时候,需要想好具体提出,什么样的问题,可以获取到这些信息,在设置问题的时候,需要尽量的明确,何人何事?为什么,如何做,举个例子,例如,你的老板,调查用户在竞品的时候习惯,首先需要想的事,用户这些相关的竞品有哪些,需要先收集,然后才能再一步的确定,用户使用的竞品有哪些?通过第一步,我们需要收集用户的种类,前期需要发放一个开放式问题,用户会用哪些产品的类型,开放式的问题,这需要问用户,你使用过哪些竞品?收集回来之后,进行整理和归纳,接下来归类,在设计半封闭式的问题进行调研,让用户具体选择这些竞品使用的频次和人群。如果你想具体使用一款用户选择最多的产品使用最多的产品,让用户单选题即可,如果多去了解,可以用的多选题。
第三让用户进行排名排名
通过前两步了解到哪些竞品最受用户欢迎,你想调查的具体的某款竞品之后,再可以通过逻辑关系的问题,我第二步就是管理,例如具体用户在电商类产品中,使用过淘宝,第三个问题,用户在淘宝上的使用情况,这个时候设计一个逻辑题,这一选项中,要选择是,才能出现下一道题,的出现,如果否,下一道题就,不出现。
个人思考:
我们往往在收到一个任务的时候,非常有可能直接奔着最终的测试结果目标进行设计问卷,而没有很好的去对问题本身进行拆解。这里非常好的提醒大家着一定,大问题一定要拆解成小目标。从不同的侧面和子维度进行调研,然后才能汇总成大问题的调研结果。
大家看一下这两个问题:
1.你的问题是否具有威胁性?
无论什么问题,尤其关于行为类问题,可能最直接和最常见的,这么简单的一个事情,很容易出错,例如可能问:您现在开的车是自己的还是公司的,汽车保研购买什么牌子的机油?
这种问题被用户视为威胁性,排斥,会使用户感到不安。因为真实回答,会暴露不太光彩的一面,会让报告失真。
例如货车司机:问学历问题,会有虚报现象。所以社交关系、活动轨迹、家庭收入都算为威胁性问题
2.如何判断一个问题具有威胁性
有时候一个问题,对于特定的人群具有威胁性,所以不能一概而论。我们只能判断一个问题对于大多数人而言,是否具有威胁性。问自己:用户会不会认为这个问题的答案有对错之分?是否答案是否符合社会期许的?例如捐款次数
答案是反社会的,会少报。例如一年几次醉酒驾驶。
参考一下做过相似问题调研的经验,无经验的时候,找部分用户进行一些测试。
个人思考:
威胁性问题非常容易出现,还有一种就是认知类问题,例如问:你相信电视广告吗?很多人会选择不相信。可是在实际的购物过程当中,客户的选择购买很多时候在不知不觉当中,被电视广告所洗脑。例如脑白金、恒源祥等广告,已经深入人心
1、无威胁性问题设计
采用辅助记忆方法:在问题设计的时候,把回忆的线索作为组成部分。您使用过哪一些app社交:微信、qq,竟可能列举所有的可能性
l让问题变得具体:填写人会花很多心思思考,举例:你通常买什么饮料?通常指的是什么时候?这个就会比较模糊
l选择恰当的时间段:询问用户非常重要的事情,在题目的内容时间涵盖上,时间扩展的而要长一些。例如重要的事情发生的频率不高。另外用户的会议,比较重要的时间,把问题设计范围更广一些。买房:十年之内,买房的次数。医疗:最近一年的花费,而不是问一个月
l学会使用日志和追踪研究:例如家电、智能硬件等可以通过用户写日记的方式记录相关事件,用在经常发生,不太显眼的。成本高,但是想获得精确、细节信息,高频率发生,又不太显眼,可以使用这种方法
l确定问题的适当长度?
如果你希望用户通过问题对自己行为和发生的事件进行回忆,设计比较长好一些。可以帮助用户更好的回忆,心理学:回答问题的长度和提问的问题长度也是有关的。开放式问题,非常有用的结论。
2、威胁性问题设计
l采用自填的方法,研究员不看。例如捐款这种情况
l使用开放性的问题,很多时候封闭式的问题比较好处理,但是如果是威胁性问题,要用开放式的问题。因为所有封闭式问题有逻辑顺序,例如从最不平凡,到平凡,两端是极端的数值。一般用户会避免选择两边的极端。一旦用户有这种心理,威胁性问题更会出现低报的情况
l嵌入问题:如果用户先问一个更具有威胁性的问题,下一个问题哪怕有威胁性问题,可以降低。例如醉酒问题之前,可以问一个杀人问题。副作用:如果用户面对如此高威胁性问题,后续就不会很好的配合
举例:想了解用户的竞品使用情况,请问您使用哪款软件炒股?
1、他到底想问我什么场景呢?手机上、电脑上还是股吧里面用的
2、他是问我最喜欢的还是最常用的还是最近的?
3、时间频率规定不清楚?上个月还是这个月用的?
选项要用半封闭的问题选择填写,或者针对不同用户随机排列,很多人喜欢专门排名第二或第三的答案。
举例:了解用户是否有场景性问题,需求挖据。加油的时候用于支付的APP,了解用户是否在加油的嗓唱没带零钱
你经常发现加油时候没带零钱?
1、经常如何判断?
2、问法的诱导性太强?问我对吗?很多人说对
是否曾经发生过至少一次,确定之后再确定发生的频率,一周月还是年?然后再由研究员判断
需求类和场景调研类的问题,不能让用户自己的判断何为经常。
个人思考:
威胁类问卷设计考研的完全是心理战,让被调研者的能够放心的真实表达自己的想法,不被问卷的题目诱导性的给出答案,也不会担心其他问题而可以隐瞒。这里面还需要做到的例如保密性原则,例如纸质版问卷我们收集起来之后会进行密封处理,填写的时候匿名处理等等
第二个部分:关于态度的问题
1、认知:由用户的信念决定的:例如以下的维度上,产品是如何帮你实现。。。。这个时候就是用户对产品的认知
2、评价:用户对某个个体的态度,好还是不好,喜欢还是不喜欢。
3、行为:回答用户自己回答和行动态度有关的,例如下次你将使用什么产品去听歌?对于自己行动的判断态度的判断。
态度可以分为三个方面
态度目标拆分的时候,避免问题的一般化,维度进行拆分。了解产品满意度的调研,可以按照功能拆分,可以按照业务方向的:在社交、娱乐方面的帮助,还可以体验:交互、视觉的满意度。功能上:投诉处理问题等等
不同的拆解大家要多尝试,看看哪一种可以让客户得到更好的答案。
态度问题和行为问题一样,会问到敏感性的问题,如果问题对研究非常有价值,不要直接提敏感性问题,例如个人利益和隐私,风俗习惯等等问题,都是敏感问题。三种方法:
1.转移对象发:不要直接问用户对这个观点的看法,社会上有几种看法,你同意哪一种
2.假定方法:二胎政策开放,之前二胎不认可。假设政府不再对人口限制,您希望生几个孩子。
3、提供背景信息:直接问你平时会用安全套吗?如果问:肯定和这个问题相关性,例如现在社会上普通采用安全套和避孕药两种方法,安全套维护健康方面比避孕药更好,您平时使用安全套吗?不会决定很突兀
态度类问题的几种形式:
1、是非型
2、选项型
3、用户给答案排序
4、认同程度等级选择
5、一堆反义词的量表
6、模拟:用情绪头像代替情绪
态度类选题注意事项:
1、穷尽并且相互独立
2、按照统一维度标准设计问题
3、前后选项要堆成
案例:
1.您喜欢用哪种类型APP:设计类、手游类、社交类,这个是无穷尽和相互独立
2.您觉得APP使用起来:简单便捷、有点麻烦,这个是没有按照维度标准分类,便捷应该是非常便捷、比较便捷等等
3.您认为新上线的功能:非常出色、很好、一般、不太好。这个是前后不对称
个人思考:
态度类问题是测量当中一个难点,需要将脑海中的概念进行量化。三种涉及敏感类问题的解决方案非常巧妙
第三种问题:意见类问题
基本上有一道开放式问题决定的。你想深入了解某一种特殊主题,非常有价值。想研究某个领域也是这个问卷方式。
优势:用户自由表达自己的意见,用自己熟悉的语言表达自己的观点。缺点是标准化程度低,后续需要归类和编码,分类提取
举例:你问***功能的意见是?
一般性在收集开放式问题之后,进行归类和编码,如果需要进一步验证,会通过多选和排序进行验证。优点是选择轻松,标准化程度高,缺点是意见受限。
举例:你觉得需要改进的三个是?这个是多选题和排序题
设计意见类问题,大家要考虑清楚,是否需要进行预编码?
举例:请问你对**产品的意见是什么?
1.在界面方面。。
2.在功能方面。。
如果不进行编码,就让客户自己填写就好了。经常做的进行预编码,这样用户的考虑方面会比较,没有预编码的好处就是可以得到更广泛的信息。
编码的流程图:
1.预编码:是否提供一级编码共用户选择?如果不需要编码,建立语料库
2.根据准备好的语料库对文本进行归类,或者直接按照内容出现的词频归类
3.检验编码是否合适?第一请其他同事为一模一样的资料进行编码,对比结构是否一致,第二一分为二,50%用户建立编码库,另外一半建立另外一个做对比。我经常要修改编码,分类修改。在进行第二次第三次调研,很多编码的工具在重构编码的时候非常方便。
三个编码工具:R、Nvivo、Atiasti
个人思考:
原来往往认为开放性问题就无法控制,所以基本涉及开放性问卷的设计都非常头疼,这里提供了一个预编码的设计流程,既在一定程度上保证了问题的开放性,有把调研对象的答案控制在一定范围内。非常好
第四部分:
如何判断问卷质量?
1、可信度和效度
一个好的研究具备可靠性和有效性两个特点,统计学叫做信度和效度。信度:测量结果是否一致稳定可靠?举例:我妈让我去买糖,第一次买了两斤,第二次买了三斤,这就不稳定。效度:能够在多大程度上测量了你想测量的事物,例如买糖结果买了味精。
2、如何测量结果具有稳定和一致性
问卷针对用户做两次或者多次调研,结果一直,说明高信度。信度会受到问卷设计的影响,后续很少为了验证再做一次同样客户的调研。那么如何评估呢?
a/跨时间的一致性
稳定系数,测试前作为预测是,如果是稳定的关系,就是跨时间的一致性。访谈:首次访谈和后续的跟踪访谈一直,说明是一致性的。我们不太会说让用户填写两次,我们一般先进行问卷填写+后续进行回访。回访的人数尽量进行全面回访,如果题目数量比较大,选择重点问题。
b/跨形式的一致性
例如:同样的问题,看看这个人胖瘦,可以通过不同问题:体重、衣服大小,本质上都是想了解胖瘦,可以设计多个不同形式问题提问。如果答案一样,就是跨形式一致性
c/内在一致性:用的最多最方便
用来测量统一概念下,不同题目之间的关联性。用的比较多的态度评分量表和需求属性的评分
例如:用户界面的设计满意度评分,视觉效果,图标大小,可以归纳为用户界面满意度的。
用内在一致性表示的信度:spss工具的操作界面,可以一步做出效果
UI满意度是第一列,交互满意度+功能满意度评分,输入数据可以直接得到一致性。这个例子结果是0.177
α系数如果低于0.6,内部一致性不足;
0.7-0.8具有相当信度
大于0.9信度相当好
不同领域标准不一样,平时实物性研究,具体了解功能的满意度,探索性研究主要是了解一个新功能,用户的使用需求点,这种一般大于0.6就可以用了,
基础研究或者学术研究,会对这个系数比较高,要求0.8以上
3、是否测量了真正想要的东西?如何判断(效度)
检测问卷有效性上,效度用的不多。信度是主要的,效度的真正含义是否策略了老板本来就像知道的东西。例如我想调研不同手机用户
同样互联网在线形式的问卷,对于白领合适,而对家庭主妇进行调研就很难获得想要的东西。由于通畅情况,无法知道真正有效,所以很难有效。三大类:
a/准则关联效度:自己测量的结果和公认结果进行比较。例如通过后台数据看出用户在线时长平均值,如果调研结果比较接近,就是比较好。行为类问题比较好判断,态度类的比较难。
b/内容效度:一般用子态度评分,需求评分,设计一个总问题,:用户界面满意度:分类问题可以是颜色、敏感、字体大小。总问题满意度和子问题满意度得分进行关联,就能知道内容效度的强弱。但是要求问卷里面有同质性很强的问卷,经常用到的是态度评分和需求评分
c/结构效度:每份问卷都会有自己的内部结构,例如产品上线后的满意度,就会涉及ui界面的满意度,交互的满意度、操作流畅度等多个维度,下面会涉及相关问题进行调查。
看的是设计的子维度在结果上,是否归结为一个维度。一般用因素分析法,属于一种进阶性的统计分析。
互联网企业,讲究敏捷开发,很多时候做的实物研究,不会太考虑效度,一般通过经验,来权衡设计的效度。
个人思考:
整体内容详实,有方法有案例有步骤,还有第五部分没有分享,继续等待!
这是我在怒马21天受虐计划的第5天。笔记内容来自:需求挖掘第一步:如何做高质量的需求调研-尚媛媛