在封闭的指标中,用户群的类型是固定的,所有用户类型构成了全部的用户整体,比如轻度用户、重度用户;男性用户,女性用户。但是这种划分方式维度可能过于单一,无法体现用户群的复杂性,并且不利于指标体系的补充改进和迭代。因此在研究中我们更倾向于采用开放性的分类方式,可以根据不同应用场景变更或者拓展指标。
开放式的指标体系包括用户人口属性、行为操作属性、态度偏好属性、用户价值属性等,用户的行为和态度是不断变化的。
在保证问卷效度的前提下,问卷设计还需要注意结合用户特征,以提高填答率以及数据准确率。比如,针对二次元用户,在用户群年龄结构偏小的前提下问卷不能太长,不能出现深奥的专业术语;同时问卷的语句表达以及页面风格也要相应调整,使其没有距离感。同时,注意筛除多次填答和注册的马甲账号问卷。此外还要注意新用户的占比,需要评估填答问卷中新注册用户的比例是否与投放期新用户正常增量一致。用户画像是否需要包含新用户取决于项目目的,也可以和产品方讨论后决定。
K均值聚类也称快速聚类,内存少,复杂程度低,快速高效,适用大数据量。但是需要提前明确分类数目,并对均值进行定义。只能对样本聚类,不能对变量聚类,样本的变量需是连续性变量。
层次聚类可以对变量聚类,也可以对样本聚类,可以是连续变量也可以是分类变量。能提供多种计算距离的方法,但是计算复杂度高,适用小数据量,我们需要结合项目的具体情况,包括项目周期、数据形式、数据量、聚类特征等等来确定聚类方法。
1. 依据产品经验,不同产品的典型用户不同
2. 根据已有的用户研究以及相关研究结论
3. 根据具体的分类效果确定
4. 根据层次聚类“步数——距离”拐点
但是,把数据还原成用户本身用户也需要遵循几个原则,画像(Persona)意味着一个令人信服的用户角色要满足七个条件:
P 代表基本性(Primary research)指该用户角色是否基于对真实用户的情景访谈。
E 代表移情性(Empathy)指用户角色中包含姓名、照片和产品相关的描述,该用户角色是否引同理心。
R 代表真实性(Realistic)指对那些每天与顾客打交道的人来说,用户角色是否看起来像真实人物。
S 代表独特性(Singular)每个用户是否是独特的,彼此很少有相似性。
O 代表目标性(Objectives)该用户角色是否包含与产品相关的高层次目标,是否包含关键词来描述该目标。
N 代表数量(Number)用户角色的数量是否足够少,以便设计团队能记住每个用户角色的姓名,以及其中的一个主要用户角色。
A 代表应用性(Applicable)设计团队是否能使用用户角色作为一种实用工具进行设计决策
注:Persona原则来源于Alan Cooper,https://plus.google.com/101097598357299353681/about
通过定量化的调研可以快速对用户建立一个精准的认识,对不同数量、不同特征的用户进行比较统计分析,在后期产品迭代改进的过程中可以将用户进行优先级排序,着重关注核心的、规模大的用户。但是,依靠数据这种偏定量的方式建立的用户画像依然是粗线条的,难以描述典型用户的生活情景、使用场景,难以挖掘用户情感倾向和行为操作背后的原因和深层次动机。因此,如果有足够精力和时间,后续可以对每类用户进行深入的访谈,将定量和定性的方法结合起来,建立的用户画像会更为精准和生动。