排名是指按照某种规则对数据进行排序,并将其分配一个排名序号的过程。
数据工厂中的排名数据将以新增列的形式添加至数据列表中,新增的数据列为数值类型。
在数据分析中,排名通常用于比较和评估数据中的不同变量之间的差异。排名可以按照升序或降序进行排序,以便确定每个数据值在整个数据源中的位置。数据排名可以帮助分析人员发现数据中的异常值、趋势和模式,并为决策提供有用的信息。
如,销售员业绩排名、学生成绩按【班级】分组排名等。
下图为同一年级两个班级的学生在各自班级中的成绩排名情况:
在数据工厂功能入口处「新建数据流」,如下图所示:
选择需要进行排名的数据源表单:
为数据流添加一个字段设置节点用于排名计算:
点击计算字段的「排名」,可以添加一个排名字段,排名字段支持以下设置:
注:
1)排名字段和分组字段均可添加 10 个字段。
2)排名字段支持数字和日期时间这两种字段类型。
3)排名方式支持升序、降序。
添加好的排名字段还可以进一步编辑修改以及删除:
无分组的情况下,全量数据从 1 开始排名。比如,年级里的所有学生成绩通过一张表展示成绩,所有班级的学生按照成绩高低排名。排名效果如下图所示:
有分组的情况下,会在各自的分组内从 1 开始排名。比如,年级里的所有学生成绩通过一张表展示成绩,同一个班级的学生按照成绩高低排名,班级即为分组字段。排名效果如下图所示:
1)添加的排名字段输出的数据结果为数值类型,支持被计算字段二次计算。
2)同一分组下,数据相同的,排名相同。