返回目录:excel表格制作
关注天善智能,走好数据之路↑↑↑
欢迎关注天善智能微信公众号,我们是专注于商业智能BI,大数据,数据分析领域的垂直社区。
本文为小编学习天善学院李奇老师用数据说话-Excel BI商业智能分析零基础精讲课程第一章第五节笔记。
Excel商业智能分析中常用的到的五种方法:数据标准化、加权平均、转换变量类型、直方图、盒须图。
数据标准化
重要性:不同指标进行对比评价时,经常会遇到由于各指标间的性质,量纲,或者是数量级的不同而造成各指标间的水平相差很大时,直接用原始指标值进行数据分析,就会突出数值较高的指标在综合分析中的作用。为了保证结果的可靠性,需要对原始的指标数据进行标准化处理。
方法:主要介绍2种:
MIN-MAX标准化:新数据=(原数据-极小值)/(极大值-极小值)
注:原数据映射在0-1区间内,同意数量级,方便进行进一步比较、分析
Z-SCORE标准化:新数据=(原数据-均值)/标准差
注:围绕0上下波动,大于0说明高于平均水平,小于0说明低于平均水平。
利用交叉表求权重方法介绍:
1. 纵向和横向对比,横向重要则为1,纵向重要为0
2. 横向加总
3. 每个阶段合计值/合计总值*100%
实操部分:
连续型变量转有序型变量方法
变量类型:
1. 名义型变量: 值与值之间没有等级顺序之分,仅代表不同类的事物。
例: 性别、民族、职业
2. 有序型变量: 值与值之间有等级顺序之分,不仅能够代表事物的分类,还能代表事物按某种特性的排序。
例: 销售阶段、优良中差
3. 连续型变量:不仅能将变量区分类别和等级,而且可以确定变量之间的数量差别和间隔距离。
例: 营业额、身高、体重
实操:
频数与频率
频数是落在各类别中的数据个数。各类别频数与总频数之比称频率。频数和频率分别从绝对数和相对数上,反映出数据在各变量值上的分布状况。(学习直方图前了解这两个概念)
直方图:用来展现数据在不同组距间分布状态的图表
组距=(最大值-最小值)/组数
1. 选择数据
2. 设置接受区域
3. 调整频率分布
直方图与柱形图区别:柱形图看的是高度,对比数值,直方图看的是面积,组距内频率的分布情况,展现整体分布趋势。
实操:
调出数据分析库之后打开直方图
设置好参数
注意:此时显示的是频数而不是频率,需要调整一下。
设置好之后调整直方图,邮件调出数据系列格式,“分类间距”调为“0”。加上相应轮廓即可。
盒须图
盒须图用来体现数据分散情况,版本建议excel2016版。
四分位数:将数据由小到大排列并分成四等份,处于三个分割点位置的数值就是四分位数
上边缘 = Q3+1.5*(Q3-Q1)
下边缘 = Q1-1.5*(Q3-Q1)
通过盒须图,可以清晰发现一组数据的分散情况。
实战:
选中所有数据之后,找出所有图标中的“箱形图”
本章笔记就到这里,后续继续更新哈,欢迎大家关注。感兴趣的同学也可以留言一起交流学习,记得点赞哈。
更多精彩内容,请登陆天善学院:www.hellobi.com。