说到数据分析,不少人都联想到各种软件工具。让很多人深陷书海无法自拔。常常会问究竟要学到什么程度才能算的上真正懂了?我们先从excel讲起!
一、 .excel是干啥的?
excel不是数据分析的专用工具。excel只是一个处理表格的基本工具,除了简单的制作表格以外,基于表格的数据计算、数据图表绘制、统计学/运筹学公式,excel都有包含。并且,完全不需要写代码就能使用,上手难度极低。
二、 excel对数据分析有啥用?
先问一句:数据分析的工作是啥?
简单来说,有5部分:
存储原始数据
按要求提取数据
按要求计算数据
将数据做成图表
解读数据,得出结论
这五个部分,用excel都能实现。并且,excel操作非常简单,因此很适合作为数据新人的启蒙工具。
那么,怎么算懂excel呢?
三、 怎么算懂excel?
理论上,100%搞懂excel的所有功能是不太可能的,君不见单单讲excel函数的书都有几百页厚。而且,也没必要100%搞明白,作为一个数据新人启蒙的工具,想搞懂excel,关键是搞懂四大基础操作。
操作1:建表。没有数据分析习惯的人,在excel里呈现数据,写的是他最终使用数据的样子。但是这样形式太固化,无法重复使用,因此经常引起反反复复的提数。有数据分析习惯的人,区分维度和指标,可以轻松进行计算,数据操作效率非常高。
操作二:清晰指标计算/汇总计算。有数据分析习惯的人,在做excel的时候,很清楚自己是在计算一个新指标,还是汇总一个旧指标整体数据。这样的习惯,能在计算的时候清晰指标间逻辑关系,不但不容易出错,而且可以基于新衍生的分类标签/指标,做更多分析。
操作三:熟练使用数据透视表。数据透视表是excel数据分析的核心功能,熟练掌握,不但计算速度更快,而且对理解数据聚合的概念有奇效。
操作四:根据需求挑选合适的图表。做一张图很容易,但是根据实际需要选择图表,才是数据分析人员的要求。
掌握了上边四大操作,就已经能把一个数据萌新与财务、hr区分开。因为此时,你已经不会横着竖着乱摆数据,而是按一定逻辑,规范处理数据。这四大操作,在后续学习sql,python等工具的时候,还会遇到。到时候完全可以对照excel的操作进行理解。
相比之下,excel有些看似复杂的操作,比如统计学/财务函数,比如线性规划工具箱、统计检验工具,线性回归模型等。虽然背后的原理很复杂,但是操作上都是套公式计算而已,有实际需求的时候再了解即可。为了复杂而复杂,就没必要了。
四、 从懂excel到数据分析
单纯懂excel,还不足以做数据分析。因为现实中的数据分析问题,常常是口语化的,随意的,比如:
“小熊妹,最近的销售情况怎么样?”
“小熊妹,为什么这次活动比上次效果差?”
“小熊妹,预测下下个月业绩有多少?”
excel里可没有一个按钮能直接点出上边几个问题的答案,需要我们自己转化问题。
常见的需求有三种:
需求一:提供数据。比如“小熊妹,最近的销售情况怎么样?”此时我们应该确认统计数据的分类维度与指标。然后做成excel示例,让需求方确认格式正确后,再到数据库里提取数据(如下图)。
需求二:对比分析。比如“小熊妹,为什么这次活动比上次效果差?”此时要把下面三个问题讨论清楚, 做好excel示例,再对应提取数据(如下图):
谁和谁进行对比
对比哪些指标
是否要分类
需求三:预测分析。比如“小熊妹,预测一下下个月业绩有多少?”此时需要业务方选择,用业务模型来预测,还是用算法模型预测。如果采用业务模型预测,则需把业务逻辑、假设情况等要素提前在excel里做好(如下图)。
如果是算法模型,那么简单的时间序列/回归模型,可以直接在excel里进行计算(如下图)。
当然,复杂的模型,还是上spss/python吧,别难为excel。
这样转化以后,才能将excel操作运用到数据分析工作之中。
不过,以上只是简单示例,现实中数据分析问题,可能更复杂。因此也更需要一开始就在excel里打好样板,让业务方看到输出物的样子,确认符合需求。避免自己埋头苦干,写了几天代码结果被人喷:“你这分析的都是啥呀!”那就太惨了。excel作为业务和技术人员沟通的桥梁,着实好用。
五、 为什么excel没有被取代
随着数据量增大,存储原始数据的任务一般交给数据库。提取、计算也可以使用sql、python等工具完成。因此excel在今天,用处大大减少。但这仍然不能撼动它的地位。因为它还有三大额外优势:
优势一:能处理各种零散数据。比如调查问卷,比如从公众号、天猫、抖音后台导出的数据,比如外部ppt里附带数据。这些都很难入数据库,可以通过excel统一处理。此时,需要进一步掌握excel数据清洗的常用函数,比如:concat(链接字符串),replace(替换内容)vlookup(匹配字段)等等。
优势二:方便业务部门自行计算。很多时候,业务喜欢自己做计算,此时可以把业务想计算的分类维度、指标准备好,然后教业务方使用数据透视表,想计算啥,就计算啥。 省的老找我们一遍遍跑数
优势三:做好的图能直接排在ppt里。写报告省事。这个就不都说了。
总之,即使技术再进步,excel也不会轻易被淘汰的。以上就是今天的分享,喜欢的小伙伴,记得转发 在看 点赞三连。
本文由上海山外山机电工程科技有限公司原创,转载时请注名:
开云网站,可靠性分析网址:
开云网站