今天这篇文章来聊聊如何轻松学习『Python数据分析』,我会以一个数据分析师的角度去聊聊做数据分析到底有没有必要学习编程、学习Python,如果有必要,又该如何学习才能做到毫不费力。

201910171186%20%281%29data:image/gif;base64,R0lGODlhAQABAPABAP///wAAACH5BAEKAAAALAAAAAABAAEAAAICRAEAOw==

1.实际的工作

201910171186%20%282%29data:image/gif;base64,R0lGODlhAQABAPABAP///wAAACH5BAEKAAAALAAAAAABAAEAAAICRAEAOw==


如果你是一名数据分析师,我相信你对上面的这些词应该不陌生。我自己在刚开始做数据分析的时候,基本上每天就是Excel,就是Excel里面的vlookup、sumifs、数据透视表这些,sql都不怎么用,因为很多数据都是直接从ba系统,就是选择你要的指标,然后点击下载按钮就行,根本不需要去数据库取,那个时候就是一个纯粹的『表哥』。刚开始还好,没有太多想法,觉得很多事情都会有一个过度过程嘛,但是做了一段时间以后,现状并没有发生太大的变化,我依旧还是每天在做excel。

2.理想的工作

 

201910171186%20%283%29data:image/gif;base64,R0lGODlhAQABAPABAP///wAAACH5BAEKAAAALAAAAAABAAEAAAICRAEAOw== 再看看当初找工作的时候看得那些招聘要求,都是要求熟练掌握各种数据工具,什么R、Python、Sas,但是为什么工作中从来都没有用到过呢?

3.开始困惑

201910171186%20%284%29data:image/gif;base64,R0lGODlhAQABAPABAP///wAAACH5BAEKAAAALAAAAAABAAEAAAICRAEAOw==


我很困惑。为什么实际的工作和我理想的工作差距这么大,让我想起了『面试造火箭,工作拧螺丝』这句话。难道真的是这样吗?我问了自己无数遍。

4.经历了一些坑

201910171186%20%285%29data:image/gif;base64,R0lGODlhAQABAPABAP///wAAACH5BAEKAAAALAAAAAABAAEAAAICRAEAOw==


后来经历了一些坑以后我终于想通了,经历了些什么坑呢,总结一下主要就是上面提到的那三点:

  1. 第一点就是excel无响应,这个提示我相信大部分人应该都遇到过,做了几个小时的报表还没来得及保存就无响应了,最后自己强制关闭了,然后所有的事情都需要重新做,这是一件多么痛苦的一件事情;

  2. 日报需要做的操作太多了,总是因为粗心忘记某个步骤而导致整个报表出错

  3. 每天大把的时间都用在了重复性工作上,工作效率很低,经常不得已加班。

这个时候我想到了python,python可以很好地解决我上面遇到的这三个坑:

  1. 在第一个问题上,python在处理的数量级和性能上是要明显高于excel的,excel可能几万条数据就很难打开,更别说是做更进一步的操作,但是python不会,几万条几十万条的数据,python还是很ok的。

  2. 第二点就是操作步骤太多,可能因为哪天心情不好,工作不在状态就会把某个操作忘记而导致报表出错。,但是在python里面就是每一个操作就是一行代码,你只需要告诉他一次他就会永远记住,根本不会出现因为你哪天心情不好就忘记了,只要你第一次是正确的,而且你也是做过数据校验的,确实是没问题的,那么以后也不用担心出错了。

  3. 第三点其实和第二点是一回事,刚说过,在python里面每一个操作就是一行代码,只需要告诉python一次,他就会永远记住,这样你下次需要做同样工作的时候,只需要给他一个命令让他去执行同样的操作就行,不需要再次告诉他每一个操作具体怎么做,这就是自动化,大大节省了繁琐工作的时间,原本几个小时的工作,现在可能几秒就可以完成。

以上就是作为一名数据分析师我觉得应该学习Python的理由。

5. 怎么学

201910171186%20%286%29data:image/gif;base64,R0lGODlhAQABAPABAP///wAAACH5BAEKAAAALAAAAAABAAEAAAICRAEAOw==


我现在已经知道我要学习Python了,可是我该怎么学?要学习,先买书哈,不管看了能不能学会或者买回来看不看,但是这个学习的态度还是要有的,那就是买书,我买了很多Python编程和Python数据分析相关的书。

越看越懵逼,越看越觉得自己不会的东西很多,因为很多Python编程书是面向开发小哥哥写的,很多Python数据分析书又是面向算法小哥哥写的,我一个每天用Excel的数据分析师让我又要学习爬虫、又要学网页开发、还要学机器学习算法,这我哪能学的完,我很焦虑哈。难道我这真的要从『入门到放弃』吗?难道我还要继续忍受Excel的折磨吗?我不甘心呐。

6.悟通了

201910171186%20%287%29data:image/gif;base64,R0lGODlhAQABAPABAP///wAAACH5BAEKAAAALAAAAAABAAEAAAICRAEAOw==


后来老衲终于悟通了,我想通了两件事:

  1. 第一件事就是我学习Python是为了做数据分析,是为了解决我遇到的坑,那我是不是只需要学会可以解决那些坑的知识就够了。我现在学习Python的唯一目标就是做数据分析师,而不是去做爬虫工程师、也不是去做算法工程师。那么那些爬虫,开发,机器学习算法相关的知识,我是不是可以先不管,等我有精力了就学学爬虫玩一玩,或者是自己做个网页啥的都可以,前提是等我有精力。想通了这点以后,我瞬间觉得学习负担没那么大了。

  2. 第二件事情就是不管是Python还是R亦或者是Sas,这些都只是一个数据分析的工具而已,我用什么工具其实并不影响我的一个分析逻辑。比如我发现了今天的成交量相比上周降了不少,那我首先需要去看一下是哪些区域下降了,再看去看这些下降的区域中哪些品类下降了,这个分析逻辑会因为我用excel或Python这不同的工具,逻辑就不一样吗?不会的。这些工具只是帮助我去实现我数据分析过程中的某个功能操作,不同工具在实现同一功能操作的方式可能不同,但是达到的效果都是一样的。

7.对比学习法

201910171186%20%288%29data:image/gif;base64,R0lGODlhAQABAPABAP///wAAACH5BAEKAAAALAAAAAABAAEAAAICRAEAOw==


那既然不同工具达到的效果是一样的,我是不是就可以对比着我比较熟悉的Excel操作去学习Python,比如说我想要对一个表进行删除重复值处理,但是因为数据量太大了,Excel处理不了,这个时候我就可以利用python去处理,可是我又不会python删除重复值可怎么办呢,最简单的方法就是我直接去百度搜索一下python删除重复值怎么实现,然后就会出来很多教程,然后随便点开一篇就会有对应的方法,我找到的一篇就是右面截图这个,里面讲了用什么方法,这个方法里面有什么参数,还有实例,我一看马上就知道怎么用Python来删除重复值了。

那我下次想用Python来排序了,我同样再去网上搜索python排序怎么实现,也会找到对应的方法,这样每当我遇到一个需要用python来进行数据处理的操作时,我就去网上搜索,同样的一个操作你搜索一次肯定是记不住怎么用的,那么一次记不住怎么办呢,最简单也是最笨的一个方法就是,就搜索多次,第一次可能只能记住用什么函数,第二次你可能就会记住某些参数,第三次你可能就会全部记住。你通过这种方法将你工作中所有需要用Excel实现的操作都用python来实现了,这个时候你就算会用Python进行数据分析了。这就是对比学习法

8.最初的想法

201910171186%20%289%29data:image/gif;base64,R0lGODlhAQABAPABAP///wAAACH5BAEKAAAALAAAAAABAAEAAAICRAEAOw==


我刚刚说到的这种方法,就是你用到的时候去搜索这是一种办法,但是这种办法有两个不好的点:

  1. 一是知识掌握的不够系统,你用到什么操作的时候你去查,等你把所有用到的操作都查完了,也都记住了,但是这个时候这些操作都是孤立的漂在你的脑海中的,操作与操作之间没有联系的,当时你可能记住了,但是时间久了以后,你可能就忘记了。

  2. 另一就是用到的时候去网上搜很浪费时间,为什么很浪费时间呢?我们大家都知道,百度里面是有很多广告的,你在搜索的时候既需要分辨哪些不是广告,又需要找到你真正想要的教程。

因为上面的不方便,我想到了一个东西,什么东西呢,就是英汉汉英词典,英汉汉英词典大家应该都很熟悉,就是你去查找英文对应的汉语或者是汉语对应的英文,那么有没有一本Excel/Python词典呢,我去查找Excel对应的Python操作,或者是Python对应的Excel操作,找了找,没找到,我就决定自己来做这件事情,于是就有了现在这本书。

9.想法落地

点击学习:http://zhishitu.com/ke/11002