看来许多初学的同学和我一样,第一个念头就是我对机器学习和Python都不太了解,该读哪些书?今天我们聊书。
1.该不该选择Python
以前做数据分析,大概会推荐R和Python,现在Python借着深度学习成了爆款,连在传统领域数据分析也有压倒R一枝独大的迹象。
2.怎么学习Python
不过Python确实好学好用,又不像R这样有很强的领域局限性,用来上手数据分析确实是不错的选择。毕竟Python是个万金油,啥都能做,学习Python是个很大的话题,就从数据分析来看,学习Python的路线大致如下:
Python语言入门->Python数据处理->Python机器学习。
不同阶段可以分别选择对应的参考书,三个阶段推荐三本书吧,都是有中文版的经典技术书。
3.推荐3本书
学习Python语言入门:Python是一款高级编程语言,有自己的使用语法,不过总的来说,Python是解释型动态语言,语法很简单,如果有C或Java之类的编程基础,看一看基本语法就能写。学习程序语言,关键还是多用。
一定想看书的话,这部分一般推荐鼠书,即《python学习手册》,机工社出了中文版。挺厚的一本书,写得很细,要读完肯定就是Python的专家。但没必要看完再进入下一阶段,切记、切记。
我不太赞同啥书都翻完才算读懂说法,学习要有目的。这一阶段我们要了解的是Python的语法,只要学完前面的基础语法部分就行,后面部分可以按需阅读。
学习Python数据处理:Python处理数据主要使用Pandas,这个库功能很强大,所以学起来也会比较吃力,推荐另一本鼠书,叫《利用Python进行数据分析》,同样机工社出了中文版。
这本书讲得很全,数据清洗、绘图、分组之类的常用知识点都覆盖,同时也很基础。推荐重点阅读。
学习Python机器学习:现在Python大热主要还是因为机器学习和深度学习,数据分析和机器学习联系也很密切,算是必然的延伸吧。Python的机器学习主要用Scikit-Learn,深度学习则有两大主流,google的tensorflow和facebook的pytorch。这个部分推荐《机器学习实战:基于Scikit-Learn和TensorFlow》,现在英文版已经出到第二版了,中文版目前只有第一版。
下回再聊。