天天看点

excel和python中的numpy优缺点_numpy+pandas除了效率对比excel还有什么功能上的优势吗...

匿名用户

1级

2017-01-12 回答

1、如果数据量不大,而且数据以数值为主,处理也是简单的统计,那么两者都挺好用,而且我觉得excel更好,纯粹就是所见即所得。而且即使是简单的创造新函数,或者自动化执行,用vba也能满足而且也足够便捷,语法的劣势没什么不舒服的体现。我团队及,财务数据方面的日常整理,统计和分析,以及核算底稿的生成,全都是vba,老少咸宜,完全没必要用别的工具。

2、如果需要灵活在各种显示范式中切换,切片,分组,聚合,索引,排序,并且结合各种统计函数的使用等,还是python比较合适。例如groupby的大部分基础功能通过excel透视分组筛选等也能实现,但是如果结合各种函数的使用,就远比excel灵活了,excel菜单或者vba的透视表函数,都远没有这个灵活度。我自己在整理数据,从不断分组,切片,排序和统计中寻找分析思路时,就喜欢用python不断进行各种尝试,观察数据结果,我想如果我用excel的话,会繁杂和混乱得多。所以我需要用量比较大的业务数据做分析时,我一般不用excel。

3、如果需要用复杂些的统计计量方法,excel远不能满足。有时候非要用vba去编写也可以,但效率会低10 倍不止,你随便找本统计书找个计量模型,按照它的公式写写代码就体会到了。不过这个在python上不仅这两个模块了,还有statsmodels等。我有时候对这些模块的函数不太熟悉,也懒得去看文档,有时候为了计算个指标,我也会用matlab,eviews等工具。只是这类计算器没有python那么强大的基础数据规整能力,而更适合用作数值计算。

4、如果数据不仅仅是数值型的,还有日期型,文本型(特别是多项信息长文本组成的值),用excel处理也很麻烦。把文本转化为虚拟变量准备回归,把多种多样的同义异形文本统一形式,把日期整理整齐统一口径准备做时间序列模型分析等等,用excel够累的,还不只要要插入几列做过程处理才够用。

5、涉及到web的数据分析,别养成用vba摘取网络数据的坏习惯,代码写到手抽筋。这个不展开了,我用得少,但是试过用vba写,的确让我没耐心,体检印象不好。

6、如果分析还涉及图形处理,跟其他程序的各种接口等,还是用边界更宽的python吧,毕竟excel只是个强大的孤岛,走出去拥抱其他不太容易。