天天看点

数据分析第4周第3天.md

pandas主要问题

1:不会分析-excel

2:代码:demo 推导 dataframe索引

数据分析概述

数据分析师

数据分析师是什么?

数据师Datician['detɪʃən]的一种,

指的是不同行业中,专门从事行业数据搜集、整理、分析,并依据数据做出行业研究、评估和预测的专业人员。

数据分析师有什么用?

这是一个用数据说话的时代,也是一个依靠数据竞争的时代。

世界500强企业中,有90%以上都建立了数据分析部门。

IBM、微软、Google等知名公司都积极投资数据业务,

建立数据部门,培养数据分析团队。

数据分析方法分类

数据分析第4周第3天.md

数据分析项目参与角色

IT技术人员

搭建并维护分析平台、

创建数据仓库、数据更新维护

业务人员

提出业务需求、检验分析结果的准确性、

使用分析结果指导业务工作 业务人员

​​

​数据分析师​

​​ 零碎工具辅助、提取数据、制作分析报告、

制作可视化看板,汇报分析结果

数据分析流程

数据分析第4周第3天.md

工作内容

围绕数据分析师的三大类工作内容

一、零碎需求-用数据使业务问题细节明朗化

工具辅助

日常取数及业务问题发现

二、业务建模-数据拓维

三、提供周、月、季度、年整体分析报告

工具辅助:​​

​Excel高阶技能(高阶函数,条件格式)​

​​ 案例应用:​

​项目排期表,考勤表​

excel函数(重点)

python中的函数调用,如果是面向对象的话

p = Person()
p.eat()
p.run()      

在 excel里面,

= 函数名(数据值,条件)      

sum(a,b,c)

=sum(1,2,3)

回车
6      

countif

数据分析第4周第3天.md

countif(range,criteria)

计算某个区域中满足给定单元条件的单元格数目,

参数range为单元格区域,

参数criteria为判断条件

countifs(range1,criteria1,…)

统计一组条件所指定的单元格数,

range1:条件区域1。criteria1:条件1。

range2:条件区域2。Criteria2:条件2。等等。。。

(1)迟到次数

=COUNTIF(B2:K2,"b")      

(2)旷课次数

=COUNTIF(B2:K2,"c")      

(3)1日和2日都迟到人数:

=COUNTIFS(B2:B11,"b",C2:C11,"b")      

SUM

语法:SUM(number1,number2,…)

语法:SUMIF(range, criteria, [sum_range])。

range:条件区域,

criteria:条件。

sum_range:求和区域。可以省略,当省略时,条件区域就是求和区域。

说明:单条件求和。

语法:SUMIFS(sum_range,

criteria_range1, criteria1,

[criteria_range2, criteria2], …)。

sum_range:求和区域。

criteria_range1:条件区域1。criteria1:条件1。

criteria_range2:条件区域2。Criteria2:条件2。等等。。。

说明:多条件求和。

数据分析第4周第3天.md
错误
=SUM(B2:B2)
=SUM(B3:B3)
=SUM(B4:B4)
=SUM(B5:B5)
=SUM(B6:B6)
正确
=SUM($B$2:B2)
=SUM($B$2:B3)
=SUM($B$2:B4)
=SUM($B$2:B5)
=SUM($B$2:B6

借

=SUMIF(D3:D14,"借",H3:H14)

贷
=SUMIF(D3:D14,"贷",H3:H14)

工行借方求和

=SUMIFS(H3:H14,E3:E14,"工行",D3:D14,"借")

工行金额>=80000金额求和

=SUMIFS(H3:H14,E3:E14,"工行",H3:H14,">=80000")      

条件格式

本质是根据条件筛选数据

但excel中将数据标注颜色

》》开始》》条件格式

数据分析第4周第3天.md
数据分析第4周第3天.md

》》开始》》条件格式

数据分析第4周第3天.md
数据分析第4周第3天.md

​注意,需要逐行设置,所以行前面不能加$​

》》开始》》条件

数据分析第4周第3天.md
数据分析第4周第3天.md

row()获得单元格的行号

mod(m,n)获得m对n的余数

数据条:进度条

色阶:表示图像亮度强弱的指数标准,也就是我们说的色彩指数

图标集:图标的集合,使用小图标对数据标注

​本质也是条件规则​

数据分析第4周第3天.md
数据分析第4周第3天.md

日期时间类函数

日期类函数应用

使用日期时间类函数需注意数据格式的调整

​​

​year 获取指定日期的年​

​​

​month 获取指定日期的月​

​​

​day 获取指定日期的日​

today 获取系统当前日期

now 获取系统当前日期和时间

​​

​date 返回标准日期格式的时间序列​

​​

​eomonth 获取指定日期所在月(或前后月)的最后一天​

​ 0表示当月,1表示下一个月

​weekday 获取指定日期的星期数​

数据分析第4周第3天.md
本月最后一天
=EOMONTH(A2,0)
本月天数
=DAY(B2)
(日期)是否是周末
=IF(WEEKDAY(A2,2)>=6,"周末","否")      

2.项目计划表

步骤提示:

1.计算项目时长,起始日期差+1

2.运用if函数计算阶段剩余天数,当结束日期恰好为今天时显示为“仅剩今天”

3.运用条件格式突出显示“仅剩今天”行,如样表红色区域

4.运用开始时间和项目时长制作甘特图(选择堆积条形图)

数据分析第4周第3天.md
(1)项目时长
=D22-C22+1
为什么要加1? 
(2)距离项目结束还剩*天
=IF(D22<TODAY(),0,IF(D22=TODAY(),"仅剩今天",D22-TODAY()))      
数据分析第4周第3天.md
数据分析第4周第3天.md

》插入》全部图表》堆积条形图

1,选取数据,项目描述,开始时间,项目时长,插入堆积条形图

数据分析第4周第3天.md

2,通过选择数据,修改y轴,只显示阶段一,阶段二,,

数据分析第4周第3天.md
数据分析第4周第3天.md
数据分析第4周第3天.md
数据分析第4周第3天.md

3,需要在x轴添加日期

数据分析第4周第3天.md
数据分析第4周第3天.md

4,设置y轴逆序

数据分析第4周第3天.md

5,设置橙色条透明

数据分析第4周第3天.md

6,设置开始时间,在坐标轴

数据分析第4周第3天.md

案例应用-员工考勤统计

A公司为化工工厂,为了规范工厂员工的工作时间,需低成本制作员工考勤表,由门卫监督签到,最终由HR统

计每月、季度、年的考勤记录,上报公司。

公司员工考勤制度章程说明(部分):

员工病事假最小请假单位为1天;

每日填写实际出勤时长,全天最小出勤时长8小时;

思路:

1.工具:使用公司配置的Excel软件制作每月考勤表

2.使用:将月度考勤表分发至各负责人,由负责人填写后每月末提交至HR处

3.统计:以员工为维度,统计平日出勤天数、病假天数、事假天数、平时加班小时数、周末加班小时数

数据分析第4周第3天.md

创建表头

数据分析第4周第3天.md
1.创建年月下拉框,知识点数据验证-序列
搞定年,月的下拉
              
2.每月的起始日均为1,在起始日上填写数字1
            
3.运用加法运算及填充柄填充当月每一天日期,并结合IF()函数判断所得数字>当前月总天数时不显示             
=IF(H24<DAY(EOMONTH(DATE($G$22,$I$22,1),0)),H24+1,"")

每月有几天?
生成第1天:=DATE(G22,I22,1)
生成最后1天:=EOMONTH(DATE(G22,I22,1),0)
取得天数:=DAY(EOMONTH(DATE(G22,I22,1),0))

4.根据日期获取对应的星期数字,运用函数DATE()、WEEKDAY(),注意weekday函数的第二参数输入1              
= WEEKDAY(DATE($G$22,$I$22,H24),1)

5.运用自定义格式将星期数字转换为标准星期,自定义格式语法输入aaa  
            
=IF(H24="","",WEEKDAY(DATE($G$22,$I$22,H24),1))      

设置高亮

6.运用条件格式,将周六日及无用列突出显示,选择公式判断如周日的C$3=1蓝色展示

计算每名员工10月、11月、12月的考勤,

参考函数countif,sumif;

出勤、病、事为天数,平时加班和周末加班为小时数"

统计病假
=COUNTIF(H5:AL5,"病")
统计事假
=COUNTIF(H5:AL5,"事")
统计出勤 周一到周五 
=COUNTIFS($H$3:$AL$3,">1",$H$3:$AL$3,"<7",H5:AL5,">=8")
周末加班=周六+周日 
=SUMIF($H$3:$AL$3,7,H5:AL5)+SUMIF($H$3:$AL$3,1,H5:AL5)
平时加班
=SUMIFS(H5:AL5,$H$3:$AL$3,">1",$H$3:$AL$3,"<7")-B5*8      

第四季度的考勤汇总

数据分析第4周第3天.md
数据分析第4周第3天.md

继续阅读