天天看点

大数据应用期末总评

  该作业要求来源于:https://edu.cnblogs.com/campus/gzcc/GZCC-16SE2/homework/3339

1.将爬虫大作业产生的csv文件上传到HDFS

我爬虫作业爬取的是招聘网站对于JAVA的岗位信息:共计15129条

大数据应用期末总评

创建文件夹并且把文件复制进去,并且尝试打开文件前5行

大数据应用期末总评
大数据应用期末总评

启动hadoop,并且查看jps,和在hdfs上面创建文件夹

大数据应用期末总评

将文件上传到hdfs

大数据应用期末总评

2.对CSV文件进行预处理生成无标题文本文件

大数据应用期末总评
大数据应用期末总评

3.把hdfs中的文本文件最终导入到数据仓库Hive中

首先创建dbcmh数据库

大数据应用期末总评

然后创建表

大数据应用期末总评

4.在Hive中查看并分析数据

使用查询语句查询并且分析结果

首先我要分析的问题的,对于java的岗位的待遇要求有什么,哪些最高,能吸引人员投简历的哪些?

下面是我查询的年底双薪待遇的条数,有12757个。

大数据应用期末总评

带薪年假这个待遇的岗位有6215个,

大数据应用期末总评

定期公司体检身体的有4557个。

大数据应用期末总评

标有发展空间大的岗位有7765个。

大数据应用期末总评

绩效奖金待遇的岗位有8692个。

大数据应用期末总评

提供技能培训的岗位仅仅只有1906个。这个也说明了公司给技能培训的很少,很多岗位都希望能马上进行工作,而不用培训。要求较高,对于经验要求很高。

大数据应用期末总评

提供五险一金的岗位有9061个,看来很多公司都会给工作人员五险一金的待遇。这个待遇对于找工作的人来说是非常看重的。

大数据应用期末总评

有部分公司的招聘写着股票期权,但是仅仅只有3538个。 

大数据应用期末总评

 年终奖是一个非常好的待遇,很多公司都有这个福利,现在查询出有11143个岗位有这个待遇。所以可以看出,有无年终奖是很多投简人的选择要求。

大数据应用期末总评

综上所述:经过分析,我发现年底双薪、年终奖、五险一金,这三个待遇是很多公司都有的,这样看来,很多择业人员选择岗位都想找有这些待遇的公司,因为这么多岗位都发放出这些待遇,说明了目前很多人重视这些。