天天看点

Hadoop综合大作业

作业来源:https://edu.cnblogs.com/campus/gzcc/GZCC-16SE1/homework/3363

Hadoop综合大作业
准备上传的文件夹,新建文件夹bigdatacase
Hadoop综合大作业
获取bigdatacase文件夹的权限 并再里面新建dataset文件夹
Hadoop综合大作业
查看我爬取数据的前5条数据

#!/bin/bash
infile=$1
outfile=$2
awk -F "," 'BEGIN{
 id=0;}
{id=id+1;
 print id"\t"$1"\t"$2"\t"$3"\t"$4\t"$5\t"$6\t"$7\t"$8\t"$9\t"$10\t"$11\t"$12\t"$13\t"$14\t"$15\t"$16\t"$17\t"$18\t"$19\t"$20\t"$21\t"$22\t"$23\t"$24\t"$25\t"$26\t"$27
}' $infile > $outfile      
Hadoop综合大作业

这是pre_deal.sh配置文件,因为我获取了27列的数据,所以打了那么多。

Hadoop综合大作业

预处理成功,生成了user_table.txt文件

Hadoop综合大作业

查看user_table.txt前面的数据

Hadoop综合大作业

查看bigdatacase文件

Hadoop综合大作业

HDFS上传文件夹/bigdatacase/dataset

Hadoop综合大作业

查看HDFS上传的user_table.txt文件的前10条数据

Hadoop综合大作业

创建数据库bdlab

Hadoop综合大作业

使用数据库bdlab

Hadoop综合大作业

无法创建数据库表 不知道是什么原因,百度了很多遍,按照百度上的各种解决方法都解决不了。

总结:前面都很顺利,UTF-8也设置好了,但是在hive中无法创建数据库表,不知道什么原因,重新安装HIVE和MYSQL都无法成功,HIVE和MYSQL的安装配置都是正常的。