在Hive中,使用最多,最重要的两种join分别是:
inner join(内连接)、left join(左连接)
join语法规则
- table_reference:是join查询中使用的表名。
- table_factor:与table_reference相同,是联接查询中使用的表名。
- join_condition:join查询关联的条件,如果在两个以上的表上需要连接,则使用AND关键字。
join查询数据环境准备
为了更好的练习、学习掌握Hive中的join语法,下面我们去创建3张表并且加载数据到表中。
表1:employee 员工表;
表2:employee_address 员工住址信息表;
表3:employee_connection 员工联系方式表;
join查询数据环境准备
inner join 内连接
- 内连接是最常见的一种连接,它也被称为普通连接,其中inner可以省略:inner join == join ;
- 只有进行连接的两个表中都存在与连接条件相匹配的数据才会被留下来。
left join 左连接
- left join中文叫做是左外连接(Left Outer Join)或者左连接,其中outer可以省略,left outer join是早期的写法。
- left join的核心就在于left左。左指的是join关键字左边的表,简称左表。
- 通俗解释:join时以左表的全部数据为准,右边与之关联;左表数据全部返回,右表关联上的显示返回,关联不上的显示null返回。
更多大数据内容:大数据Hadoop入门教程