MySQL中union和join语句使用区别的辨析教程

 更新时间:2015年12月16日 11:02:34   作者:古腾龙  
这篇文章主要介绍了MySQL中union和join语句的用法区别,举例说明了union和join在连接操作上的不同作用,需要的朋友可以参考下

union和join是需要联合多张表时常见的关联词,具体概念我就不说了,想知道上网查就行,因为我也记不准确。
先说差别:union对两张表的操作是合并数据条数,等于是纵向的,要求是两张表字段必须是相同的(Schema of both sides of union should match.)。也就是说如果A表中有三条数据,B表中有两条数据,那么A union B就会有五条数据。说明一下union 和union all的差别,对于union如果存在相同的数据记录会被合并,而union all不会合并相同的数据记录,该有多少条记录就会有多少条记录。例如在mysql下执行以下语句:

select * from tmp_libingxue_a;
name number
libingxue 1001
yuwen 1002
select * from tmp_libingxue_b;
name number
libingxue 1001
feiyao 1003
select * from tmp_libingxue_a union select * from tmp_libingxue_b;
libingxue 1001
yuwen 1002
feiyao 1003
select * from tmp_libingxue_a union all select * from tmp_libingxue_b;
libingxue 1001
yuwen 1002
libingxue 1001
feiyao 1003

但是这样在hive里面是不能执行的,执行select * from tmp_libingxue_a union all select * from tmp_libingxue_b;会failed,hive中union必须在子查询中进行。如

select * from (select * from tmp_yuwen_a union all select * from tmp_yuwen_b) t1;

注意,必须是union all,单独用union它会提示你缺少ALL,而且后面的t1必须写,你可以写成a或者b,但是一定要写,不写会出错。
而join则是偏于横向的联合,仅仅是偏向于,等下详细说明。join跟union比起来显得更宽松,对两个表的字段不做要求,没有限制条件的join等于两个表的笛卡尔乘积,所有join需要有限制条件来约束,经过限制的join就是横向的扩张了。对于满足限制条件的join会被提取出来,不满足的直接过滤掉。用法可以很灵活,下面有两个简单的例子:

select * from (select * from tmp_yuwen_a)t1 join (select * from tmp_yuwen_b) t2;
select * from tmp_yuwen_a t1 join (select * from tmp_yuwen_b) t2; 

left outer join和right outer join用法类似,区别就是left outer join会把左边表的字段全部选择出来,右边表的字段把符合条件的也选择出来,不满足的全部置空,也就是说以左边表为参照。right outer join同理以右边表为参照。这三个join之间的差别说过很多次,网上也有更详细的解释,不再赘述。
相同点:在某些特定的情况下,可以用join实现union all的功能,这种情况是有条件的,当出现这种情况的时候选择union all还是group by就可以看情况或者看两者的消耗而决定。sql虽然就在那么几个关键词,但变化多端、功能强大,只要能实现想要的功能,怎么用随便你。需求情况sql简单重现如下

drop table tmp_libingxue_resource;
create external table if not exists tmp_libingxue_resource(
  user_id string,
  shop_id string,
  auction_id  string,
  search_time  string
)partitioned by (pt string)
row format delimited fields terminated by '\t'
lines terminated by '\n'
stored as sequencefile;

drop table tmp_libingxue_result;
create external table if not exists tmp_libingxue_result(
  user_id string,
  shop_id string,
  auction_id  string,
  search_time  string
)partitioned by (pt string)
row format delimited fields terminated by '\t'
lines terminated by '\n'
stored as sequencefile;

insert overwrite table tmp_libingxue_result where(pt=20041104) select * from tmp_libingxue_resource;

sudo -u taobao hadoop dfs -rmr /group/tbads/warehouse/tmp_libingxue_result/pt=20041104
sudo -u taobao hadoop jar /home/taobao/dataqa/framework/DailyReport.jar com.alimama.loganalyzer.tool.SeqFileLoader tmp_libingxue_resource.txt hdfs://v039182.sqa.cm4:54310/group/tbads/warehouse/tmp_libingxue_result/pt=20041104/part-00000 

hive> select * from tmp_libingxue_resource;
OK
2001 0  11  101  20041104
2002 0  11  102  20041104
hive> select * from tmp_libingxue_result;
OK
2001 0  12  103  20041104
2002 0  12  104  20041104

select user_id,shop_id,max(auction_id),max(search_time)
from
(select * from tmp_libingxue_resource 
union all
select * from tmp_libingxue_result )t1
group by user_id,shop_id;
2001 0  12  103
2002 0  12  104

select t1.user_id,t1.shop_id,t2.auction_id,t2.search_time
from
(select * from tmp_libingxue_resource) t1
join
(select * from tmp_libingxue_result) t2
on t1.user_id=t2.user_id and t1.shop_id=t2.shop_id;
2001 0  12  103
2002 0  12  104



通过前面的介绍,使用UNION对表的结果集进行并运算与使用JOIN对多表进行连接,二者有本质的不同。
下面给出一个使用UNION运算符连接二表记录的运算实例。
典型的二表记录的UNION运算

假定有两个表Table3和Table4,其包含的列和数据分别如下所示。

Table1数据库表

20151216110017983.png (591×135)

Table2数据库表

20151216110102452.png (582×131)

Table1表和Table2表具有相同的列结构,因此可以使用UNION运算符连接两个表的记录集,得到的连接结果如下表所示。

使用UNION连接Table3表和Table4表的记录

20151216110125850.png (589×272)

上述连接过程的实现代码可表示如下:

SELECT *
FROM Table1
UNION
SELECT *
FROM Table2

相关文章

  • MySQL中怎么匹配年月

    MySQL中怎么匹配年月

    一般数据库中给到的时间都是年-月-日形式的,那怎么匹配年-月/的形式呢,下面通过实例代码介绍怎么在数据库中查询到关于2021年8月的数据,对mysql匹配年月相关知识,感兴趣的朋友跟随小编一起看看吧
    2024-04-04
  • Mysql的库函数整理大全(非常详细!)

    Mysql的库函数整理大全(非常详细!)

    MySQL数据库中提供了很丰富的函数,下面这篇文章主要给大家介绍了关于Mysql库函数的相关资料,文中通过代码介绍的非常详细,对大家学习或者使用Mysql具有一定的参考借鉴价值,需要的朋友可以参考下
    2024-04-04
  • MySQL中出现乱码和表格不对齐的解决办法

    MySQL中出现乱码和表格不对齐的解决办法

    这篇文章给大家介绍了MySQL中出现乱码和表格不对齐的解决办法,文中通过代码和图文讲解的非常详细,对大家的解决MySQL中出现乱码和表格不对齐有一定的帮助,需要的朋友可以参考下
    2024-02-02
  • ubuntu下设置mysql自动备份的例子

    ubuntu下设置mysql自动备份的例子

    ubuntu下设置mysql自动备份的例子,供大家学习参考
    2013-01-01
  • MySQL中的套接字错误解决

    MySQL中的套接字错误解决

    socket文件是一种特殊的文件,可以促进不同进程之间的通信,有时候系统或MySQL配置的更改可能导致MySQL无法读取套接字文件,本文主要介绍了MySQL中的套接字错误解决,感兴趣的可以了解一下
    2024-02-02
  • mysql设置默认值无效问题及解决

    mysql设置默认值无效问题及解决

    这篇文章主要介绍了mysql设置默认值无效问题及解决方案,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教
    2023-10-10
  • MySQL查询重复数据(删除重复数据保留id最小的一条为唯一数据)

    MySQL查询重复数据(删除重复数据保留id最小的一条为唯一数据)

    查重是我们在工作中经常会遇到的一个需求,下面这篇文章主要给大家介绍了关于MySQL查询重复数据(删除重复数据保留id最小的一条为唯一数据)的相关资料,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面来一起学习学习吧
    2019-03-03
  • 深入解析MySQL中的Redo Log、Undo Log和Binlog

    深入解析MySQL中的Redo Log、Undo Log和Binlog

    本文详细介绍了MySQL中的RedoLog、UndoLog和Binlog的背景、业务场景、功能、底层实现原理以及使用措施,通过Java代码示例展示了如何与这些日志进行交互,进一步深化了对MySQL日志系统的理解,理解并合理使用这些日志,可以有效地提升数据库的性能和可靠性
    2024-10-10
  • Linux服务上MySQL启动、重启和关闭的操作方法

    Linux服务上MySQL启动、重启和关闭的操作方法

    MySQL是一种广泛使用的开源关系型数据库管理系统,常用于各种规模的应用程序中,在Linux服务器上管理MySQL服务是一个基本的运维任务,本文将详细介绍如何在Linux系统上启动、重启和关闭MySQL服务,涵盖不同Linux发行版(如Ubuntu和CentOS)的操作方法
    2024-11-11
  • MySQL占用内存过大解决方案图文详解

    MySQL占用内存过大解决方案图文详解

    最近无意中在任务管理器发现MySQL内存占用达到700+M,所以下面这篇文章主要给大家介绍了关于MySQL占用内存过大的完美解决方案,文中通过图文介绍的非常详细,需要的朋友可以参考下
    2022-09-09

最新评论