神奇的 SQL 之团结的力量 → JOIN

  • 时间:
  • 浏览:0
  • 来源:大发快三_快三安卓版_大发快三安卓版

前言

  开心一刻

    闺蜜家暴富,买了一栋大别野,喊我去吃饭,菜挺丰盛的,一次性一次性铁丝你这俩不给力,银一次性一次性铁丝,好重,我知道你换个竹子的,闺蜜说,四种 银一次性一次性铁丝你家总共才五双,只能贵宾可不都都可以用~我咬着牙享受着贵宾待遇,终于,在第三次夹虾排滑落盘子时,我爆发了:去它喵的贵宾,我想虾排……完整版都是……我想竹一次性一次性铁丝!

连接

  简单来说,好多好多 我将你这俩表中的列加进去去过来,进行"加进去去列"的运算,如下图所示。

  为哪此需用进行"加进去去列"的操作 了? 将会大伙在设计数据库的之前 ,往往需用满足范式(具体满足范式几,无法一概而论,这里不做细究),会愿因 大伙某个需求的完整版列分散在不同的表中,好多好多 为了满足需求,大伙需用将你这俩表的列进行连接。大伙来看个简单例子,然后 我我大伙有两张表(t_user,t_login_log):

DROP TABLE IF EXISTS t_user;
CREATE TABLE t_user (
  id INT(11) UNSIGNED NOT NULL AUTO_INCREMENT COMMENT '自增主键',
  user_name VARCHAR(30) NOT NULL COMMENT '用户名',
  sex TINYINT(1) NOT NULL COMMENT '性别, 1:男,0:女',
  age TINYINT(3) UNSIGNED NOT NULL COMMENT '年龄',
  phone_number VARCHAR(11) NOT NULL DEFAULT '' COMMENT '电话号码',
  email VARCHAR(30) NOT NULL DEFAULT '' COMMENT '电子邮箱',
  create_time datetime NOT NULL COMMENT '创建时间',
  update_time datetime NOT NULL COMMENT '更新时间',
  PRIMARY KEY (id)
) COMMENT='用户表';

DROP TABLE IF EXISTS t_login_log;
CREATE TABLE t_login_log (
  id INT(11) UNSIGNED NOT NULL AUTO_INCREMENT COMMENT '自增主键',
  user_name VARCHAR(30) NOT NULL COMMENT '用户名',
  ip VARCHAR(15) NOT NULL COMMENT '登录IP',
  client TINYINT(1) NOT NULL COMMENT '登录端, 1:android, 2:ios, 3:PC, 4:H5',
  create_time datetime NOT NULL COMMENT '创建时间',
  PRIMARY KEY (id)
) COMMENT='登录日志';

INSERT INTO t_user(user_name, sex, age, phone_number,email,create_time,update_time) VALUES
('Bruce Lee', 1, 32, '15174430987', 'brucelee@126.com', NOW(), NOW()),
('Jackie Chan', 1, 65, '15174481234', 'JackieChan@126.com', NOW(), NOW()),
('Jet Li', 1, 56, '15174481245', 'JetLi@126.com', NOW(), NOW()),
('Jack Ma', 1, 55, '15174481256', 'JackMa@126.com', NOW(), NOW()),
('Pony', 1, 48, '15174481278', 'Pony@126.com', NOW(), NOW()),
('Robin Li', 1, 51, '15174481290', 'RobinLi@126.com', NOW(), NOW());

INSERT INTO t_login_log(user_name, ip, client, create_time) VALUES
('Jackie Chan', '10.53.56.78',2, '2019-10-12 12:23:45'),
('Jackie Chan', '10.53.56.78',2, '2019-10-12 22:23:45'),
('Jet Li', '10.53.56.12',1, '2018-08-12 22:23:45'),
('Jet Li', '10.53.56.12',1, '2019-10-19 10:23:45'),
('Jack Ma', '198.11.132.198',2, '2018-05-12 22:23:45'),
('Jack Ma', '198.11.132.198',2, '2018-11-11 22:23:45'),
('Jack Ma', '198.11.132.198',2, '2019-06-18 22:23:45'),
('Robin Li', '220.181.38.148',3, '2019-10-21 09:45:56'),
('Robin Li', '220.181.38.148',3, '2019-10-26 22:23:45'),
('Pony', '104.69.130.30',4, '2019-10-12 10:23:45'),
('Pony', '104.69.130.30',4, '2019-10-15 20:23:45');
View Code

  将会大伙需用展示如下列表(需求:展示用户列表,并显示其最近登录时间、最近登录 IP),越来越就需用 t_user 和 t_login_log 连表查了

  连接的类型有好多好多 种,细分如下图

交叉连接

  讲交叉连接之前 了,大伙先来看看笛卡尔积,假设大伙1个 集合,集合A={a, b},集合B={0, 1, 2},则A与B的笛卡尔积为{(a, 0), (a, 1), (a, 2), (b, 0), (b, 1), (b, 2)},表示为AxB,也好多好多 我集合A中的任一元素与集合B的每个元素组合后的新集合则为A与B的笛卡尔积(AxB)。数学上的笛卡尔积反映到数据库中好多好多 我交叉连接(CROSS JOIN),结合上述的案类似下:

SELECT * FROM t_user CROSS JOIN t_login_log;

-- 与 CROSS JOIN 得到的结果相同
-- 过时的写法,不符合 SQL标准,能拿下就好,不推荐使用
SELECT * FROM t_user, t_login_log;

  t_user 中含 6 条记录, t_login_log 中含 11 条记录,t_user CROSS JOIN t_login_log 的结果是 66( 6 乘以 11) 条记录

  交叉连接好多好多 我对两张表中的完整版记录进行交叉组合,然后 其结果是两张表的乘积,这也是为哪此交叉连接无法使用内连接或外连接中所使用的 ON 子句的愿因 。交叉连接基本太大应用到实际业务之中,愿因 1个 ,一是其结果越来越实用价值,二是结果行数太大,需要花费几瓶的运算时间和硬件资源。虽说交叉连接的实际使用场景几乎越来越,但还是有它的理论价值的,交叉连接是你这俩所有连接运算的基础,内连接是交叉连接的一每项,其结果是交叉连接的一每项(子集),外连接怪怪的特殊,其结果中含交叉连接之外的内容;更多详情,大伙接着往下看。

内连接

  只返回两张表匹配的记录,就叫内连接,直观的表现好多好多 我关键字:INNER JOIN ... ON,ON 表示两张表连接所使用的列(连接键);而内连接中又属等值连接最常用

  等值连接

    简单点来说,好多好多 我连接键相等

-- 等值连接
SELECT * FROM t_user tu INNER JOIN t_login_log ttl ON tu.user_name = ttl.user_name;

-- INNER JOIN 都需用简写成 JOIN
SELECT * FROM t_user tu JOIN t_login_log ttl ON tu.user_name = ttl.user_name;

-- 不加连接键, 结果与 CROSS JOIN 一样
SELECT * FROM t_user tu INNER JOIN t_login_log ttl

    等值连接的结果中,每根小记录的连接键的列的值是想等的,如上图中的 user_name 和 user_name1(为了区别于第1个 user_name,数据库系统自动取的别名,大伙都需用显示的指定)

  不等值连接

    连接键的比较谓词除了 = 之外的所有情况表,比如 >、<、<>(!=);不等值连接使用场景比较少,反正我在实际工作中几乎没用到过

SELECT * FROM t_user tu INNER JOIN t_login_log ttl ON tu.user_name <> ttl.user_name;
SELECT * FROM t_user tu INNER JOIN t_login_log ttl ON tu.user_name > ttl.user_name;

  自然连接

    不需用指定连接条件,数据库系统会自动用相同的字段作为连接键,直观的表现好多好多 我关键字:NATURAL JOIN,NATURAL LEFT JOIN、NATURAL RIGHT JOIN;

    连接键不直观,需用去看两张表中相同的字段有哪此;对于自然连接,了解即可,不推荐使用,反正我工作越来越久,一次都没用过。

外连接

  外连接的使用措施与内连接一样,也是通过 ON 使用连接键将两张表连接,从结果中获取大伙然后 的数据,然后 返回的结果与内连接有区别,具体大伙往下看

  左连接

    返回匹配的记录,以及左表多余的记录,关键字:LEFT JOIN(LEFT OUTER JOIN 的简写)

SELECT * FROM t_user tu LEFT OUTER JOIN t_login_log ttl ON tu.user_name = ttl.user_name;
-- LEFT JOIN 是 LEFT OUTER JOIN 的简写
SELECT * FROM t_user tu LEFT JOIN t_login_log ttl ON tu.user_name = ttl.user_name;

    上图中,前 11 条记录是匹配的记录,而第 12 条是不匹配、左表的记录

  右连接

    返回匹配的记录,以及表 B 多余的记录,关键字:RIGHT JOIN(RIGHT OUTER JOIN 的简写)

SELECT * FROM t_login_log ttl RIGHT OUTER JOIN t_user tu ON tu.user_name = ttl.user_name;
-- RIGHT JOIN 是 RIGHT OUTER JOIN 的简写
SELECT * FROM t_login_log ttl RIGHT JOIN t_user tu ON tu.user_name = ttl.user_name;

    将会大伙习惯了从左往右(阅读措施、写作措施),然后 在实际项目中,基本上用的完整版都是左连接

  全连接

    返回匹配的记录,以及左表和右表每所有人的多余记录,关键字:FULL JOIN (FULL OUTER JOIN 的简写)

SELECT * FROM t_user tu FULL OUTER JOIN t_login_log ttl ON tu.user_name = ttl.user_name;
-- FULL JOIN 是 FULL OUTER JOIN 的简写
SELECT * FROM t_user tu FULL JOIN t_login_log ttl ON tu.user_name = ttl.user_name;

    注意:MySQL 不支持 全连接,大伙都需用通过 左连接、右连接之前 ,再 UNION 来实现全连接

自连接

  一张表,自己连接自己,简单点来理解好多好多 我,左表、右表是同一张表;连接措施都需用是内连接、也都需用是外连接

  更多详情大伙都需用去看:项目上线后,谈一下感触比较深的你这俩:查询优化

需求:展示用户列表,并显示最近登录时间、最近登录 IP

  对于此需求,大伙会如保来写四种 SQL ? 我知道你大伙很容易想到左连接,如下所示

SELECT * FROM t_user tu LEFT JOIN t_login_log ttl ON tu.user_name = ttl.user_name;

  可结果如下:

  显示的是每个用户的所有登录日志,完整版都是大伙然后 的结果;愿因 是 t_user 中的根小记录在 t_login_log 对应的记录有多种情况表:0 条对应、1 条对应、多条对应,那四种 SQL 要如保么会写呢,措施有多种,不局限于如下实现

-- 1、连接配合子查询,注意 Bruce Lee 从未登陆过
SELECT tu.user_name, tu.sex,tu.age, tu.phone_number,tu.email,tll.create_time,tll.ip 
FROM t_user tu LEFT JOIN t_login_log tll ON tu.user_name = tll.user_name
WHERE tll.id = (SELECT MAX(id) FROM t_login_log WHERE user_name = tu.user_name) OR tll.user_name IS NULL;

-- 2、t_login_log分组统计出各个用户的最近一次登录信息后,再与 t_user 联表
SELECT tu.user_name, tu.sex,tu.age, tu.phone_number,tu.email,tll.create_time,tll.ip 
FROM t_user tu LEFT JOIN (
    SELECT tb.* FROM(
        SELECT user_name, MAX(id) id FROM t_login_log GROUP BY user_name
    ) ta LEFT JOIN t_login_log tb ON ta.id = tb.id
) tll ON tu.user_name = tll.user_name;

  具体的实现还得结合具体的业务和需求来实现,那样可不都都可以写出高效的 SQL;另外结合执行计划来建立要花费的索引。总之,越来越一成不变的、通用的高效 SQL,结合具体的业务可不都都可以写出最要花费的 SQL。

总结

  1、连接的描述措施

    常用的维恩图,描述如下

    维恩图描述有他的优势,但它不好表示交叉连接,共同容易让他误解成 SQL 中的集合操作;这里推荐另外四种 描述措施,我随便说说描述的更准确

    CROSS JOIN

     常用 JOIN

     上图中,颜色表示匹配关系,颜色相同表示匹配。返回结果中,将会另一张表越来越匹配的记录,则用 null 填充, 在上图中则表示为空白。

  2、连接中 ON 指定连接键,连接键都需用指定多个,而 WHERE  还是平时的作用,用来指定过滤条件;不推荐将连接键放于 WHERE 后;

  3、实际工作中,用的最多的是 左连接 和 等值连接,你这俩的用的怪怪的少

参考

  《SQL基础教程》

  《SQL进阶教程》