数据库术语
-
数据库(database):保存有组织的数据的容器(通常是一个文件或一组文件) -
数据表(table):某种特定类型数据的结构化清单 -
模式(schema):关于数据库和表的布局及特性的信息。模式定义了数据在表中如何存储,包含存储什么样的数据,数据如何分解,各部分信息如何命名等信息。数据库和表都有模式 -
列(column):表中的一个字段。所有表都是由一个或多个列组成的 -
行(row):表中的一个记录 -
主键(primary key):一列(或一组列),其值能够唯一标识表中每一行
-
子句:是语句和查询的组成成分。(在某些情况下,这些都是可选的。) -
表达式:可以产生任何标量值,或由列和行的数据库表 -
谓词:给需要评估的 SQL 三值逻辑(3VL)(true/false/unknown)或布尔真值指定条件,并限制语句和查询的效果,或改变程序流程 -
查询:基于特定条件检索数据。这是 SQL 的一个重要组成部分 -
语句:可以持久地影响纲要和数据,也可以控制数据库事务、程序流程、连接、会话或诊断
-
SQL 语句不区分大小写,但是数据库表名、列名和值是否区分,依赖于具体的 DBMS 以及配置。
-
多条 SQL 语句必须以分号(;)分隔。
-
处理 SQL 语句时,所有空格都被忽略。SQL 语句可以写成一行,也可以分写为多行。
-- 一行 SQL 语句
UPDATE user SET username='robot', password='robot' WHERE username = 'root';
-- 多行 SQL 语句
UPDATE user
SET username='robot', password='robot'
WHERE username = 'root';
-
SQL 支持三种注释
## 注释1
-- 注释2
/* 注释3 */
增删改查,又称为 CRUD,数据库基本操作中的基本操作。
INSERT INTO user
VALUES (10, 'root', 'root', 'xxxx@163.com');
INSERT INTO user(username, password, email)
VALUES ('admin', 'admin', 'xxxx@163.com');
INSERT INTO user(username)
SELECT name
FROM account;
UPDATE user
SET username='robot', password='robot'
WHERE username = 'root';
-
DELETE 语句用于删除表中的记录 -
TRUNCATE TABLE 可以清空表,也就是删除所有行
DELETE FROM user
WHERE username = 'robot';
TRUNCATE TABLE user;
SELECT prod_name
FROM products;
SELECT prod_id, prod_name, prod_price
FROM products;
SELECT *
FROM products;
SELECT DISTINCT
vend_id FROM products;
-- 返回前 5 行
SELECT * FROM mytable LIMIT 5;
SELECT * FROM mytable LIMIT 0, 5;
-- 返回第 3 ~ 5 行
SELECT * FROM mytable LIMIT 2, 3;
-
子查询可以嵌套在 SELECT,INSERT,UPDATE 或 DELETE 语句内或另一个子查询中 -
子查询通常会在另一个 SELECT 语句的 WHERE 子句中添加 -
您可以使用比较运算符,如 >,<,或 =。比较运算符也可以是多行运算符,如 IN,ANY 或 ALL -
子查询必须被圆括号 () 括起来 -
内部查询首先在其父查询之前执行,以便可以将内部查询的结果传递给外部查询
SELECT cust_name, cust_contact
FROM customers
WHERE cust_id IN (SELECT cust_id
FROM orders
WHERE order_num IN (SELECT order_num
FROM orderitems
WHERE prod_id = 'RGAN01'));
-
WHERE 子句用于过滤记录,即缩小访问数据的范围 -
WHERE 后跟一个返回 true 或 false 的条件 -
WHERE 可以与 SELECT,UPDATE 和 DELETE 一起使用 -
可以在 WHERE 子句中使用的操作符
SELECT * FROM Customers
WHERE cust_name = 'Kids Place';
UPDATE Customers
SET cust_name = 'Jack Jones'
WHERE cust_name = 'Kids Place';
DELETE FROM Customers
WHERE cust_name = 'Kids Place';
-
IN 操作符在 WHERE 子句中使用,作用是在指定的几个特定值中任选一个值 -
BETWEEN 操作符在 WHERE 子句中使用,作用是选取介于某个范围内的值
SELECT *
FROM products
WHERE vend_id IN ('DLL01', 'BRS01');
SELECT *
FROM products
WHERE prod_price BETWEEN 3 AND 5;
-
AND、OR、NOT 是用于对过滤条件的逻辑处理指令 -
AND 优先级高于 OR,为了明确处理顺序,可以使用 () -
AND 操作符表示左右条件都要满足 -
OR 操作符表示左右条件满足任意一个即可 -
NOT 操作符用于否定一个条件
SELECT prod_id, prod_name, prod_price
FROM products
WHERE vend_id = 'DLL01' AND prod_price <= 4;
SELECT prod_id, prod_name, prod_price
FROM products
WHERE vend_id = 'DLL01' OR vend_id = 'BRS01';
SELECT *
FROM products
WHERE prod_price NOT BETWEEN 3 AND 5;
-
LIKE 操作符在 WHERE 子句中使用,作用是确定字符串是否匹配模式 -
只有字段是文本值时才使用 LIKE -
LIKE 支持两个通配符匹配选项:% 和 _ -
不要滥用通配符,通配符位于开头处匹配会非常慢 -
% 表示任何字符出现任意次数 -
_ 表示任何字符出现一次
SELECT prod_id, prod_name, prod_price
FROM products
WHERE prod_name LIKE '%bean bag%';
SELECT prod_id, prod_name, prod_price
FROM products
WHERE prod_name LIKE '__ inch teddy bear';
-
如果一个 JOIN 至少有一个公共字段并且它们之间存在关系,则该 JOIN 可以在两个或多个表上工作 -
连接用于连接多个表,使用 JOIN 关键字,并且条件语句使用 ON 而不是 WHERE -
JOIN 保持基表(结构和数据)不变
-
内连接又称等值连接,使用 INNER JOIN 关键字。在没有条件语句的情况下返回笛卡尔积 -
自连接可以看成内连接的一种,只是连接的表是自身而已 -
自然连接是把同名列通过 = 测试连接起来的,同名列可以有多个
-
内连接提供连接的列,而自然连接自动连接所有同名列 -
外连接返回一个表中的所有行,并且仅返回来自次表中满足连接条件的那些行,即两个表中的列是相等的。外连接分为左外连接、右外连接、全外连接(Mysql 不支持) -
左外连接就是保留左表没有关联的行 -
右外连接就是保留右表没有关联的行
-
连接可以替换子查询,并且比子查询的效率一般会更快
SELECT vend_name, prod_name, prod_price
FROM vendors INNER JOIN products
ON vendors.vend_id = products.vend_id;
SELECT c1.cust_id, c1.cust_name, c1.cust_contact
FROM customers c1, customers c2
WHERE c1.cust_name = c2.cust_name
AND c2.cust_contact = 'Jim Jones';
SELECT *
FROM Products
NATURAL JOIN Customers;
SELECT customers.cust_id, orders.order_num
FROM customers LEFT JOIN orders
ON customers.cust_id = orders.cust_id;
SELECT customers.cust_id, orders.order_num
FROM customers RIGHT JOIN orders
ON customers.cust_id = orders.cust_id;
-
UNION 运算符将两个或更多查询的结果组合起来,并生成一个结果集,其中包含来自 UNION 中参与查询的提取行
-
所有查询的列数和列顺序必须相同 -
每个查询中涉及表的列的数据类型必须相同或兼容 -
通常返回的列名取自第一个查询
-
默认会去除相同行,如果需要保留相同行,使用 UNION ALL -
只能包含一个 ORDER BY 子句,并且必须位于语句的最后
-
在一个查询中从不同的表返回结构数据 -
对一个表执行多个查询,按一个查询返回数据
SELECT cust_name, cust_contact, cust_email
FROM customers
WHERE cust_state IN ('IL', 'IN', 'MI')
UNION
SELECT cust_name, cust_contact, cust_email
FROM customers
WHERE cust_name = 'Fun4All';
-
JOIN 中连接表的列可能不同,但在 UNION 中,所有查询的列数和列顺序必须相同 -
UNION 将查询之后的行放在一起(垂直放置),但 JOIN 将查询之后的列放在一起(水平放置),即它构成一个笛卡尔积
注意:不同数据库的函数往往各不相同,因此不可移植。本节主要以 Mysql 的函数为例。
SELECT *
FROM mytable
WHERE SOUNDEX(col1) = SOUNDEX('apple')
-
日期格式:YYYY-MM-DD -
时间格式:HH:MM:SS
mysql> SELECT NOW();
2018-4-14 20:25:11
SELECT AVG(DISTINCT col1) AS avg_col
FROM mytable
-
ASC :升序(默认) -
DESC :降序
SELECT * FROM products
ORDER BY prod_price DESC, prod_name ASC;
-
GROUP BY 子句将记录分组到汇总行中 -
GROUP BY 为每个组返回一个记录 -
GROUP BY 通常还涉及聚合:COUNT,MAX,SUM,AVG 等 -
GROUP BY 可以按一列或多列进行分组 -
GROUP BY 按分组字段进行排序后,ORDER BY 可以以汇总字段来进行排序
SELECT cust_name, COUNT(cust_address) AS addr_num
FROM Customers GROUP BY cust_name;
SELECT cust_name, COUNT(cust_address) AS addr_num
FROM Customers GROUP BY cust_name
ORDER BY cust_name DESC;
-
HAVING 用于对汇总的 GROUP BY 结果进行过滤 -
HAVING 要求存在一个 GROUP BY 子句 -
WHERE 和 HAVING 可以在相同的查询中
-
WHERE 和 HAVING 都是用于过滤 -
HAVING 适用于汇总的组记录;而 WHERE 适用于单个记录
SELECT cust_name, COUNT(*) AS num
FROM Customers
WHERE cust_email IS NOT NULL
GROUP BY cust_name
HAVING COUNT(*) >= 1;
CREATE DATABASE test;
DROP DATABASE test;
USE test;
CREATE TABLE user (
id int(10) unsigned NOT NULL COMMENT 'Id',
username varchar(64) NOT NULL DEFAULT 'default' COMMENT '用户名',
password varchar(64) NOT NULL DEFAULT 'default' COMMENT '密码',
email varchar(64) NOT NULL DEFAULT 'default' COMMENT '邮箱'
) COMMENT='用户表';
CREATE TABLE vip_user AS
SELECT * FROM user;
DROP TABLE user;
ALTER TABLE user
ADD age int(3);
ALTER TABLE user
DROP COLUMN age;
ALTER TABLE `user`
MODIFY COLUMN age tinyint;
ALTER TABLE user
ADD PRIMARY KEY (id);
ALTER TABLE user
DROP PRIMARY KEY;
-
视图是基于 SQL 语句的结果集的可视化的表 -
视图是虚拟的表,本身不包含数据,也就不能对其进行索引操作。对视图的操作和对普通表的操作一样
-
简化复杂的 SQL 操作,比如复杂的联结 -
只使用实际表的一部分数据 -
通过只给用户访问视图的权限,保证数据的安全性 -
更改数据格式和表示
CREATE VIEW top_10_user_view AS
SELECT id, username
FROM user
WHERE id < 10;
DROP VIEW top_10_user_view;
-
通过索引可以更加快速高效地查询数据 -
用户无法看到索引,它们只能被用来加速查询
-
更新一个包含索引的表需要比更新一个没有索引的表花费更多的时间,这是由于索引本身也需要更新。因此,理想的做法是仅仅在常常被搜索的列(以及表)上面创建索引
-
唯一索引表明此索引的每一个索引值只对应唯一的数据记录
CREATE INDEX user_index
ON user (id);
CREATE UNIQUE INDEX user_index
ON user (id);
ALTER TABLE user
DROP INDEX user_index;
-
如果存在违反约束的数据行为,行为会被约束终止 -
约束可以在创建表时规定(通过 CREATE TABLE 语句),或者在表创建之后规定(通过 ALTER TABLE 语句)
-
NOT NULL:指示某列不能存储 NULL 值 -
UNIQUE:保证某列的每行必须有唯一的值 -
PRIMARY KEY - NOT NULL 和 UNIQUE 的结合。确保某列(或两个列多个列的结合)有唯一标识,有助于更容易更快速地找到表中的一个特定的记录 -
FOREIGN KEY:保证一个表中的数据匹配另一个表中的值的参照完整性 -
CHECK:保证列中的值符合指定的条件 -
DEFAULT:规定没有给列赋值时的默认值
CREATE TABLE Users (
Id INT(10) UNSIGNED NOT NULL AUTO_INCREMENT COMMENT '自增Id',
Username VARCHAR(64) NOT NULL UNIQUE DEFAULT 'default' COMMENT '用户名',
Password VARCHAR(64) NOT NULL DEFAULT 'default' COMMENT '密码',
Email VARCHAR(64) NOT NULL DEFAULT 'default' COMMENT '邮箱地址',
Enabled TINYINT(4) DEFAULT NULL COMMENT '是否有效',
PRIMARY KEY (Id)
) ENGINE=InnoDB AUTO_INCREMENT=2 DEFAULT CHARSET=utf8mb4 COMMENT='用户表';
-
不能回退 SELECT 语句,回退 SELECT 语句也没意义;也不能回退 CREATE 和 DROP 语句 -
MySQL 默认是隐式提交,每执行一条语句就把这条语句当成一个事务然后进行提交。当出现 START TRANSACTION 语句时,会关闭隐式提交;当 COMMIT 或 ROLLBACK 语句执行后,事务会自动关闭,重新恢复隐式提交 -
通过 set autocommit=0 可以取消自动提交,直到 set autocommit=1 才会提交;autocommit 标记是针对每个连接而不是针对服务器的
-
START TRANSACTION:指令用于标记事务的起始点 -
SAVEPOINT:指令用于创建保留点 -
ROLLBACK TO:指令用于回滚到指定的保留点;如果没有设置保留点,则回退到 START TRANSACTION 语句处 -
COMMIT:提交事务
-- 开始事务
START TRANSACTION;
-- 插入操作 A
INSERT INTO `user`
VALUES (1, 'root1', 'root1', 'xxxx@163.com');
-- 创建保留点 updateA
SAVEPOINT updateA;
-- 插入操作 B
INSERT INTO `user`
VALUES (2, 'root2', 'root2', 'xxxx@163.com');
-- 回滚到保留点 updateA
ROLLBACK TO updateA;
-- 提交事务,只有操作 A 生效
COMMIT;
-
整个服务器,使用 GRANT ALL 和 REVOKE ALL -
整个数据库,使用 ON database.* -
特定的表,使用 ON database.table -
特定的列 -
特定的存储过程
-
新创建的账户没有任何权限
-
账户用 username@host 的形式定义,username@% 使用的是默认主机名
-
MySQL 的账户信息保存在 mysql 这个数据库中
USE mysql;
SELECT user FROM user;
复制代码
CREATE USER myuser IDENTIFIED BY 'mypassword';
UPDATE user SET user='newuser' WHERE user='myuser';
FLUSH PRIVILEGES;
DROP USER myuser;
SHOW GRANTS FOR myuser;
GRANT SELECT, INSERT ON *.* TO myuser;
REVOKE SELECT, INSERT ON *.* FROM myuser;
SET PASSWORD FOR myuser = 'mypass';
-
存储过程可以看成是对一系列 SQL 操作的批处理
-
代码封装,保证了一定的安全性 -
代码复用 -
由于是预先编译,因此具有很高的性能
-
命令行中创建存储过程需要自定义分隔符,因为命令行是以 ; 为结束符,而存储过程中也包含了分号,因此会错误把这部分分号当成是结束符,造成语法错误 -
包含 in、out 和 inout 三种参数 -
给变量赋值都需要用 select into 语句 -
每次只能给一个变量赋值,不支持集合的操作
DROP PROCEDURE IF EXISTS `proc_adder`;
DELIMITER ;;
CREATE DEFINER=`root`@`localhost` PROCEDURE `proc_adder`(IN a int, IN b int, OUT sum int)
BEGIN
DECLARE c int;
if a is null then set a = 0;
end if;
if b is null then set b = 0;
end if;
set sum = a + b;
END
;;
DELIMITER ;
set @b=5;
call proc_adder(2,@b,@s);
select @s as sum;
-
游标(cursor)是一个存储在 DBMS 服务器上的数据库查询,它不是一条 SELECT 语句,而是被该语句检索出来的结果集 -
在存储过程中使用游标可以对一个结果集进行移动遍历 -
游标主要用于交互式应用,其中用户需要对数据集中的任意行进行浏览和修改
-
声明游标,这个过程没有实际检索出数据 -
打开游标 -
取出数据 -
关闭游标
DELIMITER $
CREATE PROCEDURE getTotal()
BEGIN
DECLARE total INT;
-- 创建接收游标数据的变量
DECLARE sid INT;
DECLARE sname VARCHAR(10);
-- 创建总数变量
DECLARE sage INT;
-- 创建结束标志变量
DECLARE done INT DEFAULT false;
-- 创建游标
DECLARE cur CURSOR FOR SELECT id,name,age from cursor_table where age>30;
-- 指定游标循环结束时的返回值
DECLARE CONTINUE HANDLER FOR NOT FOUND SET done = true;
SET total = 0;
OPEN cur;
FETCH cur INTO sid, sname, sage;
WHILE(NOT done)
DO
SET total = total + 1;
FETCH cur INTO sid, sname, sage;
END WHILE;
CLOSE cur;
SELECT total;
END $
DELIMITER ;
-- 调用存储过程
call getTotal();
注意:在 MySQL 中,分号 ; 是语句结束的标识符,遇到分号表示该段语句已经结束,MySQL 可以开始执行了。因此,解释器遇到触发器执行动作中的分号后就开始执行,然后会报错,因为没有找到和 BEGIN 匹配的 END。
-
MySQL 中定义了 NEW 和 OLD 关键字,用来表示触发器的所在表中,触发了触发器的那一行数据 -
在 INSERT 型触发器中,NEW 用来表示将要(BEFORE)或已经(AFTER)插入的新数据 -
在 UPDATE 型触发器中,OLD 用来表示将要或已经被修改的原数据,NEW 用来表示将要或已经修改为的新数据 -
在 DELETE 型触发器中,OLD 用来表示将要或已经被删除的原数据 -
使用方法:NEW.columnName (columnName 为相应数据表某一列名
提示:为了理解触发器的要点,有必要先了解一下创建触发器的指令。
CREATE TRIGGER trigger_name
trigger_time
trigger_event
ON table_name
FOR EACH ROW
BEGIN
trigger_statements
END;
-
trigger_name:触发器名 -
trigger_time: 触发器的触发时机。取值为 BEFORE 或 AFTER -
trigger_event: 触发器的监听事件。取值为 INSERT、UPDATE 或 DELETE -
table_name:触发器的监听目标。指定在哪张表上建立触发器 -
FOR EACH ROW: 行级监视,Mysql 固定写法,其他 DBMS 不同 -
trigger_statements: 触发器执行动作。是一条或多条 SQL 语句的列表,列表内的每条语句都必须用分号 ; 来结尾
DELIMITER $
CREATE TRIGGER `trigger_insert_user`
AFTER INSERT ON `user`
FOR EACH ROW
BEGIN
INSERT INTO `user_history`(user_id, operate_type, operate_time)
VALUES (NEW.id, 'add a user', now());
END $
DELIMITER
SHOW TRIGGERS;
DROP TRIGGER IF EXISTS trigger_insert_user;
长按关注【爱数据LoveData】
回复【216】
即可领取+新人见面礼
扫码回复关键词即可领取
《小爱学习包》部分内容
《小爱学习包》部分内容
《见面礼》部分内容
往期精彩
1.这10个Excel功能,SQL也能实现!(附面试原题)
2.数据分析师有点小儿科?商业分析才是战场上的王者?
3.30个数据可视化小技巧 !建议收藏!
4.Python的网络爬虫技术在豆瓣电影中的应用:抓取、清洗及可视化分析9种最常用数据分析方法!
5.Excel技巧大揭秘:5个令你进阶的必备玩法!
发表评论