关系型数据库MySQL.md 20.0 KB
Newer Older
1
## 关系数据库入门
2

3 4 5 6 7 8 9 10 11
### 关系数据库概述

1. 数据持久化 - 将数据保存到(在掉电情况下)能够长久保存数据的存储介质中。

2. 数据库发展史 - 网状数据库、层次数据库、关系数据库。

   > 1970年,IBM的研究员E.F.Codd在*Communication of the ACM*上发表了名为*A Relational Model of Data for Large Shared Data Banks*的论文,提出了关系模型的概念,奠定了关系模型的理论基础。后来Codd又陆续发表多篇文章,论述了范式理论和衡量关系系统的12条标准,用数学理论奠定了关系数据库的基础。

3. 关系数据库特点。
12

13
   - 理论基础:集合论和关系代数。
14

15
   - 具体表象:用二维表(有行和列)组织数据。
16

17
   - 编程语言:结构化查询语言(SQL)。
18

19
4. E-R图。
20 21 22 23
   - 实体 - 矩形框
   - 属性 - 椭圆框
   - 关系 - 菱形框
   - 重数 - 1:1 / 1:N / M:N
24 25 26 27 28 29 30

5. 关系数据库产品。
   - [Oracle](https://www.oracle.com/index.html) - 目前世界上使用最为广泛的数据库管理系统,作为一个通用的数据库系统,它具有完整的数据管理功能;作为一个关系数据库,它是一个完备关系的产品;作为分布式数据库,它实现了分布式处理的功能。在Oracle最新的12c版本中,还引入了多承租方架构,使用该架构可轻松部署和管理数据库云。
   - [DB2](https://www.ibm.com/analytics/us/en/db2/) - IBM公司开发的、主要运行于Unix(包括IBM自家的[AIX](https://zh.wikipedia.org/wiki/AIX))、Linux、以及Windows服务器版等系统的关系数据库产品。DB2历史悠久且被认为是最早使用SQL的数据库产品,它拥有较为强大的商业智能功能。
   - [SQL Server](https://www.microsoft.com/en-us/sql-server/) - 由Microsoft开发和推广的关系型数据库产品,最初适用于中小企业的数据管理,但是近年来它的应用范围有所扩展,部分大企业甚至是跨国公司也开始基于它来构建自己的数据管理系统。
   - [MySQL](https://www.mysql.com/) - MySQL是开放源代码的,任何人都可以在GPL(General Public License)的许可下下载并根据个性化的需要对其进行修改。MySQL因为其速度、可靠性和适应性而备受关注。
   - [PostgreSQL]() - 在BSD许可证下发行的开发源代码的关系数据库产品。
31 32 33 34 35 36 37 38 39

### MySQL简介

1. 安装和配置。
2. 常用命令。

### SQL详解

1. DDL
40 41

   ```SQL
42 43
   -- 如果存在名为school的数据库就删除它
   drop database if exists school;
44
   
45 46 47 48 49
   -- 创建名为school的数据库并设置默认的字符集和排序方式
   create database school default charset utf8 collate utf8_bin;
   
   -- 切换到school数据库上下文环境
   use school;
50
   
51 52 53
   -- 创建学院表
   create table tb_college
   (
54 55 56 57
   collid int not null auto_increment comment '编号',
   collname varchar(50) not null comment '名称',
   collmaster varchar(20) not null comment '院长',
   collweb varchar(511) default '' comment '网站',
58 59 60 61 62
   primary key (collid)
   );
   
   -- 创建学生表
   create table tb_student
63
   (
64
   stuid int not null comment '学号',
65
   stuname varchar(20) not null comment '姓名',
66 67 68
   stusex bit default 1 comment '性别',
   stubirth date not null comment '出生日期',
   stuaddr varchar(255) default '' comment '籍贯',
69 70 71
   collid int not null comment '所属学院',
   primary key (stuid),
   foreign key (collid) references tb_college (collid)
72 73
   );
   
74
   -- alter table tb_student add constraint fk_student_collid foreign key (collid) references tb_college (collid);
75 76 77 78
   
   -- 创建教师表
   create table tb_teacher
   (
79 80 81 82 83 84
   teaid int not null comment '工号',
   teaname varchar(20) not null comment '姓名',
   teatitle varchar(10) default '助教' comment '职称',
   collid int not null comment '所属学院',
   primary key (teaid),
   foreign key (collid) references tb_college (collid)
85
   );
86
   
87 88
   -- 创建课程表
   create table tb_course
89
   (
90 91 92 93 94 95
   couid int not null comment '编号',
   couname varchar(50) not null comment '名称',
   coucredit int not null comment '学分',
   teaid int not null comment '授课老师',
   primary key (couid),
   foreign key (teaid) references tb_teacher (teaid)
96 97
   );
   
98
   -- 创建选课记录表
99
   create table tb_score
100
   (
101 102 103 104 105 106 107 108
   scid int auto_increment comment '选课记录编号',
   stuid int not null comment '选课学生',
   couid int not null comment '所选课程',
   scdate datetime comment '选课时间日期',
   scmark decimal(4,1) comment '考试成绩',
   primary key (scid),
   foreign key (stuid) references tb_student (stuid),
   foreign key (couid) references tb_course (couid)
109 110
   );
   
111 112
   -- 添加唯一性约束(一个学生选某个课程只能选一次)
   alter table tb_score add constraint uni_score_stuid_couid unique (stuid, couid);
113 114
   ```

115
2. DML
116 117

   ```SQL
118
   
119
   -- 插入学院数据
120
   insert into tb_college (collname, collmaster, collweb) values 
121 122 123 124 125
   ('计算机学院', '左冷禅', 'http://www.abc.com'),
   ('外国语学院', '岳不群', 'http://www.xyz.com'),
   ('经济管理学院', '风清扬', 'http://www.foo.com');
   
   -- 插入学生数据
126 127
   insert into tb_student (stuid, stuname, stusex, stubirth, stuaddr, collid) values
   (1001, '杨逍', 1, '1990-3-4', '四川成都', 1),
128
   (1002, '任我行', 1, '1992-2-2', '湖南长沙', 1),
129 130 131
   (1033, '王语嫣', 0, '1989-12-3', '四川成都', 1),
   (1572, '岳不群', 1, '1993-7-19', '陕西咸阳', 1),
   (1378, '纪嫣然', 0, '1995-8-12', '四川绵阳', 1),
132
   (1954, '林平之', 1, '1994-9-20', '福建莆田', 1),
133
   (2035, '东方不败', 1, '1988-6-30', null, 2),
134
   (3011, '林震南', 1, '1985-12-12', '福建莆田', 3),
135 136 137 138 139 140 141 142 143
   (3755, '项少龙', 1, '1993-1-25', null, 3),
   (3923, '杨不悔', 0, '1985-4-17', '四川成都', 3),
   (4040, '隔壁老王', 1, '1989-1-1', '四川成都', 2);
   
   -- 删除学生数据
   delete from tb_student where stuid=4040;
   
   -- 更新学生数据
   update tb_student set stuname='周芷若', stuaddr='湖南长沙' where stuid=1378;
144 145
   
   -- 插入老师数据
146
   insert into tb_teacher (teaid, teaname, teatitle, collid) values 
147 148 149 150 151 152 153
   (1122, '张三丰', '教授', 1),
   (1133, '宋远桥', '副教授', 1),
   (1144, '杨逍', '副教授', 1),
   (2255, '范遥', '副教授', 2),
   (3366, '韦一笑', '讲师', 3);
   
   -- 插入课程数据
154
   insert into tb_course (couid, couname, coucredit, teaid) values 
155 156 157 158 159 160 161 162
   (1111, 'Python程序设计', 3, 1122),
   (2222, 'Web前端开发', 2, 1122),
   (3333, '操作系统', 4, 1122),
   (4444, '计算机网络', 2, 1133),
   (5555, '编译原理', 4, 1144),
   (6666, '算法和数据结构', 3, 1144),
   (7777, '经贸法语', 3, 2255),
   (8888, '成本会计', 2, 3366),
163
   (9999, '审计学', 3, 3366);
164 165
   
   -- 插入选课数据
166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183 184
   insert into tb_score (stuid, couid, scdate, scmark) values 
   (1001, 1111, '2017-09-01', 95),
   (1001, 2222, '2017-09-01', 87.5),
   (1001, 3333, '2017-09-01', 100),
   (1001, 4444, '2018-09-03', null),
   (1001, 6666, '2017-09-02', 100),
   (1002, 1111, '2017-09-03', 65),
   (1002, 5555, '2017-09-01', 42),
   (1033, 1111, '2017-09-03', 92.5),
   (1033, 4444, '2017-09-01', 78),
   (1033, 5555, '2017-09-01', 82.5),
   (1572, 1111, '2017-09-02', 78),
   (1378, 1111, '2017-09-05', 82),
   (1378, 7777, '2017-09-02', 65.5),
   (2035, 7777, '2018-09-03', 88),
   (2035, 9999, curdate(), null),
   (3755, 1111, date(now()), null),
   (3755, 8888, date(now()), null),
   (3755, 9999, '2017-09-01', 92);
185 186
   ```

187 188
3. DQL

189 190
   ```SQL
   -- 查询所有学生信息
191
   select * from tb_student;
192 193
   
   -- 查询所有课程名称及学分(投影和别名)
194 195 196 197 198
   select couname, coucredit from tb_course;
   select couname as 课程名称, coucredit as 学分 from tb_course;
   
   select stuname as 姓名, case stusex when 1 then '男' else '女' end as 性别 from tb_student;
   select stuname as 姓名, if(stusex, '男', '女') as 性别 from tb_student;
199 200
   
   -- 查询所有女学生的姓名和出生日期(筛选)
201 202
   select stuname, stubirth from tb_student where stusex=0;
   
203 204 205 206 207 208 209 210 211 212 213 214
   -- 查询所有80后学生的姓名、性别和出生日期(筛选)
   select stuname, stusex, stubirth from tb_student where stubirth>='1980-1-1' and stubirth<='1989-12-31';
   select stuname, stusex, stubirth from tb_student where stubirth between '1980-1-1' and '1989-12-31';
   
   -- 查询姓"杨"的学生姓名和性别(模糊)
   select stuname, stusex from tb_student where stuname like '杨%';
   
   -- 查询姓"杨"名字两个字的学生姓名和性别(模糊)
   select stuname, stusex from tb_student where stuname like '杨_';
   
   -- 查询姓"杨"名字三个字的学生姓名和性别(模糊)
   select stuname, stusex from tb_student where stuname like '杨__';
215
   
216 217
   -- 查询名字中有"不"字或"嫣"字的学生的姓名(模糊)
   select stuname, stusex from tb_student where stuname like '%不%' or stuname like '%嫣%';
218
   
219 220
   -- 查询没有录入家庭住址的学生姓名(空值)
   select stuname from tb_student where stuaddr is null;
221
   
222 223
   -- 查询录入了家庭住址的学生姓名(空值)
   select stuname from tb_student where stuaddr is not null;
224
   
225 226
   -- 查询学生选课的所有日期(去重)
   select distinct scdate from tb_score;
227
   
228 229
   -- 查询学生的家庭住址(去重)
   select distinct stuaddr from tb_student where stuaddr is not null;
230 231
   
   -- 查询男学生的姓名和生日按年龄从大到小排列(排序)
232 233 234
   -- asc - ascending - 升序(从小到大)
   -- desc - descending - 降序(从大到小)
   select stuname as 姓名, year(now())-year(stubirth) as 年龄 from tb_student where stusex=1 order by 年龄 desc;
235
   
236 237
   -- 聚合函数:max / min / count / sum / avg
   -- 查询年龄最大的学生的出生日期(聚合函数)
238
   select min(stubirth) from tb_student;
239 240
   
   -- 查询年龄最小的学生的出生日期(聚合函数)
241
   select max(stubirth) from tb_student;
242
   
243
   -- 查询男女学生的人数(分组和聚合函数)
244 245 246 247 248 249 250 251 252
   select count(stuid) from tb_student;
   select stusex, count(*) from tb_student group by stusex;
   select stusex, min(stubirth) from tb_student group by stusex;
   
   -- 查询课程编号为1111的课程的平均成绩(筛选和聚合函数)
   select avg(scmark) from tb_score where couid=1111;
   select min(scmark) from tb_score where couid=1111;
   select count(scid) from tb_score where couid=1111;
   select count(scmark) from tb_score where couid=1111;
253
   
254 255
   -- 查询学号为1001的学生所有课程的平均分(筛选和聚合函数)
   select avg(scmark) from tb_score where stuid=1001;
256
   
257
   -- 查询每个学生的学号和平均成绩(分组和聚合函数)
258 259 260 261 262 263 264 265 266 267 268 269 270 271 272 273 274 275 276 277 278 279 280 281 282 283 284 285 286
   select stuid as 学号, avg(scmark) as 平均分 from tb_score group by stuid;
   
   -- 查询平均成绩大于等于90分的学生的学号和平均成绩
   -- 分组以前的筛选使用where子句
   -- 分组以后的筛选使用having子句
   select stuid as 学号, avg(scmark) as 平均分 from tb_score group by stuid having 平均分>=90;
   
   -- 查询年龄最大的学生的姓名(子查询/嵌套的查询)
   select stuname from tb_student where stubirth=(
   	select min(stubirth) from tb_student
   );
   
   -- 查询年龄最大的学生姓名和年龄(子查询+运算)
   select stuname as 姓名, year(now())-year(stubirth) as 年龄 from tb_student where stubirth=(
   	select min(stubirth) from tb_student
   );
   
   -- 查询选了两门以上的课程的学生姓名(子查询/分组条件/集合运算)
   select stuname from tb_student where stuid=(
   	select stuid from tb_score group by stuid having count(stuid)>2
   )
   
   -- 查询学生姓名、课程名称以及成绩(连接查询)
   select stuname, couname, scmark from tb_student t1, tb_course t2, tb_score t3 where t1.stuid=t3.stuid and t2.couid=t3.couid and scmark is not null;
   
   -- 内连接和分页查询
   select stuname, couname, scmark from tb_student t1 inner join tb_score t3 on t1.stuid=t3.stuid inner join tb_course t2 on t2.couid=t3.couid where scmark is not null order by scmark desc limit 5 offset 10;
   
   select stuname, couname, scmark from tb_student t1 inner join tb_score t3 on t1.stuid=t3.stuid inner join tb_course t2 on t2.couid=t3.couid where scmark is not null order by scmark desc limit 10, 5;
287 288
   
   -- 查询选课学生的姓名和平均成绩(子查询和连接查询)
289
   select stuname, avgmark from tb_student t1, (select stuid, avg(scmark) as avgmark from tb_score group by stuid) t2 where t1.stuid=t2.stuid;
290
   
291 292
   select stuname, avgmark from tb_student t1 inner join 
   (select stuid, avg(scmark) as avgmark from tb_score group by stuid) t2 on t1.stuid=t2.stuid;
293
   
294 295 296
   -- 内连接(inner join):只有满足连接条件的记录才会被查出来
   -- 外连接(outer join):左外连接 / 右外连接 / 全外连接
   -- left outer join / right outer join / full outer join
297
   -- 查询每个学生的姓名和选课数量(左外连接和子查询)
298
   select stuname, ifnull(total, 0) from tb_student t1 left outer join (select stuid, count(stuid) as total from tb_score group by stuid) t2 on t1.stuid=t2.stuid;
299 300 301 302 303 304
   ```

4. DCL

   ```SQL
   -- 创建名为hellokitty的用户
305
   create user 'hellokitty'@'%' identified by '123123';
306 307
   
   -- 将对SRS数据库所有对象的所有操作权限授予hellokitty
308
   grant all privileges on school.* to 'hellokitty'@'%';
309 310
   
   -- 召回hellokitty对SRS数据库所有对象的insert/delete/update权限
311
   revoke insert, delete, update on school.* from 'hellokitty'@'%';
312 313
   ```

314 315 316 317 318 319 320 321 322 323 324 325 326 327 328 329
###  相关知识

#### 范式理论

#### 数据完整性

1. 实体完整性 - 每个实体都是独一无二的
   - 主键 / 唯一约束 / 唯一索引
2. 引用完整性(参照完整性)
   - 外键
3. 域完整性 - 数据是有效的
   - 数据类型
   - 非空约束
   - 默认值约束
   - 检查约束

330 331
### Python数据库编程

332
我们用如下所示的数据库来演示在Python中如何访问MySQL数据库。
333

334 335 336 337 338 339 340 341 342 343 344 345 346 347 348 349 350 351 352 353 354 355 356 357 358 359 360 361 362 363 364 365 366 367 368 369 370 371 372 373 374 375 376 377 378 379 380 381 382 383 384 385 386 387 388 389 390 391 392 393 394 395 396 397 398 399 400 401 402 403 404 405 406 407 408 409 410 411 412 413 414 415 416 417 418 419 420 421 422 423 424 425 426 427 428 429 430 431 432 433 434 435 436 437 438 439 440 441 442 443 444 445 446 447 448 449 450 451 452 453 454 455 456 457 458 459 460 461 462 463 464 465 466 467 468 469 470 471 472 473 474 475 476 477 478 479 480 481 482 483 484 485 486 487 488 489 490 491 492 493 494 495 496 497 498 499 500 501 502 503 504 505 506 507 508 509 510 511 512 513 514 515 516 517 518 519 520 521 522 523 524 525 526 527 528 529 530 531 532 533 534 535 536 537 538 539 540 541 542 543 544 545 546 547 548 549 550 551 552 553 554 555 556 557 558
```SQL
drop database if exists hrs;
create database hrs default charset utf8;

use hrs;

drop table if exists tb_emp;
drop table if exists tb_dept;

create table tb_dept
(
dno   int not null comment '编号',
dname varchar(10) not null comment '名称',
dloc  varchar(20) not null comment '所在地',
primary key (dno)
);

insert into tb_dept values 
	(10, '会计部', '北京'),
	(20, '研发部', '成都'),
	(30, '销售部', '重庆'),
	(40, '运维部', '深圳');

create table tb_emp
(
eno   int not null comment '员工编号',
ename varchar(20) not null comment '员工姓名',
job   varchar(20) not null comment '员工职位',
mgr   int comment '主管编号',
sal   int not null comment '员工月薪',
comm  int comment '每月补贴',
dno   int comment '所在部门编号',
primary key (eno)
);

alter table tb_emp add constraint fk_emp_dno foreign key (dno) references tb_dept (dno);

insert into tb_emp values 
	(7800, '张三丰', '总裁', null, 9000, 1200, 20),
	(2056, '乔峰', '分析师', 7800, 5000, 1500, 20),
	(3088, '李莫愁', '设计师', 2056, 3500, 800, 20),
	(3211, '张无忌', '程序员', 2056, 3200, null, 20),
	(3233, '丘处机', '程序员', 2056, 3400, null, 20),
	(3251, '张翠山', '程序员', 2056, 4000, null, 20),
	(5566, '宋远桥', '会计师', 7800, 4000, 1000, 10),
	(5234, '郭靖', '出纳', 5566, 2000, null, 10),
	(3344, '黄蓉', '销售主管', 7800, 3000, 800, 30),
	(1359, '胡一刀', '销售员', 3344, 1800, 200, 30),
	(4466, '苗人凤', '销售员', 3344, 2500, null, 30),
	(3244, '欧阳锋', '程序员', 3088, 3200, null, 20),
	(3577, '杨过', '会计', 5566, 2200, null, 10),
	(3588, '朱九真', '会计', 5566, 2500, null, 10);
```

在Python 3中,我们通常使用纯Python的三方库PyMySQL来访问MySQL数据库,它应该是目前最好的选择。

1. 安装PyMySQL。

   ```Shell
   pip install pymysql
   ```

2. 添加一个部门。

   ```Python
   import pymysql
   
   
   def main():
       no = int(input('编号: '))
       name = input('名字: ')
       loc = input('所在地: ')
       # 1. 创建数据库连接对象
       con = pymysql.connect(host='localhost', port=3306,
                             database='hrs', charset='utf8',
                             user='root', password='123456')
       try:
           # 2. 通过连接对象获取游标
           with con.cursor() as cursor:
               # 3. 通过游标执行SQL并获得执行结果
               result = cursor.execute(
                   'insert into tb_dept values (%s, %s, %s)',
                   (no, name, loc)
               )
           if result == 1:
               # 4. 操作成功提交事务
               con.commit()
               print('添加成功!')
       finally:
           # 5. 关闭连接释放资源
           con.close()
   
   
   if __name__ == '__main__':
       main()
   ```

3. 删除一个部门。

   ```Python
   import pymysql
   
   
   def main():
       no = int(input('编号: '))
       con = pymysql.connect(host='localhost', port=3306,
                             database='hrs', charset='utf8',
                             user='root', password='123456',
                             autocommit=True)
       try:
           with con.cursor() as cursor:
               result = cursor.execute(
                   'delete from tb_dept where dno=%s',
                   (no, )
               )
           if result == 1:
               print('删除成功!')
       finally:
           con.close()
   
   
   if __name__ == '__main__':
       main()
   ```

4. 更新一个部门。

   ```Python
   import pymysql
   
   
   def main():
       no = int(input('编号: '))
       name = input('名字: ')
       loc = input('所在地: ')
       con = pymysql.connect(host='localhost', port=3306,
                             database='hrs', charset='utf8',
                             user='root', password='123456',
                             autocommit=True)
       try:
           with con.cursor() as cursor:
               result = cursor.execute(
                   'update tb_dept set dname=%s, dloc=%s where dno=%s',
                   (name, loc, no)
               )
           if result == 1:
               print('更新成功!')
       finally:
           con.close()
   
   
   if __name__ == '__main__':
       main()
   ```

5. 查询所有部门。

   ```Python
   import pymysql
   from pymysql.cursors import DictCursor
   
   
   def main():
       con = pymysql.connect(host='localhost', port=3306,
                             database='hrs', charset='utf8',
                             user='root', password='123456')
       try:
           with con.cursor(cursor=DictCursor) as cursor:
               cursor.execute('select dno as no, dname as name, dloc as loc from tb_dept')
               results = cursor.fetchall()
               print(results)
               print('编号\t名称\t\t所在地')
               for dept in results:
                   print(dept['no'], end='\t')
                   print(dept['name'], end='\t')
                   print(dept['loc'])
       finally:
           con.close()
   
   
   if __name__ == '__main__':
       main()
   ```

6. 分页查询员工信息。

   ```Python
   import pymysql
   from pymysql.cursors import DictCursor
   
   
   class Emp(object):
   
       def __init__(self, no, name, job, sal):
           self.no = no
           self.name = name
           self.job = job
           self.sal = sal
   
       def __str__(self):
           return f'\n编号:{self.no}\n姓名:{self.name}\n职位:{self.job}\n月薪:{self.sal}\n'
   
   
   def main():
       page = int(input('页码: '))
       size = int(input('大小: '))
       con = pymysql.connect(host='localhost', port=3306,
                             database='hrs', charset='utf8',
                             user='root', password='123456')
       try:
           with con.cursor() as cursor:
               cursor.execute(
                   'select eno as no, ename as name, job, sal from tb_emp limit %s,%s',
                   ((page - 1) * size, size)
               )
               for emp_tuple in cursor.fetchall():
                   emp = Emp(*emp_tuple)
                   print(emp)
       finally:
           con.close()
   
   
   if __name__ == '__main__':
       main()
   ```