Skip to content
体验新版
项目
组织
正在加载...
登录
切换导航
打开侧边栏
OpenDocCN
awesome-algorithm
提交
700b527d
A
awesome-algorithm
项目概览
OpenDocCN
/
awesome-algorithm
通知
1
Star
0
Fork
0
代码
文件
提交
分支
Tags
贡献者
分支图
Diff
Issue
0
列表
看板
标记
里程碑
合并请求
0
Wiki
0
Wiki
分析
仓库
DevOps
项目成员
Pages
A
awesome-algorithm
项目概览
项目概览
详情
发布
仓库
仓库
文件
提交
分支
标签
贡献者
分支图
比较
Issue
0
Issue
0
列表
看板
标记
里程碑
合并请求
0
合并请求
0
Pages
分析
分析
仓库分析
DevOps
Wiki
0
Wiki
成员
成员
收起侧边栏
关闭侧边栏
动态
分支图
创建新Issue
提交
Issue看板
前往新版Gitcode,体验更适合开发者的 AI 搜索 >>
未验证
提交
700b527d
编写于
1月 15, 2018
作者:
K
KEQI HUANG
提交者:
GitHub
1月 15, 2018
浏览文件
操作
浏览文件
下载
电子邮件补丁
差异文件
Update python实现八大排序.md
上级
77382d52
变更
1
隐藏空白更改
内联
并排
Showing
1 changed file
with
369 addition
and
1 deletion
+369
-1
python实现八大排序.md
python实现八大排序.md
+369
-1
未找到文件。
python实现八大排序.md
浏览文件 @
700b527d
### 直接插入排序
## 前言
八大排序,三大查找是《数据结构》当中非常基础的知识点,在这里为了复习顺带总结了一下常见的八种排序算法。
常见的八大排序算法,他们之间关系如下:
![](
https://github.com/Lisanaaa/thinking_in_lc/blob/master/images/%E5%85%AB%E5%A4%A7%E6%8E%92%E5%BA%8F%E7%AE%97%E6%B3%95%E6%80%BB%E7%BB%93.png
)
他们的性能比较:
![](
https://github.com/Lisanaaa/thinking_in_lc/blob/master/images/%E5%85%AB%E5%A4%A7%E6%8E%92%E5%BA%8F%E7%AE%97%E6%B3%95%E6%80%A7%E8%83%BD%E6%AF%94%E8%BE%83.png
)
### 直接插入排序 (Insertion sort)
![](
https://github.com/Lisanaaa/thinking_in_lc/blob/master/images/%E7%9B%B4%E6%8E%A5%E6%8F%92%E5%85%A5%E6%8E%92%E5%BA%8F.gif
)
直接插入排序的核心思想就是:将数组中的所有元素依次跟前面已经排好的元素相比较,如果选择的元素比已排序的元素小,则交换,直到全部元素都比较过。
因此,从上面的描述中我们可以发现,直接插入排序可以用两个循环完成:
...
...
@@ -19,3 +31,359 @@ def insert_sort(L):
if
L
[
i
]
>
L
[
i
+
1
]:
L
[
i
],
L
[
i
+
1
]
=
L
[
i
+
1
],
L
[
i
]
```
### 希尔排序 (Shell sort)
![](
https://github.com/Lisanaaa/thinking_in_lc/blob/master/images/%E5%B8%8C%E5%B0%94%E6%8E%92%E5%BA%8F.png
)
希尔排序的算法思想:将待排序数组按照步长gap进行分组,然后将每组的元素利用直接插入排序的方法进行排序;每次将gap折半减小,循环上述操作;当gap=1时,利用直接插入,完成排序。
同样的:从上面的描述中我们可以发现:希尔排序的总体实现应该由三个循环完成:
1.
第一层循环:将gap依次折半,对序列进行分组,直到gap=1
2.
第二、三层循环:也即直接插入排序所需要的两次循环。具体描述见上。
```
python
#希尔排序
def
insert_shell
(
L
):
#初始化gap值,此处利用序列长度的一半为其赋值
gap
=
int
(
len
(
L
)
/
2
)
#第一层循环:依次改变gap值对列表进行分组
while
(
gap
>=
1
):
#下面:利用直接插入排序的思想对分组数据进行排序
#range(gap,len(L)):从gap开始
for
x
in
range
(
gap
,
len
(
L
)):
#range(x-gap,-1,-gap):从x-gap开始与选定元素开始倒序比较,每个比较元素之间间隔gap
for
i
in
range
(
x
-
gap
,
-
1
,
-
gap
):
#如果该组当中两个元素满足交换条件,则进行交换
if
L
[
i
]
>
L
[
i
+
gap
]:
L
[
i
],
L
[
i
+
gap
]
=
L
[
i
+
gap
],
L
[
i
]
#while循环条件折半
gap
=
int
((
gap
/
2
))
```
### 简单选择排序 (Selection sort)
![](
https://github.com/Lisanaaa/thinking_in_lc/blob/master/images/%E7%AE%80%E5%8D%95%E9%80%89%E6%8B%A9%E6%8E%92%E5%BA%8F.gif
)
简单选择排序的基本思想:比较+交换。
1.
从待排序序列中,找到关键字最小的元素;
2.
如果最小元素不是待排序序列的第一个元素,将其和第一个元素互换;
3.
从余下的 N - 1 个元素中,找出关键字最小的元素,重复(1)、(2)步,直到排序结束。
因此我们可以发现,简单选择排序也是通过两层循环实现。
-
第一层循环:依次遍历序列当中的每一个元素
-
第二层循环:将遍历得到的当前元素依次与余下的元素进行比较,符合最小元素的条件,则交换。
```
python
# 简单选择排序
def
select_sort
(
L
):
#依次遍历序列中的每一个元素
for
x
in
range
(
0
,
len
(
L
)):
#将当前位置的元素定义此轮循环当中的最小值
minimum
=
L
[
x
]
#将该元素与剩下的元素依次比较寻找最小元素
for
i
in
range
(
x
+
1
,
len
(
L
)):
if
L
[
i
]
<
minimum
:
L
[
i
],
minimum
=
minimum
,
L
[
i
]
#将比较后得到的真正的最小值赋值给当前位置
L
[
x
]
=
minimum
```
### 堆排序 (Heap sort)
#### 堆的概念
堆:本质是一种数组对象。特别重要的一点性质:
<b>
任意的叶子节点小于(或大于)它所有的父节点
</b>
。对此,又分为大顶堆和小顶堆,大顶堆要求节点的元素都要大于其孩子,小顶堆要求节点元素都小于其左右孩子,两者对左右孩子的大小关系不做任何要求。
利用堆排序,就是基于大顶堆或者小顶堆的一种排序方法。下面,我们通过大顶堆来实现。
基本思想:
堆排序可以按照以下步骤来完成:
1.
首先将序列构建称为大顶堆;
(这样满足了大顶堆那条性质:位于根节点的元素一定是当前序列的最大值)
![](
https://github.com/Lisanaaa/thinking_in_lc/blob/master/images/%E6%9E%84%E5%BB%BA%E5%A4%A7%E9%A1%B6%E5%A0%86.png
)
2.
取出当前大顶堆的根节点,将其与序列末尾元素进行交换;
(此时:序列末尾的元素为已排序的最大值;由于交换了元素,当前位于根节点的堆并不一定满足大顶堆的性质)
3.
对交换后的n-1个序列元素进行调整,使其满足大顶堆的性质;
![](
https://github.com/Lisanaaa/thinking_in_lc/blob/master/images/%E8%B0%83%E6%95%B4%E5%A4%A7%E9%A1%B6%E5%A0%86.png
)
4.
重复2.3步骤,直至堆中只有1个元素为止
```
python
#-------------------------堆排序--------------------------------
#**********获取左右叶子节点**********
def
LEFT
(
i
):
return
2
*
i
+
1
def
RIGHT
(
i
):
return
2
*
i
+
2
#********** 调整大顶堆 **********
#L:待调整序列 length: 序列长度 i:需要调整的结点
def
adjust_max_heap
(
L
,
length
,
i
):
#定义一个int值保存当前序列最大值的下标
largest
=
i
#获得序列左右叶子节点的下标
left
,
right
=
LEFT
(
i
),
RIGHT
(
i
)
#当左叶子节点的下标小于序列长度 并且 左叶子节点的值大于父节点时,将左叶子节点的下标赋值给largest
if
(
left
<
length
)
and
(
L
[
left
]
>
L
[
i
]):
largest
=
left
#当右叶子节点的下标小于序列长度 并且 右叶子节点的值大于父节点时,将右叶子节点的下标值赋值给largest
if
(
right
<
length
)
and
(
L
[
right
]
>
L
[
largest
]):
largest
=
right
#如果largest不等于i 说明当前的父节点不是最大值,需要交换值
if
(
largest
!=
i
):
L
[
i
],
L
[
largest
]
=
L
[
largest
],
L
[
i
]
# 执行递归操作:两个任务:1 寻找最大值的下标;2.最大值与父节点交换
adjust_max_heap
(
L
,
length
,
largest
)
#********** 建立大顶堆 **********
def
build_max_heap
(
L
):
length
=
len
(
L
)
for
x
in
range
(
int
((
length
-
1
)
/
2
),
-
1
,
-
1
):
adjust_max_heap
(
L
,
length
,
x
)
#********** 堆排序 **********
def
heap_sort
(
L
):
#先建立大顶堆,保证最大值位于根节点;并且父节点的值大于叶子结点
build_max_heap
(
L
)
#i:当前堆中序列的长度.初始化为序列的长度
i
=
len
(
L
)
#执行循环:1. 每次取出堆顶元素置于序列的最后(len-1,len-2,len-3...)
# 2. 调整堆,使其继续满足大顶堆的性质,注意实时修改堆中序列的长度
while
(
i
>
0
):
L
[
i
-
1
],
L
[
0
]
=
L
[
0
],
L
[
i
-
1
]
#堆中序列长度减1
i
-=
1
#调整大顶堆
adjust_max_heap
(
L
,
i
,
0
)
```
### 冒泡排序 (Bubble sort)
![](
https://github.com/Lisanaaa/thinking_in_lc/blob/master/images/%E5%86%92%E6%B3%A1%E6%8E%92%E5%BA%8F.gif
)
冒泡排序思路比较简单:
1.
将序列当中的左右元素,依次比较,保证右边的元素始终大于左边的元素;
( 第一轮结束后,序列最后一个元素一定是当前序列的最大值;)
2.
对序列当中剩下的n-1个元素再次执行步骤1。
3.
对于长度为n的序列,一共需要执行n-1轮比较
(利用while循环可以减少执行次数)
```
python
#冒泡排序
def
bubble_sort
(
L
):
length
=
len
(
L
)
#序列长度为length,需要执行length-1轮交换
for
x
in
range
(
1
,
length
):
#对于每一轮交换,都将序列当中的左右元素进行比较
#每轮交换当中,由于序列最后的元素一定是最大的,因此每轮循环到序列未排序的位置即可
for
i
in
range
(
0
,
length
-
x
):
if
L
[
i
]
>
L
[
i
+
1
]:
L
[
i
],
L
[
i
+
1
]
=
L
[
i
+
1
],
L
[
i
]
```
### 快速排序 (Quick sort)
![](
https://github.com/Lisanaaa/thinking_in_lc/blob/master/images/%E5%BF%AB%E9%80%9F%E6%8E%92%E5%BA%8F.gif
)
快速排序的基本思想:挖坑填数+分治法
1.
从序列当中选择一个基准数(pivot)
在这里我们选择序列当中第一个数作为基准数
2.
将序列当中的所有数依次遍历,比基准数大的位于其右侧,比基准数小的位于其左侧
3.
重复步骤1.2,直到所有子集当中只有一个元素为止。
用伪代码描述如下:
-
i =L; j = R; 将基准数挖出形成第一个坑a[i]。
-
j--由后向前找比它小的数,找到后挖出此数填前一个坑a[i]中。
-
i++由前向后找比它大的数,找到后也挖出此数填到前一个坑a[j]中。
-
再重复执行2,3二步,直到i==j,将基准数填入a[i]中
```
python
#快速排序
#L:待排序的序列;start排序的开始index,end序列末尾的index
#对于长度为length的序列:start = 0;end = length-1
def
quick_sort
(
L
,
start
,
end
):
if
start
<
end
:
i
,
j
,
pivot
=
start
,
end
,
L
[
start
]
while
i
<
j
:
#从右开始向左寻找第一个小于pivot的值
while
(
i
<
j
)
and
(
L
[
j
]
>=
pivot
):
j
-=
1
#将小于pivot的值移到左边
if
(
i
<
j
):
L
[
i
]
=
L
[
j
]
i
+=
1
#从左开始向右寻找第一个大于pivot的值
while
(
i
<
j
)
and
(
L
[
i
]
<=
pivot
):
i
+=
1
#将大于pivot的值移到右边
if
(
i
<
j
):
L
[
j
]
=
L
[
i
]
j
-=
1
#循环结束后,说明 i=j,此时左边的值全都小于pivot,右边的值全都大于pivot
#pivot的位置移动正确,那么此时只需对左右两侧的序列调用此函数进一步排序即可
#递归调用函数:依次对左侧序列:从0 ~ i-1//右侧序列:从i+1 ~ end
L
[
i
]
=
pivot
#左侧序列继续排序
quick_sort
(
L
,
start
,
i
-
1
)
#右侧序列继续排序
quick_sort
(
L
,
i
+
1
,
end
)
```
### 归并排序 (Merge sort)
![](
https://github.com/Lisanaaa/thinking_in_lc/blob/master/images/%E5%BD%92%E5%B9%B6%E6%8E%92%E5%BA%8F.gif
)
1.
归并排序是建立在归并操作上的一种有效的排序算法,该算法是采用分治法的一个典型的应用。它的基本操作是:将已有的子序列合并,达到完全有序的序列;即先使每个子序列有序,再使子序列段间有序。
2.
归并排序其实要做两件事:
-
分解----将序列每次折半拆分
-
合并----将划分后的序列段两两排序合并
因此,归并排序实际上就是两个操作,拆分+合并
3.
如何合并?
-
L[first...mid]为第一段,L[mid+1...last]为第二段,并且两端已经有序,现在我们要将两端合成达到L[first...last]并且也有序。
-
首先依次从第一段与第二段中取出元素比较,将较小的元素赋值给temp[]
-
重复执行上一步,当某一段赋值结束,则将另一段剩下的元素赋值给temp[]
-
此时将temp[]中的元素复制给L[],则得到的L[first...last]有序
4.
如何分解?
-
在这里,我们采用递归的方法,首先将待排序列分成A,B两组;
-
然后重复对A、B序列分组;
-
直到分组后组内只有一个元素,此时我们认为组内所有元素有序,则分组结束。
```
python
# 归并排序
#这是合并的函数
# 将序列L[first...mid]与序列L[mid+1...last]进行合并
def
mergearray
(
L
,
first
,
mid
,
last
,
temp
):
#对i,j,k分别进行赋值
i
,
j
,
k
=
first
,
mid
+
1
,
0
#当左右两边都有数时进行比较,取较小的数
while
(
i
<=
mid
)
and
(
j
<=
last
):
if
L
[
i
]
<=
L
[
j
]:
temp
[
k
]
=
L
[
i
]
i
+=
1
k
+=
1
else
:
temp
[
k
]
=
L
[
j
]
j
+=
1
k
+=
1
#如果左边序列还有数
while
(
i
<=
mid
):
temp
[
k
]
=
L
[
i
]
i
+=
1
k
+=
1
#如果右边序列还有数
while
(
j
<=
last
):
temp
[
k
]
=
L
[
j
]
j
+=
1
k
+=
1
#将temp当中该段有序元素赋值给L待排序列使之部分有序
for
x
in
range
(
0
,
k
):
L
[
first
+
x
]
=
temp
[
x
]
# 这是分组的函数
def
merge_sort
(
L
,
first
,
last
,
temp
):
if
first
<
last
:
mid
=
int
(((
first
+
last
)
/
2
))
#使左边序列有序
merge_sort
(
L
,
first
,
mid
,
temp
)
#使右边序列有序
merge_sort
(
L
,
mid
+
1
,
last
,
temp
)
#将两个有序序列合并
mergearray
(
L
,
first
,
mid
,
last
,
temp
)
# 归并排序的函数
def
merge_sort_array
(
L
):
#声明一个长度为len(L)的空列表
temp
=
len
(
L
)
*
[
None
]
#调用归并排序
merge_sort
(
L
,
0
,
len
(
L
)
-
1
,
temp
)
```
### 基数排序 (Radix sort)
![](
https://github.com/Lisanaaa/thinking_in_lc/blob/master/images/%E5%9F%BA%E6%95%B0%E6%8E%92%E5%BA%8F.gif
)
1.
基数排序:通过序列中各个元素的值,对排序的N个元素进行若干趟的“分配”与“收集”来实现排序。
-
分配:我们将L[i]中的元素取出,首先确定其个位上的数字,根据该数字分配到与之序号相同的桶中
-
收集:当序列中所有的元素都分配到对应的桶中,再按照顺序依次将桶中的元素收集形成新的一个待排序列L[ ]
-
对新形成的序列L[]重复执行分配和收集元素中的十位、百位...直到分配完该序列中的最高位,则排序结束
2.
根据上述“基数排序”的展示,我们可以清楚的看到整个实现的过程
```
python
#************************基数排序****************************
#确定排序的次数
#排序的顺序跟序列中最大数的位数相关
def
radix_sort_nums
(
L
):
maxNum
=
L
[
0
]
#寻找序列中的最大数
for
x
in
L
:
if
maxNum
<
x
:
maxNum
=
x
#确定序列中的最大元素的位数
times
=
0
while
(
maxNum
>
0
):
maxNum
=
int
((
maxNum
/
10
))
times
+=
1
return
times
#找到num从低到高第pos位的数据
def
get_num_pos
(
num
,
pos
):
return
(
int
((
num
/
(
10
**
(
pos
-
1
)))))
%
10
#基数排序
def
radix_sort
(
L
):
count
=
10
*
[
None
]
#存放各个桶的数据统计个数
bucket
=
len
(
L
)
*
[
None
]
#暂时存放排序结果
#从低位到高位依次执行循环
for
pos
in
range
(
1
,
radix_sort_nums
(
L
)
+
1
):
#置空各个桶的数据统计
for
x
in
range
(
0
,
10
):
count
[
x
]
=
0
#统计当前该位(个位,十位,百位....)的元素数目
for
x
in
range
(
0
,
len
(
L
)):
#统计各个桶将要装进去的元素个数
j
=
get_num_pos
(
int
(
L
[
x
]),
pos
)
count
[
j
]
+=
1
#count[i]表示第i个桶的右边界索引
for
x
in
range
(
1
,
10
):
count
[
x
]
+=
count
[
x
-
1
]
#将数据依次装入桶中
for
x
in
range
(
len
(
L
)
-
1
,
-
1
,
-
1
):
#求出元素第K位的数字
j
=
get_num_pos
(
L
[
x
],
pos
)
#放入对应的桶中,count[j]-1是第j个桶的右边界索引
bucket
[
count
[
j
]
-
1
]
=
L
[
x
]
#对应桶的装入数据索引-1
count
[
j
]
-=
1
# 将已分配好的桶中数据再倒出来,此时已是对应当前位数有序的表
for
x
in
range
(
0
,
len
(
L
)):
L
[
x
]
=
bucket
[
x
]
```
## 运行时间实测
10w数据
```
直接插入排序:1233.581131
希尔排序:1409.8012320000003
简单选择排序:466.66974500000015
堆排序:1.2036720000000969
冒泡排序:751.274449
#****************************************************
快速排序:1.0000003385357559e-06
#快速排序有误:实际上并未执行
#RecursionError: maximum recursion depth exceeded in comparison
#****************************************************
归并排序:0.8262230000000272
基数排序:1.1162899999999354
```
从运行结果上来看,堆排序、归并排序、基数排序真的快。
对于快速排序迭代深度超过的问题,可以将考虑将快排通过非递归的方式进行实现。
## Resources
1.
[
算法导论》笔记汇总
](
http://mindlee.com/2011/08/21/study-notes-directory/
)
2.
[
八大排序算法的 Python 实现
](
http://python.jobbole.com/82270/
)
3.
[
数据结构常见的八大排序算法(详细整理)
](
https://www.jianshu.com/p/7d037c332a9d
)
编辑
预览
Markdown
is supported
0%
请重试
或
添加新附件
.
添加附件
取消
You are about to add
0
people
to the discussion. Proceed with caution.
先完成此消息的编辑!
取消
想要评论请
注册
或
登录