打造 Go 语言最快的排序算法-六虎

前言

说到排序算法，很多同学会想起快速排序、堆排序、冒泡排序这些耳熟能详的算法。了解得深一些的同学，也可能看过例如 Python 的 timsort 以及 C++ intro sort 之类的排序算法。

但是我们也会有很多疑问，例如 Go 语言中使用的快速排序和我们书上学到的快速排序有什么区别呢？如果我们自己写一个快排，会比 Go 语言自带的快吗？排序算法方面业界最新的进展是什么呢，有没有一个算法是最快的？

本篇文章会向大家介绍字节跳动-语言团队在 Go 语言排序算法的实践，我们使用了 pdqsort 算法 + Go1.18 泛型，实现了一个比标准库 API 在几乎所有情况下快 2x ~ 60x的算法库。

此项算法设计与分析改动已经被社区采纳合并进入 Go runtime 当中，成为默认的 unstable 排序算法，预计将会在 Go 1.19 中和大家见面，其中非泛型版本位于标准库 sort，泛型版本位于测试手机是否被监控 exp/slices。

Proposal: github.效率英文翻译com/golang/go/i…

临时项目地址github官网登陆入口：github.com/zhangyunhao…

简介

Go、Rus效率是什么意思t、C ++ 的默认 unstable 排序测试算法虽然名义上叫快速排序（quicksort），但其实质是混合排序算法（hybrid效率符号 sorting algorithm），它们虽然在大部分情况下会使用快速排序算法，但是也会在不同Go情况下切换到其他排序算法。

unstable 排序算测试英文法意味着在排序过程中，值相等的元素可能会被互相交换位置。

一般来说，常见的混合排序算法，都会在元素较少（这个值一般是 16 ~ 32）的序算法的特征列中切换成插入排序（insertion sort），尽管插入排序算法的有穷性是指的时间复杂度为 O(n^2)，但是其在元素较少时性能基本超越其他排序算法，所以在混合排序算法的方案中被经常使用。

在其他情况下，默认使用快速排效率符号序算法。然而，快速排序算法有可能因为 pivot 选择的问题（有些序列 pivot 选择不好，导致性能下降很快）而导致在某些情况下可能到达最坏的时间复杂度 O(n^2)，为测试用例了保证快效率集速排序算法部分在最坏情况下，我们的时间复杂度仍然为 O(n* logn)。大部分混合排序算法都会在某种情况下转而使用堆排序，因为堆排序在最坏情况下的时间复杂度仍然可以保持 O(n* logn)。

一言以蔽之，目前流行的 unstable 排序算法基本都是在不同的情况下，使用不同的方式排序从而达到最优解。而我们今天github开放私库介绍的 pdqsort 也是这一思想的延伸。公积金

前置知识

介绍一工龄越长退休金越多吗些常见的基本的排序算法以及它们的特性。

Quicksort (classic)

Average-case：O(n*logn) Bad-case：O(n^2测试英文)

经算法的空间复杂度是指典的快速排序（quigithub汤姆cksort）主要采用了分治的思想，效率意识方面存在的问题具体的过程是将一个 array 通过选定一个 pivot（锚点）分成不同的github中文官网网页 sub-arrays，选定 pivot 后，使得这个 arra测试工程师y 中位于 pivot 左边的元素都小于 p公积金ivot，位于 pivot 右边的元素都大于 piv效率英文翻译ot。由此，pivot 两边构成了两个 sub-arra测试手机是否被监控ys，然后对这些 sub-arrays 进行相同的操作（选定 pivot 然后切分）。当某个 sub测试-array 只有一个元素时，其本身有序，此时便可以退出循环。如此反复，最后得到整体的有序。

我们可以观察到，经典的 quicksor测试工程师t 主要过程就是两步：

choose pivot: 选择一个 pivot
partition: 使用 pivot 对 array 进行划分

总的来说，quicksort 的性能关键点在于选定pivot，选择 pivot 的好坏直接决定了排序的速度，如果每次 pivot 都被选定为真正的 median（中位数），此时快效率符号排的效率是最高的。因此 pivot测试工程师的选公司让员工下班发手机电量截图择重点在于寻找 array 真正的 median，目前所有的 pivot 选择方案都是在寻找一个近似的 median。

为什么 pivot 选定为中位数使得快排效率最高？

详工龄越长退休金越多吗细解算法设计与分析释可以参考：en.wikipedia.org/wik公积金i/Quicks… 如果选定为中位数，则大部分情况下每次 partition 都会形成两个长度基本相同的测试工程师 sub-arrays，我们只需要 logn 次 parti公积金tion 就可以使得 array 完全有序，此时时间复杂度为 O(n* l测试ogn)。在最坏情况下，我们需要 n-1 次 partition （每次将长度为 L 的 array 分为长度为 1 和 L – 1 的测试抑郁症的20道题两个 sub-arrays）才能使得 array 有序，此时时间复杂度为 O(n^2)。

我们为何不直接寻找 array 真正的 median？

原因是因为测试仪 array 的长度太长的话，寻找真正的 median 是一个非常昂贵的操作效率（需要存储所有的测试抑郁症的20道题 items），相比于寻找一个近似的 median 作为 pivot 会消耗更多的资源，如果找到正确 median 的消耗比使用一个近似 median 高的话，这就是一效率集个负优化。折中的方案就是使用一个高性能的近似 median 选择方案。

基本所有针对 quicksort 的改进方案，都是通过改造这两步得到的，例如第一步可以使用多种不同枸杞的 pivot 选择方案（见附录），第二步则有诸算法是指什么如 BlockQuickSort 这样通过减少分支预测来提升性能的方案。

Insgithub汤姆ertion sort

插入排序的主要想法是，每一次将一个待排序工龄差一年工资差多少的元素插入到前方已经排序好的序列中，直到插入所有元素。尽管其平均时间复杂度高达 O(n^2算法分析的目的是)，但是在 a测试用例rray 长度较短（这个值一般是 16 ~ 32）的情况下，算法工程师在实际应用中拥有良好的性能表现。

Heap sort

堆排序是利用堆结构设计出来的一种排序算法github是什么。这个算法有一个非常重要的特性，其在最坏情况下的时间复杂度测试仍然为 O(n* logn)。故而很多混合排序算法利用了这一特性，将堆排序作为 fall back 的排序算法，使得混合排序算法在最坏情况下的理论时间复杂度仍然为 O(n* logn)。

pdqsort (pattern-defeating quicksort)

论文地址：arxi公司让员工下班发手机电量截图v.org/pdf/2106.05…

pdqsort (pattern-defating quicksort) 是 Rust、C++ Boost 中默认的 unstabl测试工程师e 排序算法，其实质为一种混合排序算法，会在不同情况下切换到不同的排序机制，是 C++ 标准库算法 introsort效率英文翻译的一种改进。算法设计与分析可以认为是 unstable 混合排序算算法的五个特性法的较新成果。

其理想情况下的时间复杂度为 O(n)，最坏测试英文情况下的时间复杂度为 O算法分析的目的是(n* logn)，不需要额外的空间。

pdqgithub官网登陆入口sort 的主要改进在于，其对 common casesgithub直播平台永久回家（常见的情况）做了特殊优化。因此在这些情况下性能超越了之前算法，并且相比 introsort 在随机序列的排序性能基本保持了一致。例如当序列本身有序、完全逆序、基本效率公式有序这些情况下都超越了大部分算法。其主要的思想是，不断判定目前的序列情况，然后使用不同的方式和路径达到最优解。

这里的算法算法分析的目的是细节描述的是 g测试ithub.算法的空间复杂度是指com/zhangyunhao… 中的实践，其大致相当于论文中的 PDQ 算法（没有来自 BlockQuickSort 的优化效率高发票查验），并且加入了一些参数调整以及借鉴了部分其github永久回家地址他 pdqsort 的实践优化。

注意，不Go同 pdqsort 实践中会有一些细微差异（因为语言以及接口的关系），不过其总体思想是一致的。

pdqsort C++ 版本性能对比，位于 github.com/orlp/pdqsor…

整体流程

为了更好地解析 pdqsort 算法，我们先来描述下其主要流程。pdqsort 就是下面三算法导论种情况的不断循环，根据序列长度以及工龄越长退休金越多吗是否是最坏情况，每个 arra宫颈癌y 都会使用下面三种方法之一进行排序（有效率符号优先级，尽可能使用排在前面的方式）

短序列情况，对于长度在 [0, MAX_INSERTION] 的输入，使用 insertion sort （插入排序）来进行排序后直接返回，这里的 MAX_INSERTION 我们在 Go 语言下的性能测试，选定为 24。
最坏情github直播平台永久回家况，如果发现改进的 quicksort 效果不佳（limit== 0），则后续排序都使用 heap sort 来保证最坏情况时间复杂度为 O(n*logn)。
正常情况，对于其他输入，使用改进的 quicksort 来排序，这里的算法分几步，后续内容会详细介绍部分步骤。

图中浅黄色虚线框代表此步骤为可选项，即算法会算法导论根据情况（以下变量）来决定是否执行。

下列变量枸杞代表 pdqsort 进行本次循环排序的情效率符号况，效率意识方面存在的问题用于帮助算法来猜测需要排序的 array 的状态，来效率的英文决定某些步骤是否需要进行

wasBalanced: Bool, 代表上次 partition 是否平衡。在 pivot 和真正的 median 很接近时我们认为是平衡的（true），此变量可以用 partition 后的 pivot index 同 array 两端的距离来判定。
wasPartitioned:工资超过5000怎么扣税 Bool, 如果为真，则代表上次 partition 没有交换任何元素测试抑郁症（即上次 partition 分割的是一个本身已经有序的 array）。
limgithub官网登陆入口it: int，如果为 0，则后续对 unsorted array 的排序都会使用 heap sort效率的英文而不是 quick sort。这种情况发生在 quicksort 有很多次选择的 pivogithub开放私库t 和真正的 median 差距很大，从而导测试工程师致 partition 后的两个 sub-arrays 长度相差较大的场景中测试抑郁症。li效率意识方面存在的问题mit的初始值是根据待排序 array 的长度计算出来的，每次发现快排策略效果不佳时，即!wasBalanced为真，则使得limit减小 1。

3-1工商银行. 应对可能的最坏情况，即实现中的b效率的英文reakPatterns。此时宫颈癌会判断 wasBalan公司让员工下班发手机电量截图ced 是否为 true，如果不平衡（false），则随机测试抑郁症的20道题交换几个元素，破坏一些可能造成 pivot 与 median 相差较大的特殊情况。

3-2. pivot 的选择，即实现中的choosePivot。函数同时返回两个值，pivotidx 和 likelySorted，前者是 piv效率的拼音ot 在此 array 的 index（索引），后者代表着选择 pivot 的过程中效率意识方面存在的问题，是否可以大概率认定这个 array 已经为有序。

3-3. 应对几乎有序的情况，即实现中的partialInsertionSort。如果wasB工龄越长退休金越多吗alanced && wasPartitioned && likelySorted为 true，则代表此 array 有非常大的可能是一个有序序列。此时我们使用 partial insertion sort 的排序算法，其原理和 insert算法设计与分析ion算法是指什么 sort 大致相当，只是多了一个尝试次数，即只会对有限的元素进行插入排序，增加这个限制是为了避免猜测错误导算法导论致消耗大量时间。如果达到尝试次效率的英文数时 arr效率是什么意思ay 仍未有序，则退出。如果在尝试次数google之前发现所有元素有序，则可以直接返回。

3-4. 应对重复元素较多的情况，即实现中的partitionEqual。如果 pred 存在，并且和本次选中的 pivot 值相等（pred 是之前 array 的 pivot，即目前 array 中的最小值，因为与 pivot 重复的元素只可能出现在 partition 后的两个 sub-array工龄差一年工资差多少s 其中之一），说明重复元素很可能较多，则调用partition算法的有穷性是指Equal然后继续进行下次循环，使用这种方法将重复元素提前放到一起，因为多次选定重复元素作为 pivot 会使得 partition 的效率较低。

3-5. partitio算法的有穷性是指n，使用 pivot 来分割 array，即实现中partition。此函数和一般快排的 partition 相比基本测试用例相同，区别在于其会检测序算法的特征列是否本身就是有序的（即 partition 时没有交效率集换任何元素）。

实现细节工龄差一年工资差多少

breakPatterns (3-1)

这一步的作用是解决一些会导致现有 pivot 选择方案表现很差的情况，所以当上次 partition 的 piv测试抑郁症的20道题ot 选择不好时（表现为最终 pivot 的位置离 array 两端之一很近），此时会随机交换几个元素来避免github下载一些极端情况。同时，此步骤还会将li测试英文mit减去 1，说github中文社区明上次 pivot 的选取方案不够好（当limit为 0 时使用 heapsort 而不是快排方案来进行排序）。

pivot 选择 (3-2)

附录中有关于 pivot 选择方案的详细介绍。

假设 array 的长度为 L，SHORTEST_MEDIAN_OF_MEDIANS 值github官网为 50。这里根据长度分为三种情况：算法的特征

L 位于 [0,8): 直接取固定值作为 pivot，即 L/4 * 2
L 位于 [8,SHORTEST_MEDIAN_OF_MEDIANS): 使用 medians of three 方法采样 3 个元素筛选 pivot，即 L/4* 1 L/4* 2 L/4* 3 的中间值
L 位于 [SHORTEST_MEDIAN_OF_MEDIANS, ∞): 使用 Tukey’s median of medians 采样 9 个元素得到一个近似中间值

此方法还会判断这个 array 是否很可能已经有序，例如当第三种情况工龄差一年工资差多少时，如果发现 a a-1 a+1 这三个值中，a 恰好是中间值（b,c 也同样如此），则说明元素在这些地方枸杞都局部有序，所以这个 array 很可能是已经有序的。如果每次都发算法的有穷性是指现，a a-1 a+1 这三个值都是逆序排列（b,c 也同样如此），则说明元素在这些地方都局部逆序，整个 array 很可能是完全逆序的。此时的策略是github永久回家地址将整个 array 翻转，这github下载样有很大概率使得整个 array 几乎有序。

Go 语言环境下的实践考量

Go 1.18 泛算法的特征型对于排序算法的影响

Go 1.18 的泛型在这种情况下有较大的性能提升并且增加了可维护性，同样的算法在经过泛型改造后能得到2x的性能提升。这一点我们通过观察 pdqsort 泛型版本，以及 pdqs工商银行ort (with sort.Interface) 的版本性能对比可以观工龄差一年工资差多少察出来。

在可维护性方面，通过泛型的类型约束抽象了所有可比对的基本类型效率的拼音，不需要使用复杂的代码生成技术。

在性能方面，泛型由于有了类型参数，可以在编译期生成大量代码，免去了使用sort.Interface带来的抽象开销。

pdqsort 相比于 Go 原有算法的优势

在纯粹的算法层面，即测试抑郁症 pdqsort (with so算法rt.Interface) ，pdqsort 在完全随机测试英文的情况下和原有算法（类似于 IntroSort）性能几乎一致（非泛型版本测试，因为Go需要兼容sort.Interface）。Go在常见的场景下（例如序列有序|龚俊几乎有github官网序|逆序|几乎逆序|重复算法的特征元素较多）等情况下，会比原有的算法快1 ~ 30倍。

因此，我们同样向 Go 官方提议将 pdqso效率意识方面存在的问题rt 应用在 sort.Sort 中，相关的 issue 讨论位于：github.com/golang/go/i…

Go 原有的算法类似于 introsoGitHubrt，其通过递归次数来决定是否切换到 fall back 算法，而 pdqsort 使用了另一种计算方式（基于序列长度），使得切换到 fall back 算法的时机更加合理。

为什么禁用来自 BlockQuickSort 的优化

因为 BlockQuickSort 的优化基本来自减测试你适合学心理学吗少分支预测，原理是在 partition 一个长算法设计与分析序列的时候，先存储需要交换的元素，后续统一放到真正的序列中。经过实际性能测试，发现这一优化在 Go 上并不成立，甚至是一个负优化。原因可能由于 Go 是github官网登陆入口一门 heap-allocate 的语言，对于此类优化并不敏测试抑郁症的20道题感。并且对于减少分支预测，Go 的编译器在某些情况下并不能优化到相应指令（CMOV）。

总结

目前大部分工业界使用的 unstable 排序算法，基本上都从过去教科书中单一的排序算法转变成混合排序测试抑郁症的20道题算法，来应对实践场景中各式各样github开放私库的序列。

pdqsort 依靠其在常见github中文社区场景相比之前算法的性能优势，逐渐算法导论成为 unstable 排序算法的主流实现。基于 Go1.18 带来的泛型，使得排序算法的实现被大大简化，也给予了我们实现新算法的可能。但是 p工资超过5000怎么扣税dqsort 也不是万能灵药，效率的拼音在某些情况下，其他的算法依然保持着优势（例如 Python 标准库的 timsort 在混合升序&工商银行&降序的场景优于 pdqsort）。github永久回家地址不过在大部分情况下，pd公司让员工下班发手机电量截图qsort 依靠其对于不同情况的特定优化，成为了github开放私库 unstable 算法较好的选择。

附录

quicksortgithub汤姆 pivot 方案对比

这里简单介绍不同的 pivot 选择方案。最好的 pivot 选择方案就是使用一个高性能的近似 median 选择方案，在准确度和性能上达到平衡。假设我们需要排序的元素为[4,3,2,1]，我们需要将其排列为升序，即[1,2,3,4]。

选择首个元素

这是我们实现快排时最简单的方法，即选取 array 的首个元素作为 pivot。

[4,3,2,1]。选定 4 为 pivot，由于左边没有元素，所以会从最右边开始找，找到第一个比 4 小的元素，即 1 作交换。
[1,3,2,4]。选定 1 为 pivot，同理。希望从右边找到第一个比 1 小的元素，由于 1 已经是最github永久回家地址小的值，此轮不会交换任何元素。
[1,3,2,4]。选定 3 为 pivo测试抑郁程度的问卷t，同理。将 2 和 3 互换。
[1,2,3,4]。得到结果。

可以看到，选择首个元素的方式在 array 为逆序的情况下，每轮 partition 只将问题的规模减小了 1，即每次只能确定一个元GitHub素的最终位置。这种简单的方法在面对极端情况效率的拼音时效果并不好，在完全逆序的情况下达到了快排的最坏情况。

median of three

这个方法是分别取最左边、测试英文最右边、中间三个值，然后选出其中间值作为 pivot。例如[4,3,2,1]，我们会选取4 3 1然后选择其中的3作为 pivot。这种方式相比于首个元素的方式会效率英文翻译更加合理，因为采样了多个google元素，不容效率的英文易受到一些极端情测试况的影响，往往会比首个元素的方式有更好的效果。

stackov算法的时间复杂度取决于e测试你的自卑程度rflow discussion:

stackoverflow.com/questions/7…效率计算公式

median of medians

这个方法的原理其实和 median of three 相似，不同的地方在于加大了 pivot测试用例的效率符号采样范围，在google array 长度较长的情况下理论表现会更好。其采样步骤是先将 array 分为 n/5 个 sgithub永久回家地址ub-arrays，n 为 array 的长度。然后将这些 sub-arrays 的 medians 都取出，选取这些 medians 中的 median，同样的方式如此反复，最后得到一个 media效率英文翻译n of medians 作为最后的 pivot。算法的五个特性

stackoverflow discussion:

stackoverflow.com/questions/5…

Med工资超过5000怎么扣税ian-finding Algorithm:

brilliant.org/wiki/median测试你适合学心理学吗…

John Tukey’s median of medians

此方法其实是 median of three 的改进，我们在 median of thgithub永久回家地址ree 会取三个元素，而 Tukey’s median of medians 会取三个元素及其相邻两个元素的 median（例如 median of three 取了 a,b,c 则此方案会选择 a-1 a a+1 取这三个值的 median），然后再取这个三个 medians 的 median。即此方案会采样其中 9 个元素，相比于 median of three 多了三倍的采样率，所以此方法也叫做 Tukey’sgithub中文社区 ninther。

See

www.johndcook.com/blog/2009/0…

打造 Go 语言最快的排序算法

前言

简介