排序演算法

算法,按照一定的顺序列表的元素

電腦科學數學中,一個排序演算法(英語:Sorting algorithm)是一種能將一串資料依照特定排序方式排列的演算法。最常用到的排序方式是數值順序以及字典順序。有效的排序演算法在一些演算法(例如搜尋演算法合併演算法英語Merge algorithm)中是重要的,如此這些演算法才能得到正確解答。排序演算法也用在處理文字資料以及產生人類可讀的輸出結果。基本上,排序演算法的輸出必須遵守下列兩個原則:

  1. 輸出結果為遞增序列(遞增是針對所需的排序順序而言)
  2. 輸出結果是原輸入的一種排列、或是重組

雖然排序演算法是一個簡單的問題,但是從電腦科學發展以來,在此問題上已經有大量的研究。舉例而言,泡沫排序在1956年就已經被研究。雖然大部分人認為這是一個已經被解決的問題,有用的新演算法仍在不斷的被發明。(例子:圖書館排序在2004年被發表)

分類 編輯

電腦科學所使用的排序演算法通常依以下標準分類:

  • 計算的時間複雜度(最差、平均、和最好表現),依據串列(list)的大小( )。一般而言,好的表現是 大O符號),壞的表現是 。對於一個排序理想的表現是 ,但平均而言不可能達到。基於比較的排序演算法對大多數輸入而言至少需要 
  • 記憶體使用量(以及其他電腦資源的使用)
  • 穩定性:穩定排序演算法會讓原本有相等鍵值的紀錄維持相對次序。也就是如果一個排序演算法是穩定的,當有兩個相等鍵值的紀錄  ,且在原本的串列中 出現在 之前,在排序過的串列中 也將會是在 之前。
  • 排序的方法:插入、交換、選擇、合併等等。

穩定性 編輯

 
穩定排序紙牌的例子。當紙牌用穩定排序按點值排序的時候,兩個5之間必定保持它們最初的次序。在用不穩定排序來排序的時候,兩個5可能被按相反次序來排序。

當相等的元素是無法分辨的,比如像是整數,穩定性並不是一個問題。然而,假設以下的數對將要以他們的第一個數字來排序。

 

在這個狀況下,有可能產生兩種不同的結果,一個是讓相等鍵值的紀錄維持相對的次序,而另外一個則沒有:

  (維持次序)
  (次序被改變)

不穩定排序演算法可能會在相等的鍵值中改變紀錄的相對次序,但是穩定排序演算法從來不會如此。不穩定排序演算法可以被特別地實作為穩定。作這件事情的一個方式是人工擴充鍵值的比較,如此在其他方面相同鍵值的兩個物件間之比較,(比如上面的比較中加入第二個標準:第二個鍵值的大小)就會被決定使用在原先資料次序中的條目,當作一個同分決賽。然而,要記住這種次序通常牽涉到額外的空間負擔。

排序演算法列表 編輯

在這個表格中, 是要被排序的紀錄數量以及 是不同鍵值的數量。

穩定的排序 編輯

  • 泡沫排序(bubble sort)—  
  • 插入排序(insertion sort)— 
  • 雞尾酒排序(cocktail sort)— 
  • 桶排序(bucket sort)— ;需要 額外空間
  • 計數排序(counting sort)— ;需要 額外空間
  • 合併排序(merge sort)— ;需要 額外空間
  • 原地合併排序 如果使用最佳的現在版本
  • 二元排序樹排序(binary tree sort)—  期望時間; 最壞時間;需要 額外空間
  • 鴿巢排序(pigeonhole sort)— ;需要 額外空間
  • 基數排序(radix sort)— ;需要 額外空間
  • 侏儒排序(gnome sort)—  
  • 圖書館排序(library sort)—  期望時間; 最壞時間;需要 額外空間
  • 塊排序英語Block sort(block sort)—  
  • Tim排序(Timsort)— 平均、最壞時間; 最佳時間;需要 額外空間;是目前已知最快的排序演算法,在Python、Swift、Rust等語言的內建排序功能中被用作預設演算法

不穩定的排序 編輯

  • 選擇排序(selection sort)— 
  • 希爾排序(shell sort)— 如果使用最佳的現在版本
  • 克洛弗排序(Clover sort)— 期望時間, 最壞情況[來源請求]
  • 梳排序 
  • 堆積排序(heap sort)— 
  • 平滑排序英語Smoothsort(smooth sort)—  
  • 快速排序(quick sort)— 期望時間, 最壞情況
  • 內省排序(introsort)— 
  • 耐心排序(patience sort)— 最壞情況時間,需要額外的 空間,也需要找到最長的遞增子序列(longest increasing subsequence)

不實用的排序 編輯

  • Bogo排序 ,最壞的情況下期望時間為無窮。
  • Stupid排序 ;遞歸版本需要 額外記憶體
  • 珠排序(bead sort)—   ,但需要特別的硬件
  • 煎餅排序 ,但需要特別的硬件
  • 臭皮匠排序(stooge sort)演算法簡單,但需要約 的時間

簡要比較 編輯

名稱 數據對象 穩定性 時間複雜度 額外空間複雜度 描述
平均 最壞
泡沫排序 陣列       (無序區,有序區)。
從無序區透過交換找出最大元素放到有序區前端。
選擇排序 陣列       (有序區,無序區)。
在無序區里找一個最小的元素跟在有序區的後面。對陣列:比較得多,換得少。
鏈結串列  
插入排序 陣列、鏈結串列       (有序區,無序區)。
把無序區的第一個元素插入到有序區的合適的位置。對陣列:比較得少,換得多。
堆積排序 陣列       (最大堆,有序區)。
從堆頂把根卸出來放在有序區之前,再恢復堆。
合併排序 陣列       把數據分為兩段,從兩段中逐個選最小的元素移入新數據段的末尾。
可從上到下或從下到上進行。
   
如果不是從下到上
鏈結串列  
快速排序 陣列         (小數,基準元素,大數)。
在區間中隨機挑選一個元素作基準,將小於基準的元素放在基準之前,大於基準的元素放在基準之後,再分別對小數區與大數區進行排序。
鏈結串列  
希爾排序 陣列         每一輪按照事先決定的間隔進行插入排序,間隔會依次縮小,最後一次一定要是1。
計數排序 陣列、鏈結串列       統計小於等於該元素值的元素的個數i,於是該元素就放在目標陣列的索引i位(i≥0)。
桶排序 陣列、鏈結串列         將值為i的元素放入i號桶,最後依次把桶里的元素倒出來。
基數排序 陣列、鏈結串列       一種多關鍵字的排序演算法,可用桶排序實現。
  • 均按從小到大排列
  • k代表數值中的"數碼"個數
  • n代表數據規模
  • m代表數據的最大值減最小值

參考文獻 編輯

外部連結 編輯