資料結構與演算法學習筆記之複雜度分析

資料結構 · 發表 2018-10-06 15:27:00

摘要：前言：大家都知道資料結構和英語，就如同程式員的兩條腿一樣；只有不斷的積累，學習，擁有了健壯的“雙腿”才能越走越遠；在資料結構和演算法的領域，不得不承認自己就是一隻菜鳥；需要不斷的學習；在學習過程中，經常會有一些自己的看法，和別人獨特的見解；我都會一一做好筆記，以便進步；正文：複雜度...

前言：

大家都知道資料結構和英語，就如同程式員的兩條腿一樣；只有不斷的積累，學習，擁有了健壯的“雙腿”才能越走越遠；在資料結構和演算法的領域，不得不承認自己就是一隻菜鳥；需要不斷的學習；在學習過程中，經常會有一些自己的看法，和別人獨特的見解；我都會一一做好筆記，以便進步；

正文：複雜度分析

一、什麼是複雜度分析？

1.資料結構和演算法解決是“如何讓計算機更快時間、更省空間的解決問題”，而時間、空間複雜度做為資料結構和演算法的精髓，很直觀說明了程式碼”多快“”多省“。

2.我們可以從執行時間和佔用空間來評估資料結構和演算法的效能，也就空間複雜度、時間複雜度，統稱為複雜度。

3.複雜度描述的是演算法執行時間（或佔用空間）與資料規模的增長關係。

二、為什麼要進行復雜度分析？

1.測試環境的不穩定因素（如同樣的程式碼，i7比i3快得多），測試規模對測試結果影響很大（有些演算法更適用於大規模資料），複雜度分析有不依賴執行環境、成本低、效率高、易操作、指導性強的特點。

2.掌握複雜度分析，將能編寫出效能更優的程式碼，有利於降低系統開發和維護成本。

三、如何進行復雜度分析？

1.大O表示法

1）所有程式碼的執行時間 T(n) 與每行程式碼的執行次數 n 成正比

T(n) = O(f（n）)

其中T(n)表示演算法執行總時間，f(n)表示每行程式碼執行總次數，而n往往表示資料的規模。

大 O 時間複雜度並不具體表示程式碼真正的執行時間，而是表示程式碼執行時間隨資料規模增長的變化趨勢，也叫作漸進時間複雜度，簡稱時間複雜度，

常量階、低階以及係數實際上對這種增長趨勢不產決定性影響，所以在做時間複雜度分析時忽略這些項。

2.複雜度分析法則

1）單段程式碼看高頻：比如迴圈。

2）多段程式碼取最大：比如一段程式碼中有單迴圈和多重迴圈，那麼取多重迴圈的複雜度。

3）巢狀程式碼求乘積：比如遞迴、多重迴圈等

4）多個規模求加法：比如方法有兩個引數控制兩個迴圈的次數，那麼這時就取二者複雜度相加。

四、常用的複雜度級別？

多項式階：隨著資料規模的增長，演算法的執行時間和空間佔用，按照多項式的比例增長。包括， O(1)（常數階）、O(logn)（對數階）、O(n)（線性階）、O(nlogn)（線性對數階）、O(n^2)（平方階）、O(n^3)（立方階）

非多項式階：隨著資料規模的增長，演算法的執行時間和空間佔用暴增，這類演算法效能極差。包括， O(2^n)（指數階）、O(n!)（階乘階）

五、如何掌握好複雜度分析方法？

複雜度分析關鍵在於多練，所謂孰能生巧。

六、最好、最壞、平均、均攤時間複雜度

一、概念：

1.最壞情況時間複雜度：程式碼在最理想情況下執行的時間複雜度。

2.最好情況時間複雜度：程式碼在最壞情況下執行的時間複雜度。

3.平均時間複雜度：用程式碼在所有情況下執行的次數的加權平均值表示。

4.均攤時間複雜度：在程式碼執行的所有複雜度情況中絕大部分是低級別的複雜度，個別情況是高級別複雜度且發生具有時序關係時，可以將個別高級別複雜度均攤到低級別複雜度上。基本上均攤結果就等於低級別複雜度。

二、為什麼要引入這4個概念？

1.同一段程式碼在不同情況下時間複雜度會出現量級差異，為了更全面，更準確的描述程式碼的時間複雜度，所以引入這4個概念。
2.程式碼複雜度在不同情況下出現量級差別時才需要區別這四種複雜度。大多數情況下，是不需要區別分析它們的。

三、如何分析平均、均攤時間複雜度？

1.平均時間複雜度
程式碼在不同情況下複雜度出現量級差別，則用程式碼所有可能情況下執行次數的加權平均值表示。
2.均攤時間複雜度
兩個條件滿足時使用：1）程式碼在絕大多數情況下是低級別複雜度，只有極少數情況是高級別複雜度；2）低級別和高級別複雜度出現具有時序規律。均攤結果一般都等於低級別複雜度。

有人說，我們專案之前都會進行效能測試，再做程式碼的時間複雜度、空間複雜度分析，是不是多此一舉呢？

每段程式碼都分析一下時間複雜度、空間複雜度，是不是很浪費時間呢？

我不認為是多此一舉，漸進時間，空間複雜度分析為我們提供了一個很好的理論分析的方向，並且它是宿主平臺無關的，能夠讓我們對我們的程式或演算法有一個大致的認識，讓我們知道，比如在最壞的情況下程式的執行效率如何，同時也為我們交流提供了一個不錯的橋樑，我們可以說，演算法1的時間複雜度是O(n)，演算法2的時間複雜度是O(logN)，這樣我們立刻就對不同的演算法有了一個“效率”上的感性認識。

當然，漸進式時間，空間複雜度分析只是一個理論模型，只能提供給粗略的估計分析，我們不能直接斷定就覺得O(logN)的演算法一定優於O(n), 針對不同的宿主環境，不同的資料集，不同的資料量的大小，在實際應用上面可能真正的效能會不同，個人覺得，針對不同的實際情況，進而進行一定的效能基準測試是很有必要的，比如在統一一批手機上(同樣的硬體，系統等等)進行橫向基準測試，進而選擇適合特定應用場景下的最有演算法。

綜上所述，漸進式時間，空間複雜度分析與效能基準測試並不衝突，而是相輔相成的，但是一個低階的時間複雜度程式有極大的可能性會優於一個高階的時間複雜度程式，所以在實際程式設計中，時刻關心理論時間，空間度模型是有助於產出效率高的程式的，同時，因為漸進式時間，空間複雜度分析只是提供一個粗略的分析模型，因此也不會浪費太多時間，重點在於在程式設計時，要具有這種複雜度分析的思維。

資料結構與演算法學習筆記之 複雜度分析

前言：