熱線電話:0755-23712116
郵箱:contact@shuangyi-tech.com
地址:深圳市寶安區沙井街道后亭茅洲山工業園工業大廈全至科技創新園科創大廈2層2A
1976 年,一個瑞士計算機科學家寫一本書 《Algorithms + Data Structures = Programs》。即:算法 + 數據結構 = 程序。40 多年過去了,這個等式依然成立。
很多代碼面試題都要求候選者深入理解數據結構,不管你來自大學計算機專業還是編程培訓機構,也不管你有多少年編程經驗。有時面試題會直接提到數據結構,比如“給我實現一個二叉樹”,然而有時則不那么明顯,比如“統計一下每個作者寫的書的數量”。
什么是數據結構?
數據結構是計算機存儲、組織數據的方式。對于特定的數據結構(比如數組),有些操作效率很高(讀某個數組元素),有些操作的效率很低(刪除某個數組元素)。程序員的目標是為當前的問題選擇最優的數據結構。
為什么我們需要數據結構?
數據是程序的核心要素,因此數據結構的價值不言而喻。無論你在寫什么程序,你都需要與數據打交道,比如員工工資、股票價格、雜貨清單或者電話本。在不同場景下,數據需要以特定的方式存儲,我們有不同的數據結構可以滿足我們的需求。
8 種常用數據結構
1. 數組
數組(Array)大概是最簡單,也是最常用的數據結構了。其他數據結構,比如棧和隊列都是由數組衍生出來的。
下圖展示了 1 個數組,它有 4 個元素:
每一個數組元素的位置由數字編號,稱為下標或者索引(index)。大多數編程語言的數組第一個元素的下標是 0。
根據維度區分,有 2 種不同的數組:
數組的基本操作
2. 棧
撤回,即 Ctrl+Z,是我們最常見的操作之一,大多數應用都會支持這個功能。你知道它是怎么實現的嗎?答案是這樣的:把之前的應用狀態(限制個數)保存到內存中,最近的狀態放到第一個。這時,我們需要棧(stack)來實現這個功能。
棧中的元素采用 LIFO (Last In First Out),即后進先出。
下圖的棧有 3 個元素,3 在最上面,因此它會被第一個移除:
棧的基本操作
3. 隊列
隊列(Queue)與棧類似,都是采用線性結構存儲數據。它們的區別在于,棧采用 LIFO 方式,而隊列采用先進先出,即FIFO(First in First Out)。
下圖展示了一個隊列,1 是最上面的元素,它會被第一個移除:
隊列的基本操作
4. 鏈表
鏈表(Linked List)也是線性結構,它與數組看起來非常像,但是它們的內存分配方式、內部結構和插入刪除操作方式都不一樣。
鏈表是一系列節點組成的鏈,每一個節點保存了數據以及指向下一個節點的指針。鏈表頭指針指向第一個節點,如果鏈表為空,則頭指針為空或者為 null。
鏈表可以用來實現文件系統、哈希表和鄰接表。
下圖展示了一個鏈表,它有 3 個節點:
鏈表分為 2 種:
鏈表的基本操作
5. 圖
圖(graph)由多個節點(vertex)構成,節點之間闊以互相連接組成一個網絡。(x, y)表示一條邊(edge),它表示節點 x 與 y 相連。邊可能會有權值(weight/cost)。
圖分為兩種:
在編程語言中,圖有可能有以下兩種形式表示:
遍歷圖有兩周算法
6. 樹
樹(Tree)是一個分層的數據結構,由節點和連接節點的邊組成。樹是一種特殊的圖,它與圖最大的區別是沒有循環。
樹被廣泛應用在人工智能和一些復雜算法中,用來提供高效的存儲結構。
下圖是一個簡單的樹以及與樹相關的術語:
樹有很多分類:
其中,二叉樹和二叉查找樹是最常用的樹。
7. 前綴樹
前綴樹(Prefix Trees 或者 Trie)與樹類似,用于處理字符串相關的問題時非常高效。它可以實現快速檢索,常用于字典中的單詞查詢,搜索引擎的自動補全甚至 IP 路由。
下圖展示了“top”, “thus”和“their”三個單詞在前綴樹中如何存儲的:
單詞是按照字母從上往下存儲,“p”, “s”和“r”節點分別表示“top”, “thus”和“their”的單詞結尾。
8. 哈希表
哈希(Hash)將某個對象變換為唯一標識符,該標識符通常用一個短的隨機字母和數字組成的字符串來代表。哈希可以用來實現各種數據結構,其中最常用的就是哈希表(hash table)。
哈希表通常由數組實現。
哈希表的性能取決于 3 個指標:
下圖展示了有數組實現的哈希表,數組的下標即為哈希值,由哈希函數計算,作為哈希表的鍵(key),而數組中保存的數據即為值(value):