雜湊表：用櫃號快速找書｜由淺至深演算法

想像你在管理一座圖書館

讀者來借書，怎麼快速找到書？三種策略：

第三種就是雜湊表 (Hash Table)。

用一個雜湊函數 (Hash Function) 把 key 變成「陣列的 index」。

key: "蘋果"
hash("蘋果") = 7
A[7] = "蘋果", value

要找 “蘋果” 時，再算一次 hash，直接跳到 A[7]——不用一格一格找。

問題來了——hash(“蘋果”) 和 hash(“香蕉”) 可能算出同一個 index！這叫衝突 (Collision)。

每一格存一個 list，衝突的都串起來：

A[7] → ["蘋果"-1] → ["香蕉"-2] → null
A[3] → ["橘子"-3] → null

找 “蘋果”：先算 hash → 7 → 走 list 找到 “蘋果”。

衝突了就找下一格空的塞進去：

A[7] = "蘋果"
hash("香蕉") = 7，但 A[7] 滿了 → 試 A[8]
A[8] = "香蕉"

找 “香蕉”：先算 hash → 7 → 不是 → 看 8 → 是！

最壞 O(n) 何時發生？當大量衝突堆在同一格時——基本上 hash 函數選太爛。好的 hash 函數會讓衝突很少，所以平均 O(1) 是實際表現。

💡什麼時候用雜湊表？

Python dict、JavaScript Object、Java HashMap 背後都是雜湊表。

實務上字串雜湊常用多項式雜湊：

hash(s) = (s_0 \cdot p^{n-1} + s_1 \cdot p^{n-2} + \cdots + s_{n-1}) \mod m

但你不用記公式，知道**「用某種混合方式把 key 變成數字」**就好。

📝考試會這樣考

題型一：給 hash function 和一串 key，畫出 hash table。

例：表大小 10，hash(k) = k mod 10。插入 21, 4, 15, 32, 11，用 chaining：

A[1] → 21 → 11
A[2] → 32
A[4] → 4
A[5] → 15

題型二：講 chaining vs open addressing 優缺點。

題型三：為什麼平均 O(1) 但最壞 O(n)？ 答：好 hash 函數讓衝突少 → 大多數操作 O(1)。但極端情況（hash 全衝突 / 惡意輸入），所有 key 擠同一格 → 變成走完整個 list → O(n)。