快速入門(mén)
存儲(chǔ):put 方法 put(key,value)
查詢(xún) : get 方法 get(key)
java 代碼如下
import java.util.HashMap; import java.util.Map; public class App { public static void main(String[] args) { Map<String,String> map = new HashMap<>(); map.put("劉一","劉一"); map.put("陳二","陳二"); map.put("張三","張三"); map.put("李四","李四"); map.put("王五","王五"); map.put("Money","我是猴哥Money老師"); System.out.println(map.get("Money")); } } //輸出結(jié)果:我是猴哥Money老師
技術(shù)的本質(zhì)――底層結(jié)構(gòu)
程序是等于我們的數(shù)據(jù)結(jié)構(gòu)和算法
HashMap 其實(shí)就是做存儲(chǔ)的,做存儲(chǔ)的就是數(shù)據(jù)結(jié)構(gòu)
- 在JDK7 : HashMap 是由 數(shù)組,鏈表 組成的
- 在JDK8: HashMap 是由 數(shù)組,鏈表,紅黑樹(shù) 組成的
存儲(chǔ)是按上面的規(guī)則存儲(chǔ)的,那查詢(xún)是怎么查的了
- 算法:哈希算法
結(jié)構(gòu)構(gòu)成
既然要了解HashMap 的組成,就談?wù)勊慕Y(jié)構(gòu)組成
首先我們來(lái)說(shuō)下數(shù)組,數(shù)組在java 中是怎么定義的了
//數(shù)組:采用一段連續(xù)的存儲(chǔ)單元來(lái)存儲(chǔ)數(shù)據(jù)的 //數(shù)組的特點(diǎn): 查詢(xún)時(shí)間復(fù)雜度:0(1) ,刪除,插入,時(shí)間負(fù)責(zé)度0(N),總結(jié):查詢(xún)塊,插入慢 public static void main(String [] args){ //數(shù)組的定義:初始化長(zhǎng)度為10,數(shù)據(jù)類(lèi)型Integer , Integer integer[] = new Integer[10]; //指定下標(biāo),復(fù)制 integer[0]=0; //指定下標(biāo),復(fù)制 integer[1]=1; //指定下標(biāo),復(fù)制 integer[9]=2; //指定下標(biāo),復(fù)制 integer[9]=400; System.out.println(integer[9]); } // 輸出結(jié)果:400
數(shù)組結(jié)構(gòu)如圖:
查詢(xún): 時(shí)間復(fù)雜度 0(1),查詢(xún)非??斓?br /> 刪除,插入 :時(shí)間復(fù)雜度0(N) 非常慢的,效率沒(méi)有查詢(xún)那么快
為什么查詢(xún)快,插入,刪除慢了?
查詢(xún)快
- 是因?yàn)槲覀償?shù)組了都有一個(gè)序號(hào),如圖,0,1,2,3,4,5,… ,如果要找到下標(biāo)為3的數(shù)據(jù)值, 這些序號(hào)其實(shí)就是他們的下標(biāo)地址,可以理解為他們 的一個(gè)下標(biāo)索引,這個(gè)下標(biāo)是連續(xù)的,是自增的,所以我們立馬可以確定3個(gè)這個(gè)位置,根據(jù)這個(gè)索引3 找到它對(duì)應(yīng)的節(jié)點(diǎn)。
插入,刪除慢
- 假如我現(xiàn)在要出入一個(gè)Monkey 的數(shù)據(jù),插入到3和4之間,如圖
- 存在這個(gè)位置我們是沒(méi)有下標(biāo)的,則我們的下標(biāo)4 則要移到 Monkey 那個(gè)位置,5下標(biāo) 就移到4那個(gè)位置,如圖:
類(lèi)似,我們后面的下標(biāo)都要向左移動(dòng),這樣我后面的數(shù)據(jù)是不是要做很大的改動(dòng),這樣時(shí)間復(fù)雜度則為0(N),這樣就保證了我們數(shù)組的連續(xù)性,同理刪除的話如圖:
數(shù)組后面數(shù)據(jù)的下標(biāo),都要還原成之前插入前的下標(biāo),后面的節(jié)點(diǎn)都要改變,這樣我們可以看出,這就是數(shù)組,刪除,插入 為什么這么慢!
除非是插入,刪除,數(shù)組的最后一個(gè)元素,大家懂了嗎?還不懂那就私聊!
擴(kuò)充:
大家知道我們java 哪一個(gè)類(lèi),底層用的就是數(shù)組?
在我們的java.util 包下面有一個(gè)ArrayList 類(lèi),如圖
怎么驗(yàn)證了?
我們查看它的add 方法
public boolean add(E var1) { this.ensureCapacityInternal(this.size + 1); this.elementData[this.size++] = var1; return true; }
如果面試被問(wèn)到ArrayList 的特性,直接回答 查詢(xún)快,插入,刪除慢
為什么要用鏈表
為什么HashMap 用到數(shù)組存儲(chǔ)了,還要用到鏈表了?
談?wù)勈裁词擎湵恚?br /> 在java 中是這么定義的:
package node; import com.sun.org.apache.bcel.internal.generic.IMPDEP1; public class Node { public Node next; private Object data; public Node(Object next) { this.data = next; } //鏈表:鏈表是一種物理存儲(chǔ)單元上非連續(xù),非順序的存儲(chǔ)結(jié)構(gòu) //特點(diǎn): 插入,刪除時(shí)間復(fù)雜度0(1) 查找遍歷時(shí)間復(fù)雜度0(N) 總結(jié):插入快,查詢(xún)慢 public static void main(String[] args){ Node head =new Node("monkey"); head.next =new Node("張三"); head.next.next =new Node("劉一"); System.out.println(head.data); System.out.println(head.next.data); System.out.println(head.next.next.data); } } //輸出結(jié)果: //monkey //張三 //劉一
鏈表:鏈表是一種物理存儲(chǔ)單元上非連續(xù),非順序的存儲(chǔ)結(jié)構(gòu),如圖:
為什么它插入,刪除快,查詢(xún)慢了?
刪除 某個(gè)節(jié)點(diǎn),只需要上一個(gè)節(jié)點(diǎn) head.next =null
插入 某個(gè)幾點(diǎn),只需要上一個(gè)節(jié)點(diǎn) head.next 指向插入的節(jié)點(diǎn),插入的節(jié)點(diǎn)指向下一個(gè)節(jié)點(diǎn)
查詢(xún)某個(gè)節(jié)點(diǎn):鏈表查詢(xún)都要通過(guò)頭節(jié)點(diǎn),比如我們要查‘劉一",我們則要先查頭monkey,再查張三,再查到劉一,
雖然只有3個(gè)節(jié)點(diǎn),但是我們要查到劉一要查三次,把整個(gè)鏈表都遍歷了一次,所以查詢(xún)慢!
擴(kuò)充
在我們java 中,哪一個(gè)util 類(lèi)采用的鏈表來(lái)實(shí)現(xiàn)的?
我們來(lái)查看它的add 方法
public boolean add(E var1) { this.linkLast(var1); return true; } //看上面有一個(gè)linkLast,如下: void linkLast(E var1) { LinkedList.Node var2 = this.last; LinkedList.Node var3 = new LinkedList.Node(var2, var1, (LinkedList.Node)null); this.last = var3; if (var2 == null) { this.first = var3; } else { var2.next = var3; } ++this.size; ++this.modCount; } //看上面有一個(gè)Node,如下: private static class Node<E> { E item; LinkedList.Node<E> next; LinkedList.Node<E> prev; Node(LinkedList.Node<E> var1, E var2, LinkedList.Node<E> var3) { this.item = var2; this.next = var3; this.prev = var1; } } //上面有一個(gè)next,有一個(gè)prev //這是一個(gè)雙向鏈表
雙向鏈表如圖: 類(lèi)似與分頁(yè),上一頁(yè),下一頁(yè),下面的對(duì)象也可以獲取上面對(duì)象的數(shù)據(jù)(head.prev)
現(xiàn)在大家都已經(jīng)了解JDK7 HashMap 數(shù)據(jù)結(jié)構(gòu)了,開(kāi)始了解下算法!
哈希算法
那么HashMap 是怎么去存儲(chǔ)的了?他是如何將數(shù)據(jù)放到我們的數(shù)組和鏈表上的?
用的就是哈希算法,你們知道哈希算法的底層是怎么實(shí)現(xiàn)的?
哈希表
什么是哈希算法?
哈希算法(也叫散列),就是把任意長(zhǎng)度值(key)通過(guò)散列算法變換成固定長(zhǎng)度的key(地址), 通過(guò)這個(gè)地址進(jìn)行訪問(wèn)的數(shù)據(jù)結(jié)構(gòu),
它通過(guò)把關(guān)鍵碼值映射到表中一個(gè)位置來(lái)訪問(wèn)記錄,以加快查找速度。
例如圖中的John Smith 通過(guò)散列算法變換成固定長(zhǎng)度的key:152 (永遠(yuǎn)是152),然后通過(guò)152 變成John Smith 是不可能的,哈希算法是不可逆的。
HashCode: 通過(guò)字符串算出它的ascii 碼,進(jìn)行mod(取模),算出哈希表中的下標(biāo)
代碼如下:
public class AsciiCode { public static void main(String[] args) { char c [] ="lies".toCharArray(); for (int i = 0; i < c.length; i++) { System.out.println((c[i])+":" +(int)c[i]); } } } //輸出結(jié)果: //l:108 //i:105 //e:101 //s:115
將 lies 算出來(lái)的ascii 碼相加然后除以10 取模(為什么取模不直接存儲(chǔ) 429了 )
為什么取模不直接存儲(chǔ) 429了?
//數(shù)組是采用一段連續(xù)的存儲(chǔ)單元來(lái)存儲(chǔ)數(shù)據(jù)的,那存lies 數(shù)據(jù)將如圖:
如果你要存lies 則需要300 個(gè)這樣的內(nèi)存空間,所以我們?nèi)∧?0,算出來(lái)的值為 9,則節(jié)省了很多空間,我們?nèi)∧5哪康木褪枪?jié)省內(nèi)存空間!
如果我們?nèi)∧?huì)出現(xiàn)什么問(wèn)題
會(huì)出現(xiàn)hash 沖突(碰撞)的一個(gè)問(wèn)題,
什么是hash沖突
lies 的值通過(guò)ascii 碼計(jì)算的總和為 429foes 的值通過(guò)ascii 碼計(jì)算的總和也為 429
兩個(gè)單詞取模后的值都是 9 ,則lies 會(huì)存在下標(biāo)為9 的這個(gè)位置,foes 也存在下標(biāo)為9 的這個(gè)位置,而數(shù)組存在同一個(gè)下標(biāo)下面是會(huì)覆蓋的(上面代碼講數(shù)組的時(shí)候Intergers[9]=400,會(huì)覆蓋Intergers[9]=2 的值,最終Intergers[9] =400),同樣我們先存的是lies 后存的是foes,則lies
將會(huì)被覆蓋,lies 和foes 是不同的key, 我們HashMap 是可以存這兩個(gè)值的,為什么沒(méi)有被覆蓋了?這個(gè)地方就叫做哈希碰撞!
Hash沖突怎么解決了
我們用鏈表來(lái)解決這個(gè)問(wèn)題, 鏈表是有一個(gè)指針的,我們可以讓這個(gè)lies 指向這個(gè)foes,我們讓foes 去匹配下標(biāo)為9 的這個(gè)節(jié)點(diǎn),如果匹配lies 不相等,則去匹配下一個(gè)節(jié)點(diǎn)foes,最終就會(huì)找到這個(gè)foes,這就是我們hash 算法底層的原理及解決沖突。
手寫(xiě)HashMap
不調(diào)用JDK7 的HashMap,自己手動(dòng)寫(xiě)一個(gè)HashMap
public class App { public static void main(String[] args) { //Map<String,String> map = new HashMap<>(); App map = new App(); map.put("劉一","劉一"); map.put("陳二","陳二"); map.put("張三","張三"); map.put("李四","李四"); map.put("王五","王五"); map.put("Money","我是猴哥Money老師"); //System.out.println(map.get("Money")); } public void put(String key,String value){ System.out.printf("key:%s:::::::::::::::;::hash值:%s:::::::::::::::::::存儲(chǔ)位置:%s ",key,key.hashCode(),Math.abs(key.hashCode() % 15)); } } //輸出結(jié)果: // key:劉一:::::::::::::::;::hash值:671464:::::::::::::::::::存儲(chǔ)位置:4 // key:陳二:::::::::::::::;::hash值:1212740:::::::::::::::::::存儲(chǔ)位置:5 // key:張三:::::::::::::::;::hash值:774889:::::::::::::::::::存儲(chǔ)位置:4 // key:李四:::::::::::::::;::hash值:842061:::::::::::::::::::存儲(chǔ)位置:6 // key:王五:::::::::::::::;::hash值:937065:::::::::::::::::::存儲(chǔ)位置:0 // key:Monkey:::::::::::::::;::hash值:-1984628749:::::::::::::::::::存儲(chǔ)位置:4
- 我們多次運(yùn)行,運(yùn)行的結(jié)果還是這樣,這就是hash 算法的一個(gè)特點(diǎn):它是一個(gè)冪等性的一個(gè)算法
模擬我們是怎么存值的
我們一組數(shù)據(jù)就是 key,value , 可以用string,int 來(lái)存嗎?這里顯然不能,我們一般存這種值一般用對(duì)象來(lái)存值,我在這里隨便命名用個(gè)Object或者叫Entry 對(duì)象,其實(shí)我們還要存另外兩個(gè)值?(hash和next),當(dāng)發(fā)生hash 沖突的時(shí)候(存儲(chǔ)位置4) next 可以指向下一個(gè)節(jié)點(diǎn),hash 值是用來(lái)比較的,比較hashCode 值是否相等!
- 存取結(jié)構(gòu)圖如下:
上面的圖形結(jié)構(gòu),我們就知道如何存數(shù)據(jù)了!
那我們?cè)撊绾稳?shù)據(jù)了?
-假如我們要取‘劉一" 的值
我們通過(guò)get(key) 方法獲取數(shù)據(jù)的模,然后根據(jù)key,與hashCode 的值去比較下標(biāo)為4 的key 和hashCode,查看是否相等,如果不相等我們通過(guò)next 方法比較下一個(gè)節(jié)點(diǎn)的數(shù)據(jù),直到 key 與hashCode 對(duì)比的值都相等,此時(shí),獲取value的值就是當(dāng)前key 所對(duì)應(yīng)的value!
HashMap底層的實(shí)現(xiàn)
HashMap 底層如何實(shí)現(xiàn)的了?我們用寫(xiě)源碼的方式驗(yàn)證
模擬java HashMap
定義一個(gè)Map 接口
/** * 自己手動(dòng)定義Map * @param <K> * @param <V> */ public interface Map<K,V> { V put(K k,V v); V get(K k); int size(); interface Entry<K,V>{ K getKey(); V getValue(); } }
定義一個(gè)實(shí)現(xiàn)Map 的HashMap
import sun.management.snmp.jvmmib.JvmRTInputArgsTableMeta; /** * 自己定義HashMap * @param <K> * @param <V> */ public class HashMap<K,V> implements Map<K,V>{ //存儲(chǔ)元素對(duì)象 private Entry<K,V> table[] = null; //擴(kuò)容初始化 int size =0; //初始化存儲(chǔ)元素對(duì)象大小 public HashMap() { this.table = new Entry[16]; } /** * 1.通過(guò)key hash 算法算出hash值,然后取模 * 2.取模后就有對(duì)應(yīng)的index 數(shù)組下標(biāo),然后存儲(chǔ)對(duì)象<Entry> * 3.判斷當(dāng)前對(duì)象是否為空,如果空,直接存儲(chǔ), * 4.如果不為空,我們就要用到next 鏈表 * 5.返回當(dāng)前這個(gè)節(jié)點(diǎn) * @param k * @param v * @return */ @Override public V put(K k, V v) { int index = hash(k); Entry<K,V> entry = table[index]; if(null ==entry){ //劉一,陳二,李四,王五 就開(kāi)始存在這個(gè)entry,每個(gè)entry 對(duì)象則存儲(chǔ)到了對(duì)應(yīng)table 中 table[index] = new Entry<>(k, v, index, null); size++; }else{ //沖突了,張三,Monkey table[index] = new Entry<>(k, v, index, entry); } return table[index].getValue(); } private int hash(K k) { //HashMap 底層用到的是移位的操作,性能高很多 >>,我們這里就直接取模 int index =k.hashCode() % 16; //Math.abs(index); return index>0?index:-index; } /** * 1.通過(guò) key 進(jìn)行hash 運(yùn)算,取模,找到數(shù)組對(duì)應(yīng)的下標(biāo) index * 2.判斷當(dāng)前對(duì)象是否為空,如果不為空 * 3.判斷是否相等,如果不相等 * 4.判斷next 是否為空,如果不為空, * 5.再判斷相等,知道相等為止,或者為空為止 * 6.然后返回 * * * * @param k * @return */ @Override public V get(K k) { //如果沒(méi)有存儲(chǔ)數(shù)據(jù)那size 為0,也不用查了,直接返回null if(size ==0){ return null; } int index = hash(k); Entry<K, V> entry = findValue(table[index], k); //通過(guò)index 找打這個(gè)對(duì)象 return entry==null?null:entry.getValue(); } /** * * @param entry * @param k 查詢(xún)劉一 * @return */ private Entry<K,V> findValue(Entry<K,V> entry,K k) { //存的可能是數(shù)值類(lèi)型,也可能是字符串類(lèi)型 if (k.equals(entry.getKey()) || k == entry.getKey()) { return entry; //如果不相等,估計(jì)這個(gè)節(jié)點(diǎn)是個(gè)鏈表,判斷它next 數(shù)據(jù)是否匹配 } else { if(entry.next !=null){ //用到遞歸,在鏈表里面一直查詢(xún)這個(gè)k,值是否相等 return findValue(entry.next,k); } } return null; } @Override public int size() { return size++; } class Entry<K,V> implements Map.Entry<K,V>{ //存四個(gè)值 K k; V v; int hash; Entry<K,V> next; public Entry(K k, V v, int hash, Entry<K, V> next) { this.k = k; this.v = v; this.hash = hash; this.next = next; } @Override public K getKey() { return k; } @Override public V getValue() { return v; } } }
定義一個(gè)測(cè)試類(lèi)
public class Test { public static void main(String[] args) { Map<String,String> map = new HashMap<>(); map.put("Monkey","我是moneky老師"); map.put("東山再起","東山再起是位好同學(xué)"); System.out.println(map.get("Monkey")); System.out.println(map.get("東山再起")); } //輸出結(jié)果: //我是moneky老師 //東山再起是位好同學(xué) }
查看到測(cè)試結(jié)果,我們就能看到HashMap ,是怎么存儲(chǔ)的,和獲取值的!
但是JDK8 用的是紅黑樹(shù),為什么了?
舉個(gè)代碼的例子
import com.sun.xml.internal.ws.api.model.wsdl.WSDLOutput; public class Test { public static void main(String[] args) { Map<String,String> map = new HashMap<>(); for (int i = 0; i < 1000; i++) { map.put("Monkey"+i,"我是moneky老師"+i); } System.out.println(map); } }
可以看到這個(gè)map 的size 只有16,卻存了很多的數(shù)據(jù):
容量不夠,我們就只能把這個(gè)數(shù)據(jù)放到鏈表上,鏈表無(wú)線延長(zhǎng),這種hash沖突是十分嚴(yán)重的,而鏈表的特性是查詢(xún)慢,而鏈表又無(wú)線延長(zhǎng),我們查詢(xún)鏈表末端的數(shù)據(jù),這樣性能就很低了,所以JDK8 就用紅黑樹(shù)了!
總結(jié):解決鏈表過(guò)長(zhǎng)查詢(xún)效率過(guò)低的問(wèn)題
什么情況下用紅黑樹(shù)?
前提條件
閾值 8
HashMap 類(lèi)下面有個(gè)這個(gè):
static final int TREEIFY_THRESHOLD = 8;
為什么要閾值 是8 了?
因?yàn)榧t黑叔插入慢,他要判斷小中大(也就是左邊的小于右邊的),而鏈表插入快,刪除快,但是為什么是 8 不是 6了?
具體原因請(qǐng)參考這篇Java紅黑樹(shù)的數(shù)據(jù)結(jié)構(gòu)與算法解析
到此這篇關(guān)于HashMap底層原理全面詳解面試絕對(duì)不慌的文章就介紹到這了,更多相關(guān)HashMap底層原理內(nèi)容請(qǐng)搜索服務(wù)器之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持服務(wù)器之家!
原文鏈接:https://blog.csdn.net/weixin_39436556/article/details/118635569