前言
Set 表示由無(wú)重復(fù)對(duì)象組成的集合,也是集合框架中重要的一種集合類(lèi)型,直接擴(kuò)展自 Collection 接口。在一個(gè) Set 中,不能有兩個(gè)引用指向同一個(gè)對(duì)象,或兩個(gè)指向 null 的引用。如果對(duì)象 a 和 b 的引用滿(mǎn)足條件 a.equals(b),那么這兩個(gè)對(duì)象也不能同時(shí)出現(xiàn)在集合中。
通常 Set 是不要求元素有序的,但也有一些有序的實(shí)現(xiàn),如 SortedMap 接口、LinkedHashSet 接口等。
概述
Set 的具體實(shí)現(xiàn)通常都是基于 Map 的。因?yàn)?Map 中鍵是唯一的,因而在基于 Map 實(shí)現(xiàn) Set 時(shí),只需要關(guān)心 Map 中的鍵,和鍵關(guān)聯(lián)的值不需要有意義,使用一個(gè)任意的對(duì)象“占位”即可。我們?cè)谇懊娣治?Map 中的迭代器時(shí),KeySet() 方法得到的就是一個(gè) Set。
前面我們分析過(guò) Map 接口的幾個(gè)具體實(shí)現(xiàn),通用的實(shí)現(xiàn) HahsMap ,插入或訪問(wèn)序的 LinkedHashMap , 按照鍵升序的 TreeMap。同樣,在 Set 的具體實(shí)現(xiàn)中,也有 HashSet 、 LinkedHashSet 和 TreeSet 等,分別和 Map 一一對(duì)應(yīng),它們的特性對(duì)應(yīng)著相應(yīng)的 Map 實(shí)現(xiàn)的特性。下面基于 HashSet 的實(shí)現(xiàn)做一個(gè)簡(jiǎn)略的介紹。
HashSet 的實(shí)現(xiàn)
01 | public class HashSet<E> |
03 | implements Set<E>, Cloneable, java.io.Serializable |
05 | static final long serialVersionUID = -5024744406713321676L; |
06 | private transient HashMap<E,Object> map; |
08 | private static final Object PRESENT = new Object(); |
12 | public HashSet(Collection<? extends E> c) { |
13 | map = new HashMap<>(Math.max(( int ) (c.size()/.75f) + 1 , 16 )); |
16 | public HashSet( int initialCapacity, float loadFactor) { |
17 | map = new HashMap<>(initialCapacity, loadFactor); |
19 | public HashSet( int initialCapacity) { |
20 | map = new HashMap<>(initialCapacity); |
22 | HashSet( int initialCapacity, float loadFactor, boolean dummy) { |
23 | map = new LinkedHashMap<>(initialCapacity, loadFactor); |
從成員變量和構(gòu)造方法可以清楚地看到,內(nèi)部使用了一個(gè) HahsMap,同時(shí)定義了一個(gè)無(wú)意義的空的靜態(tài) Object 對(duì)象(占用8byte) PRESENT。既然 map 中和鍵關(guān)聯(lián)的值沒(méi)有意義,為什么不干脆使用 null 呢?我們看一下 add() 方法:
1 | public boolean add(E e) { |
2 | return map.put(e, PRESENT)== null ; |
Map 的 put() 方法在添加一個(gè)新的鍵時(shí)會(huì)返回 null,在更新一個(gè)已經(jīng)存在的鍵關(guān)聯(lián)的值時(shí)會(huì)返回舊值。因而 Set 中的 add() 方法可以據(jù)此判斷新加入的元素是否改變了集合,如果改變了就返回 true。因而 PRESENT 不可以使用 null 。
其它的方法這里簡(jiǎn)單地列一下,都是基于 map 實(shí)現(xiàn)的:
01 | public boolean contains(Object o) { |
02 | return map.containsKey(o); |
04 | public boolean remove(Object o) { |
05 | return map.remove(o)==PRESENT; |
07 | public Iterator<E> iterator() { |
08 | return map.keySet().iterator(); |
13 | public boolean isEmpty() { |
19 | @SuppressWarnings ( "unchecked" ) |
20 | public Object clone() { |
22 | HashSet<E> newSet = (HashSet<E>) super .clone(); |
23 | newSet.map = (HashMap<E, Object>) map.clone(); |
25 | } catch (CloneNotSupportedException e) { |
26 | throw new InternalError(e); |
30 | private void writeObject(java.io.ObjectOutputStream s) |
31 | throws java.io.IOException { |
33 | s.defaultWriteObject(); |
35 | s.writeInt(map.capacity()); |
36 | s.writeFloat(map.loadFactor()); |
38 | s.writeInt(map.size()); |
40 | for (E e : map.keySet()) |
43 | private void readObject(java.io.ObjectInputStream s) |
44 | throws java.io.IOException, ClassNotFoundException { |
49 | int capacity = s.readInt(); |
51 | throw new InvalidObjectException( "Illegal capacity: " + |
55 | float loadFactor = s.readFloat(); |
56 | if (loadFactor <= 0 || Float.isNaN(loadFactor)) { |
57 | throw new InvalidObjectException( "Illegal load factor: " + |
61 | int size = s.readInt(); |
63 | throw new InvalidObjectException( "Illegal size: " + |
68 | capacity = ( int ) Math.min(size * Math.min( 1 / loadFactor, 4 .0f), |
69 | HashMap.MAXIMUM_CAPACITY); |
71 | map = (((HashSet<?>) this ) instanceof LinkedHashSet ? |
72 | new LinkedHashMap<E,Object>(capacity, loadFactor) : |
73 | new HashMap<E,Object>(capacity, loadFactor)); |
75 | for ( int i= 0 ; i<size; i++) { |
76 | @SuppressWarnings ( "unchecked" ) |
77 | E e = (E) s.readObject(); |
小結(jié)
Set 的內(nèi)部通常是基于 Map 來(lái)實(shí)現(xiàn)的,Map 中的 Key 構(gòu)成了 Set,而 Value 全部使用一個(gè)無(wú)意義的 Object 。
Set 的特征與其內(nèi)部的 Set 的特征是一致的。基于 HashMap 的 HashSet 是無(wú)序時(shí)的最佳通用實(shí)現(xiàn),基于 LinkedHashMap 的 LinkedHashSet 保留插入或訪問(wèn)的順序,基于 TreeMap 的 TreeSet 可以按照元素升序排列,要求元素實(shí)現(xiàn) Comaprable 接口或自定義比較器。
HashSet , LinkedHashSet, TreeSet 都不是線程安全的,在多線程環(huán)境下使用時(shí)要注意同步問(wèn)題。
CopyOnWriteArraySet 是一個(gè)線程安全的實(shí)現(xiàn),但是并不是基于 Map 實(shí)現(xiàn)的,而是通過(guò) CopyOnWriteArrayList 實(shí)現(xiàn)的。使用 addIfAbsent() 方法進(jìn)行去重,性能比較一般。
以上就是本文的全部?jī)?nèi)容,希望對(duì)大家的學(xué)習(xí)有所幫助,也希望大家多多支持服務(wù)器之家。