一、線程概述
線程是程序運(yùn)行的基本執(zhí)行單元。當(dāng)操作系統(tǒng)(不包括單線程的操作系統(tǒng),如微軟早期的DOS)在執(zhí)行一個(gè)程序時(shí),會(huì)在系統(tǒng)中建立一個(gè)進(jìn)程,而在這個(gè)進(jìn)程中,必須至少建立一個(gè)線程(這個(gè)線程被稱為主線程)來(lái)作為這個(gè)程序運(yùn)行的入口點(diǎn)。因此,在操作系統(tǒng)中運(yùn)行的任何程序都至少有一個(gè)主線程。
進(jìn)程和線程是現(xiàn)代操作系統(tǒng)中兩個(gè)必不可少的運(yùn)行模型。在操作系統(tǒng)中可以有多個(gè)進(jìn)程,這些進(jìn)程包括系統(tǒng)進(jìn)程(由操作系統(tǒng)內(nèi)部建立的進(jìn)程)和用戶進(jìn)程(由用戶程序建立的進(jìn)程);一個(gè)進(jìn)程中可以有一個(gè)或多個(gè)線程。進(jìn)程和進(jìn)程之間不共享內(nèi)存,也就是說(shuō)系統(tǒng)中的進(jìn)程是在各自獨(dú)立的內(nèi)存空間中運(yùn)行的。而一個(gè)進(jìn)程中的線可以共享系統(tǒng)分派給這個(gè)進(jìn)程的內(nèi)存空間。
線程不僅可以共享進(jìn)程的內(nèi)存,而且還擁有一個(gè)屬于自己的內(nèi)存空間,這段內(nèi)存空間也叫做線程棧, 是在建立線程時(shí)由系統(tǒng)分配的,主要用來(lái)保存線程內(nèi)部所使用的數(shù)據(jù),如線程執(zhí)行函數(shù)中所定義的變量。
注意:任何一個(gè)線程在建立時(shí)都會(huì)執(zhí)行一個(gè)函數(shù),這個(gè)函數(shù)叫做線程執(zhí)行函數(shù)。也可以將這個(gè)函數(shù)看做線程的入口點(diǎn)(類似于程序中的main函數(shù))。無(wú)論使用什么語(yǔ)言或技術(shù)來(lái)建立線程,都必須執(zhí)行這個(gè)函數(shù)(這個(gè)函數(shù)的表現(xiàn)形式可能不一樣,但都會(huì)有一個(gè)這樣的函數(shù))。如在Windows中用于建立線程的API函數(shù)CreateThread的第三個(gè)參數(shù)就是這個(gè)執(zhí)行函數(shù)的指針。
在操作系統(tǒng)將進(jìn)程分成多個(gè)線程后,這些線程可以在操作系統(tǒng)的管理下并發(fā)執(zhí)行,從而大大提高了程序的運(yùn)行效率。雖然線程的執(zhí)行從宏觀上看是多個(gè)線程同時(shí)執(zhí)行,但實(shí)際上這只是操作系統(tǒng)的障眼法。由于一塊CPU同時(shí)只能執(zhí)行一條指令,因此,在擁有一塊CPU的計(jì)算機(jī)上不可能同時(shí)執(zhí)行兩個(gè)任務(wù)。而操作系統(tǒng)為了能提高程序的運(yùn)行效率,在一個(gè)線程空閑時(shí)會(huì)撤下這個(gè)線程,并且會(huì)讓其他的線程來(lái)執(zhí)行,這種方式叫做線程調(diào)度。我們之所以從表面上看是多個(gè)線程同時(shí)執(zhí)行,是因?yàn)椴煌€程之間切換的時(shí)間非常短,而且在一般情況下切換非常頻繁。假設(shè)我們有線程A和B。在運(yùn)行時(shí),可能是A執(zhí)行了1毫秒后,切換到B后,B又執(zhí)行了1毫秒,然后又切換到了A,A又執(zhí)行1毫秒。由于1毫秒的時(shí)間對(duì)于普通人來(lái)說(shuō)是很難感知的,因此,從表面看上去就象A和B同時(shí)執(zhí)行一樣,但實(shí)際上A和B是交替執(zhí)行的。
二、線程給我們帶來(lái)的好處
如果能合理地使用線程,將會(huì)減少開發(fā)和維護(hù)成本,甚至可以改善復(fù)雜應(yīng)用程序的性能。如在GUI應(yīng)用程序中,還以通過線程的異步特性來(lái)更好地處理事件;在應(yīng)用服務(wù)器程序中可以通過建立多個(gè)線程來(lái)處理客戶端的請(qǐng)求。線程甚至還可以簡(jiǎn)化虛擬機(jī)的實(shí)現(xiàn),如Java虛擬機(jī)(JVM)的垃圾回收器(garbage collector)通常運(yùn)行在一個(gè)或多個(gè)線程中。因此,使用線程將會(huì)從以下五個(gè)方面來(lái)改善我們的應(yīng)用程序:
1. 充分利用CPU資源
現(xiàn)在世界上大多數(shù)計(jì)算機(jī)只有一塊CPU。因此,充分利用CPU資源顯得尤為重要。當(dāng)執(zhí)行單線程程序時(shí),由于在程序發(fā)生阻塞時(shí)CPU可能會(huì)處于空閑狀態(tài)。這將造成大量的計(jì)算資源的浪費(fèi)。而在程序中使用多線程可以在某一個(gè)線程處于休眠或阻塞時(shí),而CPU又恰好處于空閑狀態(tài)時(shí)來(lái)運(yùn)行其他的線程。這樣CPU就很難有空閑的時(shí)候。因此,CPU資源就得到了充分地利用。
2. 簡(jiǎn)化編程模型
如果程序只完成一項(xiàng)任務(wù),那只要寫一個(gè)單線程的程序,并且按著執(zhí)行這個(gè)任務(wù)的步驟編寫代碼即可。但要完成多項(xiàng)任務(wù),如果還使用單線程的話,那就得在在程序中判斷每項(xiàng)任務(wù)是否應(yīng)該執(zhí)行以及什么時(shí)候執(zhí)行。如顯示一個(gè)時(shí)鐘的時(shí)、分、秒三個(gè)指針。使用單線程就得在循環(huán)中逐一判斷這三個(gè)指針的轉(zhuǎn)動(dòng)時(shí)間和角度。如果使用三個(gè)線程分另來(lái)處理這三個(gè)指針的顯示,那么對(duì)于每個(gè)線程來(lái)說(shuō)就是指行一個(gè)單獨(dú)的任務(wù)。這樣有助于開發(fā)人員對(duì)程序的理解和維護(hù)。
3. 簡(jiǎn)化異步事件的處理
當(dāng)一個(gè)服務(wù)器應(yīng)用程序在接收不同的客戶端連接時(shí)最簡(jiǎn)單地處理方法就是為每一個(gè)客戶端連接建立一個(gè)線程。然后監(jiān)聽線程仍然負(fù)責(zé)監(jiān)聽來(lái)自客戶端的請(qǐng)求。如果這種應(yīng)用程序采用單線程來(lái)處理,當(dāng)監(jiān)聽線程接收到一個(gè)客戶端請(qǐng)求后,開始讀取客戶端發(fā)來(lái)的數(shù)據(jù),在讀完數(shù)據(jù)后,read方法處于阻塞狀態(tài),也就是說(shuō),這個(gè)線程將無(wú)法再監(jiān)聽客戶端請(qǐng)求了。而要想在單線程中處理多個(gè)客戶端請(qǐng)求,就必須使用非阻塞的Socket連接和異步I/O。但使用異步I/O方式比使用同步I/O更難以控制,也更容易出錯(cuò)。因此,使用多線程和同步I/O可以更容易地處理類似于多請(qǐng)求的異步事件。
4. 使GUI更有效率
使用單線程來(lái)處理GUI事件時(shí),必須使用循環(huán)來(lái)對(duì)隨時(shí)可能發(fā)生的GUI事件進(jìn)行掃描,在循環(huán)內(nèi)部除了掃描GUI事件外,還得來(lái)執(zhí)行其他的程序代碼。如果這些代碼太長(zhǎng),那么GUI事件就會(huì)被“凍結(jié)”,直到這些代碼被執(zhí)行完為止。
在現(xiàn)代的GUI框架(如SWING、AWT和SWT)中都使用了一個(gè)單獨(dú)的事件分派線程(event dispatch thread,EDT)來(lái)對(duì)GUI事件進(jìn)行掃描。當(dāng)我們按下一個(gè)按鈕時(shí),按鈕的單擊事件函數(shù)會(huì)在這個(gè)事件分派線程中被調(diào)用。由于EDT的任務(wù)只是對(duì)GUI事件進(jìn)行掃描,因此,這種方式對(duì)事件的反映是非常快的。
5. 節(jié)約成本
提高程序的執(zhí)行效率一般有三種方法:
(1)增加計(jì)算機(jī)的CPU個(gè)數(shù)。
(2)為一個(gè)程序啟動(dòng)多個(gè)進(jìn)程
(3)在程序中使用多進(jìn)程。
第一種方法是最容易做到的,但同時(shí)也是最昂貴的。這種方法不需要修改程序,從理論上說(shuō),任何程序都可以使用這種方法來(lái)提高執(zhí)行效率。第二種方法雖然不用購(gòu)買新的硬件,但這種方式不容易共享數(shù)據(jù),如果這個(gè)程序要完成的任務(wù)需要必須要共享數(shù)據(jù)的話,這種方式就不太方便,而且啟動(dòng)多個(gè)線程會(huì)消耗大量的系統(tǒng)資源。第三種方法恰好彌補(bǔ)了第一種方法的缺點(diǎn),而又繼承了它們的優(yōu)點(diǎn)。也就是說(shuō),既不需要購(gòu)買CPU,也不會(huì)因?yàn)閱⑻嗟木€程而占用大量的系統(tǒng)資源(在默認(rèn)情況下,一個(gè)線程所占的內(nèi)存空間要遠(yuǎn)比一個(gè)進(jìn)程所占的內(nèi)存空間小得多),并且多線程可以模擬多塊CPU的運(yùn)行方式,因此,使用多線程是提高程序執(zhí)行效率的最廉價(jià)的方式。
三、Java的線程模型
由于Java是純面向?qū)ο笳Z(yǔ)言,因此,Java的線程模型也是面向?qū)ο蟮摹ava通過Thread類將線程所必須的功能都封裝了起來(lái)。要想建立一個(gè)線程,必須要有一個(gè)線程執(zhí)行函數(shù),這個(gè)線程執(zhí)行函數(shù)對(duì)應(yīng)Thread類的run方法。Thread類還有一個(gè)start方法,這個(gè)方法負(fù)責(zé)建立線程,相當(dāng)于調(diào)用Windows的建立線程函數(shù)CreateThread。當(dāng)調(diào)用start方法后,如果線程建立成功,并自動(dòng)調(diào)用Thread類的run方法。因此,任何繼承Thread的Java類都可以通過Thread類的start方法來(lái)建立線程。如果想運(yùn)行自己的線程執(zhí)行函數(shù),那就要覆蓋Thread類的run方法。
在Java的線程模型中除了Thread類,還有一個(gè)標(biāo)識(shí)某個(gè)Java類是否可作為線程類的接口Runnable,這個(gè)接口只有一個(gè)抽象方法run,也就是Java線程模型的線程執(zhí)行函數(shù)。因此,一個(gè)線程類的唯一標(biāo)準(zhǔn)就是這個(gè)類是否實(shí)現(xiàn)了Runnable接口的run方法,也就是說(shuō),擁有線程執(zhí)行函數(shù)的類就是線程類。
從上面可以看出,在Java中建立線程有兩種方法,一種是繼承Thread類,另一種是實(shí)現(xiàn)Runnable接口,并通過Thread和實(shí)現(xiàn)Runnable的類來(lái)建立線程,其實(shí)這兩種方法從本質(zhì)上說(shuō)是一種方法,即都是通過Thread類來(lái)建立線程,并運(yùn)行run方法的。但它們的大區(qū)別是通過繼承Thread類來(lái)建立線程,雖然在實(shí)現(xiàn)起來(lái)更容易,但由于Java不支持多繼承,因此,這個(gè)線程類如果繼承了Thread,就不能再繼承其他的類了,因此,Java線程模型提供了通過實(shí)現(xiàn)Runnable接口的方法來(lái)建立線程,這樣線程類可以在必要的時(shí)候繼承和業(yè)務(wù)有關(guān)的類,而不是Thread類。