最近越來越認為,在講解技術相關問題時,大白話固然很重要,通俗易懂,讓人有想讀下去的欲望。但幾乎所有的事,都有兩面性,在看到其帶來好處時,不妨想想是否也引入了不好的地方。
例如在博客中,過于大白話的語言的確會讓你閱讀起來更加順暢,也更容易理解。但這都是其他人理解,已經咀嚼過了的,人家是已經完全理解了,你從這些信息中大概可能會觀察不到全貌。所以,適當的白話是很好的,但這個度得控制一下。
接下來切入正文。
相信大家經常看到這個問題:
BIO、NIO 和 AIO 有什么區別?
看到這個問題,可能你腦海中就會浮現以下這些字眼。比如 BIO 就是如果從內核獲取數據會一直阻塞,直到數據準備完畢返回。再比如 NIO,內核在數據沒有準備好時不會阻塞住,調用程序會一直詢問內核數據是否 Ready。
雖然是正確的,字數也很少。但是這樣一來,你看這些概念就不是理解,而是背誦了。其實 BIO 和 NIO 這類的名詞還有一個共同的名字叫——IO模型,總共有:
IO 模型
由于信號驅動 IO 在實際中不常用,我們主要講以下四種模型:
- 同步阻塞
- 同步非阻塞
- IO 多路復用
- 異步 IO
這里還是通過例子來理解這 4 種 IO 模型:
假設此時客戶端正在發送一些數據到服務器,并且數據已經通過客戶端的協議棧、網卡,陸陸續續的到達了服務器這邊的內核態 Buffer 中了。
不清楚用戶態和內核態區別的可以看看《簡單聊聊用戶態和內核態的區別》
對數據在網絡中是如何傳輸的細節感興趣的,可以去看看我之前寫的文章 《請求數據包從發送到接收,都經歷了什么?》。
同步阻塞 BIO
我們需要知道,內核在處理數據的時候其實是分成了兩個階段:
- 數據準備
- 數據復制
在網絡 IO 中,數據準備可能是客戶端還有部分數據還沒有發送、或者正在發送的途中,當前內核 Buffer 中的數據并不完整;而數據復制則是將內核態 Buffer 中的數據復制到用戶態的 Buffer 中去。
當調用線程發起 read 系統調用時,如果此時內核數據還沒有 Ready,調用線程會阻塞住,等待內核 Buffer 的數據。內核數據準備就緒之后,會將內核態 Buffer 的數據復制到用戶態 Buffer 中,這個過程中調用線程仍然是阻塞的,直到數據復制完成,整個流程用圖來表示就張這樣:
同步非阻塞 NIO
相信大家知道 Java 中有個包叫 nio,但那跟我們現在正在討論的 NIO 不是同一個概念。
現在正在討論的是 Non-Blocking IO,代表同步非阻塞,是一種基礎的 IO 模型。而 nio 包則是 New IO,里面的 IO 模型實際上是 IO多路復用,大家不要搞混淆了。
有了 BIO 的基礎,這次我們直接來看圖:
NIO
還是分為兩個階段來討論。
數據準備階段。此時用戶線程發起 read 系統調用,此時內核會立即返回一個錯誤,告訴用戶態數據還沒有 Read,然后用戶線程不停地發起請求,詢問內核當前數據的狀態。
數據復制階段。此時用戶線程還在不斷的發起請求,但是當數據 Ready 之后,用戶線程就會陷入阻塞,直到數據從內核態復制到用戶態。
稍微總結一下,如果內核態的數據沒有 Ready,用戶線程不會阻塞;但是如果內核態數據 Ready 了,即使當前的 IO 模型是同步非阻塞,用戶線程仍然會進入阻塞狀態,直到數據復制完成,并不是絕對的非阻塞。
那 NIO 的好處是啥呢?顯而易見,實時性好,內核態數據沒有 Ready 會立即返回。但是事情的兩面性就來了,頻繁的輪詢內核,會占用大量的 CPU 資源,降低效率。
IO 多路復用
IO 多路復用實際上就解決了 NIO 中的頻繁輪詢 CPU 的問題。在之前的 BIO 和 NIO 中只涉及到一種系統調用——read,在 IO 多路復用中要引入新的系統調用——select。
read 用于讀取內核態 Buffer 中的數據,而 select 你可以理解成 MySQL 中的同名關鍵字,用于查詢 IO 的就緒狀態。
在 NIO 中,內核態數據沒有 Ready 會導致用戶線程不停的輪詢,從而拉滿 CPU。而在 IO 多路復用中調用了 select 之后,只要數據沒有準備好,用戶線程就會阻塞住,避免了頻繁的輪詢當前的 IO 狀態,用圖來表示的話是這樣:
IO 多路復用
異步 AIO
該模型的實現就如其名,是異步的。用戶線程發起 read 系統調用之后,無論內核 Buffer 數據是否 Ready,都不會阻塞,而是立即返回。
內核在收到請求之后,會開始準備數據,準備好了&復制完成之后會由內核發送一個 Signal 給用戶線程,或者回調用戶線程注冊的接口進行通知。用戶線程收到通知之后就可以去讀取用戶態 Buffer 的數據了。
AIO
由于這種實現方式,異步 IO 有時也被叫做信號驅動 IO。相信你也發現了,這種方式最重要的是需要 OS 的支持,如果 OS 不支持就直接完蛋。
Linux 系統在 2.6 版本的時候才引入了異步IO,不過那個時候并不算真正的異步 IO,因為內核并不支持,底層其實是通過 IO 多路復用實現的。而到了 Linux 5.1 時,才通過 io_uring 實現了真 AIO。
原文鏈接:https://mp.weixin.qq.com/s/8v66WyAaYJ4GOU_fdFOJyA