激情久久久_欧美视频区_成人av免费_不卡视频一二三区_欧美精品在欧美一区二区少妇_欧美一区二区三区的

服務器之家:專注于服務器技術及軟件下載分享
分類導航

Mysql|Sql Server|Oracle|Redis|MongoDB|PostgreSQL|Sqlite|DB2|mariadb|Access|數據庫技術|

服務器之家 - 數據庫 - Mysql - 詳解監聽MySQL的binlog日志工具分析:Canal

詳解監聽MySQL的binlog日志工具分析:Canal

2021-02-22 16:36大數據學習與分享 Mysql

Canal主要用途是基于MySQL數據庫增量日志解析,提供增量數據訂閱和消費,目前主要支持MySQL。接下來通過本文給大家介紹監聽MySQL的binlog日志工具分析:Canal的相關知識,感興趣的朋友一起看看吧

Canal是阿里巴巴旗下的一款開源項目,利用Java開發。主要用途是基于MySQL數據庫增量日志解析,提供增量數據訂閱和消費,目前主要支持MySQL。

GitHub地址:https://github.com/alibaba/canal

詳解監聽MySQL的binlog日志工具分析:Canal

在介紹Canal內部原理之前,首先來了解一下MySQL Master/Slave同步原理:

詳解監聽MySQL的binlog日志工具分析:Canal

MySQL master啟動binlog機制,將數據變更寫入二進制日志(binary log, 其中記錄叫做二進制日志事件binary log events,可以通過show binlog events進行查看)MySQL slave(I/O thread)將master的binary log events拷貝到它的中繼日志(relay log)MySQL slave(SQL thread)重放relay log中事件,將數據變更反映它自己的數據中

Canal工作原理:

Canal模擬MySQL slave的交互協議,偽裝自己為MySQL slave,向MySQL master發送dump協議MySQL master收到dump請求,開始推送binary log給slave(也就是canal)Canal解析binary log對象(原始為byte流)

簡而言之,Canal是通過模擬成為MySQL的slave,監聽MySQL的binlog日志來獲取數據。當把MySQL的binlog設置為row模式以后,可以獲取到執行的每一個Insert/Update/Delete的腳本,以及修改前和修改后的數據,基于這個特性,Canal就能高效的獲取到MySQL數據的變更。 Canal架構:

詳解監聽MySQL的binlog日志工具分析:Canal

說明: server代表一個Canal運行實例,對應于一個jvm instance對應于一個數據隊列(1個server對應1..n個instance)

詳解監聽MySQL的binlog日志工具分析:Canal

EventParser:數據源接入,模擬slave協議和master進行交互,協議解析

EventSink:Parser和Store連接器,主要進行數據過濾,加工,分發的工作

EventStore:負責存儲

MemoryMetaManager:增量訂閱和消費信息管理器

Event Parser設計:

詳解監聽MySQL的binlog日志工具分析:Canal

整個parser過程大致可分為以下幾步:

Connection獲取上一次解析成功的log position(如果是第一次啟動,則獲取初始指定的位置或者是當前數據庫的binlog log position)Connection建立連接,向MySQL master發送BINLOG_DUMP請求MySQL開始推送binary Log接收到的binary Log通過BinlogParser進行協議解析,補充一些特定信息。如補充字段名字、字段類型、主鍵信息、unsigned類型處理等將解析后的數據傳入到EventSink組件進行數據存儲(這是一個阻塞操作,直到存儲成功)定時記錄binary Log位置,以便重啟后繼續進行增量訂閱

如果需要同步的master宕機,可以從它的其他slave節點繼續同步binlog日志,避免單點故障。 Event Sink設計:

詳解監聽MySQL的binlog日志工具分析:Canal

EventSink主要作用如下:

數據過濾:支持通配符的過濾模式,表名,字段內容等

數據路由/分發:解決1:n(1個parser對應多個store的模式)

數據歸并:解決n:1(多個parser對應1個store)

數據加工:在進入store之前進行額外的處理,比如join 數據1:n業務

為了合理的利用數據庫資源, 一般常見的業務都是按照schema進行隔離,然后在MySQL上層或者dao這一層面上,進行一個數據源路由,屏蔽數據庫物理位置對開發的影響,阿里系主要是通過cobar/tddl來解決數據源路由問題。所以,一般一個數據庫實例上,會部署多個schema,每個schema會有由1個或者多個業務方關注。

數據n:1業務

同樣,當一個業務的數據規模達到一定的量級后,必然會涉及到水平拆分和垂直拆分的問題,針對這些拆分的數據需要處理時,就需要鏈接多個store進行處理,消費的位點就會變成多份,而且數據消費的進度無法得到盡可能有序的保證。所以,在一定業務場景下,需要將拆分后的增量數據進行歸并處理,比如按照時間戳/全局id進行排序歸并。 Event Store設計:

支持多種存儲模式,比如Memory內存模式。采用內存環裝的設計來保存消息,借鑒了Disruptor的RingBuffer的實現思路。 RingBuffer設計:

詳解監聽MySQL的binlog日志工具分析:Canal

定義了3個cursor:

put:Sink模塊進行數據存儲的最后一次寫入位置(同步寫入數據的cursor)

get:數據訂閱獲取的最后一次提取位置(同步獲取的數據的cursor)

ack:數據消費成功的最后一次消費位置

借鑒Disruptor的RingBuffer的實現,將RingBuffer拉直來看:

詳解監聽MySQL的binlog日志工具分析:Canal

實現說明:

put/get/ack cursor用于遞增,采用long型存儲。三者之間的關系為put>=get>=ackbuffer的get操作,通過取余或者&操作。(&操作:cusor & (size - 1) , size需要為2的指數,效率比較高)

Instance設計:

詳解監聽MySQL的binlog日志工具分析:Canal

instance代表了一個實際運行的數據隊列,包括了EventPaser、EventSink、EventStore等組件。抽象了CanalInstanceGenerator,主要是考慮配置的管理方式:

manager方式:和你自己的內部web console/manager系統進行對接。(目前主要是公司內部使用)

spring方式:基于spring xml + properties進行定義,構建spring配置。 Server設計:

詳解監聽MySQL的binlog日志工具分析:Canal

server代表了一個Canal運行實例,為了方便組件化使用,特意抽象了Embeded(嵌入式)/Netty(網絡訪問)的兩種實現。

增量訂閱/消費設計:

詳解監聽MySQL的binlog日志工具分析:Canal

具體的協議格式,可參見:CanalProtocol.proto。數據對象格式:EntryProtocol.proto

?
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
Entry
  Header
    logfileName [binlog文件名]
    logfileOffset [binlog position]
    executeTime [binlog里記錄變更發生的時間戳]
    schemaName [數據庫實例]
    tableName [表名]
    eventType [insert/update/delete類型]
  entryType  [事務頭BEGIN/事務尾END/數據ROWDATA]
  storeValue [byte數據,可展開,對應的類型為RowChange]
 
RowChange
isDdl    [是否是ddl變更操作,比如create table/drop table]
sql   [具體的ddl sql]
rowDatas  [具體insert/update/delete的變更數據,可為多條,1個binlog event事件可對應多條變更,比如批處理]
beforeColumns [Column類型的數組]
afterColumns [Column類型的數組]
 
Column
index    [column序號]
sqlType   [jdbc type]
name    [column name]
isKey    [是否為主鍵]
updated   [是否發生過變更]
isNull   [值是否為null]
value    [具體的內容,注意為文本]

針對上述的補充說明:

1.可以提供數據庫變更前和變更后的字段內容,針對binlog中沒有的name、isKey等信息進行補全

2.可以提供ddl的變更語句

Canal HA機制:

Canal的HA實現機制是依賴zookeeper實現的,主要分為Canal server和Canal client的HA。 Canal server:為了減少對MySQL dump的請求,不同server上的instance要求同一時間只能有一個處于running狀態,其他的處于standby狀態。

Canal client:為了保證有序性,一份instance同一時間只能由一個Canal client進行get/ack/rollback操作,否則客戶端接收無法保證有序。 Canal Server HA架構圖:

詳解監聽MySQL的binlog日志工具分析:Canal

大致步驟:

  • Canal server要啟動某個Canal instance時都先向Zookeeper進行一次嘗試啟動判斷 (實現:創建EPHEMERAL節點,誰創建成功就允許誰啟動)
  • 創建Zookeeper節點成功后,對應的Canal server就啟動對應的Canal instance,沒有創建成功的Canal instance就會處于standby狀態
  • 一旦Zookeeper發現Canal server A創建的節點消失后,立即通知其他的Canal server再次進行步驟1的操作,重新選出一個Canal server啟動instance
  • Canal client每次進行connect時,會首先向Zookeeper詢問當前是誰啟動了Canal instance,然后和其建立鏈接,一旦鏈接不可用,會重新嘗試connect

Canal Client的方式和Canal server方式類似,也是利用Zookeeper的搶占EPHEMERAL節點的方式進行控制。

到此這篇關于詳解監聽MySQL的binlog日志工具分析:Canal的文章就介紹到這了,更多相關MySQL的binlog日志內容請搜索服務器之家以前的文章或繼續瀏覽下面的相關文章希望大家以后多多支持服務器之家!

原文鏈接:https://www.cnblogs.com/bigdatalearnshare/p/13832709.html

延伸 · 閱讀

精彩推薦
主站蜘蛛池模板: 日日干天天摸 | 久久网综合 | 日韩一级片免费 | 亚洲免费视频大全 | 国产精品久久av | 欧美亚洲免费 | 色欲香天天天综合网站 | 日韩精品中文字幕一区 | 久久久久久久久久亚洲精品 | 国产精品久久久久久久久久久久久久久久 | 亚洲一区在线视频观看 | xnxx 日本免费 | 国产免费视频在线 | 黄色午夜剧场 | 精精国产xxxx视频在线野外 | 欧美在线a | 免费国产视频在线观看 | 欧美男女爱爱视频 | 国产乱淫a∨片免费观看 | 久久久久久久久久网 | 午夜视频在线看 | 黄色免费播放网站 | 欧美顶级毛片在线播放小说 | 久精品久久 | 国产一区视频在线观看免费 | 精品久久久久久久 | 热99re久久免费视精品频软件 | 九九热欧美 | 中文字幕 亚洲一区 | 国产羞羞视频 | 99re久久最新地址获取 | 圆产精品久久久久久久久久久 | 日韩欧美激情视频 | 天天操综| 欧美成人a | 国产无遮挡一区二区三区毛片日本 | 免费成人 | sesee99| 国产精品亚洲一区二区三区久久 | 日韩999 | 性欧美大战久久久久久久免费观看 |