BlueStore
跳至導覽
跳至搜尋
Ceph 存儲引擎
- Ceph 支援多種存儲引擎,以插件的方式來進行管理使用
- 目前支援 filestore,kvstore,memstore 以及 bluestore 等
- Ceph Luminous (12.2.Z) 以後預設是 bluestore
- BlueStore 目前基本已經穩定
BlueStore 的優勢
- 減少寫放大;
- 針對 FLASH 媒體磁碟進行了優化;(SSD)
- 直接管理設備,進一步減少檔案系統部分的開銷。
BlueStore 的邏輯架構
- BlueStore 實做了直接管理設備的方式,拋棄了本機檔案系統
- BlockDevice 實做在用戶狀態下使用 linux aio 直接對設備進行 I/O 操作,去除了本機檔案系統的消耗,減少系統複雜度,更有利於 SSD 發揮性能優勢;
- 管理設備需要一個磁碟空間管理系統,BlueStore 採用 Allocator 進行設備空間管理
- 目前支援 StupidAllocator 和 BitmapAllocator 兩種模式;
- BlueStore 的 metadata 是以 Key-Value 的形式存在 RocksDB 裡
- 而 RocksDB 不能直接操作設備,為此,BlueStore 實做了一個 BlueRocksEnv,繼承自 EnvWrapper,為 RocksDB 提供底層檔案系統的抽象介面支援;
- 為了介接 BlueRocksEnv,BlueStore 實做了一個簡潔的檔案系統 BlueFS,只實做 BlueRocksEnv 所需要的介面,
- 在系統啟動掛載這個檔案系統的時候,將所有的 metadata 都載入到記憶體中
- BlueFS 的資料和日誌檔案都通過 BlockDevice 存到底層的設備上;
- BlueFS 和 BlueStore 可以共用設備,也可以分別指定不同的設備
- 為了獲得更好的效能 BlueStore 可以使用 SATA SSD,而 BlueFS 使用 NVMe SSD