日韩成人免费在线_国产成人一二_精品国产免费人成电影在线观..._日本一区二区三区久久久久久久久不

當前位置:首頁 > 科技  > 軟件

Ceph 使用 NVME 是否可以實現 10k 混合 IOPS ?

來源: 責編: 時間:2023-09-20 21:54:32 375觀看
導讀最近,ceph subreddit上的一位用戶提了一個問題:在一個由 6 個節點組成,每個節點有 2 個 4GB FireCuda NVMe 磁盤的集群中,Ceph是否可以為單個客戶端提供10K IOPs的組合隨機讀/寫能力。該用戶也想知道是否有人對類似的場景

maM28資訊網——每日最新資訊28at.com

最近,ceph subreddit上的一位用戶提了一個問題:在一個由 6 個節點組成,每個節點有 2 個 4GB FireCuda NVMe 磁盤的集群中,Ceph是否可以為單個客戶端提供10K IOPs的組合隨機讀/寫能力。該用戶也想知道是否有人對類似的場景進行過測試并希望能夠共享一下測試結果。在 Clyso 項目組中,我們一直在積極努力改進 Ceph 代碼以實現更高的性能。我們有自己的測試和配置來評估我們對代碼的更改。正好,我們當前有可以匹配該用戶測試場景的硬件環境。因此,我們決定花些時間來進行測試以及驗證。maM28資訊網——每日最新資訊28at.com

用戶環境配置

用戶的環境包含6個節點,每個節點都有2個4TB希捷FireCuda NVMe驅動器和64GB內存。關于CPU或網絡,當前沒有明確的信息。但兩者都對這次測試可能很重要。因此,我們使用如下的 fio 命令來實現這一需求:maM28資訊網——每日最新資訊28at.com

fio --randrepeat=1 --ioengine=libaio --direct=1 --gtod_reduce=1 --name=test --filename=test --bs=4k --iodepth=64 --size=150G --readwrite=randrw --rwmixread=75

雖然我們的實驗室中沒有FireCuda驅動器,但我們確實有節點具有多個4TB三星PM983驅動器和每個128GB內存。maM28資訊網——每日最新資訊28at.com

群集配置

Nodes
maM28資訊網——每日最新資訊28at.com

10 x Dell PowerEdge R6515
maM28資訊網——每日最新資訊28at.com

CPU
maM28資訊網——每日最新資訊28at.com

1 x AMD EPYC 7742 64C/128T
maM28資訊網——每日最新資訊28at.com

Memory
maM28資訊網——每日最新資訊28at.com

128GiB DDR4
maM28資訊網——每日最新資訊28at.com

Network
maM28資訊網——每日最新資訊28at.com

1 x 100GbE Mellanox ConnectX-6
maM28資訊網——每日最新資訊28at.com

NVMe
maM28資訊網——每日最新資訊28at.com

6 x 4TB Samsung PM983
maM28資訊網——每日最新資訊28at.com

OS Version
maM28資訊網——每日最新資訊28at.com

CentOS Stream release 8
maM28資訊網——每日最新資訊28at.com

Ceph Version 1
maM28資訊網——每日最新資訊28at.com

Pacific v16.2.13 (built from source)
maM28資訊網——每日最新資訊28at.com

Ceph Version 2
maM28資訊網——每日最新資訊28at.com

Quincy v17.2.6 (built from source)
maM28資訊網——每日最新資訊28at.com

Ceph Version 3
maM28資訊網——每日最新資訊28at.com

Reef v18.1.0 (built from source)
maM28資訊網——每日最新資訊28at.com

為了盡可能匹配用戶的環境,我們只使用了集群中的 6 個節點,其中 2 個 OSD 在單個 NVMe 驅動器上運行,每個 OSD 用于 Ceph。其余節點用作客戶端節點。所有節點都位于同一Juniper QFX5200 交換機上,并通過單個 100GbE QSFP28 連接。maM28資訊網——每日最新資訊28at.com

下面將先部署好 Ceph,并使用 CBT 啟動 FIO 測試。基于Intel的系統上一項重要的操作系統級別優化是將 TuneD 配置文件設置為“延遲性能”或“網絡延遲”。這主要有助于避免與 CPU C/P 狀態轉換相關的延遲峰值。基于AMD的系統在這方面并沒有太大效果,目前還沒有確認調優是否限制了C/P狀態轉換,但是對于這些測試,調優后的配置文件仍然設置為“網絡延遲”。maM28資訊網——每日最新資訊28at.com

測試設置

用戶的環境包含6個節點,每個節點都有2個4TB希捷maM28資訊網——每日最新資訊28at.com

CBT 需要修改幾個配置,而不使用是默認的配置來部署 Ceph。每個 OSD 分配 8GB 內存(這是合理的,因為用戶的節點有 64GB 內存用于 2 個 OSD)。RBD 卷與 Msgr V1 配合一起使用,并且 cephx 被禁用。maM28資訊網——每日最新資訊28at.com

FIO 會先用大寫入預填充 RBD 卷,然后進行用戶的隨機讀/寫測試。某些后臺進程(如scrub, deep scrub, pg autoscaling, 以及 pg balancing)已禁用。PG 以及 PGP 設置為4096 (高于通常推薦的)和 3 副本的 RBD 池。用戶僅請求單個 FIO 卷和使用單個 150GB 文件的測試。我們按照要求對此進行了測試,但為了讓集群處于負載狀態,還運行了 16 個獨立的 FIO 進程的測試,這些進程寫入分布在 4 個客戶端節點上的專用 RBD 卷,每個卷都有一個 16GB 的文件。 為了保證與用戶的FIO設置一致,必須將 gtod_reduce 選項的支持添加到cbt的FIO基準測試工具中。 gtod_reduce 可以通過顯著減少 FIO 必須進行的 getTimeOfDay(2) 調用次數來提高性能, 但它也禁用了某些功能, 例如在測試期間收集操作延遲信息。為了評估影響,我們在啟用和禁用的情況下 gtod_reduce運行了測試:maM28資訊網——每日最新資訊28at.com

圖片maM28資訊網——每日最新資訊28at.com

據結果,我們決定保持 gtod_reduce 禁用狀態,以便我們也可以觀察延遲數據。請注意,啟用此 FIO 選項可以提高大約 3-4%性能。除此之外,所有其他選項要么在CBT中可用,要么在FIO中已經默認。CBT YAML 文件的基準測試部分包含單客戶端測試的配置內容如下:maM28資訊網——每日最新資訊28at.com

benchmarks:  fio:    client_endpoints: 'fiotest'    op_size: [4096]    iodepth: [64]    size: 153600 # data set size per fio instance in KB    mode: ['randrw']    rwmixread: 75     procs_per_endpoint: [1]    osd_ra: [4096]    log_avg_msec: 100    cmd_path: '/usr/local/bin/fio'

最終,我們實現了與用戶類似的FIO測試案例,但還有一些差異,主要與在測試過程中記錄iops/延遲數據有關:maM28資訊網——每日最新資訊28at.com

fio --ioengine=libaio --direct=1 --bs=4096 --iodepth=64 --rw=randrw --rwmixread=75 --rwmixwrite=25 --size=153600M --numjobs=1 --name=/tmp/cbt/mnt/cbt-rbd-kernel/0/`hostname -f`-0-0 --write_iops_log=/tmp/cbt/00000000/Fio/output.0 --write_bw_log=/tmp/cbt/00000000/Fio/output.0 --write_lat_log=/tmp/cbt/00000000/Fio/output.0 --log_avg_msec=100 --output-format=json,normal > /tmp/cbt/00000000/Fio/output.0

單客戶端和多客戶端IOPS

圖片maM28資訊網——每日最新資訊28at.com

圖片maM28資訊網——每日最新資訊28at.com

Ceph 不僅能夠在這種混合工作負載中實現 10K IOPS,而且在單個客戶端測試中速度提高了一個數量級。針對這個小型 12 OSD 集群,我們從單個客戶端實現了大約 92K 的隨機讀取和 31K 的隨機寫入 IOPS。maM28資訊網——每日最新資訊28at.com

另外,我們也運行多客戶端測試的原因是為了展示這個小集群在為其他客戶端提供服務時有多少空間。在相同的混合工作負載和 16 個客戶端下,我們僅用 12 個支持 NVMe 的 OSD 就實現了超過 500K 的隨機讀取和大約 170K 的隨機寫入 IOPS。在多客戶端測試中,Qunicy 和 Reef 的性能優勢分別比 Pacific 高出大約 6% 和 9%。啟用gtod_reduce可將 性能再提高 3-4%。maM28資訊網——每日最新資訊28at.com

單客戶端和多客戶端CPU使用率

圖片maM28資訊網——每日最新資訊28at.com

圖片maM28資訊網——每日最新資訊28at.com

根據以往的測試,我們可以發現一個明顯的問題:CPU不足導致NVME的性能無法充分發揮。為了滿足單個客戶端工作負載,每個 OSD 大約消耗 3-4 個 AMD EPYC 內核。為了滿足多客戶端工作負載的需求,每個 OSD 消耗大量 11-12 個內核!IE 即使每個節點只有 2 個 OSD,每個節點也需要一個 24 核 EPYC 處理器才能實現這些驅動器的最大性能。更快的驅動器可能需要更大/更快的處理器。什么進程使用了所有這些 CPU? 在以前的文章中,我們得出過如下的結論:maM28資訊網——每日最新資訊28at.com

NamemaM28資訊網——每日最新資訊28at.com

Count
maM28資訊網——每日最新資訊28at.com

OSD Worker Threads
maM28資訊網——每日最新資訊28at.com

16
maM28資訊網——每日最新資訊28at.com

Async Messenger Threads
maM28資訊網——每日最新資訊28at.com

3
maM28資訊網——每日最新資訊28at.com

Bluestore KV Sync Thread
maM28資訊網——每日最新資訊28at.com

1
maM28資訊網——每日最新資訊28at.com

Bluster "Finisher" Thread
maM28資訊網——每日最新資訊28at.com

1
maM28資訊網——每日最新資訊28at.com

在某些情況下,RocksDB 壓縮線程也會定期使用 CPU 資源。BlueStore KV Sync 線程很容易成為小型隨機寫入的瓶頸,尤其是在使用較低性能的 CPU 時。但是,總體 CPU 消耗主要是在 OSD 工作線程和異步信使線程中完成的工作的結果。這是 crc 檢查、編碼/解碼、內存分配等的組合。maM28資訊網——每日最新資訊28at.com

單客戶端和多客戶端cycles/OP

圖片maM28資訊網——每日最新資訊28at.com

圖片maM28資訊網——每日最新資訊28at.com

由于cycles/OP 解析代碼中的錯誤,先前的cycles/OP 計數顯著增加。這使得 OSD 的效率似乎比實際要低得多。因此,我們計算性能指標的時候,需要使用聚合平均 CPU 消耗和 IOPS 而不是聚合周期和 OPS ,校正后的數值已被驗證在預期的 ~14-17% 以內。我們認為,剩余的差異主要是由于cpu速度隨時間的變化,以及 collectl 報告的 CPU 消耗方式。maM28資訊網——每日最新資訊28at.com

在單客戶端和多客戶端測試中,性能似乎略有提高。另外,在多客戶端測試中,我們發現在高負載下處理數據的效率要高得多,而在單客戶端測試中,我們在低負載下處理數據的效率要高得多。maM28資訊網——每日最新資訊28at.com

為什么會這樣呢?在上一節中,我們討論了 OSD 中的大部分工作如何由 OSD 工作線程和異步信使線程完成。當 OSD 收到新 IO 時,首先由與相應網絡連接關聯的異步信使線程處理并移動到用戶空間中。然后將其放入給定 OSD 分片的計劃程序工作隊列中。如果隊列之前為空,則與該分片關聯的所有線程都會喚醒,并且在分片的工作隊列為空之前不會返回睡眠狀態。當只有 1 個客戶端執行 IO 時,集群上的負載會明顯減少,并且每個分片的隊列通常會在短時間內為空。線程會不斷喚醒并重新進入睡眠狀態。當群集負載較重時,隊列更有可能有工作要做,因此線程花費更少的睡眠和喚醒時間。相反,他們花更多的時間做實際工作。maM28資訊網——每日最新資訊28at.com

單客戶端和多客戶端平均延遲

圖片maM28資訊網——每日最新資訊28at.com

圖片maM28資訊網——每日最新資訊28at.com

在單客戶端測試中,Ceph 能夠保持亞毫秒級的平均讀取和寫入延遲。在多客戶端測試中,我們看到了Pacific,Quincy和Reef之間的不同行為。Pacific的讀取延遲最低,寫入延遲最高,而Reef的讀取延遲略有增加,但寫入延遲顯著降低。Quincy的介于兩者之間,但更接近Reef而不是Pacific。maM28資訊網——每日最新資訊28at.com

單客戶端和多客戶端99.9%延遲

圖片maM28資訊網——每日最新資訊28at.com

圖片maM28資訊網——每日最新資訊28at.com

正如預期的那樣,99.9% 的延遲略高。我們可以實現不到 1.3 毫秒的讀取和大約 2.1-2.3 毫秒的寫入,具體取決于版本。多客戶端測試中的尾部延遲明顯更高,但是在此測試中,Quincy 尤其是 Reef 的寫入尾部延遲明顯低于 Pacific。maM28資訊網——每日最新資訊28at.com

結論

那么我們最后是怎么做的呢?目標是在這個混合讀/寫 FIO 工作負載中達到 10K IOPS,讀取率為 75%,寫入率為 25%。我假設這意味著目標是 7500 個讀取 IOPS 和 2500 個寫入 IOPS。讓我們比較一下我們是如何做到的:maM28資訊網——每日最新資訊28at.com

Single-Client IOPS: 單客戶端 IOPS:maM28資訊網——每日最新資訊28at.com

Release
maM28資訊網——每日最新資訊28at.com

Read Goal
maM28資訊網——每日最新資訊28at.com

Read IOPS
maM28資訊網——每日最新資訊28at.com

Improvement
maM28資訊網——每日最新資訊28at.com

Write Goal
maM28資訊網——每日最新資訊28at.com

Write IOPS
maM28資訊網——每日最新資訊28at.com

Improvement
maM28資訊網——每日最新資訊28at.com

v16.2.13
maM28資訊網——每日最新資訊28at.com

7500
maM28資訊網——每日最新資訊28at.com

88540
maM28資訊網——每日最新資訊28at.com

11.8XmaM28資訊網——每日最新資訊28at.com

2500
maM28資訊網——每日最新資訊28at.com

30509
maM28資訊網——每日最新資訊28at.com

12.2XmaM28資訊網——每日最新資訊28at.com

v17.2.6
maM28資訊網——每日最新資訊28at.com

7500
maM28資訊網——每日最新資訊28at.com

89032
maM28資訊網——每日最新資訊28at.com

11.9XmaM28資訊網——每日最新資訊28at.com

2500
maM28資訊網——每日最新資訊28at.com

30644
maM28資訊網——每日最新資訊28at.com

12.3XmaM28資訊網——每日最新資訊28at.com

v18.1.0
maM28資訊網——每日最新資訊28at.com

7500
maM28資訊網——每日最新資訊28at.com

89669
maM28資訊網——每日最新資訊28at.com

12.0XmaM28資訊網——每日最新資訊28at.com

2500
maM28資訊網——每日最新資訊28at.com

30940
maM28資訊網——每日最新資訊28at.com

12.4XmaM28資訊網——每日最新資訊28at.com

多客戶端 IOPS:maM28資訊網——每日最新資訊28at.com

Release
maM28資訊網——每日最新資訊28at.com

Read Goal
maM28資訊網——每日最新資訊28at.com

Read IOPS
maM28資訊網——每日最新資訊28at.com

Improvement
maM28資訊網——每日最新資訊28at.com

Write Goal
maM28資訊網——每日最新資訊28at.com

Write IOPS
maM28資訊網——每日最新資訊28at.com

Improvement
maM28資訊網——每日最新資訊28at.com

v16.2.13
maM28資訊網——每日最新資訊28at.com

7500
maM28資訊網——每日最新資訊28at.com

490773
maM28資訊網——每日最新資訊28at.com

65.4XmaM28資訊網——每日最新資訊28at.com

2500
maM28資訊網——每日最新資訊28at.com

163649
maM28資訊網——每日最新資訊28at.com

65.5XmaM28資訊網——每日最新資訊28at.com

v17.2.6
maM28資訊網——每日最新資訊28at.com

7500
maM28資訊網——每日最新資訊28at.com

521475
maM28資訊網——每日最新資訊28at.com

69.5XmaM28資訊網——每日最新資訊28at.com

2500
maM28資訊網——每日最新資訊28at.com

173887
maM28資訊網——每日最新資訊28at.com

69.6XmaM28資訊網——每日最新資訊28at.com

v18.1.0
maM28資訊網——每日最新資訊28at.com

7500
maM28資訊網——每日最新資訊28at.com

535611
maM28資訊網——每日最新資訊28at.com

71.4XmaM28資訊網——每日最新資訊28at.com

2500
maM28資訊網——每日最新資訊28at.com

178601
maM28資訊網——每日最新資訊28at.com

71.4XmaM28資訊網——每日最新資訊28at.com

目前,我們完成了所有的測試,同時也滿足了要求!另外,如果使用更快的 NVMe 驅動器,結果應該可以進一步改善。maM28資訊網——每日最新資訊28at.com

本文鏈接:http://m.www897cc.com/showinfo-26-10633-0.htmlCeph 使用 NVME 是否可以實現 10k 混合 IOPS ?

聲明:本網頁內容旨在傳播知識,若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。郵件:2376512515@qq.com

上一篇: 數據組合利器:從入門到精通Python中的zip()函數應用

下一篇: 被難倒了! 針對高級前端的八個級JavaScript面試問題

標簽:
  • 熱門焦點
Top 日韩成人免费在线_国产成人一二_精品国产免费人成电影在线观..._日本一区二区三区久久久久久久久不
亚洲欧美日本国产专区一区| 在线观看一区二区精品视频| 欧美区在线观看| 欧美日韩精品一区二区三区四区 | 欧美日韩中文字幕在线| 欧美日韩精品免费观看视频完整| 国产精品v欧美精品v日本精品动漫| 国产女人18毛片水18精品| 在线电影一区| 一区二区日韩精品| 亚洲尤物在线| 久久久精品一区| 欧美激情1区| 国产精品日韩专区| 依依成人综合视频| 夜夜嗨av一区二区三区网站四季av| 亚洲一区国产精品| 久久综合一区二区三区| 欧美绝品在线观看成人午夜影视 | 好看的日韩视频| 日韩一级欧洲| 久久精品国产免费| 欧美日韩三级在线| 狠狠色伊人亚洲综合网站色| 9人人澡人人爽人人精品| 久久精品av麻豆的观看方式 | 国产精品自在欧美一区| 亚洲国产精品久久久| 亚洲综合欧美| 欧美国产日韩一区二区| 国产精品中文字幕欧美| 91久久精品美女| 午夜精品在线| 欧美韩日亚洲| 国产有码在线一区二区视频| 一区二区三区国产| 葵司免费一区二区三区四区五区| 欧美日韩综合在线| 精品二区久久| 午夜精品免费| 欧美日韩激情小视频| 激情欧美日韩| 亚洲欧美日韩综合aⅴ视频| 欧美国产精品| 国内免费精品永久在线视频| 亚洲一区自拍| 欧美日韩精品免费观看视一区二区| 国内自拍亚洲| 亚洲欧美日韩另类精品一区二区三区| 欧美精品免费播放| 在线欧美日韩| 久久久999国产| 国产精品影音先锋| 中日韩午夜理伦电影免费| 欧美肥婆在线| 在线精品福利| 久久精品中文字幕一区| 国产精品社区| 亚洲视频在线观看| 欧美日韩国产电影| 亚洲日本乱码在线观看| 麻豆freexxxx性91精品| 国产综合色产在线精品| 欧美一区二区三区的| 国产精品美女主播在线观看纯欲| 一区二区91| 欧美日韩精品在线播放| 日韩视频三区| 欧美激情片在线观看| 在线视频国内自拍亚洲视频| 久久免费精品日本久久中文字幕| 国产伪娘ts一区| 香蕉成人久久| 国产精品永久在线| 亚洲一本大道在线| 欧美日韩在线视频观看| 99这里只有久久精品视频| 欧美精品在线观看91| 亚洲国产精品成人va在线观看| 麻豆久久精品| 亚洲承认在线| 免费欧美电影| 亚洲日本欧美| 欧美精品一区视频| 一本色道久久精品| 国产精品白丝jk黑袜喷水| 一区二区三区免费观看| 欧美网站在线观看| 亚洲一区免费| 国产精品羞羞答答xxdd| 欧美中文在线视频| 国产综合色精品一区二区三区| 久久精品国产欧美激情| 狠色狠色综合久久| 久久久久国产一区二区| 在线观看国产日韩| 久久一区二区视频| 亚洲精品视频一区二区三区| 欧美激情一区三区| 日韩一区二区免费看| 国产精品极品美女粉嫩高清在线| 亚洲天堂偷拍| 国产伦精品一区二区三区免费| 午夜精品在线视频| 狠狠色噜噜狠狠狠狠色吗综合| 老司机一区二区三区| 亚洲人成亚洲人成在线观看图片| 欧美日韩大片| 亚洲欧美日韩国产成人精品影院| 国产性天天综合网| 久久免费视频这里只有精品| 亚洲欧洲精品一区二区三区波多野1战4 | 亚洲狼人综合| 欧美午夜激情视频| 欧美一区二区三区精品| 在线不卡中文字幕| 欧美日韩成人综合| 亚洲精品国精品久久99热一| 国产情人节一区| 亚洲尤物在线视频观看| 国产伦精品一区二区三区照片91 | 你懂的视频一区二区| 99xxxx成人网| 国产精品一区二区久久精品| 久久免费视频网| 亚洲免费av观看| 国产精品揄拍一区二区| 久久一日本道色综合久久| 亚洲精品影视| 国产精品综合av一区二区国产馆| 久久综合狠狠综合久久综青草| 亚洲精品日韩欧美| 国产精品午夜在线观看| 蜜桃伊人久久| 亚洲伊人伊色伊影伊综合网| 国外成人在线| 欧美日韩999| 久久精品国产视频| 最新国产の精品合集bt伙计| 欧美日韩一区二区视频在线观看 | 国产精品成人久久久久| 久久久久久久网| 在线视频日韩精品| 黄色成人在线观看| 欧美日韩中文| 鲁大师影院一区二区三区| 亚洲欧美在线网| 亚洲精品视频一区二区三区| 国产欧美日韩在线| 欧美久久电影| 久久久亚洲高清| 亚洲图片欧美一区| 亚洲国产欧美在线| 国产亚洲毛片在线| 欧美午夜宅男影院在线观看| 免费亚洲网站| 欧美一区二区三区日韩| 一区二区三区福利| 亚洲国产视频一区二区| 国产日韩av一区二区| 欧美人成在线视频| 久久久久久尹人网香蕉| 亚洲视频在线观看三级| 亚洲激情亚洲| 国产一区二区三区自拍| 国产精品久久久| 欧美激情按摩在线| 久久久久欧美精品| 午夜精品久久久99热福利| 日韩亚洲一区二区| 在线看视频不卡| 国产欧美精品| 国产精品激情av在线播放| 欧美精品97| 暖暖成人免费视频| 久久久久国产精品www| 亚洲欧美综合| 亚洲一区二三| 国产精品99久久久久久有的能看| 亚洲国内精品| 在线日韩电影| 悠悠资源网亚洲青| 韩日精品视频| 国产亚洲精品久久久久婷婷瑜伽| 国产精品乱码妇女bbbb| 欧美日韩一区二区三区在线观看免| 欧美成人免费网站| 免费不卡中文字幕视频| 久久久免费av| 久久久久一区二区三区| 久久国产欧美| 久久国产精品网站| 欧美一区二区久久久| 亚洲欧美三级在线| 午夜精品久久久久久久久久久| 亚洲影院免费观看| 亚洲午夜精品在线| 亚洲午夜在线观看视频在线| 一区二区三区日韩精品| 亚洲视频你懂的| 亚洲免费一在线| 欧美亚洲在线播放| 久久国产精品久久久久久久久久| 久久精品夜色噜噜亚洲aⅴ|