1.分布式存儲
分布式存儲是將數據分散的存儲在多臺獨立的節點上,當有數據請求的時候,通過某種協議進行操作組合。分布式存儲,可以拆分為分存儲服務、分布式計算兩個方面。
(1)分布式計算方案可以分為兩類,基于協議的客戶端分布式系統、基于協議的服務端分布式系統??蛻舳朔植际剿惴ㄊ潜容^簡單的,也比較好實現。
哈希算法是典型的客戶端分布式算法。除了普通的哈希算法,還有一致性哈希算法。一致性哈希算法有多種具體的實現,包括Chord算法,KAD算法等。除了客戶端分布式算法,還有服務端分布式算法。PaxosPW與Raft都是服務端分布式算法。
(2)存儲服務可以使用內存作為存儲介質,也可以使用磁盤作為存儲介質。存儲服務的經典數據模型有跳躍表、哈希表、B Tree、LSM Tree等。

2.分布式存儲與傳統存儲的區別
以下將對比分布式存儲與傳統SAN、NAS存儲的優缺點:
(1)優點
①性能
在分布式存儲達到一定規模是,性能會超過傳統的SAN、NAS。大量磁盤和節點,結合適當的數據分布策略,可以達到非常高的聚合帶寬。傳統的SAN、NAS都會有性能瓶頸,一旦達到最大擴展能力,性能不會改變甚至降低。
②可持續性
傳統的SAN、NAS擴展能力受限,一個機頭最多可以帶幾百個磁盤。如果想要個PB以上的共享存儲,分布式存儲只最好的選擇。不用擔心擴展能力問題。
③價格
傳統的SAN、NAS,價格比較高。特別是SAN網絡設備,光纖網絡成本比較高。而且,以后擴展還需要增加擴展柜。成本太高。分布式存儲只需要IP網絡,幾臺X86服務器加內置硬盤就可以組建起來,初期成本比較低。擴展也非常方便,加服務器就行。
缺點:
①數據一致性問題。對于ORACLE
RAC這一類對數據一致性要求比較高的應用場景,分布式存儲的性能可能就稍弱了,因為分布式的結構,數據同步是一個大問題,雖然現在技術一致在進步,但是也不如傳統存儲設備數據存儲方式可靠。
②穩定性問題,分布式存儲非常依賴網絡環境和帶寬,如果網絡發生抖動或者故障,都可能會影響分布式存儲系統運行。例如,一旦發生IP沖突,那么整體分布式存儲可能都無法訪問。傳統存儲一般使用專用SAN或IP網絡,穩定性方面,更可靠一些。
③需要比較強的技術能力和運維能力,甚至有開發能力的用戶。傳統存儲開箱即用,硬件由廠家提供,也有完善的文檔和服務。而分布式很多是開源或者是有公司基于開源系統提供支持服務,版本迭代比較快,出問題后有可能需要自己解決。
3.分布式存儲與集中式存儲的區別
(1)視頻流上傳不同
集中存儲:視頻流上傳到中心。
分布存儲:視頻流就近上傳,對骨干網帶寬沒有什么要求;可采用多套低端的小容量的存儲設備分布部署,設備價格和維護成本較低;小容量設備分布部署,對機房環境要求低。
(2)對機房有要求不同
集中存儲:對機房環境要求高,要求機房空間大,承重、空調等都是需要考慮的問題。
分布存儲:對骨干網帶寬沒有什么要求,可采用多套低端的小容量的存儲設備分布部署,設備價格和維護成本較低;。小容量設備分布部署,對機房環境要求低。
(3)物理介質分布不同
集中存儲:物理介質集中布放。
分布存儲:物理介質分布到不同的地理位置。
以上梳理了分布式存儲的定義及其與傳統存儲、集中式存儲的區別,希望對你有所幫助,如果你想了解更多相關內容,敬請關注三個皮匠報告的行業知識欄目。
推薦閱讀:
百易存儲:2022分布式存儲市場調研報告(30頁).pdf
分布式存儲產業方陣:分布式存儲發展白皮書(2022年)(60頁).pdf
分布式存儲概念是什么?有哪幾種類型?關鍵技術介紹