HBase是特點(diǎn)一個(gè)高可靠性、高性能、特(te)點(diǎn)面向列、特點(diǎn)可伸縮的特點(diǎn)分布式存儲系統,旨在處(chu)理大量的特點(diǎn)數據,以下是特點(diǎn)對hbase的特點(diǎn)的具體分析:
(圖片來(lái)源網(wǎng)絡(luò ),侵刪)1、特點(diǎn)數據模型和存儲機制
面向列的存儲方式:與關(guān)系型數(′?ω?`)據庫的基于行模式存儲不同,HBase采用基于列的存儲方式,每個(gè)列族都由幾個(gè)文件保存,不同列族的文件是分離的。
數據版本管理:執行更新操作時(shí),HBas??e不會(huì )刪除舊數據版(′ω`)本,而是生成一個(gè)新的版本,使得數據的舊有版本仍然得以保留。
2、可伸縮性與擴??展性
靈活的水平擴展:HBase能夠ヽ(′▽?zhuān)?/輕易地通過(guò)在集群中增加或減少硬件數量來(lái)實(shí)現性能的伸縮。
(圖片來(lái)源網(wǎng)絡(luò ),侵刪)海量存儲能力:設計用???于處理非常龐大的表,支持通過(guò)水平擴展的方式處理由超過(guò)十億行數據和數百萬(wàn)列元素所組成的數據表。
3、高并發(fā)讀寫(xiě)支持
支持高并發(fā)操作:可以提供高并發(fā)的讀寫(xiě)操作,并利用廉價(jià)的計算機來(lái)處理大規模數據。
實(shí)時(shí)查詢(xún)優(yōu)化:默認對Ro??wKey做了索引優(yōu)化,即使數據量龐大,根據RowKey查詢(xún)的效率也??會(huì )很高。
4、可靠性與容錯性
(圖片來(lái)源網(wǎng)絡(luò ),侵刪)WAL機制:保證了數據寫(xiě)入時(shí)不會(huì )因集群異常而導致寫(xiě)入數據丟失。
Replicat(???)ion機制:確保在集群出現嚴重問(wèn)題時(shí),數據不會(huì )發(fā)生丟失或損壞。
5、簡(jiǎn)易性與靈活性
簡(jiǎn)單的數據模型:將數據存儲為未經(jīng)解釋的字符串,避免了復雜的表與表之間的關(guān)系。
動(dòng)態(tài)增加列:數據表內的列可以做到動(dòng)態(tài)增加,并且列為空的時(shí)候不存儲數據,從而節省存儲空間。
6、多語(yǔ)言API支持
豐富的API支持:支持Java、Thrift和R??EST等語(yǔ)言的API來(lái)進(jìn)行數??據存取編程。
7、自動(dòng)分片??與并行處理
自動(dòng)分片:表中的數據通過(guò)Region分布在集群上,并會(huì )隨著(zhù)數據的增長(cháng)自動(dòng)拆分和重新分布。
MapReduce支持(°□°):可以利用MapReduce進(jìn)行ヽ(′ー`)ノ大規模并行處理。