hbase是數什ヾ(?■_■)ノ類(lèi)數據庫嗎?什么類(lèi)型的?
HBase是一個(gè)分布式的、面向列的據庫開(kāi)源數據庫,該技術(shù)來(lái)源于 Fay Chang 所撰寫(xiě)的數什類(lèi)Google論文“Bigtable:一個(gè)結構化數據的分布式存儲系統”。就像Bigtable利用了Google文件系統(File System)ヾ(^-^)ノ所提供的據庫分布式數據存儲一樣,HBase在Hadoop之上提供了類(lèi)似于Bigtable的數什類(lèi)能力。HBase??是據庫Apache的Hadoop項目的子項目。HBase不同于一般的數什類(lèi)關(guān)系數據庫,它是據庫一個(gè)適合于非結構化數據存儲的數據庫。另一個(gè)不同的數什類(lèi)是HBase基于列的而不是基于行的模式。
結構介紹
H(′_ゝ`)Base – Hadoop Database,據庫是數什類(lèi)一個(gè)高可靠性、高性能、據庫面向列、數什類(lèi)可伸縮的據庫分布式存儲系統,利用HBase技術(shù)可在廉價(jià)PC Server上搭建起大規模結構化存儲集群。數什類(lèi)
與FUJITSU?? Cliq等商用大數據產(chǎn)品不同,HBase是Google Bigtable的開(kāi)源實(shí)現,類(lèi)似Google Bigtable利用GFS作為其文件存儲系統,HBase利用Hadoop HDFS作為其文件存儲系統;Google運行MapReduce來(lái)處理Bigtable中的海量數據,H??Base??同樣利用Hadoop MapReduce來(lái)處理HBase中的海量數據;Google Bigtable利用 Chubby作為協(xié)同服務(wù),HBase利用Zookeeper(╯°□°)╯作為對應。
Hadoop EcoSystem的各層系統。其中,HBase位于結構化(hua)存儲層,Hadoop HDFS為(wei)HBase提供了高可靠性的底層存儲支持,Had??oop MapReduce為HBase提供了高性能的計算能力,Zookeeper為HBase提供了穩定服務(wù)和failover機制。
此外,Pig和Hi( ?ω?)ve還為HBase提供了高層語(yǔ)言支持,使得在HBase上進(jìn)行數據統計處理變的非常簡(jiǎn)單。 Sqoop則為H??Base提供了方便的(°ロ°) !RDBMS數據導入功能,使得傳統數據庫數據向HBase中遷移變的非常方便。