歡迎來到 常識詞典網(wǎng) , 一個專業(yè)的常識知識學(xué)習(xí)網(wǎng)站!
[ Ctrl + D 鍵 ]收藏本站
答案 1:
你把vertica寫成virtica了,我先幫你糾正過來。vertica是傳統(tǒng)的關(guān)系型數(shù)據(jù)庫,特點(diǎn)是按列存儲,而且集成了MapReduce支持。Cassandra則是屬于No-L陣營,特點(diǎn)是綜合Dynamo的弱一致性模型和Bigtable的數(shù)據(jù)模型。它們的比較其實(shí)就相當(dāng)于這兩個陣營的對比了,這方面文章不要太多。那么很顯然,vertica最大的優(yōu)勢就是它提供了-L的支持,可以很好的兼容以往的工具和數(shù)據(jù),習(xí)慣-L的程序員用起來也爽。傳統(tǒng)的-L語義在高可伸縮性要求下很難實(shí)現(xiàn),如join等操作。你可以設(shè)想一下,如果要join的表都非常大,超出單臺機(jī)器的處理能力,要高效地完成這個操作該有多困難。事實(shí)上這方面已經(jīng)有很多學(xué)術(shù)研究在進(jìn)行。傳統(tǒng)的數(shù)據(jù)庫除了-L語義外,還要保證transaction的ACID,而要同時滿足高一致性和事務(wù)操作的要求是很難實(shí)現(xiàn)高可伸縮性的。因而才會有No-L的出現(xiàn),它們犧牲了部分-L和事務(wù)的語義、降低一致性要求,以實(shí)現(xiàn)高可伸縮性的系統(tǒng)。Vertica的底層存儲實(shí)現(xiàn)和HBase的不一樣。雖然都是叫按列存儲,HBase是先將表格按行劃分成塊,在數(shù)據(jù)塊-才是按列存儲;Vertica的存儲比較靈活,它號稱可以配置哪些列要放在一起存儲,每列都分開就是最基本的按列存儲,所有列都和在一起就是按行存儲了,不過同一列的數(shù)據(jù)還是會放在一起。所以按列或者按行存儲只是不同的系統(tǒng)設(shè)計(jì)選擇,不是決定性因素。關(guān)鍵還是在于對上層提供的語義。你如果關(guān)心的是執(zhí)行效率,推薦你一篇-.cse.nd.edu/~dt-ain/courses/cse40771/spring2010/benc--rks-sigmod09.pdfHBase,Cassandra本身只有存儲能力,如果要做查詢需要借助Hadoop這樣的框架進(jìn)行,Hive就是把查詢都編譯成Hadoop任務(wù)實(shí)現(xiàn)的。Hadoop的查詢效率要比關(guān)系型數(shù)據(jù)庫要低,主要是因?yàn)?)Hadoop為了保證容錯,中間數(shù)據(jù)都要走一遍磁盤,IO開銷大;2)Hadoop缺少查詢優(yōu)化引擎還有索引等優(yōu)化機(jī)制(有人把Hadoop任務(wù)轉(zhuǎn)換成sql語句,然后再利用傳統(tǒng)數(shù)據(jù)庫的優(yōu)化算法優(yōu)化portal.acm.org/citation...)。Hadoop社區(qū)主要關(guān)注的是高可伸縮性,性能不行,就加機(jī)器唄。答案 2:
你那個文檔 我看過,比較的是Hadoop與Vertica,我覺得沒有可比性,應(yīng)該比HBase與Vertica。除非HBase沒有優(yōu)化它的存儲和查詢,直接使用Map Reduce做查詢。MapReduce是對大文件,無序數(shù)據(jù)處理。HBase應(yīng)該是有排序的,還沒仔細(xì)讀源代碼。下一篇:思八達(dá)能忽悠這么多的人? 下一篇 【方向鍵 ( → )下一篇】
上一篇:男人小便時會忍不住想去沖掉便池上的臟東西? 上一篇 【方向鍵 ( ← )上一篇】
快搜