aoa电子体育竞技:大数据口试必问 数据存储利器——Hbase

   刊发时间:2022-02-10 12:26:49   来源:aoa官方体育 作者:aoa官方体育平台

  HBase是一个分散式的、面向列的开源数据库,该技巧来历于 Fay Chang 所撰写的Google论文“Bigtable:一个布局化数据的分散式存储编造”。

  HBase 是一个分散式的、面向列的分散式数据库,HBase是基于Google 开源的bigtable的竣工,面向列的非干系性数据库。正在大数据分散式惩罚中,HBase是必不成少的数据存储“利器”。

  Facebook 正在 2010年11 月起源便不绝选用 HBase来动作音尘平台的存储层技巧。

  MySQL + HBase是咱们平素运用中常用的两个数据库,分手办理运用的正在线工作题目和大数据场景的海量存储题目。

  MySQL:运维简陋(组件少)、延时低(拜候旅途短)HBase:扩展性好、内置容错复原与数据冗余

  基于列式存储模子,对付数据竣工了高度压缩,俭省存储本钱采用 LSM 机造而不是B(+)树,这使得HBase十分适合海量数据及时写入的场景

  HBase中的数据是服从字典依次排序的,当豪爽相联的Rowkey集结写正在个体的region,各个region之间数据分散不服衡;

  创修表时没有提前预分区。创修的表默认只要一个region,豪爽的数据写入眼前region;

  partition顾名思义便是分区式,这种分区有点近似于MapReduce中的Partitioner,将区域用长整数动作分区号,每个region统造着相应的区域数据,正在rowkey天生时,将ID取模后,然后拼上ID满堂动作rowkey,这个斗劲简陋,必必要取样,splitkeys也十分简陋,直接是分区号即可。

  声明:该文看法仅代表作家自己,搜狐号系音信发表平台,搜狐仅供给音信存储空间任事。

 

版权所有: aoa电子体育竞技|aoa官方体育平台 

京ICP备05050114号      400-160-1670