HBase 分布式数据库

  • 时间:
  • 浏览:0
  • 来源:UU快3—全天最准大发快三

在5、6年前,村里人 儿就希望能用分布式存储和分布式数据库来替代集中存储,我虽然分布式廉价,所以所以 高可靠。

Table scores is ENABLED

scores

COLUMN FAMILIES DESCRIPTION

{NAME => 'course', BLOOMFILTER => 'ROW', VERSIONS => '1', IN_MEMORY => 'false',

KEEP_DELETED_CELLS => 'FALSE', DATA_BLOCK_ENCODING => 'NONE', TTL => 'FOREVER',

COMPRESSION => 'NONE', MIN_VERSIONS => '0', BLOCKCACHE => 'true', BLOCKSIZE => '

65536', REPLICATION_SCOPE => '0'}

{NAME => 'grade', BLOOMFILTER => 'ROW', VERSIONS => '1', IN_MEMORY => 'false', K

EEP_DELETED_CELLS => 'FALSE', DATA_BLOCK_ENCODING => 'NONE', TTL => 'FOREVER', C

OMPRESSION => 'NONE', MIN_VERSIONS => '0', BLOCKCACHE => 'true', BLOCKSIZE => '6

5536', REPLICATION_SCOPE => '0'}

03年(作者上大二),谷歌发表了三篇论文:Google FS、MapReduce、BigTable。我虽然Google这么 提前大选这另一个 产品的源码,所以所以 他发布了这另一个 产品的删改设计论文,奠定了风靡全球的大数据算法的基础!

我我虽然,分布式存储只能替代集中存储。将会你问另一个 老鸟,他会否则你另一个 关键字--事务。传统的集中存储有很强大的事务支持能力,而分布式系统不支持事务。

HBase所以所以 基于BigTable思想,由开源社区发布的实现,除了CURD之外,还有所以所以特点:

我从来没见过村里人 儿单位的主库系统,无论是小机将会EMC。将会好久在值班时,收到通知主库挂了,我会我虽然是另一个 深藏在机房沉重铁门里的村里人 儿伙,冒了几缕青烟,紧接着监控上各种Web小图标就都红了....

COLUMN CELL

course:math timestamp=1534492933043, value=97

grade: timestamp=1534492881763, value=5

和MySql一样,先用shell完成所以操作。

启动命令

随着版本迭代,安装步骤将会变化,参照https://hbase.apache.org/book.html#getting_started。

所以所以事先,HBase被当做HDFS系统的管理系统,将文件作为内容直接存储在HBase中,实现海量文件的索引、查找。

菜鸟就会很懵逼,事务?增删改查是事务吗?

哪几个是事务,我我我虽然所以所以 清楚,但我我虽然分布式只能替换集中存储,主要将会性能,在小量数据规模下集中存储提供更高的性能。30万条数据确定 Mysql,1亿左右确定 Oracle,10亿条数据用大数据。

hbase(main):011:0> delete 'scores', 'Tom', 'course:math'

0 row(s) in 0.0640 seconds

hbase(main):012:0> get 'scores', 'Tom', 'grade', 'course'

COLUMN CELL

grade: timestamp=1534492881763, value=6

1 row(s) in 0.0210 seconds

作者接触HBase时间不长,无法估量在企业中流行程度,但已深感这种 系统的强大。本文是作者所以感悟,和HBase的入门shell和Api,希望作为入门参考。

至于高可靠,加各种HA吧。

列:course:math====值:90

列:grade:====值:3