开源第一弹:什么是HBASE?

大数据工具很少单独工作,它是一个工具和数据库,以帮助数据研究人员能够更有效地分析他们的集合(或只是有利于加快速度)。 2015-03-24 10:57:40 大数据Apache HBAS开源 Java开发者编写SQL语句时常见的10种错误 当Java开发人员编写SQL语句时,一切都变得不同了。SQL是一种说明式语言,与面向对象思想和命令式思想无关。在SQL语言中,查询非常容易表达。但它也不是那么容易以最佳或最正确地方式编写出来。开发人员不仅需要重新思考自己的编程模式,还需要从集合论的角度进行深入思考。 2015-03-19 11:53:57 JavaSQL数据库开发 MySQL 数据库备份种类以及常用备份工具汇总 数据库备份种类按照数据库大小备份,有四种类型,分别应用于不同场合。本文将MySQL 数据库备份种类以及常用备份工具进行汇总,方便大家学习。

大数据工具很少单独工作,它是一个工具和数据库,以帮助数据研究人员能够更有效地分析他们的集合(或只是有利于加快速度)。

[[130262]]

在数据研究人员的工具集上有着大量的工具可以使用,这对于大数据技术,既是一件好事也是一件坏事。

当我们谈论从事大数据工作所使用的工具时,绝大部分讨论的会是Hadoop,Apache基金会关于Map Reduce和分布式存储系统的实现(HDFS是由Doug Cutting 阅读相关论文后在其供职于Yahoo时(他目前在Cloudera)建立的。但大数据工具很少单独工作,它是一个工具和数据库,以帮助数据研究人员能够更有效地分析他们的集合(或只是有利于加快速度)。

其中一项技术就是HBase。HBase的是一个非关系(NoSQL的)数据库,是Google BigTable的Java实现。它是柱状数据库中的一种。相对于关系数据库基于行存储数据,HBASE基于列存储。

不过这说起来容易,但其究竟是什么意思。让我们从对谷歌关于BigTable的相关文档的研究开始:

“Bigtable是一个具有稀疏性,分布性,持续性的多维有序映射。”

让我们深入其中,看看到底是什么意思。

稀疏

直觉上认为数据库稀疏的定义是数据库具有较少的数据项,但实际上,稀疏的意义是指数据库中数据项的数据列缺乏足够的数据。对于HBASE,之所以说它具有稀疏性,是因为它可以在其实体中容纳稀疏性数据。而对于关系表,将要求您填写的所有字段(或大部分)(想想你的关系数据库中客户资料表)。柱状数据库可以为空或NULL且不影响数据库的功能。此外,这也给你带来了其他好处,使你能够快速的添加其它你想捕捉的数据。在关系数据库中,创建一个架构(FirstName,LastName,SS#,TelephoneNumber),并希望在创建时已经得到所有你需要捕获的数据。NoSQL数据库无需设计过于复杂的架构,允许您根据需要在不中断业务正常流动时添加字段。

分布式和持久化

HBase的使用HDFS(Hadoop分布式文件系统),以实现在多个商用服务器分发数据。这是Hadoop和HBase能够处理海量数据工作的基础。它基于另一篇关于谷歌文件系统的文章(点击阅读),google文件系统是Doug Cutting 建立HDFS的基础。我们将在另一篇文章中详细讨论HDFS和DFS。

多维排序Map

一个Map(有时被称为关联数组)其中存储的键值索引不必是整数,可以是任意的字符串。其实质是键值对集合,且要求键具有惟一性。其中键按照字典序排列。(需要注意的是:此处的字典序不是按字母顺序排列,也不是按数字顺序,而是按字符串的Unicode值进行排序)

你的得与失

使用HBase可以让你对存储在Hbase的数据进行预处理和后处理操作,并给予你更大的灵活性和快速处理数十亿行数据的能力。不利的一面是,当您使用 HDFS的替代HBase,使用像Hive(类SQL数据检索)那样的工具会比在普通的HDFS慢4-5倍。此外,可以容纳数据的***容量约为1 PB而不是HDFS中的30PB。

原文链接:www.searchdatabase.com.cn/showcontent_88365.htm

©本文为清一色官方代发,观点仅代表作者本人,与清一色无关。清一色对文中陈述、观点判断保持中立,不对所包含内容的准确性、可靠性或完整性提供任何明示或暗示的保证。本文不作为投资理财建议,请读者仅作参考,并请自行承担全部责任。文中部分文字/图片/视频/音频等来源于网络,如侵犯到著作权人的权利,请与我们联系(微信/QQ:1074760229)。转载请注明出处:清一色财经

(0)
打赏 微信扫码打赏 微信扫码打赏 支付宝扫码打赏 支付宝扫码打赏
清一色的头像清一色管理团队
上一篇 2023年5月6日 09:05
下一篇 2023年5月6日 09:05

相关推荐

发表评论

登录后才能评论

联系我们

在线咨询:1643011589-QQbutton

手机:13798586780

QQ/微信:1074760229

QQ群:551893940

工作时间:工作日9:00-18:00,节假日休息

关注微信