本系列课程将基于RedHat Linux 7.4版本、Hadoop 2.7.3、Spark 2 版本全面介绍大数据的整体内容,让学员深入理解并掌握运行机制和原理,从而进一步掌握大数据的相关内容。
具备Java基础学员,并想进一步学习大数据的学员。
HBase是Apache Hadoop的数据库,能够对大数据提供随机、实时的读写访问功能,HBase是Bigtable的开源山寨版本, 是建立在HDFS之上,提供高可靠性、高性能、列存储、可伸缩、实时读写的数据库系统. HBase存储的是松散型的数据,它介于Nosql和RDBMS之间,仅通过主键(row key)和主键的range来检索数据, 仅支持单行事务(可通过hive支持来实现多表join等复杂操作).主要用来存储非结构化和半结构化的松散数据, 与hadoop一样,Hbase目标主要依靠横向扩展,通过不断增加廉价的商用服务器,来增加计算和存储能力, 但与hadoop相比,Hbase所要求的服务器性能要比hadoop的高。