课程目标
本系列课程将基于RedHat Linux 7.4版本、Hadoop 2.7.3、Spark 2 版本全面介绍大数据的整体内容,让学员深入理解并掌握运行机制和原理,从而进一步掌握大数据的相关内容。
适用人群
具备Java基础学员,并想进一步学习大数据的学员。
课程概述
Hive 是一个基于 hadoop 的开源数据仓库工具,用于存储和处理海量结构化数据。
它把海量数据存储于 hadoop 文件系统,而不是数据库,但提供了一套类数据库的数据存储和处理机制,
并采用 HQL (类 SQL )语言对这些数据进行自动化管理和处理。