《Hive编程指南》一1.4　后续事情

xiaoxiao2024-05-31 139

本节书摘来异步社区《Hive编程指南》一书中的第1章，第1.4节，作者：【美】Edward Capriolo , Dean Wampler , Jason Rutherglen 译者：曹坤，更多章节内容可以访问云栖社区“异步社区”公众号查看。1.4　后续事情我们描述了Hive在Hadoop生态系统中所扮演的重要角色。现在我们开始！

[1]不过，因为Hive是被设计用来处理的大数据集的，这个启动所消耗的时间和实际数据处理时间相比是微乎其微的。

[2]请访问Apache HBase的官方网站，http://hbase.apache.org,以及Lars George(O’Reilly)所著的《HBase权威指南》一书。

[3]请参考Cassandra的官方网站，http://cassandra.apache.org/,以及参考Edward Capriolo (Packt)所著的《High Performance Cassandra Cookbook》一书。

[4]请参考DynamoDB的官方网站，http://aws.amazon.com/dynamodb/。

[5]参考链接 https://cwiki.apache.org/Hive/。

[6]不过，非常有必要将这个wiki链接加入到网址收藏夹中，因为wiki中包含了一些我们没有覆盖的、比较模糊的信息。

[7]对于不是开发者的用户，这里需要补充说明的是“Hello World”程序通常是学习一门新的语言或者工具集的第一个程序。

[8]Apache Hadoop word count: http://wiki.apache.org/hadoop/WordCount.

[9]详细信息请参考Tom White所著的《Hadoop权威指南》一书。

[10]还有一个微小的差异。Hive查询硬编码指定一个指向数据的路径，而Java代码把这个路径作为一个输入参数处理。在第2章，我们将学习如何在Hive脚本中使用变量来避免这种硬编码。

《Hive编程指南》一1.4 后续事情

《Hive编程指南》一1.4　后续事情